Données parcours-sup 2021-2025¶

Voir Parcoursup 2025 - vœux de poursuite d’études et de réorientation dans l’enseignement supérieur et réponses des établissements.

[1]:

import pandas
from teachpyx.tools.pandas import read_csv_cached
from skrub import TableReport

Récupération des données¶

[2]:

urls = {
    "2021": "https://data.enseignementsup-recherche.gouv.fr/api/explore/v2.1/catalog/datasets/fr-esr-parcoursup_2021/exports/csv?lang=fr&timezone=Europe%2FBerlin&use_labels=true&delimiter=%3B",
    "2022": "https://data.enseignementsup-recherche.gouv.fr/api/explore/v2.1/catalog/datasets/fr-esr-parcoursup_2022/exports/csv?lang=fr&timezone=Europe%2FBerlin&use_labels=true&delimiter=%3B",
    "2023": "https://data.enseignementsup-recherche.gouv.fr/api/explore/v2.1/catalog/datasets/fr-esr-parcoursup_2023/exports/csv?lang=fr&timezone=Europe%2FBerlin&use_labels=true&delimiter=%3B",
    "2024": "https://data.enseignementsup-recherche.gouv.fr/api/explore/v2.1/catalog/datasets/fr-esr-parcoursup_2024/exports/csv?lang=fr&timezone=Europe%2FBerlin&use_labels=true&delimiter=%3B",
    "2025": "https://data.enseignementsup-recherche.gouv.fr/api/explore/v2.1/catalog/datasets/fr-esr-parcoursup/exports/csv?lang=fr&timezone=Europe%2FBerlin&use_labels=true&delimiter=%3B",
}

[3]:

df2025 = read_csv_cached(urls["2025"], sep=";")
TableReport(df2025, max_plot_columns=120, max_association_columns=120)

Processing column 118 / 118

[3]:

Column	Column name	dtype	Is sorted	Null values	Unique values	Mean	Std	Min	Median	Max
0	Session	Int64DType	True	0 (0.0%)	1 (< 0.1%)	2.02e+03	0.00
1	Statut de l’établissement de la filière de formation (public, privé…)	StringDtype	False	0 (0.0%)	4 (< 0.1%)
2	Code UAI de l'établissement	StringDtype	False	0 (0.0%)	4058 (28.5%)
3	Établissement	StringDtype	False	0 (0.0%)	3707 (26.0%)
4	Code départemental de l’établissement	StringDtype	False	0 (0.0%)	106 (0.7%)
5	Département de l’établissement	StringDtype	False	1 (< 0.1%)	105 (0.7%)
6	Région de l’établissement	StringDtype	False	97 (0.7%)	18 (0.1%)
7	Académie de l’établissement	StringDtype	False	0 (0.0%)	33 (0.2%)
8	Commune de l’établissement	StringDtype	False	0 (0.0%)	1275 (8.9%)
9	Filière de formation	StringDtype	False	0 (0.0%)	3150 (22.1%)
10	Sélectivité	StringDtype	False	0 (0.0%)	2 (< 0.1%)
11	Filière de formation très agrégée	StringDtype	False	0 (0.0%)	11 (< 0.1%)
12	Filière de formation détaillée	StringDtype	False	0 (0.0%)	11891 (83.4%)
13	Filière de formation.1	StringDtype	False	0 (0.0%)	53 (0.4%)
14	Filière de formation détaillée bis	StringDtype	False	0 (0.0%)	438 (3.1%)
15	Filière de formation très détaillée	StringDtype	False	9992 (70.1%)	2895 (20.3%)
16	Coordonnées GPS de la formation	StringDtype	False	38 (0.3%)	5786 (40.6%)
17	Capacité de l’établissement par formation	Int64DType	False	0 (0.0%)	348 (2.4%)	54.0	99.9	0	30	3,400
18	Effectif total des candidats pour une formation	Int64DType	False	0 (0.0%)	3244 (22.8%)	947.	1.58e+03	1	385	19,404
19	Dont effectif des candidates pour une formation	Int64DType	False	0 (0.0%)	2367 (16.6%)	534.	1.04e+03	0	193	14,569
20	Effectif total des candidats en phase principale	Int64DType	False	0 (0.0%)	3182 (22.3%)	916.	1.59e+03	0	348	19,404
21	Dont effectif des candidats ayant postulé en internat	Float64DType	False	13266 (93.1%)	265 (1.9%)	101.	195.	0.00	59.0	2.73e+03
22	Effectif des candidats néo bacheliers généraux en phase principale	Int64DType	False	0 (0.0%)	2258 (15.8%)	475.	1.08e+03	0	101	15,301
23	Dont effectif des candidats boursiers néo bacheliers généraux en phase principale	Int64DType	False	0 (0.0%)	699 (4.9%)	65.5	150.	0	17	2,200
24	Effectif des candidats néo bacheliers technologiques en phase principale	Int64DType	False	0 (0.0%)	1006 (7.1%)	126.	254.	0	45	4,920
25	Dont effectif des candidats boursiers néo bacheliers technologiques en phase principale	Int64DType	False	0 (0.0%)	436 (3.1%)	33.9	76.9	0	9	1,711
26	Effectif des candidats néo bacheliers professionnels en phase principale	Int64DType	False	0 (0.0%)	684 (4.8%)	66.5	133.	0	24	2,047
27	Dont effectif des candidats boursiers néo bacheliers professionnels en phase principale	Int64DType	False	0 (0.0%)	374 (2.6%)	24.2	53.6	0	7	890
28	Effectif des autres candidats en phase principale	Int64DType	False	0 (0.0%)	1499 (10.5%)	248.	500.	0	86	7,550
29	Effectif total des candidats en phase complémentaire	Int64DType	False	0 (0.0%)	461 (3.2%)	31.6	108.	0	3	3,532
30	Effectif des candidats néo bacheliers généraux en phase complémentaire	Int64DType	False	0 (0.0%)	203 (1.4%)	6.83	34.1	0	0	1,395
31	Effectif des candidats néo bacheliers technologique en phase complémentaire	Int64DType	False	0 (0.0%)	137 (1.0%)	3.94	17.2	0	0	734
32	Effectif des candidats néo bacheliers professionnels en phase complémentaire	Int64DType	False	0 (0.0%)	90 (0.6%)	2.53	8.05	0	0	219
33	Effectifs des autres candidats en phase complémentaire	Int64DType	False	0 (0.0%)	335 (2.4%)	18.3	59.8	0	1	1,774
34	Effectif total des candidats classés par l’établissement en phase principale	Int64DType	False	0 (0.0%)	2628 (18.4%)	658.	1.28e+03	0	233	19,404
35	Effectif des candidats classés par l’établissement en phase complémentaire	Int64DType	False	0 (0.0%)	281 (2.0%)	12.0	36.9	0	1	904
36	Effectif des candidats classés par l’établissement en internat (CPGE)	Float64DType	False	13266 (93.1%)	208 (1.5%)	64.3	77.9	0.00	47.0	723.
37	Effectif des candidats classés par l’établissement hors internat (CPGE)	Float64DType	False	13266 (93.1%)	668 (4.7%)	581.	563.	0.00	423.	5.89e+03
38	Effectif des candidats néo bacheliers généraux classés par l’établissement	Int64DType	False	0 (0.0%)	2005 (14.1%)	375.	899.	0	70	14,315
39	Dont effectif des candidats boursiers néo bacheliers généraux classés par l’établissement	Int64DType	False	0 (0.0%)	623 (4.4%)	51.6	135.	0	10	2,200
40	Effectif des candidats néo bacheliers technologiques classés par l’établissement	Int64DType	False	0 (0.0%)	802 (5.6%)	87.2	162.	0	35	2,725
41	Dont effectif des candidats boursiers néo bacheliers technologiques classés par l’établissement	Int64DType	False	0 (0.0%)	312 (2.2%)	21.8	44.6	0	7	911
42	Effectif des candidats néo bacheliers professionnels classés par l’établissement	Int64DType	False	0 (0.0%)	525 (3.7%)	45.9	90.7	0	16	2,040
43	Dont effectif des candidats boursiers néo bacheliers professionnels classés par l’établissement	Int64DType	False	0 (0.0%)	274 (1.9%)	15.8	35.2	0	4	890
44	Effectif des autres candidats classés par l’établissement	Int64DType	False	0 (0.0%)	1205 (8.5%)	150.	371.	0	36	7,526
45	Effectif total des candidats ayant reçu une proposition d’admission de la part de l’établissement	Int64DType	False	0 (0.0%)	1613 (11.3%)	291.	467.	0	127	5,905
46	Effectif total des candidats ayant accepté la proposition de l’établissement (admis)	Int64DType	False	0 (0.0%)	462 (3.2%)	46.4	76.4	0	25	2,187
47	Dont effectif des candidates admises	Int64DType	False	0 (0.0%)	335 (2.4%)	26.1	52.5	0	12	1,562
48	Effectif des admis en phase principale	Int64DType	False	0 (0.0%)	440 (3.1%)	42.3	73.6	0	23	2,187
49	Effectif des admis en phase complémentaire	Int64DType	False	0 (0.0%)	134 (0.9%)	4.08	12.6	0	0	332
50	Dont effectif des admis ayant reçu leur proposition d’admission à l'ouverture de la procédure principale	Int64DType	False	0 (0.0%)	280 (2.0%)	17.9	42.1	0	7	2,177
51	Dont effectif des admis ayant reçu leur proposition d’admission avant le baccalauréat	Int64DType	False	0 (0.0%)	375 (2.6%)	33.0	60.2	0	17	2,187
52	Dont effectif des admis ayant reçu leur proposition d’admission avant la fin de la procédure principale	Int64DType	False	0 (0.0%)	433 (3.0%)	41.4	70.3	0	22	2,187
53	Dont effectif des admis en internat	Float64DType	False	13266 (93.1%)	65 (0.5%)	11.2	14.2	0.00	7.00	140.
54	Dont effectif des admis boursiers néo bacheliers	Int64DType	False	0 (0.0%)	129 (0.9%)	6.95	12.3	0	4	255
55	Effectif des admis néo bacheliers	Int64DType	False	0 (0.0%)	374 (2.6%)	34.0	59.0	0	19	1,197
56	Effectif des admis néo bacheliers généraux	Int64DType	False	0 (0.0%)	353 (2.5%)	23.3	54.7	0	6	1,197
57	Effectif des admis néo bacheliers technologiques	Int64DType	False	0 (0.0%)	97 (0.7%)	6.63	10.6	0	3	163
58	Effectif des admis néo bacheliers professionnels	Int64DType	False	0 (0.0%)	50 (0.4%)	4.14	5.52	0	2	88
59	Effectif des autres candidats admis	Int64DType	False	0 (0.0%)	207 (1.5%)	12.3	27.7	0	5	1,699
60	Dont effectif des admis néo bacheliers sans information sur la mention au bac	Int64DType	False	0 (0.0%)	9 (< 0.1%)	0.0442	0.286	0	0	9
61	Dont effectif des admis néo bacheliers sans mention au bac	Int64DType	False	0 (0.0%)	173 (1.2%)	10.1	18.0	0	5	292
62	Dont effectif des admis néo bacheliers avec mention Assez Bien au bac	Int64DType	False	0 (0.0%)	198 (1.4%)	11.4	22.0	0	6	458
63	Dont effectif des admis néo bacheliers avec mention Bien au bac	Int64DType	False	0 (0.0%)	169 (1.2%)	8.33	19.6	0	3	550
64	Dont effectif des admis néo bacheliers avec mention Très Bien au bac	Int64DType	False	0 (0.0%)	124 (0.9%)	3.68	12.6	0	1	405
65	Dont effectif des admis néo bacheliers avec mention Très Bien avec félicitations au bac	Int64DType	False	0 (0.0%)	54 (0.4%)	0.512	3.87	0	0	226
66	Effectif des admis néo bacheliers généraux ayant eu une mention au bac	Int64DType	False	0 (0.0%)	292 (2.0%)	17.2	45.2	0	3	1,161
67	Effectif des admis néo bacheliers technologiques ayant eu une mention au bac	Int64DType	False	0 (0.0%)	83 (0.6%)	3.66	7.68	0	1	158
68	Effectif des admis néo bacheliers professionnels ayant eu une mention au bac	Int64DType	False	0 (0.0%)	43 (0.3%)	3.01	4.29	0	1	50
69	Dont effectif des admis issus du même établissement (BTS/CPGE)	Float64DType	False	7915 (55.5%)	41 (0.3%)	3.85	4.22	0.00	3.00	45.0
70	Dont effectif des admises issues du même établissement (BTS/CPGE)	Float64DType	False	7915 (55.5%)	22 (0.2%)	1.45	2.34	0.00	0.00	25.0
71	Dont effectif des admis issus de la même académie	Int64DType	False	0 (0.0%)	308 (2.2%)	23.7	43.9	0	13	1,024
72	Dont effectif des admis issus de la même académie (Paris/Créteil/Versailles réunies)	Int64DType	False	0 (0.0%)	330 (2.3%)	26.3	48.8	0	14	1,065
73	% d’admis ayant reçu leur proposition d’admission à l'ouverture de la procédure principale	Float64DType	False	0 (0.0%)	101 (0.7%)	35.5	26.2	0.00	31.0	100.
74	% d’admis ayant reçu leur proposition d’admission avant le baccalauréat	Float64DType	False	0 (0.0%)	99 (0.7%)	70.2	21.2	0.00	73.0	100.
75	% d’admis ayant reçu leur proposition d’admission avant la fin de la procédure principale	Float64DType	False	0 (0.0%)	77 (0.5%)	87.5	15.6	0.00	91.0	100.
76	% d’admis dont filles	Float64DType	False	0 (0.0%)	101 (0.7%)	50.0	29.6	0.00	53.0	100.
77	% d’admis néo bacheliers issus de la même académie	Float64DType	False	0 (0.0%)	101 (0.7%)	69.5	28.8	0.00	78.0	100.
78	% d’admis néo bacheliers issus de la même académie (Paris/Créteil/Versailles réunies)	Float64DType	False	0 (0.0%)	100 (0.7%)	75.4	25.5	0.00	83.0	100.
79	% d’admis néo bacheliers issus du même établissement (BTS/CPGE)	Float64DType	False	0 (0.0%)	98 (0.7%)	10.3	19.1	0.00	0.00	100.
80	% d’admis néo bacheliers boursiers	Float64DType	False	0 (0.0%)	92 (0.6%)	22.3	17.8	0.00	20.0	100.
81	% d’admis néo bacheliers	Float64DType	False	0 (0.0%)	100 (0.7%)	73.2	22.7	0.00	78.0	100.
82	% d’admis néo bacheliers sans information sur la mention au bac	Float64DType	False	0 (0.0%)	23 (0.2%)	0.148	1.55	0.00	0.00	100.
83	% d’admis néo bacheliers sans mention au bac	Float64DType	False	0 (0.0%)	97 (0.7%)	34.8	24.7	0.00	35.0	100.
84	% d’admis néo bacheliers avec mention Assez Bien au bac	Float64DType	False	0 (0.0%)	86 (0.6%)	32.6	17.8	0.00	33.0	100.
85	% d’admis néo bacheliers avec mention Bien au bac	Float64DType	False	0 (0.0%)	85 (0.6%)	21.0	17.3	0.00	18.0	100.
86	% d’admis néo bacheliers avec mention Très Bien au bac	Float64DType	False	0 (0.0%)	90 (0.6%)	8.30	14.4	0.00	3.00	100.
87	% d’admis néo bacheliers avec mention Très Bien avec félicitations au bac	Float64DType	False	0 (0.0%)	62 (0.4%)	0.965	4.64	0.00	0.00	100.
88	% d’admis néo bacheliers généraux	Float64DType	False	0 (0.0%)	100 (0.7%)	50.0	37.7	0.00	48.0	100.
89	Dont % d’admis avec mention (BG)	Float64DType	False	0 (0.0%)	101 (0.7%)	34.6	34.8	0.00	24.0	100.
90	% d’admis néo bacheliers technologiques	Float64DType	False	0 (0.0%)	95 (0.7%)	24.4	23.5	0.00	20.0	100.
91	Dont % d’admis avec mention (BT)	Float64DType	False	0 (0.0%)	95 (0.7%)	12.1	17.1	0.00	6.00	100.
92	% d’admis néo bacheliers professionnels	Float64DType	False	0 (0.0%)	97 (0.7%)	23.4	28.3	0.00	10.0	100.
93	Dont % d’admis avec mention (BP)	Float64DType	False	0 (0.0%)	97 (0.7%)	16.3	21.0	0.00	6.00	100.
94	Effectif des candidats en terminale générale ayant reçu une proposition d’admission de la part de l’établissement	Float64DType	False	0 (0.0%)	1264 (8.9%)	175.	375.	0.00	36.0	5.50e+03
95	Dont effectif des candidats boursiers en terminale générale ayant reçu une proposition d’admission de la part de l’établissement	Float64DType	False	0 (0.0%)	338 (2.4%)	24.4	47.4	0.00	6.00	686.
96	Effectif des candidats en terminale technologique ayant reçu une proposition d’admission de la part de l’établissement	Float64DType	False	0 (0.0%)	404 (2.8%)	37.2	60.4	0.00	18.0	660.
97	Dont effectif des candidats boursiers en terminale technologique ayant reçu une proposition d’admission de la part de l’établissement	Float64DType	False	0 (0.0%)	145 (1.0%)	9.42	16.2	0.00	4.00	267.
98	Effectif des candidats en terminale professionnelle ayant reçu une proposition d’admission de la part de l’établissement	Float64DType	False	0 (0.0%)	178 (1.2%)	17.9	24.4	0.00	8.00	274.
99	Dont effectif des candidats boursiers en terminale générale professionnelle ayant reçu une proposition d’admission de la part de l’établissement	Float64DType	False	0 (0.0%)	84 (0.6%)	6.21	9.82	0.00	2.00	188.
100	Effectif des autres candidats ayant reçu une proposition d’admission de la part de l’établissement	Float64DType	False	0 (0.0%)	650 (4.6%)	60.9	122.	0.00	21.0	3.01e+03
101	Regroupement 1 effectué par les formations pour les classements	StringDtype	False	1268 (8.9%)	7 (< 0.1%)
102	Rang du dernier appelé du groupe 1	StringDtype	False	56 (0.4%)	1710 (12.0%)
103	Regroupement 2 effectué par les formations pour les classements	StringDtype	False	8269 (58.0%)	5 (< 0.1%)
104	Rang du dernier appelé du groupe 2	Float64DType	False	8110 (56.9%)	387 (2.7%)	64.3	75.7	1.00	43.0	921.
105	Regroupement 3 effectué par les formations pour les classements	StringDtype	False	10791 (75.7%)	2 (< 0.1%)
106	Rang du dernier appelé du groupe 3	Float64DType	False	10586 (74.3%)	237 (1.7%)	59.9	46.6	1.00	48.0	494.
107	list_com	StringDtype	False	0 (0.0%)	2 (< 0.1%)
108	tri	StringDtype	False	0 (0.0%)	3 (< 0.1%)
109	cod_aff_form	Int64DType	False	0 (0.0%)	14252 (100.0%)	1.89e+04	1.39e+04	3	13,640	50,456
110	Concours communs et banque d'épreuves	StringDtype	False	13419 (94.2%)	118 (0.8%)
111	Lien de la formation sur la plateforme Parcoursup	StringDtype	False	38 (0.3%)	14214 (99.7%)
112	Taux d’accès	StringDtype	False	57 (0.4%)	101 (0.7%)
113	Part des terminales générales qui étaient en position de recevoir une proposition en phase principale	StringDtype	False	0 (0.0%)	102 (0.7%)
114	Part des terminales technologiques qui étaient en position de recevoir une proposition en phase principale	StringDtype	False	0 (0.0%)	94 (0.7%)
115	Part des terminales professionnelles qui étaient en position de recevoir une proposition en phase principale	StringDtype	False	0 (0.0%)	101 (0.7%)
116	etablissement_id_paysage	Float64DType	False	14252 (100.0%)
117	composante_id_paysage	Float64DType	False	14252 (100.0%)

Column 1	Column 2	Cramér's V	Pearson's Correlation
Code départemental de l’établissement	Département de l’établissement	1.00
Filière de formation très agrégée	tri	1.00
Code UAI de l'établissement	Établissement	1.00
Effectif total des candidats pour une formation	Effectif total des candidats en phase principale	0.995	0.998
Effectif total des candidats ayant accepté la proposition de l’établissement (admis)	Effectif des admis en phase principale	0.934	0.987
Dont effectif des admis issus de la même académie	Dont effectif des admis issus de la même académie (Paris/Créteil/Versailles réunies)	0.897	0.962
Sélectivité	Filière de formation très agrégée	0.892
Sélectivité	Filière de formation.1	0.885
Effectif des admis en phase principale	Dont effectif des admis ayant reçu leur proposition d’admission avant la fin de la procédure principale	0.872	0.991
Dont effectif des candidats boursiers néo bacheliers généraux en phase principale	Dont effectif des candidats boursiers néo bacheliers généraux classés par l’établissement	0.858	0.947
Effectif total des candidats ayant accepté la proposition de l’établissement (admis)	Dont effectif des admis ayant reçu leur proposition d’admission avant la fin de la procédure principale	0.847	0.994
Filière de formation.1	tri	0.845
Effectif des admis néo bacheliers	Effectif des admis néo bacheliers généraux	0.829	0.972
Regroupement 1 effectué par les formations pour les classements	Regroupement 2 effectué par les formations pour les classements	0.816
Effectif des admis néo bacheliers	Dont effectif des admis issus de la même académie (Paris/Créteil/Versailles réunies)	0.802	0.952
Effectif des autres candidats en phase principale	Effectif des autres candidats classés par l’établissement	0.773	0.909
% d’admis néo bacheliers issus de la même académie	% d’admis néo bacheliers issus de la même académie (Paris/Créteil/Versailles réunies)	0.769	0.820
Sélectivité	tri	0.767
Région de l’établissement	Académie de l’établissement	0.764
Dont effectif des admis ayant reçu leur proposition d’admission avant le baccalauréat	Effectif des admis néo bacheliers	0.762	0.962

Please enable javascript

The skrub table reports need javascript to display correctly. If you are displaying a report in a Jupyter notebook and you see this message, you may need to re-execute the cell or to trust the notebook (button on the top right or "File > Trust notebook").

[4]:

df2024 = read_csv_cached(urls["2024"], sep=";")
TableReport(df2024, max_plot_columns=120, max_association_columns=120)

Processing column 118 / 118

[4]:

Column	Column name	dtype	Is sorted	Null values	Unique values	Mean	Std	Min	Median	Max
0	Session	Int64DType	True	0 (0.0%)	1 (< 0.1%)	2.02e+03	0.00
1	Statut de l’établissement de la filière de formation (public, privé…)	StringDtype	False	0 (0.0%)	4 (< 0.1%)
2	Code UAI de l'établissement	StringDtype	False	0 (0.0%)	3996 (28.4%)
3	Établissement	StringDtype	False	0 (0.0%)	3641 (25.9%)
4	Code départemental de l’établissement	Float64DType	False	72 (0.5%)	103 (0.7%)	98.6	199.	1.00	59.0	987.
5	Département de l’établissement	StringDtype	False	2 (< 0.1%)	104 (0.7%)
6	Région de l’établissement	StringDtype	False	91 (0.6%)	18 (0.1%)
7	Académie de l’établissement	StringDtype	False	0 (0.0%)	32 (0.2%)
8	Commune de l’établissement	StringDtype	False	0 (0.0%)	1266 (9.0%)
9	Filière de formation	StringDtype	False	0 (0.0%)	3138 (22.3%)
10	Sélectivité	StringDtype	False	0 (0.0%)	2 (< 0.1%)
11	Filière de formation très agrégée	StringDtype	False	0 (0.0%)	11 (< 0.1%)
12	Filière de formation détaillée	StringDtype	False	0 (0.0%)	11851 (84.2%)
13	Filière de formation.1	StringDtype	False	0 (0.0%)	53 (0.4%)
14	Filière de formation détaillée bis	StringDtype	False	0 (0.0%)	452 (3.2%)
15	Filière de formation très détaillée	StringDtype	False	9977 (70.9%)	2805 (19.9%)
16	Coordonnées GPS de la formation	StringDtype	False	73 (0.5%)	5804 (41.2%)
17	Capacité de l’établissement par formation	Int64DType	False	0 (0.0%)	352 (2.5%)	54.7	101.	0	30	3,400
18	Effectif total des candidats pour une formation	Int64DType	False	0 (0.0%)	3076 (21.8%)	865.	1.38e+03	0	375	17,430
19	Dont effectif des candidates pour une formation	Int64DType	False	0 (0.0%)	2234 (15.9%)	486.	891.	0	191	11,417
20	Effectif total des candidats en phase principale	Int64DType	False	0 (0.0%)	3040 (21.6%)	840.	1.38e+03	0	347	17,430
21	Dont effectif des candidats ayant postulé en internat	Float64DType	False	13097 (93.0%)	227 (1.6%)	90.4	197.	0.00	52.0	2.73e+03
22	Effectif des candidats néo bacheliers généraux en phase principale	Int64DType	False	0 (0.0%)	2198 (15.6%)	455.	1.01e+03	0	104	15,978
23	Dont effectif des candidats boursiers néo bacheliers généraux en phase principale	Int64DType	False	0 (0.0%)	714 (5.1%)	72.0	155.	0	20	2,291
24	Effectif des candidats néo bacheliers technologiques en phase principale	Int64DType	False	0 (0.0%)	942 (6.7%)	117.	218.	0	47	3,740
25	Dont effectif des candidats boursiers néo bacheliers technologiques en phase principale	Int64DType	False	0 (0.0%)	450 (3.2%)	36.6	76.0	0	12	1,715
26	Effectif des candidats néo bacheliers professionnels en phase principale	Int64DType	False	0 (0.0%)	596 (4.2%)	55.0	106.	0	21	1,442
27	Dont effectif des candidats boursiers néo bacheliers professionnels en phase principale	Int64DType	False	0 (0.0%)	345 (2.5%)	22.9	48.4	0	7	737
28	Effectif des autres candidats en phase principale	Int64DType	False	0 (0.0%)	1336 (9.5%)	213.	401.	0	83	6,218
29	Effectif total des candidats en phase complémentaire	Int64DType	False	0 (0.0%)	380 (2.7%)	25.3	70.2	0	4	2,202
30	Effectif des candidats néo bacheliers généraux en phase complémentaire	Int64DType	False	0 (0.0%)	170 (1.2%)	5.43	22.5	0	0	849
31	Effectif des candidats néo bacheliers technologique en phase complémentaire	Int64DType	False	0 (0.0%)	119 (0.8%)	3.27	11.6	0	0	389
32	Effectif des candidats néo bacheliers professionnels en phase complémentaire	Int64DType	False	0 (0.0%)	83 (0.6%)	2.11	6.79	0	0	239
33	Effectifs des autres candidats en phase complémentaire	Int64DType	False	0 (0.0%)	274 (1.9%)	14.5	39.4	0	1	1,031
34	Effectif total des candidats classés par l’établissement en phase principale	Int64DType	False	0 (0.0%)	2530 (18.0%)	613.	1.12e+03	0	231	15,170
35	Effectif des candidats classés par l’établissement en phase complémentaire	Int64DType	False	0 (0.0%)	265 (1.9%)	11.8	34.6	0	1	1,039
36	Effectif des candidats classés par l’établissement en internat (CPGE)	Float64DType	False	13097 (93.0%)	180 (1.3%)	53.6	67.8	0.00	40.0	720.
37	Effectif des candidats classés par l’établissement hors internat (CPGE)	Float64DType	False	13097 (93.0%)	667 (4.7%)	593.	532.	0.00	451.	4.79e+03
38	Effectif des candidats néo bacheliers généraux classés par l’établissement	Int64DType	False	0 (0.0%)	1950 (13.9%)	362.	828.	0	74	13,095
39	Dont effectif des candidats boursiers néo bacheliers généraux classés par l’établissement	Int64DType	False	0 (0.0%)	648 (4.6%)	57.6	141.	0	13	2,291
40	Effectif des candidats néo bacheliers technologiques classés par l’établissement	Int64DType	False	0 (0.0%)	774 (5.5%)	83.8	150.	0	36	2,350
41	Dont effectif des candidats boursiers néo bacheliers technologiques classés par l’établissement	Int64DType	False	0 (0.0%)	329 (2.3%)	24.3	47.3	0	8	872
42	Effectif des candidats néo bacheliers professionnels classés par l’établissement	Int64DType	False	0 (0.0%)	475 (3.4%)	39.1	75.4	0	14	1,345
43	Dont effectif des candidats boursiers néo bacheliers professionnels classés par l’établissement	Int64DType	False	0 (0.0%)	250 (1.8%)	15.6	33.0	0	4	689
44	Effectif des autres candidats classés par l’établissement	Int64DType	False	0 (0.0%)	1089 (7.7%)	128.	297.	0	35	6,183
45	Effectif total des candidats ayant reçu une proposition d’admission de la part de l’établissement	Int64DType	False	0 (0.0%)	1618 (11.5%)	299.	467.	0	134	5,525
46	Effectif total des candidats ayant accepté la proposition de l’établissement (admis)	Int64DType	False	0 (0.0%)	456 (3.2%)	46.1	76.0	0	25	1,482
47	Dont effectif des candidates admises	Int64DType	False	0 (0.0%)	334 (2.4%)	25.9	51.8	0	12	1,040
48	Effectif des admis en phase principale	Int64DType	False	0 (0.0%)	435 (3.1%)	42.0	72.6	0	23	1,373
49	Effectif des admis en phase complémentaire	Int64DType	False	0 (0.0%)	126 (0.9%)	3.99	12.2	0	0	363
50	Dont effectif des admis ayant reçu leur proposition d’admission à l'ouverture de la procédure principale	Float64DType	False	0 (0.0%)	263 (1.9%)	16.6	37.5	0.00	6.00	1.09e+03
51	Dont effectif des admis ayant reçu leur proposition d’admission avant le baccalauréat	Float64DType	False	0 (0.0%)	397 (2.8%)	35.6	63.0	0.00	19.0	1.30e+03
52	Dont effectif des admis ayant reçu leur proposition d’admission avant la fin de la procédure principale	Float64DType	False	0 (0.0%)	425 (3.0%)	40.4	68.3	0.00	22.0	1.30e+03
53	Dont effectif des admis en internat	Float64DType	False	13097 (93.0%)	64 (0.5%)	11.2	14.1	0.00	7.00	141.
54	Dont effectif des admis boursiers néo bacheliers	Int64DType	False	0 (0.0%)	146 (1.0%)	8.25	14.5	0	4	297
55	Effectif des admis néo bacheliers	Int64DType	False	0 (0.0%)	380 (2.7%)	34.4	60.1	0	19	1,195
56	Effectif des admis néo bacheliers généraux	Int64DType	False	0 (0.0%)	353 (2.5%)	23.7	55.6	0	6	1,113
57	Effectif des admis néo bacheliers technologiques	Int64DType	False	0 (0.0%)	103 (0.7%)	6.79	10.8	0	3	169
58	Effectif des admis néo bacheliers professionnels	Int64DType	False	0 (0.0%)	52 (0.4%)	3.95	5.51	0	2	108
59	Effectif des autres candidats admis	Int64DType	False	0 (0.0%)	202 (1.4%)	11.7	24.8	0	5	1,075
60	Dont effectif des admis néo bacheliers sans information sur la mention au bac	Int64DType	False	0 (0.0%)	9 (< 0.1%)	0.0357	0.275	0	0	13
61	Dont effectif des admis néo bacheliers sans mention au bac	Int64DType	False	0 (0.0%)	176 (1.3%)	10.3	18.8	0	5	316
62	Dont effectif des admis néo bacheliers avec mention Assez Bien au bac	Int64DType	False	0 (0.0%)	195 (1.4%)	11.4	22.3	0	6	489
63	Dont effectif des admis néo bacheliers avec mention Bien au bac	Int64DType	False	0 (0.0%)	165 (1.2%)	8.45	19.6	0	3	531
64	Dont effectif des admis néo bacheliers avec mention Très Bien au bac	Int64DType	False	0 (0.0%)	124 (0.9%)	3.77	12.9	0	1	426
65	Dont effectif des admis néo bacheliers avec mention Très Bien avec félicitations au bac	Float64DType	False	0 (0.0%)	54 (0.4%)	0.481	3.56	0.00	0.00	188.
66	Effectif des admis néo bacheliers généraux ayant eu une mention au bac	Int64DType	False	0 (0.0%)	287 (2.0%)	17.6	45.5	0	3	1,013
67	Effectif des admis néo bacheliers technologiques ayant eu une mention au bac	Int64DType	False	0 (0.0%)	81 (0.6%)	3.66	7.69	0	1	161
68	Effectif des admis néo bacheliers professionnels ayant eu une mention au bac	Int64DType	False	0 (0.0%)	44 (0.3%)	2.79	4.14	0	1	53
69	Dont effectif des admis issus du même établissement (BTS/CPGE)	Float64DType	False	7752 (55.1%)	37 (0.3%)	3.93	4.22	0.00	3.00	44.0
70	Dont effectif des admises issues du même établissement (BTS/CPGE)	Float64DType	False	7752 (55.1%)	19 (0.1%)	1.47	2.26	0.00	1.00	18.0
71	Dont effectif des admis issus de la même académie	Int64DType	False	0 (0.0%)	299 (2.1%)	23.6	44.9	0	13	1,083
72	Dont effectif des admis issus de la même académie (Paris/Créteil/Versailles réunies)	Int64DType	False	0 (0.0%)	323 (2.3%)	26.2	49.9	0	14	1,083
73	% d’admis ayant reçu leur proposition d’admission à l'ouverture de la procédure principale	Float64DType	False	0 (0.0%)	101 (0.7%)	34.2	26.0	0.00	29.0	100.
74	% d’admis ayant reçu leur proposition d’admission avant le baccalauréat	Float64DType	False	0 (0.0%)	99 (0.7%)	75.7	20.2	0.00	79.0	100.
75	% d’admis ayant reçu leur proposition d’admission avant la fin de la procédure principale	Float64DType	False	0 (0.0%)	82 (0.6%)	86.3	16.1	0.00	90.0	100.
76	% d’admis dont filles	Float64DType	False	0 (0.0%)	100 (0.7%)	50.0	29.6	0.00	53.0	100.
77	% d’admis néo bacheliers issus de la même académie	Float64DType	False	0 (0.0%)	100 (0.7%)	67.4	29.4	0.00	75.0	100.
78	% d’admis néo bacheliers issus de la même académie (Paris/Créteil/Versailles réunies)	Float64DType	False	0 (0.0%)	100 (0.7%)	73.1	26.8	0.00	81.0	100.
79	% d’admis néo bacheliers issus du même établissement (BTS/CPGE)	Float64DType	False	0 (0.0%)	97 (0.7%)	10.6	19.6	0.00	0.00	100.
80	% d’admis néo bacheliers boursiers	Float64DType	False	0 (0.0%)	95 (0.7%)	25.9	19.3	0.00	23.0	100.
81	% d’admis néo bacheliers	Float64DType	False	0 (0.0%)	99 (0.7%)	74.0	22.1	0.00	78.0	100.
82	% d’admis néo bacheliers sans information sur la mention au bac	Float64DType	False	0 (0.0%)	20 (0.1%)	0.0967	0.981	0.00	0.00	50.0
83	% d’admis néo bacheliers sans mention au bac	Float64DType	False	0 (0.0%)	97 (0.7%)	35.2	25.0	0.00	36.0	100.
84	% d’admis néo bacheliers avec mention Assez Bien au bac	Float64DType	False	0 (0.0%)	87 (0.6%)	32.5	17.9	0.00	33.0	100.
85	% d’admis néo bacheliers avec mention Bien au bac	Float64DType	False	0 (0.0%)	86 (0.6%)	21.1	17.6	0.00	18.0	100.
86	% d’admis néo bacheliers avec mention Très Bien au bac	Float64DType	False	0 (0.0%)	88 (0.6%)	8.32	14.4	0.00	2.00	100.
87	% d’admis néo bacheliers avec mention Très Bien avec félicitations au bac	Float64DType	False	0 (0.0%)	60 (0.4%)	0.918	4.44	0.00	0.00	100.
88	% d’admis néo bacheliers généraux	Float64DType	False	0 (0.0%)	100 (0.7%)	50.5	37.7	0.00	50.0	100.
89	Dont % d’admis avec mention (BG)	Float64DType	False	0 (0.0%)	100 (0.7%)	35.4	35.0	0.00	25.0	100.
90	% d’admis néo bacheliers technologiques	Float64DType	False	0 (0.0%)	96 (0.7%)	25.1	23.9	0.00	21.0	100.
91	Dont % d’admis avec mention (BT)	Float64DType	False	0 (0.0%)	98 (0.7%)	12.2	16.8	0.00	6.00	100.
92	% d’admis néo bacheliers professionnels	Float64DType	False	0 (0.0%)	98 (0.7%)	22.5	27.9	0.00	8.00	100.
93	Dont % d’admis avec mention (BP)	Float64DType	False	0 (0.0%)	97 (0.7%)	15.3	20.6	0.00	4.00	100.
94	Effectif des candidats en terminale générale ayant reçu une proposition d’admission de la part de l’établissement	Float64DType	False	0 (0.0%)	1271 (9.0%)	181.	373.	0.00	40.0	5.13e+03
95	Dont effectif des candidats boursiers en terminale générale ayant reçu une proposition d’admission de la part de l’établissement	Float64DType	False	0 (0.0%)	374 (2.7%)	30.0	56.7	0.00	8.00	888.
96	Effectif des candidats en terminale technologique ayant reçu une proposition d’admission de la part de l’établissement	Float64DType	False	0 (0.0%)	434 (3.1%)	39.9	65.3	0.00	20.0	641.
97	Dont effectif des candidats boursiers en terminale technologique ayant reçu une proposition d’admission de la part de l’établissement	Float64DType	False	0 (0.0%)	178 (1.3%)	11.9	20.6	0.00	5.00	342.
98	Effectif des candidats en terminale professionnelle ayant reçu une proposition d’admission de la part de l’établissement	Float64DType	False	0 (0.0%)	199 (1.4%)	17.9	26.0	0.00	8.00	293.
99	Dont effectif des candidats boursiers en terminale générale professionnelle ayant reçu une proposition d’admission de la part de l’établissement	Float64DType	False	0 (0.0%)	110 (0.8%)	7.18	11.8	0.00	3.00	191.
100	Effectif des autres candidats ayant reçu une proposition d’admission de la part de l’établissement	Float64DType	False	0 (0.0%)	642 (4.6%)	59.7	117.	0.00	21.0	1.97e+03
101	Regroupement 1 effectué par les formations pour les classements	StringDtype	False	737 (5.2%)	8 (< 0.1%)
102	Rang du dernier appelé du groupe 1	Float64DType	False	90 (0.6%)	2346 (16.7%)	539.	1.28e+03	1.00	117.	1.62e+04
103	Regroupement 2 effectué par les formations pour les classements	StringDtype	False	8027 (57.0%)	7 (< 0.1%)
104	Rang du dernier appelé du groupe 2	Float64DType	False	7941 (56.4%)	441 (3.1%)	72.0	94.5	1.00	45.0	1.34e+03
105	Regroupement 3 effectué par les formations pour les classements	StringDtype	False	10465 (74.3%)	2 (< 0.1%)
106	Rang du dernier appelé du groupe 3	Float64DType	False	10357 (73.6%)	316 (2.2%)	74.4	72.3	1.00	56.0	1.49e+03
107	list_com	StringDtype	False	0 (0.0%)	2 (< 0.1%)
108	tri	StringDtype	False	0 (0.0%)	3 (< 0.1%)
109	cod_aff_form	Int64DType	False	0 (0.0%)	14079 (100.0%)	1.78e+04	1.27e+04	3	12,483	47,121
110	Concours communs et banque d'épreuves	StringDtype	False	13364 (94.9%)	89 (0.6%)
111	Lien de la formation sur la plateforme Parcoursup	StringDtype	False	73 (0.5%)	14006 (99.5%)
112	Taux d’accès	Float64DType	False	91 (0.6%)	100 (0.7%)	60.1	28.7	1.00	60.0	100.
113	Part des terminales générales qui étaient en position de recevoir une proposition en phase principale	Float64DType	False	0 (0.0%)	101 (0.7%)	57.7	34.0	0.00	60.0	100.
114	Part des terminales technologiques qui étaient en position de recevoir une proposition en phase principale	Float64DType	False	0 (0.0%)	88 (0.6%)	24.7	21.2	0.00	23.0	100.
115	Part des terminales professionnelles qui étaient en position de recevoir une proposition en phase principale	Float64DType	False	0 (0.0%)	99 (0.7%)	17.0	21.4	0.00	6.00	100.
116	etablissement_id_paysage	StringDtype	False	7382 (52.4%)	486 (3.5%)
117	composante_id_paysage	StringDtype	False	13835 (98.3%)	97 (0.7%)

Column 1	Column 2	Cramér's V	Pearson's Correlation
Filière de formation très agrégée	tri	1.00
Effectif total des candidats pour une formation	Effectif total des candidats en phase principale	0.994	0.999
Code UAI de l'établissement	Établissement	0.943
Sélectivité	Filière de formation très agrégée	0.889
Sélectivité	Filière de formation.1	0.888
Dont effectif des admis issus de la même académie	Dont effectif des admis issus de la même académie (Paris/Créteil/Versailles réunies)	0.878	0.961
Dont effectif des candidats boursiers néo bacheliers généraux en phase principale	Dont effectif des candidats boursiers néo bacheliers généraux classés par l’établissement	0.872	0.939
Filière de formation.1	tri	0.859
Effectif total des candidats ayant accepté la proposition de l’établissement (admis)	Effectif des admis en phase principale	0.849	0.979
% d’admis néo bacheliers issus de la même académie	% d’admis néo bacheliers issus de la même académie (Paris/Créteil/Versailles réunies)	0.812	0.855
Effectif des candidats néo bacheliers professionnels classés par l’établissement	Dont effectif des candidats boursiers néo bacheliers professionnels classés par l’établissement	0.799	0.961
Dont effectif des admis ayant reçu leur proposition d’admission avant le baccalauréat	Dont effectif des admis ayant reçu leur proposition d’admission avant la fin de la procédure principale	0.798	0.994
Effectif des candidats classés par l’établissement en phase complémentaire	Effectif des admis en phase complémentaire	0.795	0.954
Effectif total des candidats en phase complémentaire	Effectifs des autres candidats en phase complémentaire	0.790	0.968
Effectif total des candidats ayant accepté la proposition de l’établissement (admis)	Dont effectif des admis ayant reçu leur proposition d’admission avant la fin de la procédure principale	0.787	0.993
Effectif total des candidats ayant reçu une proposition d’admission de la part de l’établissement	Effectif des candidats en terminale générale ayant reçu une proposition d’admission de la part de l’établissement	0.781	0.947
Effectif des admis néo bacheliers	Effectif des admis néo bacheliers généraux	0.778	0.968
Effectif des admis en phase principale	Dont effectif des admis ayant reçu leur proposition d’admission avant la fin de la procédure principale	0.776	0.987
Regroupement 1 effectué par les formations pour les classements	Regroupement 2 effectué par les formations pour les classements	0.774
Région de l’établissement	Académie de l’établissement	0.759

Please enable javascript

[5]:

dfs = {}
for k, url in urls.items():
    print(f"loading {k!r}")
    dfs[k] = read_csv_cached(url, sep=";")

loading '2021'
loading '2022'
loading '2023'
loading '2024'
loading '2025'

Fusion des années

[6]:

df = pandas.concat(dfs.values(), axis=0)
df.shape

[6]:

(69240, 123)

Toutes les variables¶

[7]:

admis = [c for c in df.columns if "Effectif" in c]
admis[:20]

[7]:

['Effectif total des candidats pour une formation',
 'Effectif total des candidats en phase principale',
 'Effectif des candidats néo bacheliers généraux en phase principale',
 'Effectif des candidats néo bacheliers technologiques en phase principale',
 'Effectif des candidats néo bacheliers professionnels en phase principale',
 'Effectif des autres candidats en phase principale',
 'Effectif total des candidats en phase complémentaire',
 'Effectif des candidats néo bacheliers généraux en phase complémentaire',
 'Effectif des candidats néo bacheliers technologique en phase complémentaire',
 'Effectif des candidats néo bacheliers professionnels en phase complémentaire',
 'Effectifs des autres candidats en phase complémentaire',
 'Effectif total des candidats classés par l’établissement en phase principale',
 'Effectif des candidats classés par l’établissement en phase complémentaire',
 'Effectif des candidats classés par l’établissement en internat (CPGE)',
 'Effectif des candidats classés par l’établissement hors internat (CPGE)',
 'Effectif des candidats néo bacheliers généraux classés par l’établissement',
 'Effectif des candidats néo bacheliers technologiques classés par l’établissement',
 'Effectif des candidats néo bacheliers professionnels classés par l’établissement',
 'Effectif des autres candidats classés par l’établissement',
 'Effectif total des candidats ayant reçu une proposition d’admission de la part de l’établissement']

[8]:

admis[20:]

[8]:

['Effectif total des candidats ayant accepté la proposition de l’établissement (admis)',
 'Effectif des admis en phase principale',
 'Effectif des admis en phase complémentaire',
 'Effectif des admis néo bacheliers',
 'Effectif des admis néo bacheliers généraux',
 'Effectif des admis néo bacheliers technologiques',
 'Effectif des admis néo bacheliers professionnels',
 'Effectif des autres candidats admis',
 'Effectif des admis néo bacheliers généraux ayant eu une mention au bac',
 'Effectif des admis néo bacheliers technologiques ayant eu une mention au bac',
 'Effectif des admis néo bacheliers professionnels ayant eu une mention au bac',
 'Effectif des candidats en terminale générale ayant reçu une proposition d’admission de la part de l’établissement',
 'Effectif des candidats en terminale technologique ayant reçu une proposition d’admission de la part de l’établissement',
 'Effectif des candidats en terminale professionnelle ayant reçu une proposition d’admission de la part de l’établissement',
 'Effectif des autres candidats ayant reçu une proposition d’admission de la part de l’établissement']

[9]:

list_columns = sorted(df.columns)
list_columns[:30]

[9]:

['% d’admis ayant reçu leur proposition d’admission avant la fin de la procédure principale',
 '% d’admis ayant reçu leur proposition d’admission avant le baccalauréat',
 "% d’admis ayant reçu leur proposition d’admission à l'ouverture de la procédure principale",
 '% d’admis dont filles',
 '% d’admis néo bacheliers',
 '% d’admis néo bacheliers avec mention Assez Bien au bac',
 '% d’admis néo bacheliers avec mention Bien au bac',
 '% d’admis néo bacheliers avec mention Très Bien au bac',
 '% d’admis néo bacheliers avec mention Très Bien avec félicitations au bac',
 '% d’admis néo bacheliers boursiers',
 '% d’admis néo bacheliers généraux',
 '% d’admis néo bacheliers issus de la même académie',
 '% d’admis néo bacheliers issus de la même académie (Paris/Créteil/Versailles réunies)',
 '% d’admis néo bacheliers issus du même établissement (BTS/CPGE)',
 '% d’admis néo bacheliers professionnels',
 '% d’admis néo bacheliers sans information sur la mention au bac',
 '% d’admis néo bacheliers sans mention au bac',
 '% d’admis néo bacheliers technologiques',
 'Académie de l’établissement',
 'COD_AFF_FORM',
 'Capacité de l’établissement par formation',
 "Code UAI de l'établissement",
 'Code départemental de l’établissement',
 'Commune de l’établissement',
 "Concours communs et banque d'épreuves",
 'Coordonnées GPS de la formation',
 'Dont % d’admis avec mention (BG)',
 'Dont % d’admis avec mention (BP)',
 'Dont % d’admis avec mention (BT)',
 'Dont effectif des admis ayant reçu leur proposition d’admission avant la fin de la procédure principale']

[10]:

list_columns[30:60]

[10]:

['Dont effectif des admis ayant reçu leur proposition d’admission avant le baccalauréat',
 "Dont effectif des admis ayant reçu leur proposition d’admission à l'ouverture de la procédure principale",
 'Dont effectif des admis boursiers néo bacheliers',
 'Dont effectif des admis en internat',
 'Dont effectif des admis issus de la même académie',
 'Dont effectif des admis issus de la même académie (Paris/Créteil/Versailles réunies)',
 'Dont effectif des admis issus du même établissement (BTS/CPGE)',
 'Dont effectif des admis néo bacheliers avec mention Assez Bien au bac',
 'Dont effectif des admis néo bacheliers avec mention Bien au bac',
 'Dont effectif des admis néo bacheliers avec mention Très Bien au bac',
 'Dont effectif des admis néo bacheliers avec mention Très Bien avec félicitations au bac',
 'Dont effectif des admis néo bacheliers sans information sur la mention au bac',
 'Dont effectif des admis néo bacheliers sans mention au bac',
 'Dont effectif des admises issues du même établissement (BTS/CPGE)',
 'Dont effectif des candidates admises',
 'Dont effectif des candidates pour une formation',
 'Dont effectif des candidats ayant postulé en internat',
 'Dont effectif des candidats boursiers en terminale générale ayant reçu une proposition d’admission de la part de l’établissement',
 'Dont effectif des candidats boursiers en terminale générale professionnelle ayant reçu une proposition d’admission de la part de l’établissement',
 'Dont effectif des candidats boursiers en terminale technologique ayant reçu une proposition d’admission de la part de l’établissement',
 'Dont effectif des candidats boursiers néo bacheliers généraux classés par l’établissement',
 'Dont effectif des candidats boursiers néo bacheliers généraux en phase principale',
 'Dont effectif des candidats boursiers néo bacheliers professionnels classés par l’établissement',
 'Dont effectif des candidats boursiers néo bacheliers professionnels en phase principale',
 'Dont effectif des candidats boursiers néo bacheliers technologiques classés par l’établissement',
 'Dont effectif des candidats boursiers néo bacheliers technologiques en phase principale',
 'Dont taux d’accès des candidats ayant un bac général ayant postulé à la formation',
 'Dont taux d’accès des candidats ayant un bac professionnel ayant postulé à la formation',
 'Dont taux d’accès des candidats ayant un bac technologique ayant postulé à la formation',
 'Département de l’établissement']

[11]:

list_columns[60:90]

[11]:

['Effectif des admis en phase complémentaire',
 'Effectif des admis en phase principale',
 'Effectif des admis néo bacheliers',
 'Effectif des admis néo bacheliers généraux',
 'Effectif des admis néo bacheliers généraux ayant eu une mention au bac',
 'Effectif des admis néo bacheliers professionnels',
 'Effectif des admis néo bacheliers professionnels ayant eu une mention au bac',
 'Effectif des admis néo bacheliers technologiques',
 'Effectif des admis néo bacheliers technologiques ayant eu une mention au bac',
 'Effectif des autres candidats admis',
 'Effectif des autres candidats ayant reçu une proposition d’admission de la part de l’établissement',
 'Effectif des autres candidats classés par l’établissement',
 'Effectif des autres candidats en phase principale',
 'Effectif des candidats classés par l’établissement en internat (CPGE)',
 'Effectif des candidats classés par l’établissement en phase complémentaire',
 'Effectif des candidats classés par l’établissement hors internat (CPGE)',
 'Effectif des candidats en terminale générale ayant reçu une proposition d’admission de la part de l’établissement',
 'Effectif des candidats en terminale professionnelle ayant reçu une proposition d’admission de la part de l’établissement',
 'Effectif des candidats en terminale technologique ayant reçu une proposition d’admission de la part de l’établissement',
 'Effectif des candidats néo bacheliers généraux classés par l’établissement',
 'Effectif des candidats néo bacheliers généraux en phase complémentaire',
 'Effectif des candidats néo bacheliers généraux en phase principale',
 'Effectif des candidats néo bacheliers professionnels classés par l’établissement',
 'Effectif des candidats néo bacheliers professionnels en phase complémentaire',
 'Effectif des candidats néo bacheliers professionnels en phase principale',
 'Effectif des candidats néo bacheliers technologique en phase complémentaire',
 'Effectif des candidats néo bacheliers technologiques classés par l’établissement',
 'Effectif des candidats néo bacheliers technologiques en phase principale',
 'Effectif total des candidats ayant accepté la proposition de l’établissement (admis)',
 'Effectif total des candidats ayant reçu une proposition d’admission de la part de l’établissement']

[12]:

list_columns[90:120]

[12]:

['Effectif total des candidats classés par l’établissement en phase principale',
 'Effectif total des candidats en phase complémentaire',
 'Effectif total des candidats en phase principale',
 'Effectif total des candidats pour une formation',
 'Effectifs des autres candidats en phase complémentaire',
 'Filière de formation',
 'Filière de formation détaillée',
 'Filière de formation détaillée bis',
 'Filière de formation très agrégée',
 'Filière de formation très détaillée',
 'Filière de formation.1',
 'Lien de la formation sur la plateforme Parcoursup',
 'Part des terminales générales qui étaient en position de recevoir une proposition en phase principale',
 'Part des terminales professionnelles qui étaient en position de recevoir une proposition en phase principale',
 'Part des terminales technologiques qui étaient en position de recevoir une proposition en phase principale',
 'Rang du dernier appelé du groupe 1',
 'Rang du dernier appelé du groupe 2',
 'Rang du dernier appelé du groupe 3',
 'Regroupement 1 effectué par les formations pour les classements',
 'Regroupement 2 effectué par les formations pour les classements',
 'Regroupement 3 effectué par les formations pour les classements',
 'Région de l’établissement',
 'Session',
 'Statut de l’établissement de la filière de formation (public, privé…)',
 'Sélectivité',
 'Taux d’accès',
 'Taux d’accès des candidats ayant postulé à la formation (ratio entre le dernier appelé et le nombre vœux PP)',
 'cod_aff_form',
 'composante_id_paysage',
 'etablissement_id_paysage']

[13]:

list_columns[120:]

[13]:

['list_com', 'tri', 'Établissement']

Quelques explorations¶

Quelques variables.

[14]:

eff = df[
    [
        "Session",
        "Code UAI de l'établissement",
        "Établissement",
        "Sélectivité",
        "Filière de formation très agrégée",
        "Capacité de l’établissement par formation",
        "Effectif total des candidats pour une formation",
        "Effectif total des candidats en phase principale",
        "Effectif des autres candidats en phase principale",
        "Effectif total des candidats en phase complémentaire",
        "Effectifs des autres candidats en phase complémentaire",
        "Effectif total des candidats classés par l’établissement en phase principale",
        "Effectif des candidats classés par l’établissement en phase complémentaire",
        "% d’admis ayant reçu leur proposition d’admission avant la fin de la procédure principale",
        "% d’admis dont filles",
        "Rang du dernier appelé du groupe 1",
        "Rang du dernier appelé du groupe 2",
        "Rang du dernier appelé du groupe 3",
        "Concours communs et banque d'épreuves",
        "Taux d’accès",
    ]
]

[15]:

TableReport(eff)

Processing column  20 / 20

[15]:

Column	Column name	dtype	Is sorted	Null values	Unique values	Mean	Std	Min	Median	Max
0	Session	Int64DType	True	0 (0.0%)	5 (< 0.1%)	2.02e+03	1.41	2,021	2,023	2,025
1	Code UAI de l'établissement	StringDtype	False	0 (0.0%)	4369 (6.3%)
2	Établissement	StringDtype	False	0 (0.0%)	4372 (6.3%)
3	Sélectivité	StringDtype	False	0 (0.0%)	2 (< 0.1%)
4	Filière de formation très agrégée	StringDtype	False	0 (0.0%)	11 (< 0.1%)
5	Capacité de l’établissement par formation	Int64DType	False	0 (0.0%)	472 (0.7%)	55.5	103.	0	30	3,400
6	Effectif total des candidats pour une formation	Int64DType	False	0 (0.0%)	5807 (8.4%)	889.	1.41e+03	0	401	19,404
7	Effectif total des candidats en phase principale	Int64DType	False	0 (0.0%)	5796 (8.4%)	863.	1.41e+03	0	369	19,404
8	Effectif des autres candidats en phase principale	Int64DType	False	0 (0.0%)	2617 (3.8%)	238.	461.	0	99	7,550
9	Effectif total des candidats en phase complémentaire	Int64DType	False	0 (0.0%)	693 (1.0%)	26.8	75.7	0	4	3,532
10	Effectifs des autres candidats en phase complémentaire	Int64DType	False	0 (0.0%)	468 (0.7%)	15.4	42.6	0	2	1,774
11	Effectif total des candidats classés par l’établissement en phase principale	Int64DType	False	0 (0.0%)	4964 (7.2%)	624.	1.15e+03	0	236	19,404
12	Effectif des candidats classés par l’établissement en phase complémentaire	Int64DType	False	0 (0.0%)	395 (0.6%)	11.7	34.7	0	1	1,828
13	% d’admis ayant reçu leur proposition d’admission avant la fin de la procédure principale	Float64DType	False	108 (0.2%)	1568 (2.3%)	87.0	15.5	0.00	91.0	100.
14	% d’admis dont filles	Float64DType	False	108 (0.2%)	938 (1.4%)	49.7	29.6	0.00	53.0	100.
15	Rang du dernier appelé du groupe 1	ObjectDType	False	1314 (1.9%)	6052 (8.7%)
16	Rang du dernier appelé du groupe 2	Float64DType	False	38642 (55.8%)	656 (0.9%)	70.2	88.3	1.00	45.0	1.64e+03
17	Rang du dernier appelé du groupe 3	Float64DType	False	50396 (72.8%)	443 (0.6%)	72.1	67.4	1.00	55.0	1.49e+03
18	Concours communs et banque d'épreuves	StringDtype	False	65734 (94.9%)	216 (0.3%)
19	Taux d’accès	ObjectDType	False	13767 (19.9%)	201 (0.3%)

Column 1	Column 2	Cramér's V	Pearson's Correlation
Effectif total des candidats pour une formation	Effectif total des candidats en phase principale	0.995	0.999
Code UAI de l'établissement	Établissement	0.910
Sélectivité	Filière de formation très agrégée	0.893
Effectif total des candidats en phase complémentaire	Effectifs des autres candidats en phase complémentaire	0.832	0.973
Effectif total des candidats en phase principale	Effectif total des candidats classés par l’établissement en phase principale	0.646	0.918
Effectif total des candidats pour une formation	Effectif total des candidats classés par l’établissement en phase principale	0.643	0.916
Session	Taux d’accès	0.531
Sélectivité	Rang du dernier appelé du groupe 2	0.475
Effectif total des candidats en phase principale	Effectif des autres candidats en phase principale	0.463	0.800
Effectif total des candidats pour une formation	Effectif des autres candidats en phase principale	0.461	0.799
Sélectivité	Taux d’accès	0.421
Sélectivité	Effectif des candidats classés par l’établissement en phase complémentaire	0.418
Filière de formation très agrégée	Rang du dernier appelé du groupe 2	0.383
Établissement	Sélectivité	0.382
Effectif des autres candidats en phase principale	Effectif total des candidats classés par l’établissement en phase principale	0.376	0.751
Code UAI de l'établissement	Sélectivité	0.359
Rang du dernier appelé du groupe 1	Taux d’accès	0.347
% d’admis ayant reçu leur proposition d’admission avant la fin de la procédure principale	% d’admis dont filles	0.347	0.0116
Capacité de l’établissement par formation	Effectif des candidats classés par l’établissement en phase complémentaire	0.342	0.389
Sélectivité	Rang du dernier appelé du groupe 3	0.331

Please enable javascript

[16]:

capa = df[
    [
        "Session",
        "Code UAI de l'établissement",
        "Établissement",
        "Filière de formation très agrégée",
        "Capacité de l’établissement par formation",
        "Effectif total des candidats en phase principale",
    ]
]
TableReport(capa.sort_values("Établissement"))

Processing column   6 / 6

[16]:

	Session	Code UAI de l'établissement	Établissement	Filière de formation très agrégée	Capacité de l’établissement par formation	Effectif total des candidats en phase principale
7,837	2,022	0693177D	3A, l-Ecole de management responsable et solidaire	Ecole de Commerce	170	148
11,731	2,023	0693177D	3A, l-Ecole de management responsable et solidaire	Ecole de Commerce	170	136
6,349	2,024	0693177D	3A, l’Ecole de management responsable et solidaire	Ecole de Commerce	170	81
13,541	2,025	0693177D	3A, l’Ecole de management responsable et solidaire	Ecole de Commerce	170	61
629	2,021	0783676X	3IS Institut International de l'Image et du Son	Autre formation	120	463

982	2,024	0593655C	École supérieure d’art et de communication de Cambrai	Autre formation	28	152
10,229	2,025	0593655C	École supérieure d’art et de communication de Cambrai	Autre formation	28	113
3,765	2,025	0640096G	éklore-ed - Campus Pau	Ecole de Commerce	180	452
8,408	2,025	0383471S	éklore-ed – CFA Grenoble – CCI Pau Béarn	Ecole de Commerce	30	56
8,376	2,025	0932858B	éklore-ed – CFA St Denis – CCI Pau Béarn	Ecole de Commerce	30	36

Column	Column name	dtype	Is sorted	Unique values	Mean	Std	Min	Median	Max
0	Session	Int64DType	False	5 (< 0.1%)	2.02e+03	1.41	2,021	2,023	2,025
1	Code UAI de l'établissement	StringDtype	False	4369 (6.3%)
2	Établissement	StringDtype	True	4372 (6.3%)
3	Filière de formation très agrégée	StringDtype	False	11 (< 0.1%)
4	Capacité de l’établissement par formation	Int64DType	False	472 (0.7%)	55.5	103.	0	30	3,400
5	Effectif total des candidats en phase principale	Int64DType	False	5796 (8.4%)	863.	1.41e+03	0	369	19,404

Column 1	Column 2	Cramér's V	Pearson's Correlation
Code UAI de l'établissement	Établissement	0.966
Filière de formation très agrégée	Effectif total des candidats en phase principale	0.236
Capacité de l’établissement par formation	Effectif total des candidats en phase principale	0.198	0.404
Établissement	Filière de formation très agrégée	0.144
Code UAI de l'établissement	Filière de formation très agrégée	0.143
Code UAI de l'établissement	Effectif total des candidats en phase principale	0.119
Filière de formation très agrégée	Capacité de l’établissement par formation	0.103
Établissement	Effectif total des candidats en phase principale	0.0960
Code UAI de l'établissement	Capacité de l’établissement par formation	0.0925
Établissement	Capacité de l’établissement par formation	0.0812
Session	Filière de formation très agrégée	0.0642
Session	Effectif total des candidats en phase principale	0.0539	-0.00453
Session	Code UAI de l'établissement	0.0536
Session	Établissement	0.0514
Session	Capacité de l’établissement par formation	0.0393	-0.0293

Please enable javascript

[17]:

piv = capa.pivot_table(
    index=[
        "Code UAI de l'établissement",
        "Établissement",
        "Filière de formation très agrégée",
    ],
    columns=["Session"],
    values=["Capacité de l’établissement par formation"],
)
TableReport(piv)

Processing column   5 / 5

[17]:

	Capacité de l’établissement par formation
0010001W	Lycée professionnel Alexandre Berard	BTS	15.0	15.0	17.0
0010006B	Lycée Saint-Exupery	BTS	24.0	24.0	26.0	10.0	21.0
Licence					24.0
0010013J	Lycée Lalande	CPGE	48.0	45.0	45.0	47.5	48.0
0010014K	Lycée Edgar Quinet	BTS	30.3	30.3	30.3	28.7	28.0

T593500B	ESME Sudria Bordeaux	Ecole d'Ingénieur	70.0	65.0	70.0	75.0
T942095L	EPITA Lyon	Ecole d'Ingénieur	85.0	85.0	110.	71.0
T942095R	EPITA Rennes	Ecole d'Ingénieur	70.0	70.0	70.0	70.0
T942095S	EPITA Strasbourg	Ecole d'Ingénieur	60.0	70.0	70.0	70.0
T942095T	EPITA Toulouse	Ecole d'Ingénieur	70.0	75.0	90.0	90.0

Column	Column name	dtype	Is sorted	Null values	Unique values	Mean	Std	Min	Median	Max
0	('Capacité de l’établissement par formation', np.int64(2021))	Float64DType	False	1384 (22.0%)	816 (13.0%)	44.0	63.7	2.00	30.0	2.24e+03
1	('Capacité de l’établissement par formation', np.int64(2022))	Float64DType	False	1366 (21.8%)	826 (13.2%)	43.9	64.0	1.00	30.0	2.24e+03
2	('Capacité de l’établissement par formation', np.int64(2023))	Float64DType	False	1282 (20.4%)	842 (13.4%)	43.8	65.2	1.33	30.0	2.24e+03
3	('Capacité de l’établissement par formation', np.int64(2024))	Float64DType	False	1238 (19.7%)	834 (13.3%)	43.0	62.1	1.67	30.0	2.24e+03
4	('Capacité de l’établissement par formation', np.int64(2025))	Float64DType	False	1168 (18.6%)	849 (13.5%)	42.9	61.8	1.25	30.0	2.24e+03

Column 1	Column 2	Cramér's V	Pearson's Correlation
('Capacité de l’établissement par formation', 2021)	('Capacité de l’établissement par formation', 2022)	0.926	0.994
('Capacité de l’établissement par formation', 2024)	('Capacité de l’établissement par formation', 2025)	0.864	0.995
('Capacité de l’établissement par formation', 2022)	('Capacité de l’établissement par formation', 2023)	0.823	0.991
('Capacité de l’établissement par formation', 2021)	('Capacité de l’établissement par formation', 2023)	0.766	0.982
('Capacité de l’établissement par formation', 2023)	('Capacité de l’établissement par formation', 2024)	0.764	0.960
('Capacité de l’établissement par formation', 2022)	('Capacité de l’établissement par formation', 2024)	0.714	0.943
('Capacité de l’établissement par formation', 2021)	('Capacité de l’établissement par formation', 2024)	0.694	0.927
('Capacité de l’établissement par formation', 2023)	('Capacité de l’établissement par formation', 2025)	0.693	0.973
('Capacité de l’établissement par formation', 2022)	('Capacité de l’établissement par formation', 2025)	0.658	0.969
('Capacité de l’établissement par formation', 2021)	('Capacité de l’établissement par formation', 2025)	0.651	0.961

Please enable javascript

[18]:

candidats = df[
    [
        "Session",
        "Code UAI de l'établissement",
        "Établissement",
        "Filière de formation très agrégée",
        "Effectif total des candidats pour une formation",
        "Capacité de l’établissement par formation",
    ]
]
TableReport(candidats.sort_values("Établissement"))

Processing column   6 / 6

[18]:

	Session	Code UAI de l'établissement	Établissement	Filière de formation très agrégée	Effectif total des candidats pour une formation	Capacité de l’établissement par formation
7,837	2,022	0693177D	3A, l-Ecole de management responsable et solidaire	Ecole de Commerce	158	170
11,731	2,023	0693177D	3A, l-Ecole de management responsable et solidaire	Ecole de Commerce	145	170
6,349	2,024	0693177D	3A, l’Ecole de management responsable et solidaire	Ecole de Commerce	89	170
13,541	2,025	0693177D	3A, l’Ecole de management responsable et solidaire	Ecole de Commerce	77	170
629	2,021	0783676X	3IS Institut International de l'Image et du Son	Autre formation	503	120

982	2,024	0593655C	École supérieure d’art et de communication de Cambrai	Autre formation	152	28
10,229	2,025	0593655C	École supérieure d’art et de communication de Cambrai	Autre formation	113	28
3,765	2,025	0640096G	éklore-ed - Campus Pau	Ecole de Commerce	490	180
8,408	2,025	0383471S	éklore-ed – CFA Grenoble – CCI Pau Béarn	Ecole de Commerce	63	30
8,376	2,025	0932858B	éklore-ed – CFA St Denis – CCI Pau Béarn	Ecole de Commerce	51	30

Column	Column name	dtype	Is sorted	Unique values	Mean	Std	Min	Median	Max
0	Session	Int64DType	False	5 (< 0.1%)	2.02e+03	1.41	2,021	2,023	2,025
1	Code UAI de l'établissement	StringDtype	False	4369 (6.3%)
2	Établissement	StringDtype	True	4372 (6.3%)
3	Filière de formation très agrégée	StringDtype	False	11 (< 0.1%)
4	Effectif total des candidats pour une formation	Int64DType	False	5807 (8.4%)	889.	1.41e+03	0	401	19,404
5	Capacité de l’établissement par formation	Int64DType	False	472 (0.7%)	55.5	103.	0	30	3,400

Column 1	Column 2	Cramér's V	Pearson's Correlation
Code UAI de l'établissement	Établissement	0.966
Filière de formation très agrégée	Effectif total des candidats pour une formation	0.235
Effectif total des candidats pour une formation	Capacité de l’établissement par formation	0.207	0.418
Établissement	Filière de formation très agrégée	0.144
Code UAI de l'établissement	Filière de formation très agrégée	0.143
Code UAI de l'établissement	Effectif total des candidats pour une formation	0.120
Filière de formation très agrégée	Capacité de l’établissement par formation	0.103
Établissement	Effectif total des candidats pour une formation	0.0972
Code UAI de l'établissement	Capacité de l’établissement par formation	0.0925
Établissement	Capacité de l’établissement par formation	0.0812
Session	Filière de formation très agrégée	0.0642
Session	Code UAI de l'établissement	0.0536
Session	Effectif total des candidats pour une formation	0.0526	-0.00468
Session	Établissement	0.0514
Session	Capacité de l’établissement par formation	0.0393	-0.0293

Please enable javascript

[19]:

piv = candidats.pivot_table(
    index=[
        "Code UAI de l'établissement",
        "Établissement",
        "Filière de formation très agrégée",
    ],
    columns=["Session"],
    values=["Effectif total des candidats pour une formation"],
)
TableReport(piv)

Processing column   5 / 5

[19]:

	Effectif total des candidats pour une formation
0010001W	Lycée professionnel Alexandre Berard	BTS	164.	545.	172.
0010006B	Lycée Saint-Exupery	BTS	569.	522.	735.	289.	364.
Licence					381.
0010013J	Lycée Lalande	CPGE	602.	1.19e+03	836.	1.17e+03	1.11e+03
0010014K	Lycée Edgar Quinet	BTS	577.	472.	650.	406.	417.

T593500B	ESME Sudria Bordeaux	Ecole d'Ingénieur	2.26e+03	1.96e+03	2.12e+03	2.14e+03
T942095L	EPITA Lyon	Ecole d'Ingénieur	2.34e+03	2.09e+03	2.10e+03	1.68e+03
T942095R	EPITA Rennes	Ecole d'Ingénieur	1.90e+03	1.71e+03	1.72e+03	1.64e+03
T942095S	EPITA Strasbourg	Ecole d'Ingénieur	1.80e+03	1.64e+03	1.66e+03	1.63e+03
T942095T	EPITA Toulouse	Ecole d'Ingénieur	2.17e+03	1.88e+03	1.92e+03	1.89e+03

Column	Column name	dtype	Is sorted	Null values	Unique values	Mean	Std	Min	Median	Max
0	('Effectif total des candidats pour une formation', np.int64(2021))	Float64DType	False	1384 (22.0%)	2947 (46.9%)	920.	1.53e+03	0.00	394.	1.38e+04
1	('Effectif total des candidats pour une formation', np.int64(2022))	Float64DType	False	1366 (21.8%)	2929 (46.7%)	905.	1.46e+03	1.00	382.	1.20e+04
2	('Effectif total des candidats pour une formation', np.int64(2023))	Float64DType	False	1282 (20.4%)	3018 (48.1%)	885.	1.41e+03	0.00	401.	1.32e+04
3	('Effectif total des candidats pour une formation', np.int64(2024))	Float64DType	False	1238 (19.7%)	2904 (46.3%)	861.	1.39e+03	0.00	349.	1.36e+04
4	('Effectif total des candidats pour une formation', np.int64(2025))	Float64DType	False	1168 (18.6%)	3038 (48.4%)	931.	1.57e+03	1.00	350.	1.38e+04

Column 1	Column 2	Cramér's V	Pearson's Correlation
('Effectif total des candidats pour une formation', 2021)	('Effectif total des candidats pour une formation', 2022)	0.652	0.983
('Effectif total des candidats pour une formation', 2021)	('Effectif total des candidats pour une formation', 2023)	0.618	0.971
('Effectif total des candidats pour une formation', 2022)	('Effectif total des candidats pour une formation', 2023)	0.612	0.980
('Effectif total des candidats pour une formation', 2023)	('Effectif total des candidats pour une formation', 2024)	0.597	0.977
('Effectif total des candidats pour une formation', 2024)	('Effectif total des candidats pour une formation', 2025)	0.595	0.977
('Effectif total des candidats pour une formation', 2023)	('Effectif total des candidats pour une formation', 2025)	0.542	0.975
('Effectif total des candidats pour une formation', 2022)	('Effectif total des candidats pour une formation', 2024)	0.478	0.957
('Effectif total des candidats pour une formation', 2022)	('Effectif total des candidats pour une formation', 2025)	0.463	0.961
('Effectif total des candidats pour une formation', 2021)	('Effectif total des candidats pour une formation', 2025)	0.425	0.950
('Effectif total des candidats pour une formation', 2021)	('Effectif total des candidats pour une formation', 2024)	0.405	0.941

Please enable javascript

Problème : prédire Effectif total des candidats pour une formation¶

On utilise une base réduite pour essayer de prédire la variable Effectif total des candidats pour une formation.

[83]:

variables = [
    "Région de l’établissement",
    "Session",
    "Statut de l’établissement de la filière de formation (public, privé…)",
    "Sélectivité",
    "Code UAI de l'établissement",
    "Établissement",
    "Filière de formation détaillée bis",
    "Filière de formation très agrégée",
    "Filière de formation.1",
    "Capacité de l’établissement par formation",
    "Effectif total des candidats pour une formation",
    "Académie de l’établissement",
    "Code départemental de l’établissement",
    "Commune de l’établissement",
    "Concours communs et banque d'épreuves",
]
table = df[variables]
TableReport(table)

Processing column  15 / 15

[83]:

	Région de l’établissement	Session	Statut de l’établissement de la filière de formation (public, privé…)	Sélectivité	Code UAI de l'établissement	Établissement	Filière de formation détaillée bis	Filière de formation très agrégée	Filière de formation.1	Capacité de l’établissement par formation	Effectif total des candidats pour une formation	Académie de l’établissement	Code départemental de l’établissement	Commune de l’établissement	Concours communs et banque d'épreuves
0	Ile-de-France	2,021	Privé sous contrat d'association	formation sélective	0932019P	ESIEE Paris	Formation d'ingénieur Bac + 5	Ecole d'Ingénieur	Formation d'ingénieur Bac + 5 - Bacs généraux	220	3,462	Créteil	93	Noisy-le-Grand	Concours Puissance Alpha
1	Ile-de-France	2,021	Privé enseignement supérieur	formation sélective	0920674H	EPF Sceaux	Formation d'ingénieur Bac + 5	Ecole d'Ingénieur	Formation d'ingénieur Bac + 5 - Bac Série générale	20	94	Versailles	92	Sceaux	EPF Sceaux
2	Occitanie	2,021	Privé enseignement supérieur	formation sélective	0315550I	IPSA Toulouse	Formation d'ingénieur Bac + 5	Ecole d'Ingénieur	Formation d'ingénieur Bac + 5 - Bac Série générale	120	2,531	Toulouse	31	Toulouse	Concours Advance
3	Hauts-de-France	2,021	Privé sous contrat d'association	formation sélective	0021874B	Lycée Saint Remy	Communication	BTS	BTS - Services - Communication	38	357	Amiens	02	Soissons
4	Provence Alpes Côte d'Azur	2,021	Public	formation sélective	0060029Z	Lycée du Parc Imperial	Commerce International	BTS	BTS - Services - Commerce International	35	1,742	Nice	06	Nice

14,247	Normandie	2,025	Public	formation sélective	0760058A	Lycée Schuman Perret	Conception et Réalisation de Systèmes Automatiques	BTS	BTS - Production	30	241	Normandie	76	Le Havre
14,248	Normandie	2,025	Public	formation sélective	0760090K	Lycée Pierre Corneille	MPSI	CPGE	Classe préparatoire scientifique	96	1,981	Normandie	76	Rouen
14,249	Normandie	2,025	Public	formation sélective	0760091L	Lycée Jeanne D'Arc	Lettres	CPGE	Classe préparatoire littéraire	96	1,106	Normandie	76	Rouen
14,250	Normandie	2,025	Public	formation sélective	0760096S	Lycée Gustave Flaubert	Support à l'action managériale	BTS	BTS - Services	24	545	Normandie	76	Rouen
14,251	Normandie	2,025	Public	formation sélective	0760109F	Lycée Les Bruyères	ECT - Option technologique	CPGE	Classe préparatoire économique et commerciale	45	393	Normandie	76	Sotteville-lès-Rouen

Column	Column name	dtype	Is sorted	Null values	Unique values	Mean	Std	Min	Median	Max
0	Région de l’établissement	StringDtype	False	188 (0.3%)	28 (< 0.1%)
1	Session	Int64DType	True	0 (0.0%)	5 (< 0.1%)	2.02e+03	1.41	2,021	2,023	2,025
2	Statut de l’établissement de la filière de formation (public, privé…)	StringDtype	False	0 (0.0%)	4 (< 0.1%)
3	Sélectivité	StringDtype	False	0 (0.0%)	2 (< 0.1%)
4	Code UAI de l'établissement	StringDtype	False	0 (0.0%)	4369 (6.3%)
5	Établissement	StringDtype	False	0 (0.0%)	4372 (6.3%)
6	Filière de formation détaillée bis	StringDtype	False	0 (0.0%)	668 (1.0%)
7	Filière de formation très agrégée	StringDtype	False	0 (0.0%)	11 (< 0.1%)
8	Filière de formation.1	StringDtype	False	0 (0.0%)	3503 (5.1%)
9	Capacité de l’établissement par formation	Int64DType	False	0 (0.0%)	472 (0.7%)	55.5	103.	0	30	3,400
10	Effectif total des candidats pour une formation	Int64DType	False	0 (0.0%)	5807 (8.4%)	889.	1.41e+03	0	401	19,404
11	Académie de l’établissement	StringDtype	False	0 (0.0%)	34 (< 0.1%)
12	Code départemental de l’établissement	ObjectDType	False	72 (0.1%)	209 (0.3%)
13	Commune de l’établissement	StringDtype	False	0 (0.0%)	1331 (1.9%)
14	Concours communs et banque d'épreuves	StringDtype	False	65734 (94.9%)	216 (0.3%)

Column 1	Column 2	Cramér's V
Code UAI de l'établissement	Établissement	0.910
Sélectivité	Filière de formation très agrégée	0.893
Sélectivité	Filière de formation.1	0.791
Région de l’établissement	Académie de l’établissement	0.669
Filière de formation détaillée bis	Filière de formation très agrégée	0.592
Académie de l’établissement	Code départemental de l’établissement	0.583
Filière de formation très agrégée	Filière de formation.1	0.571
Filière de formation détaillée bis	Filière de formation.1	0.523
Code départemental de l’établissement	Commune de l’établissement	0.520
Sélectivité	Filière de formation détaillée bis	0.489
Code UAI de l'établissement	Commune de l’établissement	0.452
Établissement	Commune de l’établissement	0.421
Région de l’établissement	Code départemental de l’établissement	0.412
Académie de l’établissement	Commune de l’établissement	0.409
Sélectivité	Établissement	0.382
Statut de l’établissement de la filière de formation (public, privé…)	Filière de formation très agrégée	0.377
Sélectivité	Code UAI de l'établissement	0.359
Région de l’établissement	Commune de l’établissement	0.351
Statut de l’établissement de la filière de formation (public, privé…)	Concours communs et banque d'épreuves	0.322
Filière de formation très agrégée	Concours communs et banque d'épreuves	0.319

Please enable javascript

[84]:

keys = [
    "Région de l’établissement",
    "Session",
    "Statut de l’établissement de la filière de formation (public, privé…)",
    "Sélectivité",
    "Code UAI de l'établissement",
    "Établissement",
    "Filière de formation détaillée bis",
    "Filière de formation très agrégée",
    "Filière de formation.1",
    "Académie de l’établissement",
    "Code départemental de l’établissement",
    "Commune de l’établissement",
    "Concours communs et banque d'épreuves",
]
cible = "Effectif total des candidats pour une formation"
groups = df[[*keys, cible]].groupby(keys).count()
filtered = groups[groups[cible] > 1]
TableReport(filtered)

Processing column   1 / 1

[84]:

Région de l’établissement	Session	Statut de l’établissement de la filière de formation (public, privé…)	Sélectivité	Code UAI de l'établissement	Établissement	Filière de formation détaillée bis	Filière de formation très agrégée	Filière de formation.1	Académie de l’établissement	Code départemental de l’établissement	Commune de l’établissement	Concours communs et banque d'épreuves	Effectif total des candidats pour une formation
Auvergne-Rhône-Alpes	2,021	Privé enseignement supérieur	formation sélective	0693448Y	INSEEC Lyon	Formation des écoles de commerce et de management Bac + 4	Ecole de Commerce	Formation des écoles de commerce et de management Bac + 4	Lyon	69	Lyon 7e Arrondissement	Concours PASS	2
Privé hors contrat	formation sélective	0693453D	Institut Paul Bocuse	Formation des écoles supérieures de cuisine Bac +3	Autre formation	Formation des écoles supérieures de cuisine Bac +3 - Bachelor Management International des Arts Culinaires	Lyon	69	Ecully	Institut Paul Bocuse	2
Formation des écoles supérieures de cuisine Bac +4	Autre formation	Formation des écoles supérieures de cuisine Bac +4 - Bachelor (Hons.) Management International de l'Hôtellerie-Restauration	Lyon	69	Ecully	Institut Paul Bocuse	2
Privé sous contrat d'association	formation sélective	0690194L	ECAM Lyon	Formation d'ingénieur Bac + 5	Ecole d'Ingénieur	Formation d'ingénieur Bac + 5 - Série générale	Lyon	69	Lyon 5e Arrondissement	ECAM-ECAM LaSalle	3
0690519P	Lycée Notre Dame Des Minimes	Formation d'ingénieur Bac + 5	Ecole d'Ingénieur	Formation d'ingénieur Bac + 5 - Bac +1/+2	Lyon	69	Lyon 5e Arrondissement	Concours Puissance Alpha	2

Provence-Alpes-Côte d’Azur	2,022	Public	formation sélective	0133479L	IUT Aix-Marseille - Site de Marseille Luminy	Formation d'ingénieur Bac + 5	Ecole d'Ingénieur	Formations des écoles d'ingénieurs	Aix-Marseille	13	Marseille	Concours Geipi Polytech	5
Réunion	2,024	Privé sous contrat d'association	formation sélective	9741255W	Lycée Catholique St Charles	Formation d'ingénieur Bac + 5	Ecole d'Ingénieur	Formations des écoles d'ingénieurs	La Réunion	974.	Saint-Pierre	Concours Puissance Alpha	3
Public	formation sélective	9741394X	ESIROI La Réunion	Formation d'ingénieur Bac + 5	Ecole d'Ingénieur	Formations des écoles d'ingénieurs	La Réunion	974.	Saint-Pierre	Concours Geipi Polytech	3
2,025	Privé sous contrat d'association	formation sélective	9741255W	Lycée Catholique St Charles	Formation d'ingénieur Bac + 5	Ecole d'Ingénieur	Formations des écoles d'ingénieurs	La Réunion	974	Saint-Pierre	Concours Puissance Alpha	7
Public	formation sélective	9741394X	ESIROI La Réunion	Formation d'ingénieur Bac + 5	Ecole d'Ingénieur	Formations des écoles d'ingénieurs	La Réunion	974	Saint-Pierre	Concours Geipi Polytech	4

Column	Column name	dtype	Is sorted	Null values	Unique values	Mean	Std	Min	Median	Max
0	Effectif total des candidats pour une formation	Int64DType	False	0 (0.0%)	12 (1.9%)	3.02	1.75	2	2	14

Please enable javascript

[71]:

mask = df.duplicated(subset=keys, keep=False)
table = df[~mask][[*keys, cible]]
table.dtypes

[71]:

Région de l’établissement                                                   str
Session                                                                   int64
Statut de l’établissement de la filière de formation (public, privé…)       str
Sélectivité                                                                 str
Code UAI de l'établissement                                                 str
Établissement                                                               str
Filière de formation détaillée bis                                          str
Filière de formation très agrégée                                           str
Filière de formation.1                                                      str
Académie de l’établissement                                                 str
Code départemental de l’établissement                                    object
Commune de l’établissement                                                  str
Concours communs et banque d'épreuves                                       str
Effectif total des candidats pour une formation                           int64
dtype: object

[72]:

table.shape

[72]:

(56990, 14)

Le point de départ : l’année précédente pour point de départ¶

[85]:

unique_keys = [
    "Code UAI de l'établissement",
    "Établissement",
    "Région de l’établissement",
    "Session",
    "Statut de l’établissement de la filière de formation (public, privé…)",
    "Sélectivité",
    "Filière de formation détaillée bis",
    "Filière de formation très agrégée",
    "Filière de formation.1",
    "Capacité de l’établissement par formation",
]

f2025 = table["Session"] == 2025
f2024 = table["Session"] == 2024
ftwo = table[f2025 | f2024]
piv = (
    pandas.pivot_table(
        ftwo,
        index=[c for c in unique_keys if c != "Session"],
        columns="Session",
        values=cible,
    )
    .dropna(axis=0)
    .sort_index()
)
piv

[85]:

								Session	2024	2025
Code UAI de l'établissement	Établissement	Région de l’établissement	Statut de l’établissement de la filière de formation (public, privé…)	Sélectivité	Filière de formation détaillée bis	Filière de formation très agrégée	Filière de formation.1	Capacité de l’établissement par formation
0010013J	Lycée Lalande	Auvergne-Rhône-Alpes	Public	formation sélective	PCSI	CPGE	Classe préparatoire scientifique	48	937.0	957.0
0010014K	Lycée Edgar Quinet	Auvergne-Rhône-Alpes	Public	formation sélective	Collaborateur juriste notarial	BTS	BTS - Services	24	515.0	408.0
					ECG - Mathématiques appliquées + ESH	CPGE	Classe préparatoire économique et commerciale	25	425.0	457.0
					ECG - Mathématiques appliquées + HGG	CPGE	Classe préparatoire économique et commerciale	15	321.0	334.0
					Gestion de la PME	BTS	BTS - Services	30	411.0	512.0
...	...	...	...	...	...	...	...	...	...	...
9760363R	Lycée Cité scolaire de Bandrélé	Mayotte	Public	formation sélective	Economie sociale familiale	BTS	BTS - Services	36	1197.0	1497.0
9760370Y	Lycée des Lumières	Mayotte	Public	formation sélective	Assistance, conseil, vente à distance	Autre formation	Certificat de Spécialisation	29	426.0	636.0
					Commerce International	BTS	BTS - Services	24	1237.0	1172.0
					Gestion de la PME	BTS	BTS - Services	35	1585.0	1962.0
					Support à l'action managériale	BTS	BTS - Services	35	1123.0	1080.0

9001 rows × 2 columns

[86]:

from sklearn.metrics import mean_absolute_error

mean_absolute_error(piv[2025], piv[2024])

[86]:

155.24428226509383

Un model simple¶

[90]:

X, y = table.drop(cible, axis=1), table[cible]

train_test = X["Session"] < 2025

drop = ["Session", "Code UAI de l'établissement", "Établissement"]

train_X = X[train_test].drop(drop, axis=1)
train_y = y[train_test]
test_X = X[train_test].drop(drop, axis=1)
test_y = y[train_test]

[91]:

train_X.shape

[91]:

(54988, 11)

[92]:

train_X.describe()

[92]:

	Capacité de l’établissement par formation
count	54988.000000
mean	55.915709
std	103.765073
min	0.000000
25%	20.000000
50%	31.000000
75%	50.000000
max	3400.000000

[ ]:

num_cols = ["Capacité de l’établissement par formation"]
cat_cols = [c for c in unique_keys if c not in num_cols]

from sklearn.pipeline import Pipeline
from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder, StandardScaler
from sklearn.ensemble import HistGradientBoostingRegressor

model = Pipeline(
    [
        (
            "preprocessing",
            ColumnTransformer(
                [
                    ("num", StandardScaler(), num_cols),
                    ("cats", OneHotEncoder(handle_unknown="ignore"), cat_cols),
                ]
            ),
        ),
        ("regressor", HistGradientBoostingRegressor()),
    ]
)
model.fit(train_X, train_y)

/tmp/ipykernel_1056/1981098955.py:18: Pandas4Warning: For backward compatibility, 'str' dtypes are included by select_dtypes when 'object' dtype is specified. This behavior is deprecated and will be removed in a future version. Explicitly pass 'str' to `include` to select them, or to `exclude` to remove them and silence this warning.
See https://pandas.pydata.org/docs/user_guide/migration-3-strings.html#string-migration-select-dtypes for details on how to write code that works with pandas 2 and 3.
  train_X.select_dtypes(include=["object", "category"]).columns

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
Cell In[95], line 24
      7 from sklearn.ensemble import HistGradientBoostingRegressor
      9 model = Pipeline([
     10     ("preprocessing",
     11      ColumnTransformer([
   (...)     22     ("regressor", HistGradientBoostingRegressor())
     23 ])
---> 24 model.fit(train_X, train_y)

File ~/vv/this312/lib/python3.12/site-packages/sklearn/base.py:1336, in _fit_context.<locals>.decorator.<locals>.wrapper(estimator, *args, **kwargs)
   1329     estimator._validate_params()
   1331 with config_context(
   1332     skip_parameter_validation=(
   1333         prefer_skip_nested_validation or global_skip_validation
   1334     )
   1335 ):
-> 1336     return fit_method(estimator, *args, **kwargs)

File ~/vv/this312/lib/python3.12/site-packages/sklearn/pipeline.py:613, in Pipeline.fit(self, X, y, **params)
    606     raise ValueError(
    607         "The `transform_input` parameter can only be set if metadata "
    608         "routing is enabled. You can enable metadata routing using "
    609         "`sklearn.set_config(enable_metadata_routing=True)`."
    610     )
    612 routed_params = self._check_method_params(method="fit", props=params)
--> 613 Xt = self._fit(X, y, routed_params, raw_params=params)
    614 with _print_elapsed_time("Pipeline", self._log_message(len(self.steps) - 1)):
    615     if self._final_estimator != "passthrough":

File ~/vv/this312/lib/python3.12/site-packages/sklearn/pipeline.py:547, in Pipeline._fit(self, X, y, routed_params, raw_params)
    540 # Fit or load from cache the current transformer
    541 step_params = self._get_metadata_for_step(
    542     step_idx=step_idx,
    543     step_params=routed_params[name],
    544     all_params=raw_params,
    545 )
--> 547 X, fitted_transformer = fit_transform_one_cached(
    548     cloned_transformer,
    549     X,
    550     y,
    551     weight=None,
    552     message_clsname="Pipeline",
    553     message=self._log_message(step_idx),
    554     params=step_params,
    555 )
    556 # Replace the transformer of the step with the fitted
    557 # transformer. This is necessary when loading the transformer
    558 # from the cache.
    559 self.steps[step_idx] = (name, fitted_transformer)

File ~/vv/this312/lib/python3.12/site-packages/joblib/memory.py:326, in NotMemorizedFunc.__call__(self, *args, **kwargs)
    325 def __call__(self, *args, **kwargs):
--> 326     return self.func(*args, **kwargs)

File ~/vv/this312/lib/python3.12/site-packages/sklearn/pipeline.py:1484, in _fit_transform_one(transformer, X, y, weight, message_clsname, message, params)
   1482 with _print_elapsed_time(message_clsname, message):
   1483     if hasattr(transformer, "fit_transform"):
-> 1484         res = transformer.fit_transform(X, y, **params.get("fit_transform", {}))
   1485     else:
   1486         res = transformer.fit(X, y, **params.get("fit", {})).transform(
   1487             X, **params.get("transform", {})
   1488         )

File ~/vv/this312/lib/python3.12/site-packages/sklearn/utils/_set_output.py:316, in _wrap_method_output.<locals>.wrapped(self, X, *args, **kwargs)
    314 @wraps(f)
    315 def wrapped(self, X, *args, **kwargs):
--> 316     data_to_wrap = f(self, X, *args, **kwargs)
    317     if isinstance(data_to_wrap, tuple):
    318         # only wrap the first output for cross decomposition
    319         return_tuple = (
    320             _wrap_data_with_container(method, data_to_wrap[0], X, self),
    321             *data_to_wrap[1:],
    322         )

File ~/vv/this312/lib/python3.12/site-packages/sklearn/base.py:1336, in _fit_context.<locals>.decorator.<locals>.wrapper(estimator, *args, **kwargs)
   1329     estimator._validate_params()
   1331 with config_context(
   1332     skip_parameter_validation=(
   1333         prefer_skip_nested_validation or global_skip_validation
   1334     )
   1335 ):
-> 1336     return fit_method(estimator, *args, **kwargs)

File ~/vv/this312/lib/python3.12/site-packages/sklearn/compose/_column_transformer.py:988, in ColumnTransformer.fit_transform(self, X, y, **params)
    986 X = _check_X(X)
    987 # set n_features_in_ attribute
--> 988 self._validate_transformers()
    989 n_samples = _num_samples(X)
    991 self._validate_column_callables(X)

File ~/vv/this312/lib/python3.12/site-packages/sklearn/compose/_column_transformer.py:513, in ColumnTransformer._validate_transformers(self)
    510 names, transformers, _ = zip(*self.transformers)
    512 # validate names
--> 513 self._validate_names(names)
    515 # validate estimators
    516 for t in transformers:

File ~/vv/this312/lib/python3.12/site-packages/sklearn/utils/metaestimators.py:88, in _BaseComposition._validate_names(self, names)
     87 def _validate_names(self, names):
---> 88     if len(set(names)) != len(names):
     89         raise ValueError("Names provided are not unique: {0!r}".format(list(names)))
     90     invalid_names = set(names).intersection(self.get_params(deep=False))

TypeError: unhashable type: 'list'

[ ]:

Notebook on github