SABER – APPROCHE SYSTÉMIQUE POUR DE MEILLEURS RÉSULTATS ÉDUCATIFS ÉVALUATION DES ÉLÈVES 1 68235 L’essentiel en matière de système d’évaluation des élèves: Document-cadre Marguerite Clarke SABER – APPROCHE SYSTÉMIQUE POUR DE MEILLEURS RÉSULTATS ÉDUCATIFS ÉVALUATION DES ÉLÈVES 1ȱ L’essentielȱenȱmatièreȱdeȱ systèmeȱd’évaluationȱdesȱ élèves:ȱDocumentȬcadreȱ MargueriteȱClarkeȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ȱ ©ȱ2012ȱLaȱBanqueȱinternationaleȱpourȱlaȱreconstructionȱetȱleȱ développementȱ/ȱLaȱBanqueȱmondialeȱ 1818ȱHȱStreetȱNWȱ WashingtonȱDCȱ20433ȱ Téléphoneȱ:ȱ1Ȭ202Ȭ473Ȭ1000ȱ Internetȱ:ȱwww.worldbank.orgȱ ȱ 1ȱ2ȱ3ȱ4ȱ 15ȱ14ȱ13ȱ12ȱȱ ȱ CeȱtravailȱestȱleȱproduitȱduȱpersonnelȱdeȱlaȱBanqueȱetȱdeȱcontributionsȱ extérieures.ȱLesȱobservations,ȱinterprétationsȱetȱconclusionsȱprésentéesȱ dansȱceȱtravailȱneȱreflètentȱpasȱnécessairementȱlesȱvuesȱdeȱlaȱBanqueȱ mondiale,ȱdesȱmembresȱdeȱsonȱConseilȱd’Administrationȱouȱdesȱ gouvernementsȱqu’ilsȱreprésentent.ȱ LaȱBanqueȱmondialeȱneȱgarantitȱpasȱl’exactitudeȱdesȱdonnéesȱ figurantȱdansȱlaȱprésenteȱpublication.ȱLesȱfrontières,ȱcouleurs,ȱ dénominationsȱetȱautresȱinformationsȱfigurantȱsurȱlesȱcartesȱcontenuesȱ dansȱlaȱprésenteȱpublicationȱn’impliquentȱdeȱlaȱpartȱdeȱlaȱBanqueȱ mondialeȱaucunȱjugementȱquantȱauȱstatutȱjuridiqueȱd’unȱterritoireȱniȱ l’approbationȱouȱl’acceptationȱdeȱcesȱfrontières.ȱȱ ȱ Droitsȱetȱautorisationsȱ Leȱcontenuȱdeȱceȱdocumentȱestȱprotégéȱparȱlaȱloiȱsurȱlesȱdroitsȱd’auteur.ȱ LaȱBanqueȱmondialeȱencourageȱlaȱdiffusionȱdeȱsesȱétudesȱetȱaccordeȱ doncȱlȇautorisationȱdeȱreproduireȱceȱdocumentȱtotalementȱouȱ partiellementȱàȱdesȱfinsȱnonȱcommerciales,ȱsousȱréserveȱdeȱmentionȱ complèteȱdeȱlaȱsource.ȱȱ Touteȱdemandeȱconcernantȱlesȱdroitsȱetȱautorisations,ȱyȱcomprisȱlesȱ droitsȱdérivés,ȱdevraȱêtreȱadresséeȱauȱBureauȱdesȱPublications,ȱlaȱBanqueȱ mondiale,ȱ1818ȱHȱStreetȱNW,ȱWashington,ȱDCȱ20433,ȱUSAȱ;ȱfaxȱ:ȱ202Ȭ522Ȭ 2422ȱ;ȱeȬmailȱ:ȱpubrights@worldbank.org.ȱ ȱ Conceptionȱdeȱlaȱcouvertureȱ:ȱPatriciaȱHord.ȱGraphikȱDesign,ȱ Alexandria,ȱVAȱȱ ȱ ȱ Tableȱdesȱmatièresȱ Àȱproposȱdeȱcetteȱsérieȱ ......................................................................................ȱv Àȱproposȱdeȱl’auteurȱ......................................................................................ȱvii Remerciementsȱ..................................................................................................ȱ ix xi Résuméȱ...............................................................................................................ȱ Introductionȱ ........................................................................................................ȱ1 Théorieȱetȱdonnéesȱempiriquesȱsurȱlȇévaluationȱdesȱélèvesȱ .........................ȱ4 Cadreȱpourȱlesȱsystèmesȱdȇévaluationȱdesȱélèvesȱ.........................................ȱ9 Formationȱduȱcadreȱ.........................................................................................ȱ17 Niveauxȱdeȱdéveloppementȱ...........................................................................ȱ19 Conclusionsȱ......................................................................................................ȱ25 Annexeȱ1.ȱLesȱtypesȱd’évaluationȱetȱleursȱprincipalesȱdifférencesȱ...........ȱ27 Annexeȱ2.ȱGrilleȱdȇappréciationȱduȱniveauȱdeȱdéveloppementȱdesȱ différentsȱtypesȱdȇévaluationȱ..................................................................ȱ28 Annexeȱ3.ȱExempleȱd’utilisationȱdeȱlaȱgrilleȱd’appréciationȱpourȱ évaluerȱunȱprogrammeȱd’évaluationȱnationaleȱàȱgrandeȱéchelleȱ......ȱ47 Référencesȱ.........................................................................................................ȱ53 ȱ Tableauxȱ Tableauȱ1.ȱCadreȱpourȱlaȱproductionȱd’unȱsystèmeȱd’évaluationȱdesȱ élèvesȱplusȱefficaceȱ..................................................................................ȱ16 Tableauȱ2.ȱCadreȱpourȱlaȱproductionȱd’unȱsystèmeȱd’évaluationȱdesȱ élèvesȱplusȱefficace,ȱavecȱdeȱgrandsȱdomainesȱindicateursȱ ...............ȱ18 Tableauȱ3.ȱStructureȱdeȱbaseȱdesȱrubriquesȱpourȱl’évaluationȱdesȱ donnéesȱrecueilliesȱsurȱunȱsystèmeȱd’évaluationȱdesȱélèvesȱ............ȱ20 Tableauȱ4.ȱProfilsȱstylisésȱdesȱsystèmesȱd’évaluationȱdesȱélèvesȱàȱ différentsȱniveauxȱdeȱdéveloppementȱ ..................................................ȱ22 ȱ ȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ iiiȱ ȱ ȱ ȱ ȱ Àȱproposȱdeȱcetteȱsérieȱ Laȱ constitutionȱ deȱ systèmesȱ éducatifsȱ solidesȱ permettantȱ deȱ promouvoirȱ l’apprentissageȱ estȱ essentielleȱ auȱ développementȱ etȱ àȱ laȱ croissanceȱ économique.ȱȱ Auȱ coursȱ desȱ dernièresȱ années,ȱ tandisȱ queȱ lesȱ paysȱ enȱ voieȱ deȱ développementȱ sontȱ parvenusȱ àȱ bâtirȱ davantageȱ deȱ classesȱ etȱ scolariserȱ desȱ millionsȱ d’enfantsȱ supplémentaires,ȱ laȱ communautéȱ éducativeȱ aȱ commencéȱ àȱ épouserȱ laȱ perspectiveȱ d’unȱ apprentissageȱ mesurableȱ pourȱ tousȱlesȱenfantsȱscolarisés.ȱȱ Cependant,ȱ l’apprentissageȱ dépendȱ nonȱ seulementȱ desȱ ressourcesȱ investiesȱ dansȱ leȱ systèmeȱ scolaire,ȱ maisȱ égalementȱ deȱ laȱ qualitéȱ desȱ politiquesȱ etȱ institutionsȱ permettantȱ leurȱ utilisation,ȱ ainsiȱ queȱ deȱ laȱ bonneȱmiseȱenȱœuvreȱdeȱcesȱpolitiques.ȱȱ Enȱ 2011,ȱ leȱ groupeȱ deȱ laȱ Banqueȱ mondialeȱ aȱ lancéȱ laȱ Stratégieȱ deȱ laȱ Banqueȱ mondialeȱ pourȱ l’Éducationȱ 2020ȱ:ȱ l’Apprentissageȱ pourȱ tous,ȱ quiȱ présenteȱ unȱ calendrierȱ pourȱ atteindre,ȱ auȱ coursȱ deȱ laȱ décennieȱ àȱ venir,ȱ cetȱ objectifȱ d’«ȱApprentissageȱ pourȱ tousȱ»ȱ dansȱ lesȱ paysȱ enȱ développement.ȱ Dansȱ leȱ butȱ deȱ soutenirȱ laȱ miseȱ enȱ œuvreȱ deȱ cetteȱ stratégie,ȱ laȱ Banqueȱ mondialeȱ aȱ démarréȱ unȱ programmeȱ pluriannuelȱ deȱ soutienȱ pourȱ queȱ lesȱ paysȱ évaluentȱ etȱ renforcentȱ systématiquementȱ laȱ performanceȱ deȱ leurȱ systèmeȱ éducatif.ȱ Cetteȱ initiativeȱ surȱ laȱ baseȱ deȱ donnéesȱ empiriquesȱ appeléeȱ SABERȱ (Systemsȱ Approachȱ forȱ Betterȱ Educationȱ Resultsȱ ouȱ Approcheȱ systémiqueȱ pourȱ deȱ meilleursȱ résultatsȱ éducatifs)ȱ créeȱ unȱ ensembleȱ d’outilsȱ deȱ diagnosticȱ permettantȱ d’étudierȱ lesȱ systèmesȱ éducatifsȱ etȱ lesȱ politiquesȱ quiȱ lesȱ régissentȱ àȱ l’auneȱ deȱ normesȱ etȱ deȱ bonnesȱ pratiquesȱ mondiales,ȱ etȱ deȱ lesȱ comparerȱ auxȱ politiquesȱetȱpratiquesȱéducativesȱenȱvigueurȱdansȱlesȱautresȱpays.ȱGrâceȱ àȱ cetteȱ connaissanceȱ globale,ȱ SABERȱ répondȱ auȱ déficitȱ deȱ donnéesȱ etȱ deȱ faitsȱ concernantȱ lesȱ déterminantsȱ lesȱ plusȱ importantsȱ dansȱ lȇaméliorationȱ deȱlaȱqualitéȱdeȱlȇéducationȱetȱl’obtentionȱdeȱmeilleursȱrésultats.ȱȱ SABERȬÉvaluationȱ desȱ élèves,ȱ unȱ desȱ systèmesȱ étudiésȱ auȱ seinȱ duȱ programmeȱ SABER,ȱ aȱ élaboréȱ desȱ instrumentsȱ afinȱ d’analyserȱ etȱ deȱ comparerȱ lesȱ politiquesȱ d’évaluationȱ desȱ élèvesȱ dansȱ leȱ monde.ȱ Ilȱ s’agitȱ deȱ promouvoirȱ desȱ systèmesȱ d’évaluationȱ plusȱ robustesȱ quiȱ contribueront,ȱd’uneȱpart,ȱàȱaméliorerȱlaȱqualitéȱdeȱl’éducationȱet,ȱd’autreȱ part,ȱ àȱ l’apprentissageȱ pourȱ tous.ȱ Pourȱ aiderȱ àȱ cetteȱ explorationȱ deȱ lȇétatȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ vȱ desȱ connaissancesȱ dansȱ ceȱ domaine,ȱ lȇéquipeȱ deȱ SABERȬÉvaluationȱ desȱ élèvesȱaȱconviéȱdesȱuniversitairesȱéminents,ȱdesȱexpertsȱdeȱlȇévaluationȱetȱ desȱpraticiensȱenȱprovenanceȱàȱlaȱfoisȱdeȱpaysȱindustrialisésȱetȱdeȱpaysȱenȱ voieȱ deȱ développementȱ àȱ seȱ réunirȱ afinȱ deȱ discuterȱ desȱ questionsȱ d’évaluationȱ pertinentesȱ pourȱ uneȱ améliorationȱ deȱ laȱ qualitéȱ deȱ l’éducationȱ etȱ desȱ produitsȱ deȱ l’apprentissage.ȱ Lesȱ documentsȱ etȱ étudesȱ deȱ casȱ surȱ l’évaluationȱ desȱ élèvesȱ publiésȱ dansȱ cetteȱ sérieȱ sontȱ leȱ fruitȱ deȱ cesȱ discussionsȱ etȱ desȱrecherchesȱquiȱ yȱsontȱ liées.ȱ Avantȱ leurȱ publication,ȱ tousȱ cesȱ documentsȱ ontȱ étéȱ soumisȱ àȱ unȱ rigoureuxȱ processusȱ deȱ révisionȱ comprenantȱ desȱ commentairesȱ deȱ laȱ partȱ duȱ personnelȱ deȱ laȱ Banqueȱ mondiale,ȱ d’universitaires,ȱ deȱ professionnelsȱ duȱ développementȱ etȱ d’expertsȱenȱévaluationȱdesȱpays.ȱ Tousȱ lesȱ documentsȱ deȱ cetteȱ sérieȱ deȱ SABERȬÉvaluationȱ desȱ élèvesȱ ontȱ bénéficiéȱ duȱ soutienȱ duȱ Fondsȱ fiduciaireȱ deȱ l’assistanceȱ russeȱ àȱ l’éducationȱ pourȱ leȱ développementȱ (READȱ TF).ȱ READȱ TFȱ estȱ uneȱ collaborationȱ entreȱ laȱ fédérationȱ deȱ Russieȱ etȱ laȱ Banqueȱ mondialeȱ pourȱ soutenirȱ l’améliorationȱ desȱ produitsȱ deȱ l’apprentissageȱ dansȱ lesȱ paysȱ àȱ faibleȱ revenuȱ grâceȱ àȱ lȇélaborationȱ deȱ solidesȱ systèmesȱ dȇévaluationȱ desȱ élèves.ȱ Laȱ sérieȱ deȱ documentsȱ deȱ travailȱ SABERȱ aȱ étéȱ produiteȱ sousȱ laȱ directionȱ généraleȱ d’Elizabethȱ King,ȱ Directriceȱ deȱ l’Éducationȱ etȱ deȱ Robinȱ Horn,ȱ Responsableȱ deȱ l’Éducationȱ auȱ Réseauȱ pourȱ leȱ développementȱ humainȱ deȱ laȱ Banqueȱ mondiale.ȱ Lesȱ documentsȱ deȱ laȱ sérieȱ Évaluationȱ desȱ élèvesȱ ontȱ étéȱ produitsȱ sousȱ laȱ directionȱ techniqueȱ deȱ Margueriteȱ Clark,ȱ experteȱ deȱ hautȱ niveauȱ enȱ éducationȱ etȱ coordinatriceȱ deȱ l’équipeȱ SABERȬÉvaluationȱ desȱ élèvesȱ auȱ Réseauȱ pourȱ leȱ développementȱ humainȱ deȱ laȱ Banqueȱ mondiale.ȱ Lesȱ vuesȱ indépendantesȱ expriméesȱ dansȱ lesȱ documentsȱ deȱ cetteȱ sérieȱ n’engagentȱ queȱleursȱauteurs.ȱ ȱ ȱ ȱ ȱ MargueriteȱClarkeȱ viȱ Àȱproposȱdeȱl’auteurȱ Margueriteȱ Clarkeȱ estȱ experteȱ deȱ hautȱ niveauȱ auȱ Réseauȱ pourȱ leȱ développementȱ humainȱ deȱ laȱ Banqueȱ mondiale.ȱ Elleȱ dirigeȱ leȱ travailȱ deȱ laȱ Banqueȱ surȱ l’évaluationȱ deȱ l’apprentissageȱ etȱ fournitȱ unȱ appuiȱ auxȱ paysȱcherchantȱindividuellementȱàȱaméliorerȱleursȱmodesȱd’évaluationȱetȱ l’utilisationȱ desȱ donnéesȱ recueilliesȱ lorsȱ deȱ cesȱ évaluations.ȱ Elleȱ dirigeȱ égalementȱ leȱ programmeȱ mondialȱ deȱ travailȱ surȱ l’évaluationȱ desȱ élèvesȱ menéȱ sousȱ l’égideȱ duȱ programmeȱ duȱ Fondsȱ fiduciaireȱ deȱ lȇassistanceȱ russeȱ àȱ lȇéducationȱ pourȱ leȱ développementȱ (READ).ȱ Sousȱ l’égideȱ deȱ READ,ȱelleȱestȱchargéeȱd’élaborerȱdesȱinstrumentsȱsurȱlaȱbaseȱdeȱdonnéesȱ empiriquesȱ etȱ desȱ approchesȱ permettantȱ dȇévaluerȱ etȱ deȱ renforcerȱ laȱ qualitéȱ desȱ systèmesȱ dȇévaluationȱ desȱ élèves.ȱ Avantȱ deȱ rejoindreȱ laȱ Banque,ȱMargueriteȱaȱœuvréȱdansȱlaȱrecherche,ȱlaȱpolitiqueȱetȱlaȱpratiqueȱ liéesȱ àȱ l’enseignementȱ etȱ l’apprentissageȱ dansȱ l’éducationȱ supérieure,ȱ laȱ qualitéȱ deȱ l’éducationȱ supérieureȱ etȱ laȱ politiqueȱ dȇévaluationȱ etȱ deȱ testȱ desȱ élèvesȱ dansȱ desȱ universitésȱ enȱ Australieȱ (Universitéȱ d’AustralieȬ Méridionale)ȱetȱauxȱÉtatsȬUnisȱ(UniversitéȱBrown,ȱBostonȱCollege).ȱElleȱaȱ égalementȱ enseignéȱ dansȱ lesȱ systèmesȱ éducatifsȱ chinois,ȱ irlandais,ȱ japonaisȱ etȱ américainȱ etȱ aȱ reçuȱ leȱ Prixȱ nationalȱ deȱ l’Enseignementȱ duȱ Ministèreȱ irlandaisȱ deȱ l’Éducationȱ enȱ 1989.ȱ Titulaireȱ d’uneȱ bourseȱ d’étudesȱ Fulbright,ȱ elleȱ aȱ obtenuȱ sonȱ doctoratȱ enȱ Recherche,ȱ mesureȱ etȱ évaluationȱ pédagogiquesȱ auȱ Bostonȱ Collegeȱ (2000)ȱ etȱ siègeȱ auȱ comitéȱ consultatifȱdeȱl’Observatoireȱsurȱlesȱrésultatsȱd’apprentissageȱdeȱl’Institutȱ deȱstatistiqueȱdeȱl’UNESCO.ȱ ȱ ȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ viiȱ ȱ ȱ ȱ ȱ ȱ Remerciementsȱ Nombreuxȱ sontȱ ceuxȱ quiȱ ontȱ nourriȱ ceȱ documentȱ deȱ leursȱ commentairesȱ etȱ suggestions.ȱ Jeȱ remercieȱ toutȱ particulièrementȱ lesȱ examinateursȱ pairsȱ etȱlesȱprésidentsȱdeȱréunionȱ:ȱLuisȱBenveniste,ȱLuisȱCrouch,ȱDeonȱFilmer,ȱ Robinȱ Horn,ȱ Elizabethȱ King,ȱ Marlaineȱ Lockheed,ȱ Harryȱ Patrinosȱ etȱ Albertoȱ Rodriguez.ȱ Merciȱ égalementȱ àȱ l’équipeȱ duȱ Fondsȱ fiduciaireȱ READ,ȱ enȱ particulierȱ Juliaȱ Libermanȱ etȱ MaríaȬJoséȱ Ramírez,ȱ quiȱ ontȱ apportéȱ leurȱ précieuxȱ soutienȱ dansȱ l’élaborationȱ d’unȱ ensembleȱ deȱ rubriquesȱ etȱ deȱ questionnairesȱ inspirésȱ deȱ ceȱ documentȬcadre,ȱ ainsiȱ queȱ Olavȱ Christensen,ȱ Emilyȱ Gardner,ȱ Manoramaȱ Gotur,ȱ Emineȱ Kildirgici,ȱ Dianaȱ Manevskaya,ȱ Cassiaȱ Mirandaȱ etȱ Fahmaȱ Nur.ȱ Jeȱ remercieȱ aussiȱ lesȱ membresȱ duȱ Groupeȱ techniqueȱ deȱ READ,ȱ anciensȱ etȱ actuels,ȱ dontȱ Luisȱ Benveniste,ȱ Cedricȱ Croft,ȱ Amberȱ Gove,ȱ Vincentȱ Greaney,ȱ Anilȱ Kanjee,ȱ Thomasȱ Kellaghan,ȱ Marinaȱ Kuznetsova,ȱ MaríaȬJoséȱ Ramírezȱ etȱ Yuliaȱ Tumeneva,ȱainsiȱqueȱlesȱchefsȱd’équipeȱetȱlesȱéquipesȱdesȱpaysȱduȱREAD.ȱ D’autresȱ personnesȱ ontȱ contribuéȱ àȱ ceȱ travailȱ parȱ d’utilesȱ indications,ȱ dontȱ Patriciaȱ Arregui,ȱ Felipeȱ Barrera,ȱ Viktorȱ Bolotov,ȱ Lesterȱ Flockton,ȱ Alejandroȱ Ganimian,ȱ Julianaȱ Guaqueta,ȱ Gabrielleȱ Matters,ȱ Emilioȱ Porta,ȱ Halseyȱ Rogers,ȱ Alanȱ Ruby,ȱ JeeȬPengȱ Tan,ȱ Igorȱ Valdmanȱ etȱ Emilianaȱ Vegas.ȱ Jeȱ remercieȱ toutȱ particulièrementȱ leȱ Gouvernementȱ russeȱ pourȱ sonȱsoutienȱàȱceȱtravailȱgrâceȱauȱprogrammeȱduȱFondsȱfiduciaireȱREAD.ȱ ȱ ȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ ixȱ ȱ ȱ ȱ ȱ ȱ Résuméȱ Ceȱ documentȱ aȱ pourȱ objectifȱ deȱ présenterȱ lesȱ élémentsȱ essentielsȱ àȱ laȱ créationȱ d’unȱ systèmeȱ dȇévaluationȱ desȱ élèvesȱ efficace.ȱ Ilȱ estȱ axéȱ surȱ lesȱ systèmesȱ d’évaluationȱ deȱ lȇapprentissageȱ etȱ desȱ acquisȱ desȱ élèvesȱ auxȱ niveauxȱ primaireȱ etȱ secondaire.1ȱ Ilȱ tireȱ sesȱ principesȱ etȱ directivesȱ deȱ l’expérienceȱ desȱ pays,ȱ desȱ normesȱ professionnellesȱ deȱ testȱ etȱ deȱ l’étatȱ actuelȱdesȱrecherches.ȱLeȱbutȱestȱdeȱfournirȱauxȱdécideursȱnationaux,ȱauxȱ représentantsȱ desȱ ministèresȱ deȱ l’éducation,ȱ auȱ personnelȱ desȱ organisationsȱ deȱ développement,ȱ ainsiȱ quȇauxȱ autresȱ partiesȱ prenantes,ȱ unȱ cadreȱ etȱ desȱ indicateursȱ clésȱ pourȱ leȱ diagnostic,ȱ laȱ discussionȱ etȱ laȱ créationȱ d’unȱ consensusȱ autourȱ desȱ modalitésȱ deȱ constitutionȱ dȇunȱ systèmeȱ dȇévaluationȱ desȱ élèvesȱ sainȱ etȱ durable,ȱ susceptibleȱ deȱ contribuerȱ àȱ uneȱ meilleureȱ qualitéȱ deȱ lȇéducationȱetȱàȱlȇapprentissageȱpourȱtous.ȱȱ ȱ ȱ ȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ 1ȱ Ceȱ documentȱ neȱ traiteȱ pasȱ desȱ testsȱ psychologiquesȱ ouȱ dansȱ leȱ milieuȱ duȱ travailȱ etȱ n’abordeȱpasȱnonȱplusȱexplicitementȱl’évaluationȱdeȱl’apprentissageȱetȱdesȱacquisȱauȱniveauȱ deȱ l’enseignementȱ supérieur,ȱ bienȱ queȱ deȱ nombreusesȱ questionsȱ qu’ilȱ soulèveȱ peuventȱ égalementȱs’yȱappliquer.ȱȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ xiȱ ȱ ȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱ d’évaluationȱdesȱélèvesȱ:ȱȱ DocumentȬcadreȱ MargueriteȱClarkeȱȱ Enȱ matièreȱ d’éducation,ȱ lȇévaluationȱ estȱ auȱ cœurȱ deȱ l’essentielȱ:ȱ ilȱ neȱ s’agitȱ pasȱ seulementȱ desȱ tauxȱ deȱ scolarisationȱ etȱ d’achèvementȱ duȱ cycleȱ d’études,ȱ maisȱ duȱ véritableȱ objectifȱ deȱ l’apprentissageȱparȱl’élèveȈȱ(Banqueȱmondiale,ȱ2010,ȱp.ȱ5).ȱ Introductionȱ L’évaluationȱ estȱ leȱ processus2ȱ deȱ collecteȱ etȱ deȱ mesureȱ desȱ donnéesȱ surȱ ceȱ queȱsait,ȱcomprendȱetȱpeutȱfaireȱl’élèveȱdansȱleȱbutȱdeȱfavoriserȱuneȱpriseȱ deȱ décisionȱ informéeȱ concernantȱ lesȱ phasesȱ suivantesȱ duȱ processusȱ éducatif.ȱ Lesȱ méthodesȱ d’évaluationȱ peuventȱ êtreȱ aussiȱ simplesȱ queȱ desȱ questionsȬréponsesȱ àȱ l’oralȱ (parȱ exempleȱ:ȱ «ȱQuelleȱ estȱ laȱ capitaleȱ deȱ l’Éthiopieȱ?ȱ»)ȱ ouȱ aussiȱ complexesȱ queȱ lesȱ modèlesȱ d’examenȱ informatiséȱ adaptatifȱ basésȱ surȱ desȱ algorithmesȱ deȱ notationȱ multiformesȱ etȱ lesȱ progressionsȱ deȱ l’apprentissage.3ȱ Lesȱ décisionsȱ impulséesȱ parȱ lesȱ résultatsȱ sontȱ variables,ȱ allantȱ deȱ laȱ méthodeȱ deȱ conceptionȱ deȱ programmesȱ globauxȱ d’améliorationȱ deȱ l’enseignementȱ etȱ deȱ l’apprentissageȱ àȱ lȇécoleȱ àȱ lȇidentificationȱ desȱ phasesȱ suivantesȱ deȱ laȱ pédagogieȱ enȱ classeȱ ouȱ àȱ laȱ déterminationȱ desȱ candidatsȱ quiȱ serontȱ acceptésȱàȱlȇuniversité.ȱȱ Unȱ systèmeȱ d’évaluationȱ estȱ unȱ ensembleȱ deȱ politiques,ȱ deȱ pratiquesȱ etȱ d’outilsȱ deȱ productionȱ etȱ d’utilisationȱ desȱ informationsȱ surȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ 2ȱ Utiliséȱ commeȱ substantif,ȱ évaluationȱ peutȱ faireȱ référenceȱ àȱ unȱ outilȱ particulier,ȱ telȱ qu’unȱ examen.ȱȱ 3ȱ Uneȱ listeȱ deȱ programmesȱ d’examensȱ informatisésȱ adaptatifsȱ estȱ disponibleȱ surȱ http://www.psych.umn.edu/ȱpsylabs/catcentral/.ȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 1ȱ ȱ l’apprentissageȱ deȱ l’élèveȱ etȱ sesȱ acquis.ȱ Lesȱ systèmesȱ d’évaluationȱ efficacesȱsontȱceuxȱquiȱfournissentȱdesȱinformationsȱenȱquantitéȱetȱqualitéȱ suffisantesȱpourȱsatisfaireȱauxȱbesoinsȱdeȱdonnéesȱetȱdeȱpriseȱdeȱdécisionȱ desȱ partiesȱ prenantesȱ dansȱ leȱ butȱ d’uneȱ améliorationȱ deȱ laȱ qualitéȱ deȱ l’éducationȱ etȱ desȱ acquisȱ deȱ l’élèveȱ (Ravelaȱ etȱ al.,ȱ 2009).4ȱ Satisfaireȱ cesȱ besoinsȱ deȱ façonȱ àȱ rallierȱ leȱ soutienȱ desȱ groupesȱ politiquesȱ etȱ autreȱ groupesȱclésȱdeȱlaȱsociétéȱcontribueraȱàȱlaȱdurabilitéȱetȱàȱl’efficacitéȱàȱplusȱ longȱtermeȱduȱsystèmeȱd’évaluation.ȱ Lesȱ gouvernements,ȱ organisationsȱ internationalesȱ etȱ autresȱ partiesȱ prenantesȱ reconnaissentȱ deȱ plusȱ enȱ plusȱ lȇimportanceȱ deȱ l’évaluationȱ pourȱ suivreȱ etȱ améliorerȱ l’apprentissageȱ etȱ leȱ niveauȱ desȱ acquisȱ desȱ élèves,ȱ ainsiȱ queȱ leȱ besoinȱ concomitantȱ deȱ développerȱ desȱ systèmesȱ plusȱ solidesȱpourȱévaluerȱceȱdernierȱ(IEG,ȱ2006ȱ;ȱMcKinseyȱ&ȱCompany,ȱ2007ȱ;ȱ UNESCO,ȱ 2007).ȱ Cetteȱ reconnaissanceȱ estȱ liéeȱ auxȱ indicationsȱ deȱ plusȱ enȱ plusȱ fréquentesȱ queȱ deȱ nombreuxȱ bénéficesȱ deȱ lȇéducationȱ (culturels,ȱ économiquesȱ etȱ sociaux)ȱ neȱ profitentȱ àȱ laȱ sociétéȱ queȱ lorsqueȱ l’apprentissageȱ aȱ vraimentȱ lieuȱ (OCDE,ȱ 2010).ȱ Parȱ exemple,ȱ uneȱ augmentationȱ dȇunȱ écartȱ typeȱ dansȱ lesȱ scoresȱ desȱ enquêtesȱ internationalesȱ desȱ acquisȱ enȱ lectureȱ etȱ mathématiquesȱ estȱ liéeȱ àȱ uneȱ augmentationȱ deȱ 2ȱ pourcentȱ duȱ tauxȱ deȱ croissanceȱ annuelȱ duȱ PIBȱ parȱ habitantȱ(HanushekȱetȱWoessmann,ȱ2007,ȱ2009).ȱȱ Pourȱ certains,ȱ lesȱ évaluations,ȱ particulièrementȱ lesȱ exercicesȱ àȱ grandeȱ échelle,ȱ sontȱ tropȱ onéreux.ȱ Enȱ fait,ȱ c’estȱ leȱ contraireȱ quiȱ sembleȱ s’avérerȱ:ȱ lesȱ testsȱ paraissantȱ enȱ effetȱ lesȱ innovationsȱ lesȱ moinsȱ coûteusesȱ enȱ termesȱ deȱ réformeȱ deȱ l’éducation,ȱ ilsȱ sontȱ généralementȱ bienȱ moinsȱ chersȱ quȇuneȱ augmentationȱ duȱ traitementȱ desȱ enseignantsȱ ouȱ queȱ laȱ réductionȱ desȱ effectifsȱ dansȱ laȱ classe.ȱ Hoxbyȱ (2002)ȱ aȱ constatéȱ qu’auxȱ ÉtatsȬUnis,ȱ mêmeȱ lesȱ programmesȱ deȱ responsabilisationȱ lesȱ plusȱ chersȱ basésȱ surȱ desȱ testsȱ àȱ lȇéchelleȱ dȇunȱ Étatȱ représentaientȱ moinsȱ deȱ 25ȱ pourcentȱ deȱ laȱ dépenseȱ parȱ élève.ȱ Deȱ même,ȱ dansȱ lesȱ paysȱ d’Amériqueȱ latineȱ étudiésȱ parȱ Wolffȱ (2007),ȱ lesȱ testsȱ n’ontȱ jamaisȱ mobilisésȱ plusȱ deȱ 0,3ȱ pourcentȱ duȱ budgetȱ nationalȱ deȱ lȇéducationȱ destinéȱ auȱ niveauȱ testéȱ (primaireȱ ouȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ 4ȱ Unȱ systèmeȱ d’évaluationȱ desȱ élèvesȱ répondȱ àȱ uneȱ variétéȱ deȱ besoinsȱ d’informationsȱ:ȱ ilȱ peutȱ influerȱ l’apprentissageȱ etȱ laȱ pédagogie,ȱ déterminerȱ laȱ progression,ȱ mesurerȱ lesȱ acquisȱ etȱ fournirȱ desȱ donnéesȱ partiellesȱ enȱ termesȱ deȱ responsabilité.ȱ Tousȱ cesȱ éléments,ȱ etȱ lesȱ décisionsȱ quiȱ enȱ découlent,ȱ devraientȱ auȱ finalȱ conduireȱ àȱ uneȱ améliorationȱ deȱ laȱ qualitéȱ etȱ desȱniveauxȱd’apprentissageȱduȱsystèmeȱéducatif.ȱȱ ȱ 2ȱ MargueriteȱClarkeȱ secondaire).ȱ Malgréȱ cetȱ aspectȱ économiqueȱ séduisant,ȱ celuiȬciȱ neȱ devraitȱ pasȱ occulterȱ d’autresȱ facteursȱ importants,ȱ commeȱ parȱ exempleȱ lesȱ objectifsȱ dȇéquitéȱ etȱ dȇaméliorationȱ socialeȱ quiȱ doiventȱ êtreȱ prisȱ enȱ compteȱ dansȱ touteȱ décisionȱ surȱ laȱ possibleȱ instaurationȱ dȇunȱ programmeȱ dȇévaluationȱparticulier.ȱȱ Auȱcoursȱdesȱ20ȱdernièresȱannées,ȱdeȱnombreuxȱpaysȱontȱcommencéȱ àȱ mettreȱ enȱ placeȱ desȱ exercicesȱ d’évaluationȱ ouȱ àȱ enȱ élaborerȱ àȱ partirȱ deȱ systèmesȱ d’évaluationȱ existantsȱ (UNESCO,ȱ 2007).ȱ Onȱ noteȱ enȱ outreȱ uneȱ remarquableȱ augmentationȱ duȱ nombreȱ deȱ paysȱ participantȱ auxȱ exercicesȱ d’enquêtesȱ comparativesȱ telsȱ queȱ leȱ Trendsȱ inȱ Internationalȱ Mathematicsȱ andȱ Scienceȱ Studyȱ (TIMSS)ȱ etȱ leȱ Programmeȱ forȱ Internationalȱ Studentȱ Assessmentȱ (PISA).5ȱ Lesȱ organisationsȱ nonȱ gouvernementalesȱ fontȱ égalementȱ deȱ plusȱ enȱ plusȱ souventȱ appelȱ auxȱ évaluationsȱ d’élèvesȱ pourȱ attirerȱ l’attentionȱ duȱ publicȱ surȱ laȱ médiocritéȱ desȱ niveauxȱ deȱ réussiteȱ etȱ créerȱainsiȱuneȱimpulsionȱdeȱchangement.ȱȱ Malgréȱ cetȱ intérêtȱ manifesteȱ pourȱ l’évaluationȱ desȱ élèves,ȱ tropȱ peuȱ deȱ paysȱ ontȱ misȱ enȱ placeȱ lesȱ politiques,ȱ structures,ȱ pratiquesȱ etȱ instrumentsȱ constituantȱ unȱ systèmeȱ d’évaluationȱ efficace.ȱ Ceciȱ estȱ particulièrementȱvraiȱdesȱpaysȱàȱfaibleȱrevenu,ȱquiȱsontȱpourtantȱlesȱplusȱàȱmêmeȱ deȱ bénéficierȱ dȇeffortsȱ systématiquesȱ pourȱ mesurerȱ lesȱ résultatsȱ deȱ lȇapprentissage.ȱ Certainsȱ deȱ cesȱ paysȱ expérimententȱ desȱ évaluationsȱ àȱ grandeȱ échelleȱ ouȱ d’autresȱ typesȱ standardisésȱ d’évaluationȱ deȱ l’apprentissageȱ desȱ élèvesȱ etȱ desȱ niveauxȱ deȱ réussiteȱ maisȱ ceȱ sontȱ tropȱ souventȱ desȱ expériencesȱ ponctuellesȱ neȱ faisantȱ pasȱ partieȱ d’uneȱ stratégieȱ éducativeȱ etȱ nonȱ maintenuesȱ dansȱ leȱ temps.ȱ Uneȱ différenceȱ cléȱ entreȱ lesȱ évaluationsȱ ponctuellesȱ etȱ unȱ systèmeȱ durableȱ d’évaluationȱ estȱ queȱ leȱ premierȱ neȱ fournitȱ quȇunȱ instantanéȱ duȱ niveauȱ deȱ réussiteȱ desȱ élèves,ȱ tandisȱ queȱ leȱ dernierȱ offreȱ laȱ possibilitéȱ dȇunȱ suiviȱ desȱ tendancesȱ deȱ laȱ réussiteȱetȱduȱniveauȱdesȱacquisȱsurȱlaȱduréeȱ(unȱpeuȱcommeȱuneȱsérieȱdeȱ clichés).ȱ Ilȱ permetȱ uneȱ meilleureȱ compréhensionȱ deȱ laȱ contributionȱ relativeȱ desȱ apportsȱ etȱ desȱ pratiquesȱ éducativesȱ auxȱ variationsȱ deȱ cesȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ 5ȱ Leȱ nombreȱ deȱ paysȱ participantȱ auȱ PISAȱ estȱ passéȱ deȱ 43ȱ enȱ 2000ȱ àȱ 66ȱ enȱ 2007.ȱ Enȱ comparaison,ȱ leȱ nombreȱ deȱ paysȱ enȱ voieȱ deȱ développementȱ ayantȱ participéȱ àȱ desȱ enquêtesȱ internationalesȱ surȱ lesȱ acquisȱ desȱ élèvesȱ demeureȱ restreint.ȱ Cesȱ paysȱ seȱ situentȱ généralementȱ auȱ basȱ duȱ palmarès,ȱ ceȱ quiȱ limiteȱ laȱ quantitéȱ d’informationȱ qu’ilsȱ peuventȱ retirerȱ deȱ cesȱ donnéesȱ afinȱ deȱ mieuxȱ comprendreȱ etȱ d’améliorerȱ leurȱ propreȱ systèmeȱ éducatif.ȱȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 3ȱ ȱ tendances.ȱ Lesȱ évaluationsȱ ponctuellesȱ peuventȱ jouerȱ leȱ rôleȱ d’électrochocȱ etȱ créerȱ l’opportunitéȱ d’unȱ débatȱ surȱ laȱ qualitéȱ deȱ l’éducation,ȱ ceȱ quiȱ peutȱ constituerȱ uneȱ stratégieȱ àȱ courtȱ termeȱ pourȱ porterȱlȇéducationȱàȱlȇordreȱduȱjour.6ȱCependant,ȱseulsȱlesȱgouvernementsȱ doiventȱ finalementȱ gérerȱ leȱ défiȱ nécessaireȱ queȱ constitueȱ laȱ miseȱ enȱ œuvreȱ deȱ systèmesȱ quiȱ permettrontȱ unȱ suiviȱ régulierȱ etȱ unȱ soutienȱ deȱ l’apprentissageȱ etȱ desȱ acquisȱ desȱ élèves.ȱ C’estȱ leȱ seulȱ moyenȱ d’exploiterȱ dansȱsaȱtotalitéȱleȱpotentielȱdesȱévaluations.ȱȱ Théorieȱetȱdonnéesȱempiriquesȱsurȱlȇévaluationȱ desȱélèvesȱ Laȱrechercheȱsurȱl’évaluationȱdesȱélèvesȱpartȱduȱprincipeȱqueȱleȱbonȱtypeȱ d’activitésȱd’évaluationȱetȱlaȱbonneȱutilisationȱdesȱdonnéesȱproduitesȱparȱ cellesȬciȱ contribuentȱ àȱ deȱ meilleursȱ résultats,ȱ qu’ilȱ s‘agisseȱ d’uneȱ améliorationȱ deȱ l’apprentissageȱ ouȱ deȱ meilleuresȱ décisionsȱ politiquesȱ (parȱ exempleȱ :ȱ Heubertȱ etȱ Hauser,ȱ 1999).7ȱ Ceȱ quiȱ estȱ entenduȱ parȱ «ȱbon(ne)ȱ»ȱ estȱ largementȱ motivéȱ parȱ unȱ ensembleȱ deȱ directivesȱ théoriquesȱ etȱ techniquesȱ destinéȱ auxȱ développeursȱ d’examensȱ etȱ auxȱ utilisateursȱdesȱdonnéesȱdeȱl’évaluationȱ(AERA,ȱAPA,ȱetȱNCME,ȱ1999).ȱȱ Ilȱ existeȱ égalementȱ unȱ vasteȱ corpusȱ deȱ rechercheȱ empiriqueȱ quiȱ montreȱ lesȱ avantagesȱ dansȱ l’apprentissageȱ deȱ typesȱ spécifiquesȱ d’activitésȱ d’évaluation,ȱ lorsqu’ellesȱ sontȱ misesȱ enȱ œuvreȱ etȱ utiliséesȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ 6ȱ Parmiȱ cesȱ initiatives,ȱ uneȱ desȱ plusȱ courantesȱ estȱ l’EGRA.ȱ Selonȱ leȱ siteȱ Webȱ d’USAIDȱ (https://www.eddataglobal.org/)ȱ :ȱ Leȱ Earlyȱ Gradeȱ Readingȱ Assessmentȱ (EGRA)ȱ estȱ uneȱ évaluationȱoraleȱdestinéeȱàȱmesurerȱlesȱtoutesȱpremièresȱcompétencesȱdeȱbaseȱenȱlectureȱauȱ débutȱdeȱlaȱscolarité…ȱafinȱd’informerȱlesȱministèresȱetȱlesȱbailleursȱdeȱfondsȱsurȱlesȱbesoinsȱ duȱsystèmeȱenȱvueȱd’uneȱaméliorationȱdeȱlaȱpédagogie.ȱ»ȱ 7ȱ Ravelaȱ etȱ al.ȱ (2008)ȱ notentȱ queȱ l’évaluationȱ deȱ l’élèveȱ estȱ uneȱ conditionȱ nécessaireȱ maisȱ insuffisanteȱ pourȱ uneȱ améliorationȱ deȱ l’éducation.ȱ Ilȱ estȱ démontréȱ queȱ laȱ simpleȱ existenceȱ etȱlaȱdiffusionȱd’informationsȱrecueilliesȱlorsȱdesȱévaluationsȱaȱunȱeffetȱ surȱcertainsȱacteurs.ȱ Maisȱ l’évaluationȱ n’estȱ qu’unȱ élémentȱ cléȱ parmiȱ d’autresȱ dansȱ laȱ politiqueȱ éducativeȱ;ȱ ilȱ yȱ aȱ égalementȱ laȱ formationȱ deȱ l’enseignantȱ avantȱ etȱ aprèsȱ sonȱ débutȱ professionnel,ȱ lesȱ conditionsȱ deȱ travail,ȱ laȱ gestionȱ etȱ supervisionȱ deȱ l’établissementȱ scolaire,ȱ laȱ conceptionȱ duȱ programme,ȱ lesȱ manuelsȱ etȱ leȱ matérielȱ pédagogique,ȱ l’investissementȱ enȱ ressourcesȱ proportionnelȱ auxȱ besoinsȱ desȱ populationsȱ variéesȱ etȱ l’actionȱ concertéeȱ desȱ responsablesȱ éducatifsȱpourȱrésoudreȱtoutȱproblèmeȱidentifié.ȱȱ ȱ 4ȱ MargueriteȱClarkeȱ correctement.ȱ Laȱ rechercheȱ montreȱ parȱ exempleȱ unȱ lienȱ fortȱ entreȱ desȱ activitésȱd’évaluationȱformativesȱdeȱgrandeȱqualitéȱmenéesȱdansȱlaȱclasseȱ etȱdeȱmeilleursȱrésultatsȱd’apprentissageȱmesurésȱparȱlaȱperformanceȱdesȱ élèvesȱ àȱ desȱ examensȱ standardisésȱ d’évaluationȱ desȱ acquis.ȱ Laȱ synthèseȱ établieȱparȱBlackȱetȱWiliamȱ(1998)ȱdeȱplusȱdeȱ250ȱétudesȱempiriquesȱdansȱ leȱ mondeȱ entierȱ surȱ l’impactȱ d’activitésȱ d’évaluationȱ formativesȱ deȱ grandeȱ qualitéȱ menéesȱ dansȱ laȱ classeȱ montreȱ unȱ gainȱ d’unȬdemiȱ àȱ unȱ pointȱ d’écartȱ typeȱ surȱ lesȱ examensȱ standardisésȱ d’évaluationȱ desȱ acquis,ȱ leȱ gainȱ leȱ plusȱ importantȱ étantȱ attribuéȱ auxȱ élèvesȱ lesȱ plusȱ faibles.8ȱ Blackȱ etȱWiliamȱ(1998)ȱconcluentȱ:ȱ Lesȱ gainsȱ enȱ réussiteȱ semblentȱ relativementȱ considérables,ȱ et…ȱ parmiȱ lesȱ plusȱ importantsȱ jamaisȱ signalésȱpourȱdesȱinterventionsȱéducatives.ȱPourȱillustrerȱ l’importanceȱ deȱ cesȱ gains,ȱ uneȱ ampleurȱ deȱ l’effetȱ deȱ 0,7,ȱ rapportéeȱ àȱ lȇéchelleȱ nationale,ȱ seraitȱ équivalenteȱ àȱ uneȱ augmentationȱ duȱ scoreȱ enȱ mathématiquesȱ d’unȱ paysȱ «ȱmoyenȱ»ȱ commeȱ l’Angleterre,ȱ laȱ NouvelleȬZélandeȱ ouȱ lesȱ ÉtatsȬUnisȱ pourȱ lesȱ placerȱ parmiȱ lesȱ «ȱcinqȱ premiersȱ paysȱ»ȱ aprèsȱ ceuxȱ deȱ laȱ ceintureȱ duȱ Pacifiqueȱ:ȱ Singapour,ȱlaȱCorée,ȱleȱJaponȱetȱHongȱKong.ȱ(p.ȱ61)ȱ Bennettȱ (2011)ȱ remarqueȱ cependantȱ quȇunȱ travailȱ plusȱ approfondiȱ estȱ nécessaireȱ afinȱ deȱ définirȱ etȱ isolerȱ lesȱ caractéristiquesȱ spécifiquesȱ desȱ activitésȱdȇévaluationȱformativesȱenȱclasseȱconduisantȱàȱuneȱaméliorationȱ desȱacquisȱdeȱlȇélève.9ȱ Laȱ rechercheȱ corrélationnelleȱ surȱ lesȱ examensȱ finauxȱ auȱ niveauȱ duȱ lycéeȱ ouȱ deȱ l’enseignementȱ secondaireȱ supérieurȱ démontreȱ unȱ lienȱ entreȱ ceuxȱ quiȱ appliquentȱ cesȱ politiquesȱ etȱ deȱ meilleuresȱ performancesȱ desȱ élèvesȱ dansȱ lesȱ enquêtesȱ internationales,ȱ telsȱ queȱ leȱ PISAȱ ouȱ leȱ TIMSSȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ 8ȱRodriguezȱ(2004)ȱsignaleȱdesȱeffetsȱduȱmêmeȱordreȱauxȱÉtatsȬUnisȱpourȱlaȱperformanceȱenȱ mathématiquesȱ auȱ TIMSS,ȱ issueȱ d’uneȱ utilisationȱ efficaceȱ deȱ l’évaluationȱ enȱ classeȱ (cetteȱ constatationȱestȱtiréeȱdeȱl’analyseȱdesȱréponsesȱd’enseignantsȱdeȱpaysȱparticipantȱauȱTIMSSȱ àȱdesȱquestionsȱsurȱleȱsujetȱdeȱl’utilisationȱdesȱévaluationsȱenȱclasse).ȱ 9ȱ Uneȱ métaȬanalyseȱ deȱ 21ȱ étudesȱ contrôléesȱ (Fuchsȱ etȱ Fuchs,ȱ 1986)ȱ examinantȱ laȱ fréquenceȱ desȱ activitésȱ d’évaluationȱ enȱ classeȱ aȱ constatéȱ queȱ l’utilisationȱ systématiqueȱ d’activitésȱ d’évaluationȱ formativesȱ enȱ classe,ȱ auȱ minimumȱ hebdomadaire,ȱ pouvaitȱ avoirȱ unȱ effetȱ trèsȱ positifȱsurȱlesȱacquisȱdeȱl’élèveȱ(parȱexemple,ȱdeuxȱévaluationsȱparȱsemaineȱproduisentȱuneȱ ampleurȱdeȱl’effetȱdeȱ0,85,ȱouȱunȱgainȱdeȱ30ȱrangsȱcentiles).ȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 5ȱ ȱ (parȱ exemple,ȱ Bishop,ȱ Maneȱ etȱ Bishop,ȱ 2001).ȱ D’autresȱ étudesȱ montrentȱ unȱ lienȱ entreȱ lesȱ caractéristiquesȱ spécifiquesȱ desȱ examensȱ utilisésȱ dansȱ cesȱ programmesȱ d’évaluationȱ etȱ lesȱ acquisȱ deȱ l’élève,ȱ lesȱ examensȱ basésȱ surȱ leȱ sujetȱ ouȱ leȱ programmeȱ (plutôtȱ queȱ desȱ testsȱ d’aptitudeȱ ouȱ deȱ compétenceȱ plusȱ générale)ȱ étantȱ lesȱ plusȱ efficacesȱ pourȱ deȱ meilleursȱ acquisȱdeȱlȇélèveȱ(Au,ȱ2007ȱ;ȱHill,ȱ2010).ȱȱ Enȱ mêmeȱ temps,ȱ ceȱ typeȱ d’examenȱ auxȱ enjeuxȱ fortsȱ aȱ montréȱ unȱ impactȱ négatifȱ surȱ lesȱ élèvesȱ desȱ groupesȱ défavorisés,ȱ soitȱ enȱ limitantȱ deȱ façonȱ disproportionnéeȱ leursȱ chancesȱ deȱ passerȱ auȱ niveauȱ supérieurȱ duȱ systèmeȱ éducatif,ȱ soitȱ enȱ lesȱ soustrayantȱ àȱ certainesȱ opportunitésȱ éducativesȱ (Greaneyȱ etȱ Kellaghan,ȱ 1995ȱ ;ȱ Madausȱ etȱ Clarke,ȱ 2001).ȱ Pourȱ cesȱ questionsȱ dȇéquité,ȱ lesȱ utilisationsȱ etȱ résultatsȱ desȱ examensȱ doiventȱ êtreȱ soigneusementȱ suivisȱ auxȱ niveauxȱ duȱ système,ȱ duȱ groupeȱ etȱ deȱ lȇindividuȱ etȱ desȱ effortsȱ doiventȱ êtreȱ faitsȱ pourȱ limiterȱ ouȱ réduireȱ cesȱ conséquencesȱnégativesȱnonȱintentionnelles.ȱȱ Lesȱ résultatsȱ desȱ évaluationsȱ systémiquesȱ àȱ grandeȱ échelleȱ deȱ l’ensembleȱ desȱ acquisȱ deȱ l’élèveȱ serventȱ deȱ plusȱ enȱ plusȱ dȇassiseȱ àȱ desȱ programmesȱdeȱ responsabilisationȱ basésȱ surȱ desȱ testsȱ dansȱdeȱ nombreuxȱ pays.ȱLaȱrechercheȱmontreȱqu’unȱsimpleȱreportingȱdeȱl’informationȱsurȱlesȱ scoresȱmoyensȱdesȱécolesȱlorsȱdeȱcesȱévaluationsȱpeutȱégalementȱmenerȱàȱ uneȱ améliorationȱ deȱ laȱ performanceȱ deȱ l’élèveȱ (Hanushekȱ etȱ Raymond,ȱ 2003),ȱ suggérantȱ qu’ilȱ resteȱ beaucoupȱ àȱ apprendreȱ surȱ laȱ combinaisonȱ optimaleȱ d’incitationsȱ àȱ desȱ modèlesȱ deȱ responsabilisationȱ basésȱ surȱ desȱ testsȱ quiȱ produiraȱ lesȱ meilleursȱ résultatsȱ avecȱ leȱ minimumȱ d’effetsȱ secondairesȱ négatifs.ȱ Àȱ ceȱ jour,ȱ laȱ rechercheȱ suggèreȱ queȱ lesȱ élémentsȱ déterminantsȱ clésȱ quantȱ àȱ l’aspectȱ plutôtȱ positifȱ ouȱ négatifȱ desȱ exercicesȱ deȱ responsabilisationȱ basésȱ surȱ desȱ testsȱ comprennentȱ lesȱ testsȱ euxȬ mêmes,ȱlaȱcorrespondanceȱentreȱlaȱconceptionȱduȱtestȱetȱlaȱfaçonȱdontȱlesȱ résultatsȱsontȱutilisés,ȱainsiȱqueȱlaȱmesureȱdansȱlaquelleȱdesȱsoutiensȱsontȱ misȱ enȱ placeȱ pourȱ aiderȱ lesȱ écolesȱ ouȱ lesȱ enseignantsȱ identifiésȱ commeȱ peuȱperformantsȱ(Ravela,ȱ2005).10ȱȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ 10ȱRavelaȱ(2005)ȱdécritȱl’utilisationȱdesȱrésultatsȱd’uneȱenquêteȱnationaleȱàȱgrandeȱéchelleȱenȱ Uruguayȱ pourȱ aiderȱ lesȱ enseignantsȱ àȱ améliorerȱ leurȱ enseignement.ȱ Laȱ miseȱ enȱ avantȱ deȱ l’utilisationȱ formativeȱ enȱ classeȱ aȱ contribuéȱ àȱ l’acceptationȱ desȱ résultatsȱ parȱ lesȱ enseignantsȱ etȱ influencéȱ laȱ conceptionȱ deȱ l’évaluation,ȱ enȱ mettantȱ enȱ évidenceȱ laȱ nécessitéȱ d’uneȱ approcheȱ sociodémographiqueȱ deȱ laȱ collecteȱ desȱ donnéesȱ etȱ leȱ recoursȱ auxȱ facteursȱ contextuelsȱpourȱrepérerȱlesȱfacteursȱnonȱscolairesȱaffectantȱlaȱperformance.ȱȱ ȱ 6ȱ MargueriteȱClarkeȱ Laȱ rechercheȱ seȱ concentreȱ toujoursȱ davantageȱ surȱ lesȱ caractéristiquesȱ deȱ systèmesȱ d’évaluationȱ efficacesȱ comprenantȱ lesȱ typesȱ d’activitéȱ etȱ lesȱ utilisationsȱ mentionnésȱ ciȬdessusȱ (c’estȬàȬdireȱ évaluationȱ enȱ classe,ȱ examensȱ etȱ évaluationsȱ systémiquesȱ àȱ grandeȱ échelle).ȱ Cetteȱ étudeȱ reposeȱ surȱ lesȱ principesȱ etȱ lesȱ bonnesȱ pratiquesȱ desȱ écritsȱ relatifsȱ auxȱ évaluations,ȱ ainsiȱ queȱ surȱ lesȱ analysesȱ desȱ systèmesȱ d’évaluationȱ deȱ nationsȱ trèsȱ performantes.ȱ DarlingȬHammondȱ etȱ Wentworthȱ (2010)ȱ ontȱ examinéȱ lesȱ pratiquesȱ desȱ systèmesȱ éducatifsȱ trèsȱ performantsȱ dansȱ leȱ mondeȱ entierȱ (parȱ exempleȱ l’Australie,ȱ laȱ Finlande,ȱ Singapour,ȱ laȱ Suèdeȱ etȱ leȱ RoyaumeȬUni)ȱ etȱ ontȱ remarquéȱ queȱ lesȱ activitésȱ d’évaluationȱ deȱ l’élèveȱdansȱcesȱsystèmesȱ:ȱ x illustraientȱ l’importanceȱ deȱ l’évaluationȱ deȱ etȱ pourȱ l’apprentissage,ȱ ainsiȱ queȱ commeȱ apprentissage,ȱ plutôtȱ queȱ commeȱ élémentȱ séparéȱ etȱ déconnectéȱdeȱl’actionȱéducativeȱȱ x fournissaientȱunȱfeedbackȱauxȱélèves,ȱenseignantsȱetȱécolesȱsurȱceȱquiȱaȱ étéȱ apprisȱ etȱ «ȱdonnaientȱ desȱ indicationsȱ»ȱ pouvantȱ informerȱ l’apprentissageȱ futur,ȱ ainsiȱ queȱ guiderȱ laȱ priseȱ deȱ décisionȱ relativeȱ àȱ laȱformationȱouȱàȱlaȱcarrièreȱ x faisaientȱ étroitementȱ correspondreȱ entreȱ euxȱ lesȱ attentesȱ quantȱ auȱ programme,ȱ leȱ sujetȱ etȱ lesȱ critèresȱ deȱ performanceȱ ainsiȱ queȱ lesȱ résultatsȱescomptésȱȱ x impliquaientȱ lesȱ enseignantsȱ dansȱ leȱ développementȱ deȱ lȇévaluationȱ etȱ deȱ laȱ notationȱ commeȱ moyensȱ d’améliorationȱ deȱ leurȱ pratiqueȱ professionnelleȱ etȱ deȱ leurȱ capacitéȱ àȱ accompagnerȱ l’apprentissageȱ etȱ laȱréussiteȱdeȱl’élèveȱȱ x impliquaientȱ lesȱ élèvesȱ dansȱ desȱ évaluationsȱ authentiquesȱ afinȱ d’améliorerȱleurȱmotivationȱetȱleurȱapprentissageȱȱ x cherchaientȱ àȱ faireȱ progresserȱ l’apprentissageȱ deȱ l’élèveȱ versȱ desȱ capacitésȱ deȱ réflexionȱ supérieureȱ etȱ deȱ résolutionȱ desȱ problèmesȱ enȱ utilisantȱ uneȱ gammeȱ élargieȱ deȱ stratégiesȱ pédagogiquesȱ etȱ d’évaluationȱ x privilégiaientȱlaȱqualitéȱàȱlaȱquantitéȱdesȱexamensȱstandardisés11ȱȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ 11ȱ C’estȬàȬdireȱ queȱ certainsȱ paysȱ ontȱ deȱ bonsȱ résultatsȱ dansȱ lesȱ exercicesȱ desȱ enquêtesȱ internationalesȱ maisȱ utilisentȱ peuȱ d’examensȱ standardisésȱ dansȱ leurȱ propreȱ systèmeȱ éducatifȱ (parȱ exemple,ȱ laȱ Finlande).ȱ D’autresȱ paysȱ mettentȱ l’accentȱ surȱ lesȱ examensȱ standardisésȱ (commeȱ lesȱ ÉtatsȬUnis)ȱ maisȱ neȱ réussissentȱ pasȱ aussiȱ bienȱ dansȱ lesȱ mêmesȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 7ȱ ȱ x utilisaientȱ majoritairementȱ etȱ deȱ plusȱ enȱ plusȱ dansȱ leursȱ systèmesȱ d’évaluation,ȱ desȱ tâchesȱ deȱ performanceȱ ouvertesȱ etȱ desȱ évaluationsȱ internesȱexigeantȱbeaucoupȱd’écritȱdeȱlaȱpartȱdeȱl’élèveȱetȱluiȱdonnantȱ desȱ chancesȱ deȱ développerȱ desȱ compétencesȱ duȱ «ȱvingtȬetȬ unièmeȱsiècleȱ».12ȱȱ Tandisȱ queȱ lesȱ recherchesȱ deȱ DarlingȬHammondȱ etȱ Wentworthȱ fournissentȱ uneȱ visionȱ élargieȱ desȱ propriétésȱ d’unȱ systèmeȱ d’évaluationȱ efficace,ȱ ellesȱ neȱ nousȱ disentȱ pasȱ commentȱ leȱ créer.ȱ D’autresȱ étudesȱ seȱ plongentȱ dansȱ cesȱ questionsȱ deȱ planification,ȱ processusȱ etȱ miseȱ enȱ œuvre.ȱ Parȱ exemple,ȱFerrerȱ (2006)ȱ proposeȱ desȱ conseilsȱ surȱlaȱ conceptionȱ deȱ systèmesȱ d’évaluationȱ adéquatsȱ etȱ durablesȱ basésȱ surȱ sonȱ analyseȱ desȱ systèmesȱ existantsȱ enȱ Amériqueȱ latine.ȱ Brayȱ etȱ Stewardȱ (1998)ȱ conduisentȱ uneȱ analyseȱ similaireȱ pourȱ lesȱ examensȱ dȇécolesȱ secondaires.ȱ D’autresȱ (parȱ exemple,ȱ Lockheed,ȱ 2009)ȱ évaluentȱ l’avancementȱ desȱ activitésȱ desȱ bailleursȱ deȱ fondsȱ dansȱ leȱ domaineȱ deȱ l’évaluationȱ etȱ discutentȱ desȱ moyensȱ dȇaméliorerȱ lȇefficacitéȱ deȱ ceȱ typeȱ deȱ soutienȱ auxȱ pays.ȱ D’autresȱ encoreȱ seȱ plongentȱ dansȱ l’aspectȱ politiqueȱ deȱ laȱ conceptionȱ deȱ systèmesȱ d’évaluationȱ durablesȱetȱefficacesȱ(McDermott,ȱ2011).ȱȱ Ceȱ documentȱ rassembleȱ tousȱ lesȱ courantsȱ deȱ donnéesȱ mentionnésȱ ciȬdessusȱ enȱ organisantȱ lesȱ questionsȱ etȱ facteursȱ clésȱ auȱ seinȱ d’unȱ cadreȱ unifiéȱ permettantȱ deȱ comprendreȱ àȱ quoiȱ ressembleȱ unȱ systèmeȱ dȇévaluationȱ efficaceȱ etȱ commentȱ lesȱ paysȱ peuventȱ commencerȱ àȱ créerȱ deȱ telsȱsystèmes.ȱȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ exercicesȱ desȱ enquêtesȱ internationales.ȱ 12ȱ Lesȱ résultatsȱ desȱ tâchesȱ deȱ performanceȱ standardiséesȱ sontȱ incorporésȱ auxȱ scoresȱ obtenusȱ auxȱ examensȱ parȱ lesȱ élèvesȱ dansȱ desȱ systèmesȱ aussiȱ variésȱ queȱ leȱ GCSEȱ auȱ RoyaumeȬUni,ȱ leȱ systèmeȱ d’examensȱ deȱ Singapour,ȱ lesȱ systèmesȱ deȱ certificatsȱ deȱ Victoriaȱ etȱ duȱ Queenslandȱ enȱ Australie,ȱ etȱ leȱ Baccalauréatȱ internationalȱ présentȱ dansȱ plusȱ deȱ 100ȱ paysȱ dansȱ leȱ monde.ȱ Cesȱ évaluationsȱ étantȱ inclusesȱ dansȱ leȱ programme,ȱ ellesȱ influencentȱ leȱ travailȱ quotidienȱ deȱ l’enseignementȱ etȱ deȱ l’apprentissageȱ enȱ mettantȱ l’accentȱ surȱ l’utilisationȱ desȱ connaissancesȱ pourȱ résoudreȱ lesȱ problèmes.ȱȱ 12ȱLesȱrésultatsȱdesȱtâchesȱdeȱperformanceȱstandardiséesȱsontȱincorporésȱauxȱscoresȱobtenusȱ auxȱ examensȱ parȱ lesȱ élèvesȱ dansȱ desȱ systèmesȱ aussiȱ variésȱ queȱ leȱ GCSEȱ auȱ RoyaumeȬUni,ȱ leȱ systèmeȱ d’examensȱ deȱ Singapour,ȱ lesȱ systèmesȱ deȱ certificatsȱ deȱ Victoriaȱ etȱ duȱ Queenslandȱ enȱ Australie,ȱ etȱ leȱ Baccalauréatȱ internationalȱ présentȱ dansȱ plusȱ deȱ 100ȱ paysȱ dansȱ leȱ monde.ȱ Cesȱ évaluationsȱ étantȱ inclusesȱ dansȱ leȱ programme,ȱ ellesȱ influencentȱ leȱ travailȱ quotidienȱ deȱ l’enseignementȱ etȱ deȱ l’apprentissageȱ enȱ mettantȱ l’accentȱ surȱ l’utilisationȱdesȱconnaissancesȱpourȱrésoudreȱlesȱproblèmes.ȱȱ ȱ 8ȱ MargueriteȱClarkeȱ Cadreȱpourȱlesȱsystèmesȱdȇévaluationȱdesȱélèvesȱ Pourȱ aborderȱ ceȱ cadreȱ deȱ façonȱ stratégique,ȱ ilȱ nousȱ fautȱ d’abordȱ identifierȱ certainesȱ dimensionsȱ clésȱ desȱ systèmesȱ dȇévaluation.ȱ Deuxȱ dimensionsȱ principalesȱ fontȱ iciȱ l’objetȱ deȱ notreȱ discussionȱ:ȱ (i)ȱ lesȱ types/objectifsȱdesȱactivitésȱd’évaluationȱetȱ(ii)ȱlaȱqualitéȱdeȱcesȱactivités.ȱȱ Premièreȱdimensionȱ:ȱlesȱtypesȱetȱlesȱobjectifsȱdesȱactivitésȱ d’évaluationȱȱ Lesȱ systèmesȱ d’évaluationȱ sontȱ généralementȱ constituésȱ deȱ troisȱ principauxȱ typesȱ d’activitésȱ dȇévaluationȱ correspondantȱ auxȱ troisȱ principauxȱbesoinsȱd’informationȱouȱobjectifsȱ(voirȱégalementȱAnnexeȱ1).ȱ Cesȱtypesȱetȱlesȱbesoinsȱd’informationȱconcomitantsȱsontȱ:ȱȱ x lesȱévaluationsȱenȱclasseȱquiȱfournissentȱdesȱinformationsȱenȱtempsȱréelȱ utilesȱ pourȱ l’enseignementȱ etȱ l’apprentissageȱ dansȱ lesȱ classesȱ individuellesȱȱ x lesȱ examensȱ quiȱ permettentȱ deȱ prendreȱ desȱ décisionsȱ relativesȱ auȱ parcoursȱ d’unȱ élèveȱ particulierȱ auȱ seinȱ duȱ systèmeȱ éducatifȱ (parȱ exemple,ȱ desȱ décisionsȱ surȱ unȱ certificatȱ ouȱ uneȱ sélection),ȱ yȱ comprisȱ desȱpropositionsȱd’opportunitésȱéducativesȱraresȱȱ x lesȱ évaluationsȱ systémiquesȱ àȱ grandeȱ échelleȱ quiȱ fournissentȱ unȱ suiviȱ etȱ desȱ informationsȱ utilesȱ auxȱ décideursȱ etȱ professionnelsȱ surȱ lesȱ niveauxȱ deȱ performanceȱ globaleȱ auȱ seinȱ duȱ système,ȱ lesȱ évolutionsȱ deȱcesȱniveauxȱetȱlesȱfacteursȱyȱcontribuantȱouȱquiȱyȱsontȱliés.ȱȱ Ilȱ estȱ certainȱ queȱ cesȱ typesȱ d’évaluationȱ neȱ sontȱ pasȱ totalementȱ indépendantsȱlesȱunsȱdesȱautresȱetȱneȱsontȱpasȱnonȱplusȱexhaustifsȱ(c’estȬ àȬdireȱ queȱ certainesȱ activitésȱ d’évaluationȱ n’entrentȱ pasȱ toutȱ àȱ faitȱ dansȱ cesȱ catégories).ȱ Pourȱ autant,ȱ ilsȱ représententȱ lesȱ principalesȱ sortesȱ dȇactivitésȱ dȇévaluationȱ utiliséesȱ dansȱ laȱ majoritéȱ desȱ systèmesȱ éducatifsȱ duȱmonde.ȱ Lesȱ évaluationsȱ enȱ classe,ȱ égalementȱ appeléesȱ évaluationsȱ continuesȱ ouȱformativesȱsontȱcellesȱquiȱsontȱmenéesȱparȱlesȱenseignantsȱauȱcoursȱdeȱ leursȱ activitésȱ quotidiennesȱ (Airasianȱ etȱ Russell,ȱ 2007).ȱ Ellesȱ comprennentȱ uneȱ variétéȱ d’instrumentsȱ etȱ procéduresȱ standardisésȱ etȱ nonȱ standardisésȱ permettantȱ deȱ recueillirȱ etȱ d’interpréterȱ desȱ manifestationsȱ desȱ acquisȱ deȱ l’élèveȱ àȱ l’écrit,ȱ l’oralȱ ouȱ sousȱ d’autresȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 9ȱ ȱ formes.ȱ Lesȱ activitésȱ d’évaluationȱ enȱ classeȱ peuventȱ êtreȱ desȱ questionsȱ oralesȱ etȱ unȱ feedback,ȱ desȱ devoirsȱ àȱ faireȱ àȱ laȱ maison,ȱ desȱ présentationsȱ parȱ l’élève,ȱ desȱ évaluationsȱ deȱ diagnosticȱ etȱ desȱ interrogationsȱ deȱ finȱ deȱ séquence.ȱ L’objectifȱ principalȱ deȱ cesȱ évaluationsȱ estȱ deȱ fournirȱ enȱ «ȱtempsȱ réelȱ»ȱ desȱ informationsȱ utilesȱ pourȱ l’enseignementȱ etȱ l’apprentissage.ȱȱ Lesȱexamens,ȱsouventȱqualifiésȱparȱlesȱtermesȱ«ȱpublicsȱ»,ȱ«ȱexternesȱ»ȱ ouȱ «ȱdeȱ finȱ deȱ cycleȱ»,ȱ fournissentȱ desȱ informationsȱ pourȱ uneȱ priseȱ deȱ décisionȱ deȱ premierȱ ordreȱ concernantȱ unȱ élèveȱ particulier,ȱ commeȱ parȱ exemple,ȱ êtreȱ orientéȱ versȱ unȱ typeȱ spécifiqueȱ d’établissementȱ ouȱ deȱ programmeȱ académique,ȱ obtenirȱ unȱ diplômeȱ duȱ lycéeȱ ouȱ entrerȱ àȱ l’universitéȱ (Greaneyȱ etȱ Kellaghan,ȱ 1995ȱ ;ȱ Heubertȱ etȱ Hauser,ȱ 1999).ȱ Qu’ilsȱ soientȱ administrésȱ àȱ l’extérieurȱ ouȱ (deȱ plusȱ enȱ plus)ȱ auȱ seinȱ deȱ l’établissementȱ scolaire,ȱ leurȱ natureȱ standardiséeȱ signifieȱ qu’uneȱ chanceȱ égaleȱ estȱ donnéeȱ àȱ tousȱ lesȱ élèvesȱ deȱ montrerȱ ceȱ qu’ilsȱ saventȱ etȱ peuventȱ faireȱ parȱ rapportȱ àȱ unȱ programmeȱ officielȱ ouȱ toutȱ autreȱ corpusȱ identifiéȱ deȱ savoirsȱ etȱ deȱ compétencesȱ (Madausȱ etȱ Clarke,ȱ 2001).ȱ Leȱ certificatȱ ouȱ l’examenȱ deȱ sortieȱ marquantȱ laȱ finȱ deȱ laȱ scolaritéȱ obligatoireȱ enȱ estȱ unȱ bonȱexempleȱdansȱdeȱnombreuxȱsystèmesȱéducatifs.ȱCommeȱévoquéȱplusȱ haut,ȱ laȱ natureȱ etȱ lȇimportanceȱ deȱ lȇenjeuȱ deȱ laȱ plupartȱ desȱ examensȱ peuventȱ produireȱ unȱ contrecoupȱ surȱ leȱ systèmeȱ éducatifȱ enȱ termesȱ deȱ contenuȱ deȱ lȇenseignementȱ etȱ deȱ lȇapprentissage,ȱ ceȱ quiȱ affecte,ȱ pourȱ leȱ meilleurȱ ouȱ pourȱ leȱ pire,ȱ leȱ profilȱ deȱ connaissancesȱ etȱ deȱ compétencesȱ desȱ diplômésȱ (Westȱ etȱ Crighton,ȱ 1999).ȱ Deȱ tellesȱ conséquencesȱ doiventȱ êtreȱ prisesȱ enȱ considérationȱ lorsquȇilȱ sȇagitȱ deȱ déterminerȱ siȱ lȇutilisationȱ deȱ cesȱ évaluationsȱ estȱ appropriée13ȱ etȱ si,ȱ ouȱalorsȱ comment,ȱ ellesȱ peuventȱ êtreȱ associéesȱ àȱ d’autresȱ sourcesȱ d’informationsȱ afinȱ deȱ garantirȱ uneȱ utilisationȱ desȱ résultatsȱ quiȱ soitȱ laȱ plusȱ justeȱ possibleȱ pourȱ lesȱ individus,ȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ 13ȱGreaneyȱ etȱ Kellaghanȱ (1995)ȱ remarquentȱ que,ȱ duȱ faitȱ desȱ fortsȱ enjeuxȱ liésȱ àȱ laȱ performanceȱ dansȱ lesȱ examens,ȱ laȱ pédagogieȱ desȱ enseignantsȱ estȱ souventȱ mobiliséeȱ parȱ ceȱ seulȱ objectif,ȱ mettantȱ deȱ côtéȱ lesȱ occasions,ȱ pourȱ lesȱ élèvesȱ quiȱ quitterontȱ l’écoleȱ tôt,ȱ d’acquérirȱ desȱ connaissancesȱ etȱ desȱ compétencesȱ pertinentes.ȱ Lesȱ pratiquesȱ associéesȱ auxȱ examensȱ pouvantȱ créerȱ desȱ inégalitésȱ pourȱ certainsȱ élèvesȱ sontȱ lesȱ modesȱ deȱ notation,ȱ leȱ paiementȱdeȱfraisȱd’examensȱparȱlesȱcandidats,ȱlesȱcoursȱparticuliers,ȱlaȱlangueȱdeȱl’examenȱ quiȱ peutȱ êtreȱ unȱ handicapȱ pourȱ certainsȱ élèvesȱ etȱ touteȱ uneȱ variétéȱ deȱ pratiquesȱ douteuses.ȱ L’utilisationȱ deȱ systèmesȱ deȱ quotasȱ pourȱ répondreȱ auxȱ variationsȱ deȱ performanceȱ selonȱ leȱ lieuȱgéographique,ȱl’appartenanceȱethniqueȱouȱlaȱlangueȱpratiquéeȱpeutȱégalementȱs’avérerȱ uneȱsourceȱd’iniquitéȱpourȱcertainsȱélèves.ȱ ȱ 10ȱ MargueriteȱClarkeȱ lesȱgroupesȱ etȱ laȱsociétéȱ dansȱ sonȱ ensemble.ȱ Ilȱ estȱimportantȱ deȱ soulignerȱ l’existenceȱ deȱ critèresȱ professionnelsȱ etȱ techniquesȱ trèsȱ spécifiquesȱ quantȱ àȱ lȇutilisationȱ appropriéeȱ ouȱ inappropriéeȱ desȱ examensȱ (etȱ desȱ évaluationsȱ enȱ général)ȱ pourȱ laȱ priseȱ deȱ décisionȱ deȱ premierȱ ordreȱ relativeȱàȱunȱélèveȱindividuelȱ(AERA,ȱAPA,ȱetȱNCME,ȱ1999).ȱȱ Lesȱ évaluationsȱ systémiquesȱ àȱ grandeȱ échelleȱ sontȱ conçuesȱ pourȱ fournirȱ desȱ renseignementsȱ surȱ lesȱ niveauxȱ deȱ performanceȱ dȇunȱ systèmeȱ etȱ lesȱ facteursȱ yȱ contribuantȱ ouȱ quiȱ yȱ sontȱ liésȱ (Greaneyȱ etȱ Kellaghan,ȱ 2008ȱ ;ȱ Kifer,ȱ 2001),ȱ typiquementȱ enȱ relationȱ àȱ unȱ ensembleȱ convenuȱ deȱ standardsȱ ouȱ d’objectifsȱ d’apprentissage,ȱ afinȱ d’informerȱ laȱ politiqueȱ éducativeȱ etȱ laȱ pratiqueȱ pédagogique.ȱ Ilȱ s’agitȱ parȱ exempleȱ desȱ enquêtesȱ internationalesȱ surȱ lesȱacquisȱdesȱ élèves,ȱ telsȱqueȱleȱ TIMSS,ȱ leȱ PIRLSȱ etȱ leȱ PISAȱ;ȱ desȱ enquêtesȱ régionales,ȱ commeȱ leȱ PASECȱ dansȱ l’Afriqueȱ francophone,ȱ leȱ SACMEQȱ dansȱ l’Afriqueȱ anglophoneȱ etȱ leȱ LLECEȱ enȱ AmériqueȱduȱSudȱ;ȱdesȱévaluationsȱauȱniveauȱnational,ȱtelsȱqueȱleȱSIMCEȱ auȱ Chiliȱ;ȱ etȱ desȱ évaluationsȱ auȱ niveauȱ régionalȱ dansȱunȱ pays,ȱ commeȱ lesȱ testsȱ auȱ niveauȱ desȱ États/provincesȱ auxȱ ÉtatsȬUnisȱ etȱ auȱ Canada.14ȱ Cesȱ évaluationsȱ varientȱ selonȱ leȱ niveauȱ scolaireȱ ouȱ l’âgeȱévalué,ȱ laȱ tailleȱ deȱ laȱ populationȱ cibléeȱ (échantillonȱ ouȱ recensement),ȱ laȱ dimensionȱ intérieureȱ ouȱextérieureȱ(parȱexemple,ȱdesȱcritèresȱnationauxȱouȱinternationaux),ȱlesȱ sujetsȱ ouȱ domainesȱ deȱ compétenceȱ mesurés,ȱ lesȱ typesȱ deȱ donnéesȱ contextuellesȱrecueilliesȱetȱlaȱfréquenceȱàȱlaquelleȱellesȱsontȱmenées.ȱEllesȱ varientȱ égalementȱ selonȱ laȱ façonȱ dontȱ lesȱ résultatsȱ sontȱ rapportésȱ etȱ utilisés.ȱ Parȱ exemple,ȱ commeȱ nousȱ l’avonsȱ vuȱ plusȱ haut,ȱ tandisȱ queȱ certainsȱ s’arrêtentȱ auȱ rapportȱ desȱ résultatsȱ auprèsȱ desȱ décideursȱ ouȱ duȱ grandȱ public,ȱ d’autresȱ utilisentȱ lesȱ résultatsȱ pourȱ mettreȱ desȱ groupesȱ spécifiquesȱ duȱ systèmeȱ éducatifȱ devantȱ leursȱ responsabilitésȱ (Clarke,ȱ 2007).15ȱȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ 14ȱTIMSSȱ (Trendsȱ inȱ Internationalȱ Mathematicsȱ andȱ Scienceȱ Study)ȱ ;ȱ PIRLSȱ (Progressȱ inȱ Internationalȱ Readingȱ Literacyȱ Study)ȱ ;ȱ PISAȱ (Programȱ forȱ Internationalȱ Studentȱ Assessment)ȱ ;ȱ PASECȱ (Programmeȱ dȇAnalyseȱ desȱ Systèmesȱ Éducatifs)ȱ ;ȱ SACMEQȱ (Southernȱ andȱ Easternȱ Africaȱ Consortiumȱ forȱ Monitoringȱ Educationalȱ Quality)ȱ ;ȱ LLECEȱ (Laboratorioȱ Latinoamericanoȱ deȱ Evaluaciónȱ deȱ laȱ Calidadȱ deȱ laȱ Educación)ȱ ;ȱ SIMCEȱ (Sistemaȱ deȱ Mediciónȱ deȱ Calidadȱ deȱ laȱ Educación).ȱ 15ȱ Leȱ soutienȱ deȱ laȱ Banqueȱ mondialeȱ enȱ matièreȱ d’activitésȱ d’évaluationȱ cesȱ 20ȱ dernièresȱ annéesȱ(LarchȱetȱLockheed,ȱ1992ȱ;ȱLibermanȱetȱClarke,ȱ2012)ȱaȱévolué,ȱpassantȱdeȱlaȱréformeȱ desȱ examensȱ àȱ laȱ miseȱ enȱ œuvreȱ d’exercicesȱ d’évaluationȱ systémiqueȱ àȱ grandeȱ échelleȱ afinȱ deȱsuivreȱlesȱtendancesȱauȱniveauȱdesȱacquisȱetȱd’informerȱlesȱpolitiquesȱetȱpratiques.ȱȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 11ȱ ȱ Unȱ moyenȱ deȱ différencierȱ cesȱ troisȱ typesȱ d’activitésȱ d’évaluationȱ estȱ leȱ suivantȱ:ȱ l’évaluationȱ enȱ classeȱ porteȱ principalementȱ surȱ l’évaluationȱ commeȱ apprentissageȱ ouȱ pourȱ l’apprentissageȱ (elleȱ estȱ doncȱ fondamentalementȱ deȱ natureȱ formative)ȱ tandisȱ queȱ lesȱ examensȱ etȱ enquêtesȱ sontȱ surtoutȱ desȱ évaluationsȱ deȱ l’apprentissageȱ (etȱ doncȱ deȱ natureȱ sommative).ȱ Cesȱ distinctionsȱ neȱ sontȱ pasȱ toujoursȱ trèsȱ nettesȱ enȱ pratique,ȱ etȱ desȱ approchesȱ hybridesȱ sontȱ deȱ plusȱ enȱ plusȱ communes.ȱ Singapourȱ a,ȱ parȱ exemple,ȱ unȱ systèmeȱ d’évaluationȱ structuréȱ autourȱ d’examensȱ publicsȱ maisȱ aȱ constituéȱ touteȱ uneȱ infrastructureȱ deȱ soutienȱ pourȱ l’apprentissageȱ enȱ parallèleȱ deȱ ceȱ systèmeȱ (L.ȱ Benveniste,ȱ communicationȱ personnelle,ȱ marsȱ 2010).ȱ D’autresȱ activitésȱ hybridesȱ impliquentȱ l’adaptationȱ d’instrumentsȱ conçusȱ pourȱ unȱ typeȱ d’activitéȱ d’évaluationȱ (parȱ exempleȱ desȱ instrumentsȱ deȱ laȱ classeȱ informantȱ laȱ pédagogie)ȱ dansȱ unȱ autreȱ butȱ (parȱ exemple,ȱ documenterȱ laȱ performanceȱ auȱ niveauȱ systémique).ȱ Àȱ cetȱ égard,ȱ uneȱ desȱ initiativesȱ lesȱ plusȱ connuesȱ estȱ l’Earlyȱ Gradeȱ Readingȱ Assessmentȱ (EGRA),ȱ unȱ instrumentȱ élaboréȱ avecȱ leȱ soutienȱ d’agencesȱ desȱ bailleursȱ deȱ fondsȱ etȱ d’expertsȱ pourȱ uneȱ utilisationȱ dansȱ lesȱ paysȱ enȱ voieȱ deȱ développementȱ (https://www.eddataglobal.org/).ȱ Selonȱ unȱ outilȱ conçuȱ àȱ l’origineȱ pourȱ uneȱ utilisationȱ enȱ classe,ȱ l’EGRAȱ estȱ utiliséȱ pourȱ recueillirȱ desȱ donnéesȱ systémiquesȱ surȱ laȱ performanceȱ desȱ élèvesȱ relativeȱ auxȱ compétencesȱ deȱ baseȱ enȱ lectureȱ afinȱ d’informerȱ lesȱ ministèresȱ etȱ lesȱ bailleursȱ surȱ lesȱ besoinsȱduȱsystèmeȱpourȱaméliorerȱlaȱpédagogieȱ(GoveȱetȱCvelich,ȱ2011).ȱȱ Lesȱ systèmesȱ éducatifsȱ peuventȱ comporterȱ desȱ profilsȱ relativementȱ différentsȱ enȱ termesȱ dȇimportanceȱ desȱ différentsȱ typesȱ d’activitésȱ d’évaluation.ȱ Leȱ systèmeȱ éducatifȱ deȱ laȱ Finlandeȱ metȱ parȱ exempleȱ l’accentȱ surȱ l’évaluationȱ enȱ classeȱ commeȱ uneȱ sourceȱ cléȱ d’informationȱ surȱl’apprentissageȱetȱlesȱacquisȱdeȱlȇélèveȱetȱexploiteȱbeaucoupȱmoinsȱlesȱ examensȱ ouȱ l’évaluationȱ systémiqueȱ àȱ grandeȱ échelle.ȱ Laȱ Chineȱ accordeȱ traditionnellementȱ uneȱ importanceȱ considérableȱ auxȱ examensȱ quiȱ sontȱ unȱ moyenȱ deȱ trierȱ etȱ sélectionnerȱ leȱ vasteȱ ensembleȱ deȱ sesȱ effectifsȱ dȇélèves,ȱ etȱ uneȱ attentionȱ relativementȱ moindreȱ àȱ lȇévaluationȱ enȱ classeȱ ouȱ lesȱ enquêtesȱ àȱ grandeȱ échelleȱ (bienȱ qu’uneȱ évolutionȱ soitȱ amorcée).16ȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ ȱ Parmiȱ d’autresȱ facteursȱ figurentȱ l’héritageȱ desȱ évaluationsȱ dansȱ l’histoireȱ d’unȱ systèmeȱ 16 éducatifȱ particulier,ȱ quiȱ peutȱ causerȱ unȱ intérêtȱ préférentielȱ pourȱ unȱ typeȱ d’activitéȱ d’évaluationȱ (Madaus,ȱ Clarke,ȱ etȱ O’Leary,ȱ 2003)ȱ;ȱ laȱ capacitéȱ desȱ diversesȱ partiesȱ prenantesȱ ȱ 12ȱ MargueriteȱClarkeȱ Lesȱ facteursȱ contribuantȱ àȱ cesȱ différentsȱ profilsȱ deȱ systèmesȱ dȇévaluationȱ varient,ȱ qu’ilȱ s’agisseȱ deȱ laȱ visionȱ officielleȱ etȱ desȱ objectifsȱ duȱ systèmeȱ éducatifȱ (etȱ leȱ rôleȱ deȱ l’évaluationȱ dansȱ laȱ réalisationȱ deȱ cetteȱ vision)ȱ ouȱ desȱ structuresȱ économiquesȱ etȱ desȱ opportunitésȱ dansȱ unȱ pays,ȱ ainsiȱ queȱ desȱ besoinsȱ enȱ informationȱ desȱ principalesȱ partiesȱ prenantes.ȱ L’existenceȱ d’unȱ profilȱ idéalȱ deȱ systèmeȱ d’évaluationȱ fonctionnantȱ toutȱ aussiȱ bienȱ enȱ touteȱoccasionȱn’aȱrienȱd’évident.ȱ Deuxièmeȱdimensionȱ:ȱlesȱvecteursȱdeȱlaȱqualitéȱ Auȱ lieuȱ deȱ pouvoirȱ référencerȱ unȱ profilȱ idéalȱ deȱ systèmeȱ d’évaluationȱ desȱ élèves,ȱ laȱ considérationȱ cléȱ estȱ celleȱ deȱ laȱ qualitéȱ individuelleȱ etȱ combinéeȱ desȱ activitésȱ d’évaluationȱ enȱ termesȱ deȱ pertinenceȱ deȱ l’informationȱ généréeȱ pourȱ unȱ soutienȱ àȱ laȱ priseȱ deȱ décisionȱ (Messick,ȱ 1989ȱ;ȱShepard,ȱ2000).ȱȱ Onȱ trouveȱ troisȱ principauxȱ vecteursȱ deȱ laȱ qualitéȱ deȱ l’informationȱ dansȱ unȱ systèmeȱ d’évaluationȱ (AERA,ȱ APA,ȱ etȱ NCME,ȱ 1999ȱ ;ȱ DarlingȬ HammondȱetȱWentworth,ȱ2010)ȱ:ȱȱ x unȱcontexteȱfavorableȱȱ x l’adéquationȱduȱsystèmeȱȱ x laȱqualitéȱdeȱlȇévaluation.ȱȱ Bienȱ qu’étroitementȱ liées,ȱ cesȱ troisȱ dimensionsȱ sontȱ présentéesȱ iciȱ séparémentȱauxȱfinsȱdeȱlaȱdiscussion.ȱȱ Leȱ contexteȱ favorableȱ estȱ leȱ contexteȱ élargiȱ dansȱ lequelȱ l’activitéȱ d’évaluationȱestȱmenéeȱetȱlaȱmesureȱdansȱlaquelleȱceȱcontexteȱestȱpropiceȱ à,ȱ ouȱ soutient,ȱ l’évaluation.ȱ Ilȱ recouvreȱ lesȱ domainesȱ telsȱ queȱ leȱ cadreȱ législatifȱ ouȱ politiqueȱ desȱ activitésȱ dȇévaluationȱ ;ȱ leȱ leadershipȱ entourantȱ lȇactivitéȱ dȇévaluationȱ (yȱ comprisȱ laȱ volontéȱ politiqueȱ deȱ menerȱ uneȱ évaluationȱ enȱ dépitȱ deȱ laȱ conscienceȱ duȱ faitȱ queȱ lesȱ résultatsȱ pourraientȱ révélerȱ deȱ gravesȱ problèmesȱ ouȱ desȱ inégalitésȱ dansȱ l’apprentissage)ȱ;ȱ l’engagementȱ publicȱ auprèsȱ deȱ l’activitéȱ d’évaluationȱ;ȱ lesȱ modalitésȱ institutionnellesȱ deȱ laȱ conception,ȱ deȱ laȱmiseȱ enȱ œuvreȱ ouȱ deȱ l’utilisationȱ desȱ résultatsȱ deȱ l’activitéȱ d’évaluation17ȱ;ȱ laȱ miseȱ àȱ dispositionȱ deȱ sourcesȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ dansȱ leȱ systèmeȱ àȱ conduireȱ différentsȱ typesȱ d’activitésȱ d’évaluationȱ (Greaneyȱ etȱ Kellaghan,ȱ 2008)ȱ;ȱetȱleȱcoût,ȱperçuȱouȱréel,ȱdesȱactivitésȱd’évaluationȱ(Wolff,ȱ2007).ȱȱ 17ȱUnȱ débatȱexisteȱsurȱlaȱnécessitéȱouȱnonȱ deȱmenerȱlesȱexamensȱouȱlesȱunitésȱd’évaluationȱàȱ grandeȱ échelleȱ enȱ interneȱ ouȱ surȱ unȱ modeȱ externeȱ auȱ ministèreȱ deȱ l’éducation.ȱ Enȱ fait,ȱ laȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 13ȱ ȱ deȱ financementȱ suffisantesȱ etȱ stablesȱ etȱ laȱ présenceȱ deȱ personnelȱ d’évaluationȱcompétentȱetȱdȇenseignantsȱenȱclasse.ȱ Mettreȱ enȱ placeȱ unȱ contexteȱ favorableȱ estȱ primordial,ȱ carȱ c’estȱ unȱ vecteurȱ cléȱ deȱ laȱ qualitéȱ àȱ longȱ termeȱ etȱ deȱ l’efficacitéȱ d’unȱ systèmeȱ d’évaluation.ȱ Commeȱ laȱ terre,ȱ l’eauȱ etȱ l’airȱ nécessairesȱ àȱ laȱ croissanceȱ d’uneȱ plante,ȱ aucunȱ systèmeȱ d’évaluationȱ n’estȱ durableȱ sansȱ luiȱ (Banqueȱ mondiale,ȱ 2010).ȱ Dansȱ laȱ plupartȱ desȱ cas,ȱ c’estȱ auȱ gouvernementȱ deȱ fournirȱ laȱ vision,ȱ leȱ leadershipȱ etȱ leȱ cadreȱ politiqueȱ permettantȱ d’établirȱ ceȱ contexteȱ favorableȱ (ilȱ fautȱ cependantȱ garderȱ àȱ l’espritȱ qu’uneȱ autonomieȱ relativeȱ parȱ rapportȱ àȱ l’influenceȱ politiqueȱ estȱ uneȱ desȱ caractéristiquesȱ d’unȱ systèmeȱ d’évaluationȱ plusȱ mature),ȱ quiȱ pourraȱ ensuiteȱêtreȱmisȱenȱœuvreȱviaȱdesȱpartenariatsȱpublic/privéȱ(parȱexemple,ȱ confierȱ l’administrationȱ d’unȱ programmeȱ d’évaluationȱ àȱ uneȱ firmeȱ externe).ȱ Certainsȱ systèmesȱ d’éducation,ȱ particulièrementȱ dansȱ unȱ contexteȱ fédéral,ȱ associentȱ leursȱ forcesȱ pourȱ créerȱ unȱ contexteȱ favorableȱ enȱ termesȱ deȱ mutualisationȱ desȱ ressourcesȱ ouȱ desȱ modalitésȱ institutionnellesȱ pourȱ leȱ développement,ȱ l’analyseȱ ouȱ leȱ reportingȱ relatifsȱ auxȱ évaluationsȱ (parȱ exemple,ȱ lorsqueȱ lesȱ étatsȱ ouȱ lesȱ systèmesȱ seȱ réunissentȱ pourȱ élaborerȱ uneȱ banqueȱ communeȱ dȇélémentsȱ queȱ chacunȱ pourraȱ utiliserȱ selonȱ sesȱ propresȱ objectifs,ȱ réduisantȱ parȱ làȬmêmeȱ leȱ coûtȱ pourȱ lesȱ étatsȱ ouȱ systèmesȱ individuels).ȱ Desȱ exercicesȱ d’évaluationȱ régionale,ȱ telsȱ queȱ leȱ SACMEQ,ȱ leȱ PASECȱ ouȱ leȱ LLECEȱ représententȱ uneȱ autreȱ formeȱ deȱ collaborationȱ pourȱ créerȱ unȱ contexteȱ favorable.ȱ Lesȱ économiesȱ dȇéchelleȱ réaliséesȱ parȱ cesȱ collaborationsȱ facilitentȱ laȱ rentabilitéȱ duȱ développementȱ d’évaluationsȱ deȱ meilleureȱ qualitéȱ etȱ deȱ l’incorporationȱ d’avancéesȱ technologiquesȱ dansȱ leȱ processusȱ d’évaluation.ȱȱ L’adéquationȱ duȱ systèmeȱ concerneȱ laȱ mesureȱ dansȱ laquelleȱ l’évaluationȱ estȱ enȱ adéquationȱ avecȱ d’autresȱ composantesȱ duȱ systèmeȱ éducatif.ȱ Elleȱ comprendȱ leȱ rapportȱ entreȱ lesȱ activitésȱ d’évaluationȱ etȱ lesȱ objectifsȱdeȱl’apprentissage,ȱlesȱcritères,ȱleȱprogrammeȱetȱlesȱopportunitésȱ deȱ formationȱ initialeȱ etȱ continueȱ desȱ enseignantsȱ (Fuhrmanȱ etȱ Elmore,ȱ 1994ȱ ;ȱ Smithȱ etȱ O’Day,ȱ 1991).ȱ Ilȱ importeȱ queȱ lesȱ activitésȱ dȇévaluationȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ situationȱ institutionnelleȱ importeȱ moinsȱ qu’uneȱ cultureȱ deȱ laȱ continuitéȱ etȱ deȱ laȱ transparenceȱ crééeȱ autourȱ deȱ l’évaluationȱ (Ravelaȱ etȱ al.,ȱ 2008).ȱ Cetteȱ cultureȱ existeȱ lorsqu’uneȱ évaluationȱ aȱ unȱ mandatȱ clairȱ etȱ uneȱ structureȱ solide,ȱ ceȱ quiȱ implique,ȱ pourȱ leȱ systèmeȱd’évaluation,ȱlaȱnécessitéȱd’êtreȱappuyéȱparȱunȱstatutȱjuridique.ȱȱ ȱ 14ȱ MargueriteȱClarkeȱ soientȱ enȱ adéquationȱ avecȱ leȱ resteȱ duȱ systèmeȱ éducatifȱ afinȱ queȱ lesȱ informationsȱ qu’ellesȱ fournissentȱ soientȱ utilesȱ àȱ l’améliorationȱ deȱ laȱ qualitéȱpédagogiqueȱduȱsystèmeȱetȱqueȱdesȱsynergiesȱpuissentȱseȱcréer.ȱȱ Cetteȱ adéquationȱ impliqueȱ davantageȱ quȇuneȱ simpleȱ correspondanceȱ entreȱ ceȱ quiȱ estȱ évaluéȱ etȱ ceȱ quiȱ seȱ trouveȱ dansȱ lesȱ critèresȱ officielsȱ ouȱ leȱ programmeȱ prévuȱ (ilȱ estȱ cependantȱ importantȱ queȱ laȱ plupartȱ desȱ activitésȱ d’évaluationȱ fournissentȱ unȱ minimumȱ dȇinformationsȱsurȱlȇapprentissageȱetȱlesȱacquisȱdeȱl’élèveȱparȱrapportȱauxȱ critèresȱ officielsȱ ouȱ auȱ programme).ȱ Tandisȱ queȱ laȱ correspondanceȱ entreȱ leȱ programmeȱ d’unȱ paysȱ etȱ ceȱ quiȱ estȱ évaluéȱ dansȱ lesȱ enquêtesȱ internationalesȱ telsȱ queȱ leȱ PISAȱ etȱ leȱ TIMSSȱ peutȱ êtreȱ faible,ȱ l’enquêteȱ peutȱ toutȱ deȱ mêmeȱ correspondreȱ (etȱ êtreȱ richeȱ enȱ informations)ȱ auxȱ objectifsȱd’ensembleȱetȱaspirationsȱduȱsystèmeȱéducatifȱetȱdeȱsaȱréforme.ȱȱ Dansȱ ceȱ cas,ȱ l’évaluationȱ peutȱ enȱ faitȱ apporterȱ desȱ améliorationsȱ qualitativesȱ auȱ systèmeȱ éducatifȱ plutôtȱ queȱ d’effectuerȱ unȱ simpleȱ suiviȱ (malgréȱ tout,ȱ l’utilisationȱ deȱ donnéesȱ desȱ TIMSS,ȱ PIRLSȱ etȱ PISAȱ dansȱ leȱ suiviȱ àȱ longȱ termeȱ deȱ l’impactȱ desȱ réformesȱ nationalesȱ surȱ laȱ performanceȱ s’estȱ avéréeȱ unȱ élémentȱ cléȱ dansȱ l’améliorationȱ duȱ niveauȱ desȱ acquisȱ dansȱ desȱ paysȱ aussiȱ diversȱ queȱ leȱ Brésil,ȱ laȱ Jordanieȱ etȱ laȱ Pologne).ȱ Laȱ qualitéȱ deȱ lȇévaluationȱ faitȱ référenceȱ àȱ laȱ qualitéȱ psychométriqueȱ desȱ instruments,ȱ processusȱ etȱ procéduresȱ utilisésȱ dansȱ lȇactivitéȱ dȇévaluationȱ(AERA,ȱAPAȱetȱNCME,ȱ1999).ȱIlȱestȱimportantȱdeȱremarquerȱ queȱ laȱ qualitéȱ deȱ l’évaluationȱ estȱ unȱ souciȱ pourȱ toutȱ typeȱ d’activitéȱ d’évaluation,ȱ c’estȬàȬdireȱ qu’ilȱ s’agisseȱ d’uneȱ évaluationȱ enȱ classeȱ ouȱ d’uneȱ évaluationȱ systémiqueȱ àȱ grandeȱ échelle.ȱ Elleȱ recouvreȱ desȱ questionsȱ tellesȱ queȱ laȱ conceptionȱ etȱ laȱ miseȱ enȱ œuvreȱ desȱ activitésȱ d’évaluation,ȱ desȱ questionsȱ d’examenȱ ouȱ desȱ élémentsȱ d’enquêteȱ;ȱ l’analyseȱ etȱ l’interprétationȱ desȱ réponsesȱ desȱ élèvesȱ auxȱ activités,ȱ questionsȱ ouȱ élémentsȱ d’évaluationȱ;ȱ ainsiȱ queȱ laȱ pertinenceȱ deȱ laȱ façonȱ dontȱ l’évaluation,ȱ ouȱ lesȱ résultatsȱ deȱ l’enquête,ȱ sontȱ rapportésȱ etȱ utilisésȱ (Heubertȱ etȱ Hauser,ȱ 1999ȱ ;ȱ Shepard,ȱ 2000).ȱ Selonȱ l’activitéȱ d’évaluation,ȱ lesȱ critèresȱ exactsȱ utilisésȱ pourȱ cesȱ décisionsȱ varient.ȱ Laȱ qualitéȱ deȱ l’évaluationȱ estȱ importante,ȱ carȱ siȱ uneȱ évaluationȱ n’estȱ pasȱ fiableȱ enȱ termesȱ deȱ conception,ȱ miseȱ enȱ œuvre,ȱ analyse,ȱ interprétation,ȱ reportingȱ ouȱ utilisation,ȱ elleȱ peutȱ contribuerȱ àȱ laȱ priseȱ deȱ mauvaisesȱ décisionsȱ relativesȱ àȱl’apprentissageȱdesȱ élèvesȱ etȱ àȱ laȱ qualitéȱ duȱ systèmeȱ(Messick,ȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 15ȱ ȱ 1989ȱ ;ȱ Wolff,ȱ 2007).ȱ Enȱ fait,ȱ uneȱ qualitéȱ dȇévaluationȱ médiocreȱ pourraitȱ saperȱ laȱ totalitéȱ deȱ l’exerciceȱ d’évaluationȱ siȱ elleȱ engendreȱ uneȱ méfianceȱ parȱrapportȱàȱl’approche.ȱ Deuxȱ aspectsȱ techniquesȱ doiventȱ êtreȱ prisȱ enȱ considérationȱ dansȱ touteȱ étudeȱ deȱ laȱ qualitéȱ deȱ lȇévaluationȱ :ȱ laȱ fiabilitéȱ etȱ laȱ validité.ȱ Laȱ fiabilitéȱ recouvreȱ lȇexactitudeȱ desȱ informationsȱ produitesȱ parȱ lȇévaluation,ȱ etȱ estȱ particulièrementȱ importanteȱ dansȱ lesȱ examensȱ dontȱ lesȱ enjeuxȱ sontȱ deȱ premierȱ ordre,ȱ ainsiȱ qu’enȱ casȱ deȱ suiviȱ dansȱ leȱ temps.ȱ Laȱ validitéȱ concerneȱ laȱ mesureȱ dansȱ laquelleȱ lesȱ scoresȱ deȱ l’évaluationȱ représententȱ bienȱ ceȱ qu’ilsȱ sontȱ censésȱ représenterȱ etȱ s’ilsȱ conviennentȱ auxȱ utilisationsȱ prévues.ȱ Unȱ dangerȱ communȱ pourȱ laȱ validitéȱ desȱ scoresȱ estȱ l’existenceȱ d’uneȱ différenceȱ entreȱ laȱ langueȱ deȱ l’enseignementȱ etȱ celleȱ deȱ l’évaluation,ȱ ceȱ quiȱ compliqueȱ lesȱ chosesȱ pourȱ l’enfantȱ quiȱ doitȱ montrerȱ ceȱ qu’ilȱ saitȱ etȱ peutȱ faire.ȱ L’utilisationȱ desȱ résultatsȱ estȱ unȱ conceptȱ essentielȱ deȱlaȱ validitéȱquiȱ exigeȱ qu’onȱ prenneȱ soigneusementȱ enȱ compteȱ sesȱ conséquences,ȱ yȱ comprisȱ socialesȱ etȱ économiques,ȱ ainsiȱ queȱ lesȱautresȱimpactsȱsurȱdifférentsȱgroupesȱdeȱlaȱpopulation.ȱȱ Siȱ l’onȱ croiseȱ cesȱ vecteursȱ deȱ laȱ qualitéȱ avecȱ lesȱ différentsȱ typesȱ etȱ objectifs,ȱonȱobtientȱleȱcadreȱexposéȱdansȱleȱtableauȱ1.ȱȱ ȱ ȱ Tableauȱ1.ȱCadreȱpourȱlaȱproductionȱd’unȱsystèmeȱd’évaluationȱdesȱ élèvesȱplusȱefficaceȱ Types/objectifs de l’évaluation Évaluation Évaluation en systémique classe Examens à grande échelle Contexte favorable Adéquation du système Qualité de l'évaluation Sourceȱ:ȱBanqueȱmondiale.ȱ ȱ ȱ 16ȱ MargueriteȱClarkeȱ Laȱ suiteȱ deȱ ceȱ documentȱ formeȱ leȱ cadreȱ etȱ discuteȱ deȱ sonȱ utilisationȱ pourȱl’élaborationȱd’unȱsystèmeȱd’évaluationȱplusȱefficace.ȱCeȱcadreȱpeutȱ êtreȱ appliquéȱ auȱ systèmeȱ d’évaluationȱ deȱ toutȱ paysȱ pourȱ ouvrirȱ laȱ voieȱ àȱ uneȱ discussionȱ surȱ lesȱ pointsȱ fortsȱ duȱ systèmeȱ etȱ ceuxȱ nécessitantȱ dȇêtreȱ retravaillés.ȱȱ Formationȱduȱcadreȱ Leȱ cadreȱ duȱ tableauȱ 1ȱ estȱ unȱ pointȱ deȱ départȱ pourȱ identifierȱ lesȱ indicateursȱpouvantȱêtreȱutilisésȱpourȱrevoirȱdesȱsystèmesȱdȇévaluationȱetȱ préparerȱ leurȱ amélioration.ȱ Lesȱ indicateursȱ peuventȱ êtreȱ identifiésȱ selonȱ uneȱcombinaisonȱdeȱcritèresȱcomprenantȱ:ȱȱ x lesȱstandardsȱprofessionnelsȱdeȱl’évaluationȱ x laȱ rechercheȱ empiriqueȱ surȱ lesȱ caractéristiquesȱ desȱ systèmesȱ d’évaluationȱ efficaces,ȱ dontȱ l’analyseȱ desȱ particularitésȱ distinguantȱ lesȱ systèmesȱ d’évaluationȱ desȱ nationsȱ performantesȱ etȱ peuȱ performantesȱ x laȱ théorie,ȱ c’estȬàȬdireȱ leȱ consensusȱ généralȱ parmiȱ lesȱ expertsȱ selonȱ lequelȱleȱsystèmeȱcontribueȱàȱuneȱévaluationȱefficace.ȱȱ Laȱ baseȱ desȱ donnéesȱ empiriquesȱ estȱ plusȱ solideȱ dansȱ certainsȱ domaines.ȱ Parȱ exemple,ȱ deȱ nombreuxȱ critèresȱ professionnelsȱ existentȱ pourȱlaȱqualitéȱdeȱl’évaluationȱ(APA,ȱAERA,ȱetȱNCME,ȱ1999),18ȱbeaucoupȱ moinsȱ pourȱ leȱ contexteȱ favorable.ȱ Enȱ outre,ȱ certainesȱ étudesȱ empiriquesȱ sontȱ limitéesȱ parȱ leurȱ natureȱ corrélationnelle,ȱ etȱ laȱ prudenceȱ estȱ doncȱ deȱ miseȱ afinȱ d’éviterȱ desȱ attributionsȱ inappropriéesȱ ouȱ uneȱ surinterprétationȱ deȱ l’associationȱ entreȱ lesȱ caractéristiques.ȱ Malgréȱ cesȱ limites,ȱ lesȱ donnéesȱ empiriquesȱ provenantȱ d’uneȱ variétéȱ deȱ sourcesȱ convergentȱ deȱ façonȱ relativementȱ convaincanteȱ pourȱ permettreȱ deȱ distinguerȱ ceȱ quiȱ caractériseȱ uneȱévaluationȱmeilleureȱd’uneȱautre,ȱmoinsȱbonne.ȱ Lesȱ critèresȱ etȱ considérationsȱ exposésȱ ciȬdessusȱ ontȱ étéȱ utilisésȱ afinȱ d’élargirȱ lesȱ vecteursȱ deȱ laȱ qualitéȱ auxȱ grandsȱ domainesȱ indicateursȱ exposésȱ dansȱ leȱ tableauȱ 2.ȱ Cesȱ domainesȱ sontȱ plusȱ particulièrementȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ ȱIlȱ existeȱ uneȱ baseȱ deȱ rechercheȱ significativeȱ portantȱ surȱ l’adéquationȱ duȱ systèmeȱ (parȱ 18 exemple,ȱFuhrmanȱetȱElmore,ȱ1994ȱ;ȱHamilton,ȱStecher,ȱetȱKlein,ȱ2002).ȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 17ȱ ȱ pertinentsȱ pourȱ lesȱ examensȱ etȱ lesȱ activitésȱ d’évaluationȱ systémiqueȱ àȱ grandeȱ échelleȱ maisȱ peuventȱ égalementȱ êtreȱ appliquésȱ àȱ lȇévaluationȱ enȱ classe.ȱȱ ȱ Tableauȱ2.ȱCadreȱpourȱlaȱproductionȱd’unȱsystèmeȱd’évaluationȱdesȱ élèvesȱplusȱefficace,ȱavecȱdeȱgrandsȱdomainesȱindicateursȱ Types/objectifs de l’évaluation Évaluation Évaluation en systémique classe Examens à grande échelle Politiques Leadership et engagement public Contexte favorable Financement Modalités institutionnelles Ressources humaines Adéquation Objectifs en termes d'apprentissage/qualité Programme du système Opportunités de formation initiale et continue de l’enseignant Qualité Garantie de la qualité (conception, administration, analyse) de l'évaluation Garantie d’utilisations efficaces Sourceȱ:ȱBanqueȱmondiale.ȱȱ ȱ Desȱ donnéesȱ relativesȱ àȱ certainsȱ deȱ cesȱ domainesȱ indicateursȱ peuventȱ êtreȱtrouvéesȱ dansȱ desȱ documentsȱ officiels,ȱdesȱ rapportsȱpubliésȱ (parȱ exempleȱ Ferrer,ȱ 2006),ȱ desȱ articlesȱ deȱ rechercheȱ (telsȱ queȱ Braunȱ etȱ Kanjee,ȱ 2006)ȱ etȱ desȱ basesȱ deȱ donnéesȱ enȱ ligne.19ȱ Pourȱ l’essentiel,ȱ cependant,ȱ lesȱ donnéesȱ pertinentesȱ n’ontȱ pasȱ étéȱ collectéesȱ deȱ façonȱ exhaustiveȱ ouȱ systématique.20ȱ Ceuxȱ quiȱ désirentȱ examinerȱ ceȱ typeȱ d’informationsȱ pourȱ unȱ systèmeȱ d’évaluationȱ particulierȱ devrontȱ probablementȱ recueillirȱ lesȱ donnéesȱ parȱ euxȬmêmes.ȱ Enȱ réponseȱ àȱ ceȱ besoin,ȱ laȱ Banqueȱ mondialeȱ aȱ développéȱ unȱ ensembleȱ deȱ questionnairesȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ 19ȱParmiȱlesȱbasesȱdeȱdonnéesȱlesȱplusȱutilesȱ:ȱhttp://www.inca.org.uk/ȱetȱhttp://epdc.org/.ȱ 20ȱ Brinkley,ȱ Guthrieȱ etȱ Wyattȱ (1991)ȱ ontȱ étudiéȱ lesȱ pratiquesȱ d’examenȱ etȱ d’évaluationȱ systémiqueȱ àȱ grandeȱ échelleȱ dansȱ lesȱ paysȱ deȱ l’OCDE.ȱ Larachȱ etȱ Lockheedȱ (1992)ȱ ontȱ menéȱ uneȱ étudeȱ similaireȱ surȱ lesȱ évaluationsȱ avecȱ leȱ soutienȱ deȱ laȱ Banqueȱ mondiale.ȱ Macintoshȱ (1994)ȱ aȱ menéȱ uneȱ étudeȱ dansȱ 10ȱ paysȱ (Australie,ȱ Bahreïn,ȱ Angleterreȱ etȱ Paysȱ deȱ Galles,ȱ Guatemala,ȱIsraël,ȱMalaisie,ȱNamibie,ȱPologne,ȱÉcosseȱetȱSlovénie).ȱȱ ȱ 18ȱ MargueriteȱClarkeȱ standardisésȱetȱdeȱrubriquesȱpourȱrecueillirȱetȱévaluerȱlesȱdonnéesȱsurȱlesȱ troisȱ typesȱ d’évaluationȱ (évaluationsȱ enȱ classe,ȱ examensȱ etȱ évaluationsȱ systémiquesȱ àȱ grandeȱ échelle)ȱ etȱ lesȱ vecteursȱ deȱ laȱ qualitéȱ (contexteȱ favorable,ȱ adéquationȱ duȱ système,ȱ qualitéȱ deȱ l’évaluation).ȱ Lesȱ outilsȱ régulièrementȱ misȱ àȱ jourȱ surȱ laȱ baseȱ desȱ nouvellesȱ expériencesȱ deȱ donnéesȱ empiriquesȱ etȱ deȱ paysȱ sontȱ disponiblesȱ surȱ http://www.worldbank.org/education/saber.ȱ Lesȱ paysȱ peuventȱ utiliserȱ cesȱ outils,ȱ àȱ partirȱ duȱ cadreȱ etȱ desȱ grandsȱ domainesȱ indicateursȱ exposésȱ dansȱ leȱ tableauȱ 2,ȱ pourȱ examinerȱ deȱ façonȱ systématiqueȱ etȱ mieuxȱ comprendreȱ lesȱ forcesȱ etȱ lesȱ faiblessesȱ deȱ leurȱ systèmeȱ d’évaluationȱ desȱ élèves,ȱ ceciȱ afinȱ deȱ préparerȱ lesȱ objectifsȱ futurs.ȱ Ilȱ estȱ importantȱ deȱ soulignerȱ queȱ cesȱ instrumentsȱ ontȱ pourȱ principaleȱ fonctionȱ deȱ baliserȱ lesȱ politiques,ȱ pratiquesȱ etȱ modalitésȱ dȇunȱ paysȱ concernantȱ lesȱ évaluationsȱ enȱ classe,ȱ lesȱ examensȱ etȱ lesȱ activitésȱ dȇévaluationȱ systémiqueȱ àȱ grandeȱ échelleȱ auȱ niveauȱ duȱ système.ȱ Desȱ outilsȱ supplémentairesȱ seraientȱ nécessairesȱ pourȱ déterminerȱ lesȱ véritablesȱ pratiquesȱ desȱ enseignantsȱ etȱ desȱélèvesȱsurȱleȱterrain,ȱdansȱlesȱétablissementsȱscolaires.ȱ Niveauxȱdeȱdéveloppementȱ Laȱ structureȱ deȱ baseȱ desȱ rubriquesȱ permettantȱ d’évaluerȱ lesȱ donnéesȱ recueilliesȱ parȱ desȱ questionnairesȱ standardisésȱ estȱ résuméeȱ dansȱ leȱ tableauȱ3.ȱLaȱtotalitéȱdeȱlȇensembleȱdesȱrubriquesȱestȱfournieȱenȱannexeȱ2.ȱ Lȇobjectifȱ desȱ rubriquesȱ estȱ deȱ fournirȱ àȱ unȱ paysȱ uneȱ estimationȱ duȱ niveauȱ deȱ développementȱ deȱ sesȱ activitésȱ dȇévaluationȱ parȱ comparaisonȱ auxȱpratiquesȱrecommandéesȱdansȱleȱdomaine.ȱȱ Pourȱ chaqueȱ indicateur,ȱ laȱ rubriqueȱ afficheȱ quatreȱ niveauxȱ deȱ développementȱ:ȱLatent,ȱÉmergeant,ȱÉtabliȱ etȱAvancé.21ȱCesȱniveauxȱsontȱ desȱ catégoriesȱ artificiellesȱ choisiesȱ pourȱ symboliserȱ lesȱ étapesȱ clésȱ duȱ développementȱdeȱchaqueȱindicateur.ȱChaqueȱniveauȱs’accompagneȱd’uneȱ descriptionȱ deȱ ceȱ queȱ doitȱ êtreȱ laȱ performanceȱ deȱ l’indicateurȱ àȱ ceȱ niveau.ȱȱ ȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ 21ȱ L’étiquetteȱ deȱ Latentȱ pourraitȱ s’appliquerȱ àȱ desȱ paysȱ oùȱ aucuneȱ activitéȱ d’évaluationȱ formelleȱ n’aȱ lieuȱ ouȱ dansȱ lesquelsȱ leȱ systèmeȱ éducatifȱ aȱ étéȱ interrompuȱ pourȱ causeȱ deȱ guerreȱouȱd’autreȱtypeȱdeȱconflit.ȱȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 19ȱ ȱ Tableauȱ3.ȱStructureȱdeȱbaseȱdesȱrubriquesȱpourȱl’évaluationȱdesȱ donnéesȱrecueilliesȱsurȱunȱsystèmeȱd’évaluationȱdesȱélèvesȱ Niveau de développement LATENT (Absence ÉMERGEANT d’attribut (En voie de ÉTABLI ou écart satisfaire au (Critère AVANCÉ par rapport critère minimum (Bonne Dimension à l'attribut) minimum) acceptable) pratique) Justification CF — CONTEXTE FAVORABLE CF1 — Politiques CF2 — Leadership, engagement public CF3 — Financement CF4 — Modalités institutionnelles CF5 — Ressources humaines AS — ADÉQUATION DU SYSTÈME AS1 — Objectifs en termes d'apprentissage/qualité AS2 — Programme AS3 — Opportunités de formation initiale et continue de l’enseignant QE — QUALITÉ DE L’ÉVALUATION QE1 — Garantie de la qualité (conception, administration, analyse) QE2 — Garantie d’utilisations efficaces Sourceȱ:ȱBanqueȱmondiale.ȱȱ ȱ Latentȱ estȱ leȱ plusȱ basȱ niveauȱ deȱ performanceȱ;ȱ ilȱ représenteȱ l’absenceȱ d’attributȱ ouȱ l’écartȱ parȱ rapportȱ àȱ lȇattribut.ȱ Émergeantȱ estȱ leȱ niveauȱ suivantȱ;ȱ ilȱ représenteȱ l’absenceȱ partielleȱ deȱ l’attribut.ȱ Établiȱ représenteȱ leȱ critèreȱ minimumȱ acceptableȱ pourȱ l’indicateur,ȱ etȱ Avancéȱ symboliseȱ laȱ pratiqueȱ idéaleȱ ouȱ laȱ bonneȱ pratiqueȱ actuelle.ȱ Toutesȱ lesȱ questionsȱ duȱ questionnaireȱ neȱ sontȱ pasȱ représentéesȱ dansȱ lesȱ rubriques,ȱ carȱ toutesȱ lesȱ questionsȱ neȱ sontȱ pasȱ étayéesȱ parȱ uneȱ baseȱ deȱ donnéesȱ empiriquesȱ ȱ 20ȱ MargueriteȱClarkeȱ démontrantȱ uneȱ relationȱ entreȱ uneȱ augmentationȱ desȱ niveauxȱ deȱ performanceȱ surȱ lȇattribut/indicateurȱ etȱ uneȱ meilleurȱ qualitéȱ ouȱ efficacitéȱ desȱactivitésȱdȇévaluation.ȱ Ilȱ estȱ importantȱ deȱ reconnaîtreȱ queȱ deȱ nombreuxȱ aspectsȱ queȱ nousȱ cherchonsȱ àȱ déterminerȱ grâceȱ auxȱ indicateursȱ etȱ niveauxȱ deȱ développementȱ associésȱ peuventȱ êtreȱ difficilesȱ àȱ mesurer.ȱ Dansȱ certainsȱ cas,ȱ desȱ critèresȱ techniquesȱ explicitesȱ existentȱ etȱ peuventȱ êtreȱ exploitésȱ pourȱ contribuerȱ àȱ cesȱ effortsȱ deȱ mesureȱ (parȱ exemple,ȱ lesȱ normesȱ internationalesȱ déterminantȱ siȱ lesȱ résultatsȱ dȇunȱ paysȱ auȱ TIMSSȱ sontȱ suffisammentȱ conséquentsȱ pourȱ êtreȱ intégrésȱ auȱ rapportȱ international).ȱ D’autresȱ casȱ sontȱ affaireȱ deȱ jugementȱ (parȱ exemple,ȱ mesurerȱ leȱ degréȱ deȱ soutienȱ publicȱ pourȱ uneȱ activitéȱ d’évaluationȱ particulière).ȱ Pourȱ améliorerȱ laȱ fiabilitéȱ d’ensembleȱ etȱ laȱ comparabilitéȱ desȱ indicateursȱ etȱ desȱniveauxȱdeȱdéveloppementȱdeȱdifférentsȱsystèmes,ȱlesȱquestionnairesȱ etȱrubriquesȱs’appuient,ȱautantȱqueȱpossible,ȱsurȱdesȱmesuresȱobjectives.ȱ Outreȱ l’évaluationȱ deȱ laȱ performanceȱ surȱ desȱ indicateursȱ individuels,ȱ ilȱ peutȱ êtreȱ utileȱ deȱ comparerȱ laȱ qualitéȱ desȱ caractéristiquesȱ d’ensembleȱ d’unȱ systèmeȱ d’évaluationȱ àȱ desȱ profilsȱ deȱ systèmesȱ d’évaluationȱ quiȱ peuventȱ seȱ concentrerȱ surȱ dȇautresȱ niveauxȱ deȱ développement.ȱLeȱtableauȱ4ȱprésenteȱdesȱprofilsȱgénériques,ȱàȱpartirȱdesȱ informationsȱ fourniesȱ dansȱ leȱ tableauȱ 2ȱ etȱ l’annexeȱ 2,ȱ pourȱ desȱ systèmesȱ d’évaluationȱ auxȱ niveauxȱ deȱ développementȱ Émergeant,ȱ Établiȱ etȱ Avancéȱ (Latentȱ n’estȱ pasȱ inclus,ȱ carȱ ilȱ représenteȱ l’absenceȱ deȱ touteȱ activitéȱ d’évaluation).ȱ Lesȱ systèmesȱ d’évaluationȱ situésȱ auȱ niveauȱ Émergeantȱ sontȱ caractérisésȱ parȱ desȱ contextesȱ favorables,ȱ ainsiȱ queȱ desȱ niveauxȱ d’adéquationȱduȱsystèmeȱetȱdeȱqualitéȱdeȱl’évaluationȱquiȱsontȱenȱvoieȱdeȱ formation.ȱ Cesȱ systèmesȱ sontȱ marquésȱ parȱ uneȱ instabilitéȱ etȱ uneȱ incertitudeȱ quantȱ auȱ choix,ȱ àȱ laȱ fréquenceȱ etȱ àȱ l’utilisationȱ desȱ activitésȱ d’évaluation,ȱ ceȱ quiȱ indiqueȱ unȱ manqueȱ deȱ visionȱ pourȱ desȱ évaluationsȱ systémiquesȱ etȱ unȱ financementȱ incertainȱ ouȱ insuffisantȱ pourȱ lesȱ activitésȱ d’évaluation.ȱ Dansȱ ceȱ contexte,ȱ l’évaluationȱ estȱ plutôtȱ unȱ «ȱplusȱ»ȱ duȱ systèmeȱ sansȱ grandȱ effortȱ systématiqueȱ pourȱ laȱ mettreȱ enȱ conformitéȱ avecȱ lesȱ critères,ȱ programmesȱ ouȱ opportunitésȱ deȱ formationȱ desȱ enseignants.ȱ Leȱ renforcementȱ desȱ capacitésȱ nȇestȱ généralementȱ pasȱ systématiqueȱ etȱ sembleȱ avoirȱ uneȱ efficacitéȱ limitée,ȱ lesȱ individusȱ seȱ dispersant,ȱ uneȱ foisȱ formés,ȱ versȱ dȇautresȱ branchesȱ deȱ lȇorganisationȱ ouȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 21ȱ ȱ versȱ leȱ secteurȱ privé.ȱ Lesȱ activitésȱ d’évaluationȱ sontȱ généralementȱ deȱ qualitéȱmédiocreȱparȱmanqueȱdeȱconnaissanceȱouȱd’attentionȱrelativeȱauxȱ critèresȱprofessionnels.ȱ ȱ Tableauȱ4.ȱProfilsȱstylisésȱdesȱsystèmesȱd’évaluationȱdesȱélèvesȱàȱ différentsȱniveauxȱdeȱdéveloppementȱ Émergeant Établi Avancé x Directives ou cadre x Directives ou cadre Idem que pour Établi politique absents ou politique clairs limités x Leadership/engagem + fort accent sur : x Faible ent public fort leadership/engagement x Programmes de public x l’évaluation pour formation/personnel l’apprentissage Contexte x Personnel peu formé ; formé avec de faibles fortes fluctuations du fluctuations x l’évaluation dans favorable personnel l’établissement et x Financement en classe x Financement stable/régulier aléatoire/irrégulier x le rôle des x Modalités enseignants x Modalités institutionnelles institutionnelles peu claires et stables x l’innovation et les claires ou instables pratiques tirées de la recherche x Les évaluations ne sont x Les évaluations sont pas en parfaite en adéquation avec adéquation avec les les objectifs objectifs d’apprentissage/de d’apprentissage/de qualité, les critères, le Adéquation qualité, les critères, le programme du système programme x Les évaluations sont x Les évaluations ne sont en adéquation avec pas en adéquation avec les opportunités de les opportunités de formation initiale et formation initiale et continue de continue de l’enseignant l’enseignant x Conscience ou x Conscience et application limitée des application des critères techniques ou critères techniques ou Qualité de professionnels pour professionnels pour l'évaluationȱ garantir la qualité et les garantir la qualité et utilisations efficaces de les utilisations l’évaluation efficaces de l’évaluation Sourceȱ:ȱBanqueȱmondiale.ȱ Remarqueȱ:ȱLeȱniveauȱLatentȱn’estȱpasȱinclus,ȱcarȱilȱreprésenteȱl’absenceȱdeȱtouteȱactivitéȱ d’évaluation.ȱȱ ȱ ȱ 22ȱ MargueriteȱClarkeȱ Lesȱ systèmesȱ d’évaluationȱ situésȱ auȱ niveauȱ Établiȱ sontȱ caractérisésȱ parȱ desȱ contextesȱ favorables,ȱ ainsiȱ queȱ desȱ niveauxȱ d’adéquationȱ duȱ systèmeȱ etȱ deȱ qualitéȱ deȱ l’évaluationȱ quiȱ sontȱ deȱ natureȱ stable,ȱ assuréeȱ ouȱ consolidée.ȱ Cesȱ systèmesȱ sontȱ marquésȱ parȱ laȱ continuitéȱ etȱ laȱ certitudeȱ duȱ choix,ȱ deȱ laȱ fréquenceȱ etȱ deȱ l’utilisationȱ desȱ activitésȱ d’évaluation,ȱ ainsiȱ queȱ parȱ desȱ sourcesȱ deȱ financementȱ stablesȱ etȱ suffisantes,ȱ ceȱ quiȱ indiqueȱ uneȱ visionȱ etȱ uneȱ «ȱadhésionȱ»ȱ àȱ l’évaluationȱ systémique.ȱ Dansȱ ceȱ contexte,ȱ l’évaluationȱ fonctionneȱ plutôtȱ commeȱ partieȱ intégranteȱ duȱ système,ȱ avecȱ desȱ effortsȱ systématiquesȱ pourȱ laȱ mettreȱ enȱ conformitéȱ avecȱ lesȱ critères,ȱ programmesȱ ouȱ opportunitésȱ deȱ formationȱ desȱ enseignants.ȱ Leȱ renforcementȱ desȱ capacitésȱ aȱ tendanceȱ àȱ êtreȱ concentré,ȱ durableȱ etȱ efficace,ȱ avecȱ deȱ faiblesȱ fluctuationsȱ duȱ personnel.ȱ Lesȱ activitésȱ d’évaluationȱ sontȱ généralementȱ deȱ bonneȱ qualitéȱ duȱfaitȱdeȱlaȱconnaissanceȱdesȱcritèresȱprofessionnelsȱetȱdeȱl’attentionȱquiȱ leurȱestȱportée.ȱCeȱniveauȱpeutȱêtreȱconsidéréȱcommeȱleȱcritèreȱminimumȱ acceptableȱpourȱqu’unȱsystèmeȱd’évaluationȱsoitȱefficace.ȱȱ Lesȱsystèmesȱd’évaluationȱsituésȱauȱniveauȱAvancéȱsontȱcaractérisésȱ parȱ desȱ contextesȱ favorables,ȱ ainsiȱ queȱ desȱ niveauxȱ d’adéquationȱ duȱ systèmeȱ etȱ deȱ qualitéȱ deȱ l’évaluationȱ quiȱ sontȱ deȱ natureȱ hautementȱ développée.ȱ Outreȱ leȱ faitȱ qu’ilsȱ comportentȱ lesȱ meilleursȱ élémentsȱ desȱ systèmesȱ Établis,ȱ lesȱ systèmesȱ Avancésȱ sontȱ marquésȱ parȱ lesȱ plusȱ hautsȱ niveauxȱ d’innovationȱ etȱ deȱ pratiquesȱ tiréesȱ deȱ laȱ recherche.ȱ Dansȱ ceȱ contexte,ȱ l’évaluationȱ fonctionneȱ commeȱ uneȱ partieȱ essentielleȱ duȱ système.ȱ Leȱ renforcementȱ desȱ capacitésȱ estȱ centréȱ surȱ lesȱ enseignants,ȱ outreȱ lesȱ «ȱtechniciensȱ»,ȱ ceȱ quiȱ témoigneȱ d’uneȱ forteȱ valorisationȱ deȱ lȇévaluationȱ dansȱ l’établissementȱ scolaireȱ etȱ enȱ classeȱ (semblableȱ auxȱ caractéristiquesȱ clésȱ desȱ systèmesȱ hautementȱ performantsȱ soulignésȱ parȱ DarlingȬHammondȱetȱWentworthȱdansȱleurȱtravail).ȱȱ Enȱ réalité,ȱ ilȱ estȱ probableȱ queȱ lesȱ systèmesȱ d’évaluationȱ seȱ situentȱ àȱ différentsȱ niveauxȱ deȱ développementȱ selonȱ leȱ domaineȱ examiné.ȱ Parȱ exemple,ȱ unȱ systèmeȱ peutȱ seȱ situerȱ dansȱ laȱ rubriqueȱ Établiȱ enȱ ceȱ quiȱ concerneȱ lesȱ examensȱ maisȱ Émergeantȱ pourȱ ceȱ quiȱ estȱ deȱ l’évaluationȱ systémiqueȱ àȱ grandeȱ échelle,ȱ etȱ viceȱ versa.ȱ L’intuitionȱ suggèreȱ qu’ilȱ vautȱ probablementȱ mieuxȱ seȱ situerȱ leȱ plusȱ loinȱ possibleȱ dansȱ leȱ plusȱ grandȱ nombreȱ deȱ domaines.ȱ Pourȱ autant,ȱ laȱ nécessitéȱ dȇêtreȱ auȱ niveauȱ Avancéȱ dansȱ tousȱ lesȱ domainesȱ nȇestȱ pasȱ clairementȱ démontrée.ȱ Onȱ peutȱ ainsiȱ considérerȱ leȱ niveauȱ Établiȱ commeȱ unȱ résultatȱ minimumȱ àȱ acquérirȱ dansȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 23ȱ ȱ tousȱ lesȱ domainesȱ (c’estȱ ceȱ qu’onȱ observeȱ dansȱ lesȱ systèmesȱ d’évaluationȱ deȱpaysȱtelsȱqueȱlaȱFinlandeȱetȱl’Australie)ȱmaisȱonȱneȱpeutȱqueȱsouhaiterȱ allerȱ plusȱ loinȱ dansȱ lesȱ domainesȱ quiȱ contribuentȱ leȱ plusȱ àȱ laȱ visionȱ nationaleȱ ouȱ auxȱ prioritésȱ deȱ l’éducation.ȱ Conformémentȱ àȱ cesȱ considérations,ȱ lesȱ scoresȱ générésȱ parȱ lesȱ rubriquesȱ deȱ l’annexeȱ 2ȱ neȱ sontȱ pasȱ conçusȱ pourȱ êtreȱ ajoutésȱ àȱ tousȱ lesȱ typesȱ d’évaluationȱ (c’estȬàȬdireȱ qu’ilsȱ neȱ sontȱ pasȱ censésȱ êtreȱ ajoutésȱ pourȱ créerȱ unȱ scoreȱ globalȱ duȱ systèmeȱ d’évaluationȱ;ȱ ilsȱ ontȱ pourȱ simpleȱ objectifȱ deȱ produireȱ unȱ scoreȱ globalȱpourȱchaqueȱtypeȱd’évaluation).ȱȱ Ilȱ estȱ sansȱ aucunȱ douteȱ utileȱ dȇavoirȱ uneȱ idéeȱ deȱ l’aspectȱ desȱ systèmesȱ d’évaluationȱ etȱ desȱ différentsȱ typesȱ d’évaluationȱ àȱ différentsȱ niveauxȱ deȱ développementȱ maisȱ ilȱ estȱ également,ȱ siȱ ceȱ nȇestȱ davantage,ȱ utileȱ deȱ savoirȱ commentȱ progresserȱ dansȱ cesȱ niveaux.ȱ Ilȱ nousȱ estȱ doncȱ aussiȱ nécessaireȱ deȱ comprendreȱ certainesȱ desȱ réformesȱ clésȱ ouȱ desȱ apportsȱ utilisésȱ parȱ lesȱ paysȱ pourȱ développerȱ desȱ systèmesȱ d’évaluationȱ plusȱ efficaces.ȱ Malheureusement,ȱ dansȱ ceȱ domaine,ȱ lesȱ donnéesȱ empiriquesȱseȱfontȱraresȱetȱdesȱrecherchesȱplusȱpousséesȱsontȱabsolumentȱ nécessairesȱpourȱpouvoirȱdéterminerȱlesȱstratégiesȱconcrètesȱimpliquées.ȱȱ D’aprèsȱ leȱ peuȱ deȱ donnéesȱ empiriquesȱ disponibles,ȱ leȱ principalȱ facteurȱquiȱsembleȱcaractériserȱlesȱsystèmesȱquiȱprogressentȱd’Émergeantsȱ àȱ Établisȱ (globalementȱ ouȱ dansȱ unȱ domaineȱ dȇévaluationȱ précis)ȱ estȱ unȱ accentȱ concertéȱ surȱ lesȱ réformes,ȱ lesȱ apportsȱ etȱ lesȱ pratiquesȱ quiȱ renforcentȱ leȱ contexteȱ favorableȱ àȱ l’évaluationȱ (Ferrer,ȱ 2006).22ȱ Parȱ exemple,ȱ dansȱ leurȱ revueȱ duȱ soutienȱ deȱ laȱ Banqueȱ mondialeȱ pourȱ desȱ projetsȱd’évaluationȱdansȱdesȱpaysȱclients,ȱLarachȱetȱLockheedȱ(1992)ȱontȱ constatéȱ queȱ lesȱ projetsȱ quiȱ sȇattachaientȱ dansȱ unȱ premierȱ tempsȱ àȱ lȇaméliorationȱ desȱ modalitésȱ institutionnellesȱ avaientȱ plusȱ deȱ chanceȱ deȱ réussirȱ (c’estȬàȬdireȱ àȱ conduireȱ versȱ unȱ programmeȱ d’évaluationȱ durableȱ dansȱ leȱ pays)ȱ queȱ lesȱ projetsȱ quiȱ tentaientȱ d’abordȱ d’améliorerȱ lȇaspectȱ techniqueȱ desȱ activitésȱ dȇévaluationȱ existantes.ȱ Enȱ cohérenceȱ avecȱ cetteȱ observation,ȱ dansȱ leurȱ étudeȱ desȱ effortsȱ deȱ réformeȱ desȱ évaluationsȱ dansȱ lesȱ paysȱ d’Europeȱ centraleȱ etȱ d’Europeȱ deȱ l’Est,ȱ Westȱ etȱ Crightonȱ (1999)ȱ ontȱ remarquéȱ queȱ lesȱ réformesȱ avaientȱ uneȱ meilleurȱ chanceȱ deȱ durerȱ ȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱȱ 22ȱIlȱ peutȱ êtreȱ bénéfiqueȱ pourȱ unȱ systèmeȱ deȱ concentrerȱ àȱ courtȱ termeȱ sesȱ ressourcesȱ surȱ l’améliorationȱ d’unȱ vecteurȱ spécifiqueȱ deȱ laȱ qualitéȱ (parȱ exemple,ȱ leȱ contexteȱ favorable),ȱ maisȱ ceȱ n’estȱ pasȱ uneȱ stratégieȱ àȱ longȱ terme,ȱ carȱ chaqueȱ vecteurȱ deȱ laȱ qualitéȱ estȱ unȱ facteurȱ nécessaireȱpourȱunȱsystèmeȱd’évaluationȱefficace.ȱ ȱ 24ȱ MargueriteȱClarkeȱ lorsqu’ellesȱ étaientȱ accompagnéesȱ d’unȱ consensusȱ publicȱ surȱ leurȱ nécessité,ȱ d’unȱ soutienȱ politiqueȱ clairȱ etȱ cohérentȱ auȱ changementȱ etȱ d’allocationsȱdeȱressourcesȱsuffisantes.ȱȱ Leȱ facteurȱ principalȱ quiȱ sembleȱ caractériserȱ lesȱ systèmesȱ ayantȱ progresséȱ dȇÉtablisȱ àȱ Avancésȱ estȱ laȱ concentrationȱ surȱ lesȱ réformes,ȱ lesȱ contributionsȱ etȱ lesȱ pratiquesȱ quiȱ privilégientȱ laȱ classe,ȱ avecȱ lesȱ enseignantsȱ etȱ lesȱ élèvesȱ commeȱ acteursȱ clésȱ deȱ lȇévaluationȱ (DarlingȬ Hammondȱ etȱ Wentworth,ȱ 2010ȱ ;ȱ Shepard,ȱ 2000).ȱ Ceciȱ sȇexpliqueȱ parȱ leȱ faitȱ queȱ laȱ formeȱ dȇévaluationȱ laȱ plusȱ influente,ȱ lorsquȇelleȱ estȱ bienȱ menée,ȱ estȱ celleȱqueȱfontȱ lȇenseignantȱ etȱ lesȱ élèvesȱauȱfilȱ deȱleursȱactivitésȱ quotidiennesȱ enȱ classeȱ (l’évaluationȱ enȱ classe).ȱ Menerȱ ceȱ typeȱ d’évaluationȱ correctementȱ nécessiteȱ unȱ renforcementȱ desȱ capacitésȱ significatifȱ etȱ uneȱ attentionȱ portéeȱ surȱ laȱ questionȱ deȱ laȱ qualitéȱ deȱ l’enseignant.ȱ Conclusionsȱ L’évaluationȱestȱessentielleȱpourȱsavoirȱsiȱunȱsystèmeȱéducatifȱproduitȱlesȱ résultatsȱ escomptésȱ pourȱ lesȱ élèves,ȱ l’économieȱ etȱ laȱ sociétéȱ dansȱ sonȱ ensemble.ȱ Sansȱ évaluationȱ efficace,ȱ ilȱ estȱ impossibleȱ deȱ savoirȱ siȱ lesȱ élèvesȱapprennentȱetȱsiȱlesȱréformesȱfonctionnentȱcommeȱprévu.ȱȱ Ceȱ documentȱ aȱ tiréȱ desȱ principesȱ etȱ desȱ orientationsȱ deȱ l’expérienceȱ desȱ paysȱ etȱ deȱ l’étatȱ actuelȱ desȱ recherchesȱ afinȱ deȱ dessinerȱ unȱ cadreȱ permettantȱ deȱ développerȱ unȱ systèmeȱ d’évaluationȱ desȱ élèvesȱ plusȱ efficace.ȱ Ceȱ cadreȱ fournitȱ auxȱ décideurs,ȱ ainsiȱ qu’àȱ d’autres,ȱ uneȱ structureȱ baséeȱ surȱ desȱ donnéesȱ empiriquesȱ ouvrantȱ laȱ voieȱ versȱ uneȱ discussionȱ etȱ l’ébaucheȱ d’unȱ consensusȱ autourȱ desȱ prioritésȱ etȱ apportsȱ clésȱpouvantȱbénéficierȱàȱleurȱsystèmeȱd’évaluation.ȱȱ Uneȱ importanteȱ contributionȱ deȱ ceȱ cadreȱ estȱ d’aiderȱ lesȱ paysȱ àȱ identifierȱ lesȱ vecteursȱ clésȱ deȱ laȱ qualitéȱ quiȱ nécessitentȱ d’êtreȱ mobilisésȱ afinȱ deȱ renforcerȱ laȱ qualitéȱ etȱ l’utilitéȱ desȱ informationsȱ produitesȱ parȱ lesȱ différentesȱ activitésȱ d’évaluationȱ deȱ leurȱ système.ȱ C’estȱ primordial,ȱ carȱ l’objectifȱ principalȱ deȱ toutȱ systèmeȱ d’évaluationȱ estȱ deȱ fournirȱ desȱ informationsȱ validesȱ etȱ ponctuellesȱ àȱ unȱ ensembleȱ d’utilisateursȱ (lesȱ élèves,ȱ l’enseignant,ȱ laȱ communautéȱ etȱ leȱ décideurȱ politique)ȱ afinȱ qu’ilsȱ puissentȱ prendreȱ deȱ meilleuresȱ décisionsȱ pourȱ obtenirȱ uneȱ qualitéȱ etȱ desȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 25ȱ ȱ acquisȱmeilleurs.ȱLesȱchoixȱportantȱsurȱlesȱsystèmesȱd’évaluationȱdoiventȱ êtreȱ enȱ cohérenceȱ avecȱ lesȱ besoinsȱ deȱ serviceȱ etȱ dȇinformationȱ deȱ leursȱ utilisateurs.ȱȱ Ceȱ cadreȱ comporteȱ égalementȱ uneȱ dimensionȱ dynamiqueȱ illustrantȱ laȱtrajectoireȱdeȱlaȱprogressionȱd’unȱniveauȱdeȱdéveloppementȱauȱsuivantȱ dansȱ chaqueȱ domaineȱ d’évaluation.ȱ Ilȱ importeȱ deȱ préciserȱ queȱ cetteȱ progressionȱ d’unȱ niveauȱ àȱ l’autreȱ prendȱ duȱ temps.ȱ Lesȱ étudesȱ deȱ casȱ surȱ lesȱ expériencesȱ desȱ paysȱ quiȱ renforcentȱ leurȱ systèmeȱ d’évaluationȱ desȱ élèvesȱ révèlentȱ quȇilȱ fautȱ souventȱ uneȱ décennieȱ ouȱ plusȱ pourȱ quȇunȱ ensembleȱ deȱ réformesȱ etȱ dȇapportsȱ seȱ mettentȱ réellementȱ enȱ placeȱ etȱ produisentȱ desȱ résultatsȱ tangibles.ȱ Lesȱ équipesȱ paysȱ doiventȱ doncȱ prévoirȱ dèsȱ leȱ départȱ unȱ engagementȱ àȱ longȱ termeȱ etȱ unȱ investissementȱ dansȱ lesȱ politiques,ȱ lesȱ apportsȱ etȱ lesȱ actionsȱ nécessairesȱ pourȱ transformerȱ leurȱ systèmeȱ d’évaluation.ȱ Leȱ bénéficeȱ seraȱ unȱ systèmeȱ d’évaluationȱ quiȱ pourraȱ appuyerȱ deȱ meilleuresȱ prisesȱ deȱ décisionȱ etȱ contribuerȱ àȱ deȱ plusȱ hautsȱ niveauxȱ deȱ qualitéȱ pédagogiqueȱ etȱ d’apprentissageȱpourȱtous.ȱȱ ȱ ȱ ȱ 26ȱ MargueriteȱClarkeȱ Annexeȱ1.ȱLesȱtypesȱd’évaluationȱetȱleursȱ principalesȱdifférencesȱȱ Évaluation systémique à grande échelle En classe Nationale Internationale Examens Objectif Fournir un Fournir un Fournir un Sélectionner ou feedback feedback sur l’état feedback sur la certifier des immédiat pour de santé global du performance élèves passant informer la système pour un comparative du au niveau pédagogie en niveau de classe système éducatif supérieur dans classe ou un âge précis et pour un niveau le système suivre les de classe ou un éducatif (ou évolutions des âge précis dans la vie acquis active) Fréquence Quotidienne Pour des sujets Pour des sujets Annuelle et plus individuels de individuels de fréquente façon régulière façon régulière lorsque le (tous les 3 à 5 ans) (tous les 3 à 5 système permet ans) le redoublement Qui est évalué ? Tous les élèves Un échantillon ou Un échantillon ou Tous les élèves un recensement un recensement éligibles d’élèves à un d’élèves à un niveau de classe niveau de classe ou un âge précis ou un âge précis Format Varie de Souvent un Souvent un Souvent une l’observation, à la questionnaire à questionnaire à dissertation et question, à choix multiple et à choix multiple et un l’interrogation réponse courte à réponse courte questionnaire à écrite ou à la choix multiple performance de l’élève Couvre le Toutes les Généralement Généralement Couvre les programme matières limitée à quelques limitée à une ou domaines de la matières deux matières matière principale Informations Oui, fait partie de Fréquemment Oui Rarement supplémentaires la pédagogie recueillies auprès des élèves ? Notation Généralement Varie de simple à Implique Varie de simple informelle et des techniques généralement à des simple statistiques plus des techniques techniques sophistiquées statistiques statistiques plus sophistiquées sophistiquées Sourceȱ:ȱBanqueȱmondiale.ȱȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 27ȱ ȱ Annexeȱ2.ȱGrilleȱdȇappréciationȱduȱniveauȱdeȱ développementȱdesȱdifférentsȱtypesȱdȇévaluationȱ Évaluationȱenȱclasseȱ LATENT ÉMERGEANT (Absence d’attribut (En voie de ÉTABLI AVANCÉ ou écart par rapport satisfaire au (Critère minimum (Bonne Justifica- à l'attribut) critère minimum) acceptable) pratique) tion Contexte favorable & Adéquation du système (CF & AS) Politique globale et cadre de ressources au sein duquel l’activité d’évaluation en classe a lieu dans un système éducatif, et le degré de cohérence de cette activité d’évaluation avec les autres composantes du système. CF & AS — Clarté des directives régissant l’évaluation en classe Aucun document (Q1) Un document (Q1) Un document Option non systémique ne fournit informel formel systémique applicable à cette de directives pour systémique fournit fournit des dimension. l’évaluation en classe. des directives directives pour pour l’évaluation l’évaluation en en classe. classe. Option non applicable Option non (Q3, Q4) (Q3, Q4) à cette dimension. applicable à cette Disponibilité Document dimension. restreinte du largement document. disponible. CF & AS2 — Adéquation de l’évaluation en classe avec les objectifs de l’apprentissage (Q5) Aucune (Q5) Peu de (Q5) Certaines (Q5) Variété de ressource systémique ressources ressources ressources pour l'enseignant en systémiques pour systémiques pour systémiques pour vue de l'évaluation en l'enseignant en l'enseignant en vue l'enseignant en classe. vue de l'évaluation de l'évaluation en vue de en classe. classe. l'évaluation en classe. Aucun programme (Q6) Un (Q6) Un officiel ni document programme officiel programme standard. ou des documents officiel ou des standards documents spécifient quels standards sont les acquis des spécifient quels élèves escomptés sont les acquis mais le niveau de des élèves performance requis escomptés et le n’est pas clair. niveau de performance requis. ȱ 28ȱ MargueriteȱClarkeȱ LATENT ÉMERGEANT (Absence d’attribut (En voie de ÉTABLI AVANCÉ ou écart par rapport satisfaire au (Critère minimum (Bonne Justifica- à l'attribut) critère minimum) acceptable) pratique) tion CF & AS3 — Ressources humaines adéquates pour mener les activités d’évaluation en classe (Q7, Q8) Aucun Option non (Q7, Q8) Certains (Q7, Q8) Variété mécanisme applicable à cette mécanismes de mécanismes systémique dimension. systémiques systémiques garantissant garantissent garantissant l’acquisition par l’acquisition par l’acquisition par l’enseignant des l’enseignant des l’enseignant des compétences et de compétences et de compétences et l’expertise requises l’expertise requises de l’expertise pour une évaluation pour une requises pour une en classe. évaluation en évaluation en classe. classe. Qualité de l'évaluation (QE) Qualité de la conception, de l’administration et de l’utilisation de l’évaluation en classe QE1 — Garantie de la qualité de l'évaluation en classe (Q11) L’ensemble des Les pratiques Les pratiques Les pratiques pratiques d’évaluation d'évaluation en d'évaluation en d'évaluation en en classe comporte classe sont classe sont de classe sont des faiblesses / médiocres. qualité moyenne. généralement de aucune information bonne qualité. disponible sur les pratiques d’évaluation en classe. (Q12) Aucun (Q12) Des (Q12) Des (Q12) Variété de mécanisme de suivi mécanismes ad mécanismes mécanismes de la qualité des hoc de suivi de la systématiques systématiques en pratiques d'évaluation qualité des limités de suivi de place pour en classe. pratiques la qualité des effectuer le suivi d'évaluation en pratiques de la qualité des classe. d'évaluation en pratiques classe. d'évaluation en classe. ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 29ȱ ȱ LATENT ÉMERGEANT (Absence d’attribut (En voie de ÉTABLI AVANCÉ ou écart par rapport satisfaire au (Critère minimum (Bonne Justifica- à l'attribut) critère minimum) acceptable) pratique) tion QE2 — Garantie d’une utilisation efficace de l’évaluation en classe (Q14) Aucune Option non (Q14) Exigence de (Q14) Exigence exigence de diffusion applicable à cette diffusion auprès de de diffusion auprès des parties dimension. certaines parties auprès de toutes prenantes clés des prenantes clés des les parties informations informations prenantes clés recueillies lors des recueillies lors des des informations évaluations en classe. évaluations en recueillies lors classe. des évaluations en classe. (Q15) Aucune (Q15) Exigence (Q15) Exigence (Q15) Exigence exigence d’utilisation d’utilisations d’utilisations d’utilisations de l’évaluation en limitées de adéquates de adéquates de classe pour contribuer l’évaluation en l’évaluation en l’évaluation en à l'apprentissage de classe pour classe pour classe pour l'élève. contribuer à contribuer à contribuer à l'apprentissage de l'apprentissage de l'apprentissage de l'élève. l'élève. l'élève, y compris en apport pour les résultats des examens externes. Sourceȱ:ȱBanqueȱmondiale.ȱ ȱ ȱ ȱ ȱ 30ȱ MargueriteȱClarkeȱ Examenȱ LATENT ÉMERGEANT (Absence (En voie de ÉTABLI d’attribut ou écart satisfaire (Critère AVANCÉ par rapport à au critère minimum (Bonne Justifica- l'attribut minimum) acceptable) pratique) tion Contexte favorable (CF) Cadre global du leadership, des politiques, des structures organisationnelles et des ressources fiscales et humaines au sein duquel l’activité d’évaluation a lieu dans un système éducatif et mesure dans laquelle ce contexte est propice à, ou soutient, l’évaluation. CF1 — Clarté des politiques (Q3_III) Aucun (Q3_III) L’examen (Q3_III) Option non examen standardisé standardisé a lieu L’examen est un applicable à n’a eu lieu. de façon programme cette dimension. irrégulière. stable qui a régulièrement lieu. (Q3) Aucun (Q3) Un document (Q3) Un Option non document politique politique informel document applicable à n’autorise l’examen. ou préliminaire politique formel cette dimension. autorise l’examen. autorise l’examen. Option non (Q5) Le document (Q5) Le Option non applicable à cette politique n’est pas document applicable à dimension. mis à disposition politique est mis cette dimension. du public. à disposition du public. Option non Option non (Q6) Le (Q6) Le applicable à cette applicable à cette document document dimension. dimension. politique traite politique traite de certains de tous les aspects clés de aspects clés de l’examen. l’examen. CF2 — Force du leadership (Q8) Tous les (Q8) La plupart (Q8) La plupart (Q8) Tous les groupes de parties des groupes de des groupes de groupes de prenantes parties prenantes parties parties s'opposent s'opposent à prenantes prenantes radicalement à l'examen. soutiennent soutiennent l'examen. l'examen. l'examen. ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 31ȱ ȱ LATENT ÉMERGEANT (Absence (En voie de ÉTABLI d’attribut ou écart satisfaire (Critère AVANCÉ par rapport à au critère minimum (Bonne Justifica- l'attribut minimum) acceptable) pratique) tion (Q9) Aucune Option non (Q9) Tentatives (Q9) Tentatives tentative applicable à cette indépendantes coordonnées d’amélioration de dimension. d’amélioration d’amélioration l’examen par des de l’examen par de l’examen par groupes des parties des groupes des des groupes prenantes. parties des parties prenantes. prenantes. (Q10) Efforts Option non (Q10) Efforts Option non d’amélioration de applicable à cette d’amélioration applicable à l’examen accueillis dimension. de l’examen cette dimension. défavorablement généralement par les accueillis responsables de favorablement l'examen. par les responsables de l'examen. CF3 — Régularité du financement (Q11) Aucun (Q11) (Q11) Option non financement alloué Financement Financement applicable à à l’examen. irrégulier alloué à régulier alloué à cette dimension. l’examen. l’examen. Option non (Q12) Le (Q12) Le Option non applicable à cette financement financement applicable à dimension. couvre certaines couvre toutes cette dimension. activités les activités essentielles de essentielles de l’examen : l’examen : conception, conception, administration, administration, traitement des traitement des données ou données et reporting. reporting. Option non (Q12) Le Non applicable. (Q12) Le applicable à cette financement ne financement dimension. couvre pas la couvre la recherche et le recherche et le développement. développement. ȱ 32ȱ MargueriteȱClarkeȱ LATENT ÉMERGEANT (Absence (En voie de ÉTABLI d’attribut ou écart satisfaire (Critère AVANCÉ par rapport à au critère minimum (Bonne Justifica- l'attribut minimum) acceptable) pratique) tion DF4 — Solidité des structures organisationnelles (Q14) Le bureau (Q14) Le bureau (Q14) Le bureau Option non des examens des examens est des examens applicable à n’existe pas ou est nouveau. est une cette dimension. nouveau. organisation stable. (Q15) Le bureau Option non (Q15) Le bureau Option non des examens ne applicable à cette des examens applicable à rend pas de dimension. rend des cette dimension. comptes à un comptes à un conseil ou une conseil ou une agence externe. agence externe. (Q16) Les résultats (Q16) Les (Q16) Les Q16) Les d’examen ne sont résultats résultats résultats pas reconnus par d’examen sont d’examen sont d’examen sont un système de reconnus par le reconnus par le reconnus par au certification ou de système de système de moins deux sélection. certification ou de certification ou systèmes de sélection du pays. de sélection certification ou d’un autre pays. de sélection d’un autre pays. (Q17) Le bureau (Q17) Le bureau (Q17) Le bureau (Q17) Le des examens n’a des examens a des examens a bureau des pas les locaux certains des tous les locaux examens a des nécessaires pour locaux nécessaires locaux organiser l'examen. nécessaires pour pour organiser ultramodernes organiser l'examen. pour organiser l'examen. l'examen. CF5 — Efficacité des ressources humaines (Q18) Aucun (Q18, Q19) Le (Q18, Q19) Le (Q18, Q19) Le personnel pour bureau des bureau des bureau des mener l’examen. examens manque examens a le examens a le de personnel pour personnel personnel mener l'examen ; adéquat pour adéquat pour les problèmes mener mener sont fréquents. efficacement efficacement l'examen ; les l'examen, sans problèmes sont aucun rares. problème. ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 33ȱ ȱ LATENT ÉMERGEANT (Absence (En voie de ÉTABLI d’attribut ou écart satisfaire (Critère AVANCÉ par rapport à au critère minimum (Bonne Justifica- l'attribut minimum) acceptable) pratique) tion (Q20) Le Option non (Q20) Le (Q20) Le pays/système applicable à cette pays/système pays/système n’offre aucune dimension. offre quelques offre une possibilité de possibilités de gamme étendue préparation à préparation à de possibilités l’examen. l’examen. de préparation à l’examen. Adéquation du système (AS) Degré de cohérence de l’évaluation avec les autres composantes du système éducatif. AS1 — Adéquation de l’examen avec les objectifs et les opportunités de l'apprentissage (Q21) Ce que Option non (Q21) Ce que Option non l’examen cherche à applicable à cette l’examen applicable à mesurer n’est pas dimension. cherche à cette dimension. clair. mesurer est clair. (Q22) Ce que Option non (Q22) Ce que Option non mesure l’examen applicable à cette l'examen applicable à est remis en dimension. mesure est cette dimension. questions par largement certains groupes de accepté par les parties prenantes. groupes de parties prenantes. (Q23, Q24) Le (Q23, Q24) (Q23, Q24) (Q23, Q24) matériel de Matériel de Matériel complet Matériel préparation à préparation à de préparation à complet de l’examen est l’examen l’examen préparation à minimal et accessible à accessible à la l’examen accessible à très quelques élèves. plupart des accessible à peu d’élèves. élèves. tous les élèves. AS2 — Formations sur l’examen dispensées aux enseignants (Q25) Aucun cours (Q25) Aucun (Q25) Des cours (Q25) Les cours ou atelier sur cours ou atelier ou ateliers ou ateliers l’examen n’est mis actualisé sur actualisés sur actualisés sur à disposition des l’examen n’est mis l’examen sont à l’examen enseignants. à disposition des disposition des destinés aux enseignants. enseignants enseignants (volontariat). sont obligatoires. ȱ 34ȱ MargueriteȱClarkeȱ LATENT ÉMERGEANT (Absence (En voie de ÉTABLI d’attribut ou écart satisfaire (Critère AVANCÉ par rapport à au critère minimum (Bonne Justifica- l'attribut minimum) acceptable) pratique) tion (Q26) Les (Q26) Les (Q26) Les (Q26) Les enseignants sont enseignants sont enseignants enseignants exclus de toute impliqués dans sont impliqués sont impliqués tâche liée à très peu de tâches dans certaines dans la plupart l’examen. liées à l’examen. tâches liées à des tâches liées l’examen. à l’examen. Qualité de l'évaluation (QE) Degré de conformité aux normes de qualité, d'équité et à une utilisation efficace de l’évaluation. QE1 — Garantie de la qualité (Q27) Aucun (Q27) Il existe de (Q27) Il existe (Q27) Il existe rapport technique ni la documentation un rapport un rapport documentation sur l’examen mais technique technique quelconque. pas dans un complet mais à complet format de rapport diffusion d'excellente formel. restreinte. qualité, disponible au public. (Q28) Aucun Option non (Q28) (Q28) mécanisme de applicable à cette Mécanisme Mécanismes garantie de la dimension. limité en place variés et qualité de l’examen. pour garantir la systématiques qualité de en place pour l’examen. garantir la qualité de l’examen. QE2 — Garantie de l’équité (Q29) (Q29) (Q29) (Q29) Comportement Comportement Comportement Comportement inapproprié fréquent inapproprié inapproprié rare inapproprié relatif à l’examen. modéré relatif à relatif à marginal relatif l’examen. l’examen. à l’examen. (Q30) Les résultats (Q30) Les (Q30) Les Option non de l’examen sont résultats de résultats de applicable à peu crédibles l’examen sont l’examen sont cette dimension. auprès de tous les crédibles auprès crédibles auprès groupes de parties de certains de tous les prenantes. groupes de parties groupes de prenantes. parties prenantes. ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 35ȱ ȱ LATENT ÉMERGEANT (Absence (En voie de ÉTABLI d’attribut ou écart satisfaire (Critère AVANCÉ par rapport à au critère minimum (Bonne Justifica- l'attribut minimum) acceptable) pratique) tion (Q31, Q32) La (Q31, Q32) Une (Q31, Q32) Une (Q31) Tous les majorité des élèves importante petite proportion élèves peuvent (plus de 50 %) peut proportion d’élèves (moins passer l'examen ne pas être en d’élèves (10 % à de 10 %) peut ; aucun obstacle mesure de passer 50 %) peut ne pas ne pas être en de langue, de l’examen pour des être en mesure de mesure de sexe ou autre. raisons de langue, passer l’examen passer l’examen de sexe ou pour un pour des raisons pour des raisons autre obstacle de langue, de de langue, de équivalent. sexe ou pour un sexe ou pour un autre obstacle autre obstacle équivalent. équivalent. QE3 — Utilisation équitable des données de l’examen (Q33) Les résultats (Q33) Les (Q33) Les (Q33) Les de l’examen ne sont résultats résultats résultats utilisés de façon d’examen sont d’examen sont d’examen sont appropriée par utilisés de façon utilisés de façon utilisés de façon aucun groupe de appropriée par appropriée par appropriée par parties prenantes. certains groupes la plupart des tous les de parties groupes de groupes de prenantes. parties parties prenantes. prenantes. (Q34) Les noms Option non (Q34) Les Option non des élèves et les applicable à cette résultats des applicable à résultats sont dimension. élèves sont cette dimension. rendus publics. confidentiels. QE4 — Garantie des conséquences positives de l’examen (Q35) Aucune (Q35) Options très (Q35) Des (Q35) Une option pour les limitées pour les options existent variété d’options élèves qui n’ont pas élèves qui n’ont pour les élèves existe pour les réussi l’examen / pas réussi qui n’ont pas élèves qui n’ont les élèves doivent l’examen. réussi l’examen. pas réussi quitter le système l’examen. éducatif. (Q36) Aucun Option non (Q36) Il existe (Q36) Il existe mécanisme de suivi applicable à cette certains une variété de des conséquences dimension. mécanismes de mécanismes de de l’examen. suivi des suivi des conséquences conséquences de l’examen. de l’examen. Sourceȱ:ȱBanqueȱmondiale.ȱȱ ȱ ȱ 36ȱ MargueriteȱClarkeȱ Évaluationȱnationaleȱàȱgrandeȱéchelleȱ(ENGE)ȱ LATENT ÉMERGEANT (Absence (En voie de d’attribut ou écart satisfaire au ÉTABLI AVANCÉ par rapport à critère (Critère minimum (Bonne Justifica- l'attribut) minimum) acceptable) pratique) tion Contexte favorable Cadre global du leadership, des politiques, des structures organisationnelles et des ressources fiscales et humaines au sein duquel l’activité d’ENGE a lieu dans un système éducatif et mesure dans laquelle ce contexte est propice à, ou soutient, cette activité. CF1 — Des politiques claires pour l’ENGE (Q3_III) Aucun (Q3_III) L’ENGE (Q3_III) L’ENGE Option non exercice d’ENGE est entreprise de constitue un applicable à n’a eu lieu. façon irrégulière. programme cette stable et a dimension. régulièrement lieu. (Q5) Il n’existe (Q5) Un document (Q5) Un Option non aucun document politique informel document applicable à politique relatif aux ou préliminaire politique formel cette ENGE. autorise les ENGE. autorise les dimension. ENGE. Non applicable. (Q7) Le document (Q7) Le Option non politique n’est pas document applicable à mis à disposition politique est mis cette du public. à disposition du dimension. public. (Q8) Aucune Option non (Q8, Q9) Il est (Q8, Q9) Il y a activité d’ENGE applicable à cette entendu que un plan écrit n’est prévue. dimension. des ENGE des ENGE pour auront lieu. les années à venir. CF2 — Forte implication du public pour l’ENGE (Q11, Q12) Tous (Q11, Q12) (Q11, Q12) La (Q11, Q12) les groupes de Certains plupart des Tous les parties prenantes groupes de groupes de parties groupes de s'opposent parties prenantes parties radicalement à prenantes soutiennent prenantes l’ENGE. s'opposent à l’ENGE. soutiennent l’ENGE. l’ENGE. ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 37ȱ ȱ LATENT ÉMERGEANT (Absence (En voie de d’attribut ou écart satisfaire au ÉTABLI AVANCÉ par rapport à critère (Critère minimum (Bonne Justifica- l'attribut) minimum) acceptable) pratique) tion CF3 — Régularité du financement pour l’ENGE (Q13) Aucun (Q13) (Q13) Option non financement alloué Financement Financement applicable à aux ENGE. irrégulier alloué régulier alloué aux cette aux ENGE. ENGE. dimension. Non applicable. (Q14) Le (Q14) Le Option non financement financement applicable à couvre certaines couvre toutes les cette activités activités dimension. essentielles de essentielles de l’ENGE : l’ENGE : conception, conception, administration, administration, analyse ou analyse et reporting. reporting. Non applicable. (Q14) Le Option non (Q14) Le financement ne applicable à cette financement couvre pas les dimension. couvre les activités de activités de recherche et de recherche et de développement. développement. DF4 — Solidité des structures organisationnelles pour l’ENGE (Q15) Aucun (Q15) Le bureau (Q15) Le bureau Option non bureau, unité ou d’ENGE est une d’ENGE est une applicable à équipe ad hoc agence ou un agence, institution cette d’ENGE. groupe d’agents ou unité dimension. temporaire. permanente. Option non (Q16, Q17) Des (Q16, Q17) Des (Q16, Q17) Des applicable à cette considérations considérations considérations dimension. politiques politiques politiques entravent entravent parfois n’entravent régulièrement les considérations jamais les les techniques. considérations considérations techniques. techniques. Option non (Q18, Q19) Le (Q18, Q19) Le Option non applicable à cette bureau d’ENGE bureau d’ENGE applicable à dimension. ne rend pas de rend des comptes cette comptes à un à un organe dimension. organe clairement défini. clairement défini. ȱ 38ȱ MargueriteȱClarkeȱ LATENT ÉMERGEANT (Absence (En voie de d’attribut ou écart satisfaire au ÉTABLI AVANCÉ par rapport à critère (Critère minimum (Bonne Justifica- l'attribut) minimum) acceptable) pratique) tion CF5 — Efficacité des ressources humaines pour l'ENGE (Q20) Aucun (Q20, Q21) Le (Q20, Q21) Le (Q20, Q21) Le personnel alloué à bureau d’ENGE bureau d’ENGE a bureau d’ENGE la gestion des manque de le personnel a le personnel ENGE. personnel pour adéquat pour adéquat pour mener mener mener efficacement les efficacement les efficacement évaluations. évaluations ; les les évaluations, problèmes sont sans aucun rares. problème. (Q22) Le Option non (Q22) Le (Q22) Le pays/système applicable à pays/système offre pays/système n’offre aucune cette dimension. quelques offre une possibilité de possibilités de gamme préparation aux préparation aux étendue de ENGE. ENGE. possibilités de préparation aux ENGE. Adéquation du système (AS) Degré de cohérence de l’ENGE avec les autres composantes du système éducatif. AS1 — Adéquation de l’ENGE avec les objectifs de l’apprentissage (Q23) L’ENGE Option non (Q23) L’ENGE Option non n’est pas applicable à mesure la applicable à clairement basée cette dimension. performance par cette sur un programme rapport à un dimension. ou des critères programme ou des d’apprentissage. critères d’apprentissage. (Q24) Ce que Option non (Q24) Ce que (Q24) Ce que mesure l’ENGE est applicable à mesure l’ENGE est mesure l’ENGE remis en questions cette dimension. remis en questions est largement par des groupes de par certains accepté par les parties prenantes. groupes de parties groupes de prenantes. parties prenantes. ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 39ȱ ȱ LATENT ÉMERGEANT (Absence (En voie de d’attribut ou écart satisfaire au ÉTABLI AVANCÉ par rapport à critère (Critère minimum (Bonne Justifica- l'attribut) minimum) acceptable) pratique) tion (Q25) Aucun (Q25, Q26) Des (Q25, Q26) Des Option non mécanisme ne revues ad hoc revues internes applicable à garantit que garantissent régulières cette l’ENGE mesure que l’ENGE garantissent que dimension. effectivement ce mesure ce l’ENGE mesure ce qu'elle est censée qu'elle est qu'elle est censée mesurer. censée mesurer. mesurer. AS2 — Formations proposées aux enseignants sur les ENGE (Q27) Aucun cours (Q27, Q28) (Q27, Q28) Des (Q27, Q28) ou atelier sur les Cours ou cours ou ateliers Offre élargie et ENGE. ateliers sur les ENGE sont régulière de occasionnels régulièrement cours ou sur les ENGE. proposés. d’ateliers de bonne qualité sur les ENGE. Qualité de l'évaluation (QE) Degré de conformité de l’ENGE aux normes techniques, d'équité et à une utilisation efficace de l’évaluation QE1 — Garantie de la qualité de l’ENGE (Q29) Aucune Option non (Q29) Il existe au (Q29) Il existe option n’existe pour applicable à moins une option plusieurs inclure tous les cette dimension. pour inclure tous options pour groupes d’élèves les groupes inclure tous les dans les ENGE. d’élèves dans les groupes ENGE. d’élèves dans les ENGE. (Q30) Aucun Option non (Q30) Certains (Q30) Une mécanisme de applicable à mécanismes en variété de garantie de la cette dimension. place pour garantir mécanismes en qualité des ENGE. la qualité des place pour ENGE. garantir la qualité des ENGE. ȱ 40ȱ MargueriteȱClarkeȱ LATENT ÉMERGEANT (Absence (En voie de d’attribut ou écart satisfaire au ÉTABLI AVANCÉ par rapport à critère (Critère minimum (Bonne Justifica- l'attribut) minimum) acceptable) pratique) tion (Q31) Aucun (Q31) Il existe (Q31) Il y a un (Q31) Rapport rapport technique de la rapport technique technique ni documentation documentation complet mais à complet de quelconque sur les sur les aspects diffusion restreinte. bonne qualité à ENGE. techniques des la disposition du ENGE mais pas public. dans un format de rapport formel. QE2 — Garantie d’une utilisation efficace de l’ENGE (Q32) Les résultats (Q32) Les (Q32) Les résultats Option non des ENGE ne sont résultats des des ENGE sont applicable à pas diffusés. ENGE sont mal efficacement cette diffusés. diffusés. dimension. (Q33) Les données Option non (Q33) Les résultats (Q33) Les des ENGE ne sont applicable à des ENGE sont résultats des pas utilisées ou le cette dimension. utilisés par ENGE sont sont de façon non certains groupes utilisés par tous conforme aux de parties les groupes de objectifs ou prenantes parties caractéristiques conformément aux prenantes techniques des objectifs et conformément évaluations. caractéristiques aux objectifs et techniques des caractéristiques évaluations. techniques des évaluations. (Q34) Aucun Option non (Q34) Il existe (Q34) Il existe mécanisme de applicable à certains une variété de suivi des cette dimension. mécanismes de mécanismes de conséquences des suivi des suivi des ENGE. conséquences des conséquences ENGE. des ENGE. Sourceȱ:ȱBanqueȱmondiale.ȱ ȱ ȱ ȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 41ȱ ȱ Évaluationȱinternationaleȱàȱgrandeȱéchelleȱ(EIGE)ȱȱ LATENT ÉMERGEANT (Absence (En voie de d’attribut ou satisfaire au ÉTABLI AVANCÉ écart par rapport critère (Critère minimum (Bonne Justifica- à l'attribut) minimum) acceptable) pratique) tion Contexte favorable (CF) Cadre global du leadership, des politiques, des structures organisationnelles et des ressources fiscales et humaines au sein duquel l’activité d’EIGE a lieu dans un système éducatif et mesure dans laquelle ce contexte est propice à, ou soutient, cette activité. CF1 — Clarté des politiques pour l’EIGE (Q1, Q2) Le Option non (Q1, Q2) Le (Q1, Q2) Le pays/système n’a applicable à pays/système a pays/système pas participé à cette participé à au moins a participé à au une EIGE depuis dimension. une EIGE depuis 10 moins deux 10 ans. ans. EIGE depuis 10 ans. (Q3) Le Option non (Q3) Le pays/système Option non pays/système n’a applicable à a pris des mesures applicable à pas pris de cette concrètes pour cette mesures dimension. participer à au moins dimension. concrètes pour une EIGE dans les 5 participer à une années à venir. EIGE dans les 5 années à venir. (Q5) Aucun (Q5) Document (Q5) Document Option non document politique politique formel relatif applicable à politique relatif à informel ou à une participation cette une participation préliminaire aux EIGE. dimension. aux EIGE. relatif à une participation aux EIGE. Non applicable. (Q7) Le (Q7) Le document Option non document politique est mis à applicable à politique n’est disposition du public. cette pas mis à dimension. disposition du public. ȱ 42ȱ MargueriteȱClarkeȱ LATENT ÉMERGEANT (Absence (En voie de d’attribut ou satisfaire au ÉTABLI AVANCÉ écart par rapport critère (Critère minimum (Bonne Justifica- à l'attribut) minimum) acceptable) pratique) tion CF2 — Régularité du financement pour l’EIGE (Q8) Aucun (Q9) Il y a un (Q9) Un financement (Q9) Un financement pour financement régulier est alloué à financement participer aux provenant de discrétion. régulier est EIGE. prêts ou de approuvé par bailleurs une loi, un externes. décret ou une norme. Option non (Q10) Le (Q10) Le financement Option non applicable à cette financement couvre toutes les applicable à dimension. couvre activités essentielles cette certaines des EIGE. dimension. activités essentielles des EIGE. (Q10) Le Option non Option non applicable (Q10) Le financement ne applicable à à cette dimension. financement couvre pas les cette couvre les activités de dimension. activités de recherche et de recherche et développement. de développement . CF3 — Efficacité des ressources humaines pour l’EIGE (Q11, Q12) Aucun (Q11, Q12) Il y (Q11, Q12) Il y a un Option non coordinateur ni a un coordinateur et une applicable à équipe coordinateur équipe nationale/du cette nationale/du ou une équipe système pour mener dimension. système pour nationale/du les activités d’EIGE. mener les système pour activités d’EIGE. mener les activités d’EIGE. Option non (Q13) Le (Q13) Le coordinateur Option non applicable à cette coordinateur national ou du applicable à dimension. national ou du système parle cette système, ou couramment la dimension. bien le membre langue officielle de de l'équipe l'EIGE. désignée ne parle pas la langue officielle de l'EIGE. ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 43ȱ ȱ LATENT ÉMERGEANT (Absence (En voie de d’attribut ou satisfaire au ÉTABLI AVANCÉ écart par rapport critère (Critère minimum (Bonne Justifica- à l'attribut) minimum) acceptable) pratique) tion Option non (Q13, Q14, (Q13, Q14, Q15) Le (Q13, Q14, applicable à cette Q15) Le bureau des EIGE a le Q15) Le dimension. bureau des personnel adéquat bureau des EIGE manque pour mener EIGE a le de personnel efficacement les personnel ou de évaluations ; les adéquat pour personnel problèmes sont rares. mener formé pour efficacement mener les efficacement évaluations, ses sans aucun évaluations. problème. Adéquation du système (AS) Degré de cohérence de l’EIGE avec les autres composantes du système éducatif. AS1 — (Q14) L’équipe (Q14) L’équipe (Q14) L’équipe Option non d’EIGE n’a pas d’EIGE a d’EIGE a assisté à applicable à assisté à des assisté à tous les ateliers ou cette réunions ou quelques réunions dimension. ateliers réunions ou internationaux. internationaux. ateliers internationaux. (Q16) Le Option non (Q16, Q17) Le (Q16, Q17) Le pays/système applicable à pays/système offre pays/système n’offre pas cette des occasions offre de d’occasions dimension. d’apprendre des nombreuses d’apprendre des choses sur occasions choses sur les les EIGE. d’apprendre EIGE. des choses sur les EIGE. Option non Option non (Q18) Les occasions (Q18) Les applicable à cette applicable à d’apprendre des occasions dimension. cette choses sur les EIGE d’apprendre dimension. ne sont offertes des choses sur qu’aux membres de les EIGE sont l’équipe d’EIGE du offertes à un pays/système. large public, au-delà des membres de l’équipe d’EIGE du pays/système. ȱ 44ȱ MargueriteȱClarkeȱ LATENT ÉMERGEANT (Absence (En voie de d’attribut ou satisfaire au ÉTABLI AVANCÉ écart par rapport critère (Critère minimum (Bonne Justifica- à l'attribut) minimum) acceptable) pratique) tion Qualité de l'évaluation (QE) Degré de conformité de l’EIGE aux normes de qualité technique, d'équité et à une utilisation efficace de l’évaluation. QE1 — Garantie de la qualité des EIGE (Q19) Les (Q19) Le (Q19) Le Option non données des pays/système pays/système est applicable à EIGE ne sont pas est conforme à toutes les cette publiées. suffisamment normes techniques et dimension. conforme aux ses données sont normes pour présentées dans la que ses principale catégorie données soient du rapport présentées en international. dehors de la principale catégorie du rapport international ou en annexe. (Q20) Le Option non Option non applicable (Q20) Le pays/système n’a applicable à à cette dimension. pays/système pas contribué de cette a contribué de nouvelles dimension. nouvelles connaissances connaissances aux EIGE. aux EIGE. QE2 — Garantie d’une utilisation efficace de l’EIGE (Q21, Q22) S’ils (Q21, Q22) Les (Q21, Q22) Les (Q21, Q22) existent, les résultats et résultats et données Les résultats et résultats et données spécifiques du données données spécifiques du pays/système sont spécifiques du spécifiques du pays/système régulièrement pays/système pays/système ne sont diffusés au sein du sont sont pas diffusés irrégulièrement pays/système. régulièrement au sein du diffusés au et largement pays/système. sein du diffusés au pays/système. sein du pays/système. ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 45ȱ ȱ LATENT ÉMERGEANT (Absence (En voie de d’attribut ou satisfaire au ÉTABLI AVANCÉ écart par rapport critère (Critère minimum (Bonne Justifica- à l'attribut) minimum) acceptable) pratique) tion (Q21, Q23) Les Option non (Q21, Q23) Les (Q21, Q23) produits applicable à produits permettant Les produits permettant de cette de fournir un permettant de fournir un dimension. feedback sur les fournir un feedback sur les EIGE aux feedback sur EIGE aux établissements les EIGE aux établissements scolaires et établissements scolaires et éducateurs sont scolaires et éducateurs ne parfois mis à éducateurs sont pas mis à disposition. sont disposition. systématiquem ent mis à disposition. (Q24) Les (Q24) Les (Q24) Les résultats (Q24) Les résultats des résultats des des EIGE sont résultats des EIGE ne sont pas EIGE sont peu couverts par les EIGE sont couverts par les couverts par médias. largement médias. les médias. couverts par les médias. (Q25, Q26) S’ils (Q26) Les (Q26) Les résultats (Q26) Les existent, les résultats des des EIGE sont utilisés résultats des résultats et EIGE sont peu pour informer la prise EIGE sont données des utilisés pour de décision au sein utilisés de EIGE spécifiques informer la du pays/système. maintes façons au pays/système prise de pour informer ne sont pas décision au la prise de utilisés pour sein du décision au informer la prise pays/système. sein du de décision au pays/système. sein du pays/système. (Q27) Peu de Option non Option non applicable (Q27) Les clarté quant à applicable à à cette dimension. décisions l’impact positif des cette basées sur les décisions basées dimension. résultats des sur les résultats EIGE ont eu un des EIGE sur le impact positif niveau de réussite sur le niveau des élèves. de réussite des élèves. Sourceȱ:ȱBanqueȱmondiale.ȱ ȱ ȱ 46ȱ MargueriteȱClarkeȱ Annexeȱ3.ȱExempleȱd’utilisationȱdeȱlaȱgrilleȱ d’appréciationȱpourȱévaluerȱunȱprogrammeȱ d’évaluationȱnationaleȱàȱgrandeȱéchelleȱ Score ajusté (sous Poids standard Grille d’appréciation pour l’Évaluation nationale à grande échelle Remarques contrainte) Niveau de (ENGE) - PAYS X développement Score préliminaire (basé sur le score ajusté) LATENT Absence ÉMERGEAN d’attribut ou T (En voie de ÉTABLI 2,32 2,11 1 ÉMERGEANT écart par satisfaire au (Critère AVANCÉ rapport à critère minimum (Bonne JUSTIFI- l'attribut minimum) acceptable) pratique) CATION Contexte favorable (CF) Cadre global du leadership, des politiques, des structures organisationnelles et des ressources fiscales et humaines au sein duquel l’activité d’ENGE 2,63 2 0,33 Émergeant a lieu dans un système éducatif et mesure dans laquelle ce contexte est propice à, ou soutient, cette activité. CF1 — Clarté des politiques pour l’ENGE 2 2 0 ,2 (Q3_III) (Q3_III) (Q3_III) Option non En 2009, le Aucun L’ENGE est L’ENGE applicable à programme exercice entreprise de constitue un cette d’ENGE du d’ENGE n’a façon programme dimension. pays X eu lieu. irrégulière. stable et a fonctionnait régulièrement régulièrement. lieu. Les sources de financement Contrainte des différents exercices 3 0,25 d’ENGE provenaient cependant de divers bailleurs et les évaluations avaient lieu approximative ment tous les 3 ou 4 ans. (Q5) Aucun (Q5) Un (Q5) Un Option non En 2009, le document document document applicable à pays X n’avait politique relatif politique politique cette aucun aux ENGE. informel ou formel dimension. document Contrainte préliminaire autorise les politique autorise les ENGE. (formel, 1 0,25 ENGE. informel ou préliminaire) relatif aux activités d’ENGE. Non (Q7) Le (Q7) Le Option non Aucun applicable. document document applicable à document politique n’est politique est cette politique 1 0,25 pas mis à mis à dimension. disponible en disposition du disposition du 2009. public. public. ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 47ȱ ȱ Score ajusté (sous Poids standard Grille d’appréciation pour l’Évaluation nationale à grande échelle Remarques contrainte) Niveau de (ENGE) - PAYS X développement Score préliminaire (basé sur le score ajusté) LATENT Absence ÉMERGEAN d’attribut ou T (En voie de ÉTABLI 2,32 2,11 1 ÉMERGEANT écart par satisfaire au (Critère AVANCÉ rapport à critère minimum (Bonne JUSTIFI- l'attribut minimum) acceptable) pratique) CATION (Q8) Aucune Option non (Q8, Q9) Il est (Q8, Q9) Plan Aucun activité applicable à entendu que écrit des document d’ENGE n’est cette des ENGE ENGE pour politique ne prévue. dimension. auront lieu. les années à soutenait les venir. ENGE en 2009, mais il était 3 0,25 entendu que ces évaluations auraient lieu tous les 3 ou 4 ans. CF2 — Forte implication du public pour l’ENGE 4 0,2 (Q11, Q12) (Q11, Q12) (Q11, Q12) La (Q11, Q12) D’après nos Tous les Certains plupart des Tous les informations, il groupes de groupes de groupes de groupes de n’y a aucune parties parties parties parties opposition à 4 1 prenantes prenantes prenantes prenantes l’ENGE. s'opposent s'opposent soutiennent soutiennent radicalement aux ENGE. les ENGE. les ENGE. aux ENGE. CF3 — Régularité du financement pour l’ENGE 2 2 0,2 (Q13) Aucun (Q13) (Q13) Option non Les activités financement Financement Financement applicable à d’ENGE sont alloué aux irrégulier régulier alloué cette financées en ENGE. alloué aux aux ENGE. dimension. partie par le Contrainte ENGE. Ministère de l’Éducation, en 2 0,33 partie par les bailleurs. Le financement demeure ad hoc. Non (Q14) Le (Q14) Le Option non Le financement applicable. financement financement applicable à a eu tendance couvre couvre toutes cette à ne couvrir certaines les activités dimension. que les aspects activités essentielles élémentaires essentielles des ENGE : des activités des ENGE : conception, d'ENGE. Le 2 0,33 conception, administration financement a administration , analyse et parfois été , analyse ou reporting. insuffisant pour reporting. couvrir toutes les activités essentielles. Non (Q14) Le Option non (Q14) Le Le financement applicable. financement applicable à financement a ne couvre pas cette couvre les principalement les activités dimension. activités de été axé sur la de recherche recherche et mise en place 2 0,33 et de de des activités développeme développeme d’ENGE et non nt. nt. sur le R&D ou l'analyse secondaire. ȱ 48ȱ MargueriteȱClarkeȱ Score ajusté (sous Poids standard Grille d’appréciation pour l’Évaluation nationale à grande échelle Remarques contrainte) Niveau de (ENGE) - PAYS X développement Score préliminaire (basé sur le score ajusté) LATENT Absence ÉMERGEAN d’attribut ou T (En voie de ÉTABLI 2,32 2,11 1 ÉMERGEANT écart par satisfaire au (Critère AVANCÉ rapport à critère minimum (Bonne JUSTIFI- l'attribut minimum) acceptable) pratique) CATION DF4 — Solidité des structures organisationnelles pour 2,67 2 0,2 l’ENGE (Q15) Aucun (Q15) Le (Q15) Le Option non En 2009, bureau, unité bureau des bureau des applicable à l’équipe ou équipe ad ENGE est ENGE est une cette d’ENGE était hoc pour les une agence agence, dimension. constituée d’un ENGE. ou un groupe institution ou personnel d’agents unité réduit (4 temporaire. permanente. membres), dont certains n’avaient Contrainte aucune connaissance 2 0,33 ou formation en ENGE. Il n’y avait aucune unité permanente, et des locaux pour abriter l’institution étaient à l’étude. Option non (Q16, Q17) (Q16, Q17) (Q16, Q17) Aucun cas applicable à Des Des Des signalé de cette considération considérations considération considération dimension. s politiques politiques s politiques politique ayant entravent entravent n’entravent entravé les 4 0,33 régulièrement parfois les jamais les considérations les considérations considération techniques. considération techniques. s techniques. s techniques. Option non (Q18, Q19) (Q18, Q19) Le Option non En 2009, le applicable à Le bureau bureau applicable à bureau d’ENGE cette d’ENGE ne d’ENGE rend cette ne rendait pas dimension. rend pas de des comptes dimension. de comptes à comptes à un à un organe un organe organe clairement clairement 2 0,33 clairement défini. défini. Ceci est défini. dû au fait que le bureau était en cours de relocalisation institutionnelle. CF5 — Efficacité des ressources humaines pour l’ENGE 2,5 0,2 (Q20) Aucun (Q20, Q21) (Q20, Q21) Le (Q20, Q21) En 2009, le personnel Le bureau bureau Le bureau bureau d’ENGE alloué à la d’ENGE d’ENGE a le d’ENGE a le manquait de gestion des manque de personnel personnel personnel pour ENGE. personnel adéquat pour adéquat pour mener pour mener mener mener efficacement 2 0,5 efficacement efficacement efficacement les évaluations. les les les évaluations. évaluations ; évaluations; les problèmes sans aucun sont rares. problème. ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 49ȱ ȱ Score ajusté (sous Poids standard Grille d’appréciation pour l’Évaluation nationale à grande échelle Remarques contrainte) Niveau de (ENGE) - PAYS X développement Score préliminaire (basé sur le score ajusté) LATENT Absence ÉMERGEAN d’attribut ou T (En voie de ÉTABLI 2,32 2,11 1 ÉMERGEANT écart par satisfaire au (Critère AVANCÉ rapport à critère minimum (Bonne JUSTIFI- l'attribut minimum) acceptable) pratique) CATION (Q22) Le Option non (Q22) Le (Q22) Le Certains cours pays/système applicable à pays/système pays/système relatifs aux n’offre aucune cette offre quelques offre une évaluations et possibilité de dimension. possibilités de gamme aux mesures à préparation préparation étendue de grande échelle 3 0,5 aux ENGE. aux ENGE. possibilités de ont été préparation proposés par la aux ENGE. principale université du pays X. Adéquation du système (AS) Degré de cohérence de l’ENGE avec les autres composantes du 2 0,33 Émergeant système éducatif. AS1 — Adéquation de l’ENGE avec les objectifs de 3 0,5 l’apprentissage (Q23) L’ENGE Option non (Q23) L’ENGE Option non L’ENGE était n’est pas applicable à mesure la applicable à conforme au clairement cette performance cette programme et basée sur un dimension. par rapport à dimension. critères programme un existants. 3 0,33 ou des programme critères ou des d’apprentissa critères ge. d’apprentissa ge. (Q24) Ce que Option non (Q24) Ce que (Q24) Ce que Le Ministère de mesure applicable à mesure mesure l'Éducation et l’ENGE est cette l’ENGE est l’ENGE est les autres généralement dimension. remis en largement parties remis en questions par accepté par prenantes ont 4 0,33 questions par certains les groupes accepté des groupes groupes de de parties l’ENGE. de parties parties prenantes. prenantes. prenantes. (Q25) Aucun (Q25, Q26) (Q25, Q26) Option non En 2009, mécanisme Des revues Des revues applicable à certaines ne garantit ad hoc internes cette procédures de que l’ENGE garantissent régulières dimension. revue étaient mesure que l’ENGE garantissent en place pour effectivement mesure ce que l’ENGE évaluer la ce qu'elle est qu'elle est mesure ce conformité de censée censée qu'elle est l’ENGE aux 2 0,33 mesurer. mesurer. censée concepts/conte mesurer. nu qu’elle était censée mesurer mais ces procédures n'étaient ni formalisées ni standardisées. ȱ 50ȱ MargueriteȱClarkeȱ Score ajusté (sous Poids standard Grille d’appréciation pour l’Évaluation nationale à grande échelle Remarques contrainte) Niveau de (ENGE) - PAYS X développement Score préliminaire (basé sur le score ajusté) LATENT Absence ÉMERGEAN d’attribut ou T (En voie de ÉTABLI 2,32 2,11 1 ÉMERGEANT écart par satisfaire au (Critère AVANCÉ rapport à critère minimum (Bonne JUSTIFI- l'attribut minimum) acceptable) pratique) CATION AS2 — Formations proposées aux enseignants sur les ENGE 1 0,5 (Q27) Aucun (Q27, Q28) (Q27, Q28) (Q27, Q28) Les seuls cours cours ou Cours ou Des cours ou Offre élargie ou ateliers atelier sur les ateliers ateliers sur les et régulière relatifs à de ENGE. occasionnels ENGE sont de cours ou précédents sur les régulièrement d’ateliers de exercices ENGE. proposés. bonne qualité d'ENGE sont sur les destinés aux 1 1 ENGE. décideurs et éducateurs de haut niveau mais pas aux enseignants travaillant dans la classe. Qualité de l'évaluation (QE) Émergeant ou Degré de conformité de l’ENGE aux normes techniques, d'équité 2,33 0,33 Établi et à une utilisation efficace de l’évaluation. QE1 — Garantie de la qualité de l’ENGE 2,67 0,5 (Q29) Aucune Option non (Q29) Il existe (Q29) Il existe L’ENGE est option n’existe applicable à au moins une plusieurs traduite dans la pour inclure cette option pour options pour langue tous les dimension. inclure tous inclure tous d'instruction 3 0,33 élèves dans les groupes les groupes pertinente dans les ENGE. d’élèves dans d’élèves dans chaque région. les ENGE. les ENGE. (Q30) Aucun Option non (Q30) (Q30) Une En 2009, mécanisme applicable à Certains variété de certaines ne garantit la cette mécanismes mécanismes procédures de qualité des dimension. en place en place revue étaient ENGE. garantissent garantit la en place pour la qualité des qualité des évaluer la ENGE. ENGE. conformité de l’ENGE aux concepts/conte nu qu’elle était censée mesurer mais ces procédures 3 0,33 n'étaient ni formalisées ni standardisées. Ceci nous permet de dire que certains mécanismes étaient en place pour garantir la qualité de l’ENGE. (Q31) Aucun (Q31) Il existe (Q31) Rapport (Q31) En 2009, aucun rapport de la technique Rapport rapport technique ni documentatio complet mais technique technique documentatio n sur les à diffusion complet de formel de n quelconque aspects restreinte. bonne qualité l’ENGE n’était sur les ENGE. techniques à la disponible. 2 0,33 des ENGE disposition du mais pas public. dans un format de rapport formel. ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 51ȱ ȱ Score ajusté (sous Poids standard Grille d’appréciation pour l’Évaluation nationale à grande échelle Remarques contrainte) Niveau de (ENGE) - PAYS X développement Score préliminaire (basé sur le score ajusté) LATENT Absence ÉMERGEAN d’attribut ou T (En voie de ÉTABLI 2,32 2,11 1 ÉMERGEANT écart par satisfaire au (Critère AVANCÉ rapport à critère minimum (Bonne JUSTIFI- l'attribut minimum) acceptable) pratique) CATION QE2 — Garantie d’une utilisation efficace de l’ENGE 2 0,5 (Q32) Les (Q32) Les (Q32) Les Option non En 2009, les résultats des résultats des résultats des applicable à résultats de ENGE ne sont ENGE sont ENGE sont cette l’ENGE n’ont pas diffusés. mal diffusés. efficacement dimension. pas été diffusés. largement diffusés auprès 2 0,33 des parties prenantes clés. Peu de copies du rapport étaient disponibles. (Q33) Les Option non (Q33) Les (Q33) Les En 2009, les données des applicable à résultats des résultats des résultats de ENGE ne sont cette ENGE sont ENGE sont l’ENGE ont été pas utilisées dimension. utilisés par utilisés par utilisés, dans ou le sont de certains tous les une certaine façon non groupes de groupes de mesure, dans conforme aux parties parties l’élaboration objectifs ou prenantes prenantes des 3 0,33 caractéristiqu conformément conformémen programmes et es techniques aux objectifs t aux objectifs la formation des et et des évaluations. caractéristiqu caractéristiqu enseignants. es techniques es techniques des des évaluations. évaluations. (Q34) Aucun Option non (Q34) Il existe (Q34) Il existe En 2009, il n’y mécanisme applicable à certains une variété avait aucun de suivi des cette mécanismes de mécanisme de conséquences dimension. de suivi des mécanismes suivi des 1 0,33 des ENGE. conséquences de suivi des conséquences des ENGE. conséquence de l’ENGE. s des ENGE. Sourceȱ:ȱBanqueȱmondiale.ȱ ȱ ȱ ȱ ȱ ȱ 52ȱ MargueriteȱClarkeȱ Référencesȱ Airasian,ȱ P.,ȱ etȱ M.ȱ Russell.ȱ 2007.ȱ Classroomȱ Assessment:ȱ Conceptsȱ andȱ Applicationsȱ(6eȱéd.).ȱNewȱYorkȱ:ȱMcGrathȱHill.ȱȱ Au,ȱ W.ȱ 2007.ȱ “HighȬStakesȱ Testingȱ andȱ Curricularȱ Control:ȱ Aȱ Qualitativeȱ Metasynthesis.”ȱEducationalȱResearcherȱ36(5)ȱ:ȱ258–67.ȱ Americanȱ Educationalȱ Researchȱ Associationȱ (AERA),ȱ Americanȱ Psychologicalȱ Associationȱ (APA),ȱ etȱ Nationalȱ Councilȱ onȱ Measurementȱ inȱ Educationȱ (NCME).ȱ 1999.ȱ Standardsȱ forȱ Educationalȱ andȱPsychologicalȱTesting.ȱWashington,ȱDCȱ:ȱAERA.ȱ Banqueȱ mondiale.ȱ 2010.ȱ Russiaȱ Educationȱ Aidȱ forȱ Developmentȱ (READ)ȱ Trustȱ FundȱAnnualȱReportȱ2009.ȱWashington,ȱDCȱ:ȱBanqueȱmondiale.ȱ Bennett,ȱ R.ȱ E.ȱ 2011.ȱ “Formativeȱ Assessment:ȱ Aȱ Criticalȱ Review.”ȱ Assessmentȱ inȱEducation:ȱPrinciples,ȱPolicyȱandȱPracticeȱ18(1)ȱ:ȱ5–25.ȱȱ Bishop,ȱ J.,ȱ F.ȱ Mane,ȱ etȱ M.ȱ Bishop.ȱ 2001.ȱ “Secondaryȱ Educationȱ inȱ theȱ Unitedȱ States:ȱWhatȱCanȱOthersȱLearnȱfromȱOurȱMistakes?”ȱCAHRSȱWorkingȱ Paperȱ Series.ȱ Cornellȱ Centerȱ forȱ Advancedȱ Humanȱ Resourceȱ Studiesȱ (CAHRS).ȱ Black,ȱ P.,ȱ etȱ D.ȱ Wiliam.ȱ 1998.ȱ “Assessmentȱ andȱ Classroomȱ Learning.”ȱ AssessmentȱinȱEducation:ȱPrinciples,ȱPolicyȱandȱPracticeȱ5(1)ȱ:ȱ7–73.ȱȱ Braun,ȱ H.,ȱ etȱ A.ȱ Kanjee.ȱ 2006.ȱ “Usingȱ Assessmentȱ toȱ Improveȱ Educationȱ inȱ Developingȱ Nations.”ȱ Inȱ J.ȱ Cohen,ȱ D.ȱ Bloom,ȱ etȱ M.ȱ Malin,ȱ éd.,ȱ Educatingȱ Allȱ Children:ȱ Aȱ Globalȱ Agenda.ȱ Cambridge,ȱ MAȱ :ȱ Americanȱ AcademyȱofȱArtsȱandȱSciences.ȱ Bray,ȱ M.,ȱ etȱ L.ȱ Steward,ȱ éd.ȱ 1998.ȱ Examinationȱ Systemsȱ inȱ Smallȱ States:ȱ Comparativeȱ Perspectivesȱ onȱ Policies,ȱ Modelsȱ andȱ Operations.ȱ Londresȱ :ȱ SecrétariatȱduȱCommonwealth.ȱ Brinkley,ȱM.,ȱJ.ȱGuthrie,ȱetȱT.ȱWyatt.ȱ1991.ȱAȱSurveyȱofȱNationalȱAssessmentȱandȱ ExaminationȱPracticesȱinȱOECDȱCountries.ȱLugano,ȱSuisseȱ:ȱOCDE.ȱȱ Carnoy,ȱ M.,ȱ etȱ S.ȱ Loeb.ȱ 2002.ȱ “Doesȱ Externalȱ Accountabilityȱ Affectȱ Studentȱ Outcomes?ȱ Aȱ CrossȬStateȱ Analysis.”ȱ Educationalȱ Evaluationȱ andȱ Policyȱ Analysisȱ24(4)ȱ:ȱ305–331.ȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 53ȱ ȱ Clarke,ȱ M.ȱ 2007.ȱ “Stateȱ Responsesȱ toȱ theȱ Noȱ Childȱ Leftȱ Behindȱ Act:ȱ Theȱ Uncertainȱ Linkȱ betweenȱ Implementationȱ andȱ ‘Proficiencyȱ forȱ All’.”ȱ Inȱ C.ȱKaestleȱetȱA.ȱLodewick,ȱéd.,ȱToȱEducateȱaȱNation:ȱFederalȱandȱNationalȱ Strategiesȱ ofȱ Schoolȱ Reformȱ (pp.ȱ 144–174).ȱ Lawrenceȱ :ȱ Universityȱ ofȱ KansasȱPress.ȱ DarlingȬHammond,ȱ L.,ȱ etȱ L.ȱ Wentworth.ȱ 2010.ȱ Benchmarkingȱ Learningȱ Systems:ȱ Studentȱ Performanceȱ Assessmentȱ inȱ Internationalȱ Context.ȱ Stanford,ȱ CAȱ :ȱ Universitéȱ deȱ Stanford,ȱ Stanfordȱ Centerȱ forȱ OpportunityȱPolicyȱinȱEducation.ȱȱ Ferrer,ȱ G.ȱ 2006.ȱ Educationalȱ Assessmentȱ Systemsȱ inȱ Latinȱ America:ȱ Currentȱ Practiceȱ andȱ Futureȱ Challenges.ȱ Washington,ȱ DCȱ :ȱ Partnershipȱ forȱ EducationalȱRevitalizationȱinȱtheȱAmericas.ȱ Fuchs,ȱ L.ȱ S.,ȱ etȱ D.ȱ Fuchs.ȱ 1986.ȱ “Effectsȱ ofȱ Systematicȱ Formativeȱ Evaluationȱ onȱ Studentȱ Achievement:ȱ Aȱ MetaȬAnalysis.”ȱ Exceptionalȱ Childrenȱ 53ȱ :ȱ 199–208.ȱ Fuhrman,ȱ S.,ȱ etȱ D.ȱ Elmore,ȱ éd.ȱ 1994.ȱ Governingȱ Curriculum.ȱ Alexandria,ȱ VAȱ :ȱ ASCD.ȱ Gove,ȱA.,ȱetȱP.ȱCvelich.ȱ2011.ȱEarlyȱReading:ȱIgnitingȱEducationȱforȱAll.ȱAȱReportȱ byȱ theȱ Earlyȱ Gradeȱ Learningȱ Communityȱ ofȱ Practice.ȱ Éditionȱ revueȱ etȱ corrigée.ȱResearchȱTriangleȱPark,ȱNCȱ:ȱResearchȱTriangleȱInstitute.ȱ Greaney,ȱ V.,ȱ etȱ T.ȱ Kellaghan.ȱ 2008.ȱ Assessingȱ Nationalȱ Achievementȱ Levelsȱ inȱ Education.ȱWashington,ȱDCȱ:ȱBanqueȱmondiale.ȱ Groupeȱ d’évaluationȱ indépendanteȱ (IEG).ȱ 2006.ȱ Fromȱ Schoolingȱ Accessȱ toȱ Learningȱ Outcomes:ȱ Anȱ Unfinishedȱ Agenda.ȱ Washington,ȱ DCȱ :ȱ Banqueȱ mondiale.ȱȱ ȱ———.ȱ 1995.ȱ Equityȱ Issuesȱ inȱ Publicȱ Examinationsȱ inȱ Developingȱ Countries.ȱ Washington,ȱDCȱ:ȱBanqueȱmondiale.ȱ Hamilton,ȱ L.,ȱ B.ȱ Stecher,ȱ etȱ S.ȱ Klein.,ȱ éd.ȱ 2002.ȱ Makingȱ Senseȱ ofȱ TestȬBasedȱ AccountabilityȱinȱEducation.ȱSantaȱMonica,ȱCAȱ:ȱRANDȱCorporation.ȱ Hanushek,ȱ E.,ȱ etȱ M.ȱ Raymond.ȱ 2003.ȱ “Lessonsȱ aboutȱ theȱ Designȱ ofȱ Stateȱ Accountabilityȱ Systems.”ȱ Inȱ P.ȱ Petersonȱ etȱ M.ȱ West,ȱ éd.,ȱ Noȱ Childȱ Leftȱ Behind?ȱ Theȱ Politicsȱ andȱ Practiceȱ ofȱ Accountabilityȱ (pp.ȱ 127–151).ȱ Washington,ȱDCȱ:ȱBrookingsȱInstitutionȱPress.ȱ ȱ 54ȱ MargueriteȱClarkeȱ Hanushek,ȱ E.,ȱ etȱ L.ȱ Woessmann.ȱ 2009.ȱ “Schooling,ȱ Cognitiveȱ Skills,ȱ andȱ theȱ Latinȱ Americanȱ Growthȱ Puzzle.”ȱ Documentȱ deȱ travailȱ 15066.ȱ Cambridge,ȱMAȱ:ȱNationalȱBureauȱofȱEconomicȱResearch.ȱ ȱ———.ȱ 2007.ȱ Educationȱ Qualityȱ andȱ Economicȱ Growth.ȱ Washington,ȱ DCȱ :ȱ Banqueȱmondiale.ȱ Heubert,ȱ J.,ȱ etȱ R.ȱ Hauser.ȱ 1999.ȱ Highȱ Stakes:ȱ Testingȱ forȱ Tracking,ȱ Promotion,ȱ andȱGraduation.ȱWashington,ȱDCȱ:ȱNationalȱAcademyȱPress.ȱ Hill,ȱ P.ȱ 2010.ȱ Examinationȱ Systems.ȱ AsiaȬPacificȱ Secondaryȱ Educationȱ Systemȱ ReviewȱSeries.ȱBangkokȱ:ȱUNESCO.ȱ Hoxby,ȱ C.ȱ 2002.ȱ “Theȱ Costȱ ofȱ Accountability.”ȱ NBERȱ Workingȱ Paperȱ Seriesȱ N°ȱ w8855.ȱ Cambridge,ȱ MAȱ :ȱ Nationalȱ Bureauȱ ofȱ Economicȱ Research.ȱ DisponibleȱsurȱSSRNȱ:ȱhttp://ssrn.com/abstract=305599.ȱ Kifer,ȱ E.ȱ 2001.ȱ LargeȬScaleȱ Assessment:ȱ Dimensions,ȱ Dilemmas,ȱ andȱ Policy.ȱ ThousandȱOaks,ȱCAȱ:ȱCorwinȱPress,ȱInc.ȱ Larach,ȱ L.,ȱ etȱ M.ȱ Lockheed.ȱ 1992.ȱ “Worldȱ Bankȱ Lendingȱ forȱ Educationalȱ Testing.”ȱ PHREEȱ Backgroundȱ Paper,ȱ 92/62R.ȱ Départementȱ deȱ laȱ populationȱ etȱ desȱ ressourcesȱ humaines.ȱ Washington,ȱ DCȱ :ȱ Banqueȱ mondiale.ȱ Liberman,ȱ J.,ȱ etȱ M.ȱ Clarke.ȱ 2012.ȱ Reviewȱ ofȱ Worldȱ Bankȱ Supportȱ forȱ Assessmentȱ Activitiesȱ inȱ Clientȱ Countries.ȱ Manuscritȱ nonȱ publié.ȱ Washington,ȱ DCȱ :ȱ Banqueȱmondiale.ȱ Lockheed,ȱ M.ȱ 2009.ȱ Reviewȱ ofȱ Donorȱ Supportȱ forȱ Assessmentȱ Capacityȱ Buildingȱ inȱ Developingȱ Countries.ȱ Manuscritȱ nonȱ publié.ȱ Washington,ȱ DCȱ :ȱ Banqueȱmondiale.ȱ Macintosh,ȱ H.ȱ 1994.ȱ Aȱ Comparativeȱ Studyȱ ofȱ Currentȱ Theoriesȱ andȱ Practicesȱ inȱ Assessingȱ Students’ȱ Achievementsȱ atȱ Primaryȱ andȱ Secondaryȱ Level.ȱ IBEȱ Documentȱ Series,ȱ Numéroȱ 4.ȱ Genève,ȱ Suisseȱ:ȱ Bureauȱ internationalȱ deȱ l’éducation.ȱ Madaus,ȱ G.,ȱ etȱ M.ȱ Clarke.ȱ 2001.ȱ “Theȱ Impactȱ ofȱ HighȬStakesȱ Testingȱ onȱ Minorityȱ Students.”ȱ Inȱ M.ȱ Kornhaberȱ etȱ G.ȱ Orfield,ȱ éd.,ȱ Raisingȱ Standardsȱ orȱ Raisingȱ Barriers:ȱ Inequalityȱ andȱ Highȱ Stakesȱ Testingȱ inȱ Publicȱ Educationȱ(pp.ȱ85–106).ȱNewȱYorkȱ:ȱCenturyȱFoundation.ȱȱ Madausȱ G.,ȱ M.ȱ Clarke,ȱ etȱ M.ȱ O’Leary.ȱ 2003.ȱ “Aȱ Centuryȱ ofȱ Standardizedȱ Mathematicsȱ Testing.”ȱ Inȱ G.ȱ M.A.ȱ Stanicȱ etȱ J.ȱ Kilpatrick,ȱ éd.,ȱ Aȱ Historyȱ ofȱSchoolȱMathematicsȱ(pp.ȱ1311–1434).ȱReston,ȱVAȱ:ȱNCTM.ȱ ȱ L’essentielȱenȱmatièreȱdeȱsystèmeȱd’évaluationȱdesȱélèvesȱ:ȱDocumentȬcadreȱ 55ȱ ȱ McDermott,ȱ K.ȱ A.ȱ 2011.ȱ HighȬStakesȱ Reform:ȱ Theȱ Politicsȱ ofȱ Educationalȱ Accountability.ȱWashington,ȱDCȱ:ȱGeorgetownȱUniversityȱPress.ȱ McKinseyȱ &ȱ Company.ȱ 2007.ȱ Howȱ theȱ World’sȱ Bestȱ Performingȱ Schoolȱ Systemsȱ ComeȱOutȱOnȱTop.ȱLondresȱ:ȱMcKinseyȱ&ȱCompany.ȱȱ Messick,ȱ S.ȱ 1989.ȱ “Validity.”ȱ Inȱ R.ȱ Linn,ȱ éd.,ȱ Educationalȱ Measurementȱ (3eȱ éd.)ȱ (pp.ȱ13–103).ȱNewȱYorkȱ:ȱAmericanȱCouncilȱonȱEducation/Macmillan.ȱ Organisationȱ deȱ coopérationȱ etȱ deȱ développementȱ économiqueȱ (OCDE).ȱ 2010.ȱ Theȱ Highȱ Costȱ ofȱ Lowȱ Educationalȱ Performance.ȱ Theȱ LongȬRunȱ EconomicȱImpactȱofȱImprovingȱPISAȱOutcomes.ȱParisȱ:ȱOCDE.ȱȱ OrganisationȱdesȱNationsȱuniesȱpourȱ lȇéducation,ȱ laȱ scienceȱetȱlaȱcultureȱ (UNESCO).ȱ 2007.ȱ Educationȱ forȱ Allȱ Globalȱ Monitoringȱ Reportȱ 2008:ȱ Educationȱ forȱ Allȱ byȱ 2015.ȱ Willȱ Weȱ Makeȱ It?ȱ Parisȱ :ȱ UNESCO/Oxfordȱ UniversityȱPress.ȱ Ravela,ȱ P.ȱ 2005.ȱ “Aȱ Formativeȱ Approachȱ toȱ Nationalȱ Assessments:ȱ Theȱ Caseȱ ofȱUruguay.”ȱProspectsȱ35(1)ȱ:ȱ21–43.ȱ Ravela,ȱ P.,ȱ P.ȱ Arregui,ȱ G.ȱ Valverde,ȱ R.ȱ Wolfe,ȱ G.ȱ Ferrer,ȱ F.ȱ Martinez,ȱ M.ȱ Aylwin,ȱ etȱ L.ȱ Wolff.ȱ 2008.ȱ “Theȱ Educationalȱ Assessmentsȱ thatȱ Latinȱ Americaȱ Needs.”ȱ Workingȱ Paperȱ Seriesȱ N°ȱ 40.ȱ Washington,ȱ DCȱ :ȱ PartnershipȱforȱEducationalȱRevitalizationȱinȱtheȱAmericasȱ(PREAL).ȱȱ Ravela,ȱ P.,ȱ P.ȱ Arregui,ȱ G.ȱ Valverde,ȱ R.ȱ Wolfe,ȱ G.ȱ Ferrer,ȱ F.ȱ Martinez,ȱ M.ȱ Aylwin,ȱ etȱ L.ȱ Wolff.ȱ 2009.ȱ “Theȱ Educationalȱ Assessmentsȱ thatȱ Latinȱ AmericaȱNeeds.”ȱWashington,ȱDCȱ:ȱPREAL.ȱ Rodriguez,ȱ M.ȱ C.ȱ 2004.ȱ “Theȱ Roleȱ ofȱ Classroomȱ Assessmentȱ inȱ Studentȱ PerformanceȱonȱTIMSS.”ȱAppliedȱMeasurementȱinȱEducationȱ17(1)ȱ:ȱ1–24.ȱ Shepard,ȱ L.ȱ 2000.ȱ “Theȱ Roleȱ ofȱ Assessmentȱ inȱ aȱ Learningȱ Culture.”ȱ EducationalȱResearcherȱ29(7)ȱ:ȱ4–14.ȱȱ Smith,ȱ M.ȱ S.,ȱ etȱ J.ȱ O’Day.ȱ 1991.ȱ “Systemicȱ Schoolȱ Reform.”ȱ Inȱ S.ȱ H.ȱ Fuhrmanȱ etȱ B.ȱ Malen,ȱ éd.,ȱ Theȱ Politicsȱ ofȱ Curriculumȱ andȱ Testing,ȱ 1990ȱ Yearbookȱ ofȱ theȱ Politicsȱ ofȱ Educationȱ Associationȱ (pp.ȱ 233–267).ȱ Londresȱ etȱ Washington,ȱDCȱ:ȱFalmerȱPress.ȱȱ West,ȱ R.,ȱ etȱ J.ȱ Crighton.ȱ 1999.ȱ “Examinationȱ Reformȱ inȱ Centralȱ andȱ Easternȱ Europe:ȱIssuesȱandȱTrends.”ȱAssessmentȱinȱEducationȱ6(2)ȱ:ȱ271–280.ȱȱ Wolff,ȱ L.ȱ 2007.ȱ Theȱ Costsȱ ofȱ Studentȱ Assessmentȱ inȱ Latinȱ America.ȱ Washington,ȱ DCȱ:ȱPREAL.ȱȱ ȱ 56ȱ MargueriteȱClarkeȱ List of papers published in the current Working Paper series  &ODUNH0´:KDW0DWWHUV0RVWIRU6WXGHQW$VVHVVPHQW6\VWHPV $)UDPHZRUN3DSHUµ(Available in Russian and Portuguese).  5DPLUH]0´'HYHORSLQJWKH(QDEOLQJ&RQWH[WIRU6WXGHQW$VVHVVPHQWLQ &KLOHµ(Available in Russian).  5DPLUH]0´'LVVHPLQDWLQJDQG8VLQJ6WXGHQW$VVHVVPHQW,QIRUPDWLRQLQ &KLOHµ(Available in Russian).  /LEHUPDQ-DQG0&ODUNH´5HYLHZRI:RUOG%DQN6XSSRUWIRU6WXGHQW $VVHVVPHQW$FWLYLWLHVLQ&OLHQW&RXQWULHVµ(Available in Russian).  )ORFNWRQ/´7KH'HYHORSPHQWRIWKH6WXGHQW$VVHVVPHQW6\VWHPLQ1HZ =HDODQGµ(Available in Russian).  $OOHQ5´'HYHORSLQJWKH(QDEOLQJ&RQWH[WIRU6FKRRO%DVHG$VVHVVPHQW LQ4XHHQVODQG$XVWUDOLDµ(Available in Russian).  &DVWUR0´'HYHORSLQJWKH(QDEOLQJ&RQWH[WIRU6WXGHQW$VVHVVPHQWLQ %UD]LOµ(Available in Russian).  .DQMHH$DQG6$FDQD´'HYHORSLQJWKH(QDEOLQJ&RQWH[WIRU6WXGHQW $VVHVVPHQWLQ8JDQGDµ(Available in Russian).  %RORWRY9*.RYDOHYD03LQVND\DDQG,9DOGPDQ´'HYHORSLQJWKH (QDEOLQJ&RQWH[WIRU6WXGHQW$VVHVVPHQWLQWKH5XVVLDQ)HGHUDWLRQµ(Available in Russian). Forthcoming papers 7\XPHQHYD<´'LVVHPLQDWLQJDQG8VLQJ6WXGHQW$VVHVVPHQW,QIRUPDWLRQ LQ5XVVLDµ Ce document a pour objectif de présenter les éléments essentiels à la FUpDWLRQG·XQV\VWqPHG·pYDOXDWLRQGHVpOqYHVHIÀFDFH,OHVWD[pVXUOHV V\VWqPHVG·pYDOXDWLRQGHO·DSSUHQWLVVDJHHWGHVDFTXLVGHVpOqYHVDX[ QLYHDX[SULPDLUHHWVHFRQGDLUH,OWLUHVHVSULQFLSHVHWGLUHFWLYHVGH O·H[SpULHQFHGHVSD\VGHVQRUPHVSURIHVVLRQQHOOHVGHWHVWHWGHO·pWDW DFWXHOGHVUHFKHUFKHV/HEXWHVWGHIRXUQLUDX[GpFLGHXUVQDWLRQDX[DX[ UHSUpVHQWDQWVGHVPLQLVWqUHVGHO·pGXFDWLRQDXSHUVRQQHOGHVRUJDQLVDWLRQV GHGpYHORSSHPHQWDLQVLTX·DX[DXWUHVSDUWLHVSUHQDQWHVXQFDGUHHW GHVLQGLFDWHXUVFOpVSRXUOHGLDJQRVWLFODGLVFXVVLRQHWODFUpDWLRQG·XQ consensus autour des modalités de constitution d’un système d’évaluation GHVpOqYHVVDLQHWGXUDEOHVXVFHSWLEOHGHFRQWULEXHUjXQHPHLOOHXUHTXDOLWp GHO·pGXFDWLRQHWjO·DSSUHQWLVVDJHSRXUWRXV Marguerite Clarke, experte de haut niveau au Réseau pour le développement humain de la Banque mondiale .G(QPFUſFWEKCKTGFGNŏCUUKUVCPEGTWUUG´NŏÃFWECVKQPRQWTNGFÃXGNQRRGOGPV 4'#&6( GUVWPGEQNNC DQTCVKQPGPVTGNC(ÃFÃTCVKQPFG4WUUKGGVNC$CPSWGOQPFKCNGXKUCPV´UQWVGPKTNŏCOÃNKQTCVKQPFGUTÃUWNVCVU FŏCRRTGPVKUUCIGFGUÃNÂXGUFCPUNGURC[U´HCKDNGTGXGPWIT¸EG´NŏÃNCDQTCVKQPFGU[UVÂOGUFŏÃXCNWCVKQP UQNKFGU2QWTGPUCXQKTRNWUTGPFG\XQWUUWTNGUKVG9GDFG4'#&YYYYQTNFDCPMQTITGCFVH