Statewide ¡High ¡School ¡Exit ¡Exams ¡and ¡ ¡ Data-‑Based ¡School ¡Improvement: ¡ ¡ A ¡European ¡Story ¡
Esther ¡Dominique ¡Klein ¡
BEAR ¡Seminar ¡– ¡UC ¡Berkeley ¡– ¡February ¡23, ¡2016 ¡
Statewide High School Exit Exams and Data-Based School - - PowerPoint PPT Presentation
Statewide High School Exit Exams and Data-Based School Improvement: A European Story Esther Dominique Klein BEAR Seminar UC Berkeley
BEAR ¡Seminar ¡– ¡UC ¡Berkeley ¡– ¡February ¡23, ¡2016 ¡
(Defini'on ¡adapted ¡from ¡Kellaghan ¡and ¡Madaus‘, ¡2003, ¡defini'on ¡of ¡public ¡exams) ¡
mandatory ¡for ¡graduaTon ¡ based ¡on ¡prescribed ¡syllabi ¡in ¡curriculum ¡ taken ¡in ¡a ¡common ¡test ¡situaTon ¡ controlled ¡by ¡an ¡agency ¡external ¡to ¡the ¡schools ¡ based ¡on ¡tasks ¡or ¡assignments ¡that ¡are ¡set ¡by ¡an ¡agency ¡external ¡to ¡the ¡schools ¡ usually ¡administered ¡by ¡a ¡naTonal ¡or ¡state ¡government ¡
Länder ¡with ¡statewide ¡Abitur ¡exams ¡(Zentralabitur) ¡ Länder ¡with ¡school-‑based ¡Abitur ¡exams ¡ Länder ¡with ¡a ¡mix ¡of ¡both ¡ before ¡2005 ¡ a^er ¡2008 ¡
(Zabala ¡et ¡al., ¡2008) ¡ (McIntosh, ¡2012) ¡
10 ¡
Achievement ¡ Accounta-‑ bility ¡ InnovaTon ¡ Professional ¡ learning ¡
comparability ¡
assurance, ¡control ¡of ¡the ¡ delivered ¡curriculum ¡ For ¡both ¡students ¡and ¡ teachers/schools ¡ ImplementaTon ¡of ¡new ¡ curricula ¡or ¡new ¡methods ¡
assessment ¡
diagnosTc ¡skills, ¡reduce ¡ uncertainTes, ¡iniTate ¡ reflecTve ¡thinking ¡
validaTon ¡and ¡evaluaTon, ¡ improving ¡collaboraTon ¡ and ¡other ¡organizaTonal ¡ rouTnes ¡
Survey ¡
¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Review ¡of ¡Exam ¡Procedures ¡in ¡OECD ¡countries ¡
educaTon, ¡historical ¡context, ¡ development ¡of ¡exam ¡tasks, ¡ student ¡choice, ¡exam ¡ supervision, ¡marking ¡ procedures, ¡use ¡of ¡exam ¡ results, ¡... ¡
Exam ¡ procedures ¡
standardizaTon, ¡ focal ¡/ ¡core ¡ themes, ¡... ¡
Curriculum ¡
complexity ¡/ ¡difficulty, ¡ curricular ¡validity, ¡... ¡
Tasks ¡
standardizaTon, ¡ and ¡bindingness ¡
schemes, ¡actual ¡ compliance ¡with ¡ marking ¡ schemes, ¡... ¡
Marking ¡ Document ¡analysis ¡ Interviews ¡ Curriculum ¡/ ¡Task ¡analysis ¡ ObservaTon ¡of ¡marking ¡ behavior ¡ ... ¡
** ¡no ¡federal ¡countries ¡except ¡Germany ¡
(Klein ¡et ¡al., ¡2009; ¡Klein ¡& ¡van ¡Ackeren, ¡2011) ¡
school-‑based ¡
specializaTon ¡ ¡
choice? ¡
choice? ¡
difficulty ¡ levels? ¡
difficulty ¡level ¡ for ¡final ¡grade ¡
choice? ¡
Achievement ¡ Accounta-‑ bility ¡ InnovaTon ¡ Professional ¡ learning ¡
comparability ¡
assurance, ¡control ¡of ¡the ¡ delivered ¡curriculum ¡ For ¡both ¡students ¡and ¡ teachers/schools ¡ ImplementaTon ¡of ¡new ¡ curriculua ¡or ¡new ¡ methods ¡of ¡delivery ¡and ¡ assessment ¡
diagnosTc ¡skills, ¡reduce ¡ uncertainTes, ¡iniTate ¡ reflecTve ¡thinking ¡
validaTon ¡and ¡evaluaTon, ¡ improving ¡collaboraTon ¡ and ¡other ¡organizaTonal ¡ rouTnes ¡
(e.g., ¡Altrichter ¡& ¡Maag ¡Merki, ¡2010; ¡Kussau ¡ & ¡Brüsemeister, ¡2007) ¡
Actual ¡ Outcome ¡ Target ¡ Outcome ¡ Comparison ¡of ¡ target ¡and ¡actual ¡
NaTonal ¡tests ¡ Statewide ¡exit ¡exams ¡ School ¡ processes ¡ ReflecTon ¡ Strategic ¡decisions ¡ for ¡ school ¡development ¡ Standards ¡
Reinforcement ¡ If ¡ ¡ congruent ¡ If ¡not ¡ congruent ¡ InterpretaTon ¡ RecontextualizaTon ¡ ModificaTon ¡
(Maag ¡Merki, ¡2010; ¡shortened ¡version) ¡
24 ¡
Accountability, ¡support, ¡incenTves ¡ Individual, ¡school, ¡society, ¡and ¡policyfactors ¡
“Technology” ¡of ¡the ¡ exams ¡ Use ¡of ¡the ¡exams ¡ (School, ¡department, ¡teacher ¡level) ¡ OrganizaTonal ¡rouTnes ¡ (School, ¡department, ¡individual ¡level) ¡ Intended ¡and ¡ unintended ¡effects ¡
FuncTons ¡and ¡ strategies ¡ ImplementaTon ¡ process ¡ Governance ¡system, ¡System ¡of ¡quality ¡assurance ¡ ¡ Local ¡administraTon, ¡district ¡
(Klein, ¡2013, ¡adapted ¡from ¡Visscher, ¡2002) ¡
sexngs ¡want ¡state-‑wide ¡exit ¡exams ¡to ¡affect ¡ schooling? ¡
and ¡what ¡factors ¡on ¡system, ¡school ¡and ¡ subject ¡level ¡influence ¡their ¡responses? ¡
26 ¡
Ø InternaTonal ¡comparaTve ¡case ¡study ¡of ¡statewide ¡exit ¡exams ¡at ¡the ¡end ¡of ¡upper ¡ secondary ¡educaTon ¡(ISCED ¡3A) ¡ Ø MulT-‑method/mulT-‑perspecTve ¡approach ¡(Yin, ¡2009) ¡ Ø Exploratory ¡approach ¡ ¡
Context-‑free ¡research ¡quesTon ¡à ¡DescripTon ¡à ¡JuxtaposiTon ¡and ¡Comparison ¡à ¡Hypotheses ¡
(Philips ¡& ¡Schweisfurth, ¡2007) ¡
Exam ¡ Ylioppilastutkinto ¡ Leaving ¡Cer'ficate ¡ Examina'ons ¡ Eindexamen ¡vwo ¡ Exam ¡type ¡ Statewide ¡exit ¡ exams ¡ Statewide ¡exit ¡ exams ¡ Statewide ¡(50%) ¡ und ¡school-‑based ¡ (50%) ¡exit ¡exams ¡ StandardizaTon ¡
procedures ¡ moderate ¡ high ¡ SWEE: ¡high ¡ SBEE: ¡low ¡ Governance* ¡ LegiTmacy ¡type ¡ with ¡Local ¡ Empowerment ¡ LegiTmacy ¡/ ¡ Bureaucracy ¡type ¡ with ¡School ¡ Empowerment ¡ ¡ LegiTmacy ¡/ ¡ Efficiency ¡type ¡with ¡ School ¡ Empowerment ¡
*Schmid ¡et ¡al., ¡2007; ¡Glager ¡et ¡al., ¡2003 ¡
¡States ¡with ¡statewide ¡high ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡school ¡exit ¡exams ¡have ¡a ¡ higher ¡unemployment ¡rate ¡and ¡more ¡ diversity ¡among ¡students ¡ à SWEE ¡are ¡a ¡means ¡to ¡counteract ¡ disadvantages ¡and ¡inequiTes ¡in ¡the ¡ acquisiTon ¡of ¡cerTficates ¡and ¡ access ¡to ¡higher ¡educaTon ¡
(Warren ¡& ¡Kulick, ¡2007) ¡ SWEE ¡are ¡used ¡for ¡„a ¡higher ¡transpa-‑ ¡ rency ¡of ¡the ¡requirements, ¡a ¡higher ¡ comparability ¡of ¡the ¡achievements, ¡and ¡ more ¡equity ¡in ¡the ¡allocaTon ¡of ¡cerTficates. ¡ [...] ¡ Peformance ¡of ¡the ¡educaTon ¡system ¡as ¡a ¡ whole: ¡[...] ¡Based ¡on ¡the ¡data ¡from ¡SWEE, ¡ improvement ¡measures ¡can ¡be ¡iniTated.“ ¡ (h]p://www.standardsicherung. ¡ schulministerium.nrw.de/zp10/ziele/ ¡; ¡ transla'on ¡by ¡me) ¡
(Klein ¡2013) ¡
students ¡
school ¡processes ¡
expectaTon ¡
students ¡
schools ¡
low ¡stakes ¡for ¡schools ¡
expectaTon ¡
school-‑based ¡exams ¡
benchmark ¡for ¡student ¡ achievements ¡
internal ¡and ¡external ¡ evaluaTon ¡system ¡
expectaTon ¡
¡ (Schildkamp ¡et ¡al., ¡2012) ¡
1999) ¡
DeBray ¡et ¡al., ¡2000; ¡Saunders, ¡2000; ¡Saunders ¡& ¡Rudd, ¡1999; ¡Schildkamp ¡& ¡Kuiper ¡2010; ¡ Schildkamp ¡et ¡al. ¡2012) ¡
Is ¡the ¡school ¡actors’ ¡percepTon ¡of ¡ the ¡exam ¡funcTons ¡coherent ¡with ¡ the ¡intenTons ¡of ¡the ¡state? ¡ ¡ How ¡do ¡school ¡actors ¡uTlize ¡the ¡ exams ¡for ¡school ¡and ¡classroom ¡ development? ¡
(Klein ¡2013) ¡
35 ¡upper ¡secondary ¡university-‑bound ¡schools ¡
0% ¡ 25% ¡ 50% ¡ 75% ¡ 100% ¡
Benchmarking ¡ Monitoring ¡ Vergleich ¡ Rechensch_L ¡ EvaluaTon_L ¡ EvaluaTon_SL ¡ PublikaTon ¡ U-‑entwickl. ¡
U-‑ressourcen ¡
Finland ¡
0% ¡ 25% ¡ 50% ¡ 75% ¡ 100% ¡
Benchmarking ¡ Monitoring ¡ Vergleich ¡ Rechensch_L ¡ EvaluaTon_L ¡ EvaluaTon_SL ¡ PublikaTon ¡ U-‑entwickl. ¡
U-‑ressourcen ¡
Ireland ¡
0% ¡ 25% ¡ 50% ¡ 75% ¡ 100% ¡
Benchmarking ¡ Monitoring ¡ Vergleich ¡ Rechensch_L ¡ EvaluaTon_L ¡ EvaluaTon_SL ¡ PublikaTon ¡ U-‑entwickl. ¡
U-‑ressourcen ¡
Netherlands ¡
N ¡= ¡15 ¡ N ¡= ¡12 ¡ N ¡= ¡6 ¡ Comparison ¡ Comparison ¡ Comparison ¡ Teacher ¡Acc. ¡ Teacher ¡Acc. ¡ Teacher ¡Acc. ¡ Teacher ¡Eval. ¡ Teacher ¡Eval. ¡ Teacher ¡Eval. ¡ Principal ¡Eval. ¡ Principal ¡Eval. ¡ Principal ¡Eval. ¡ PublicaTon ¡ PublicaTon ¡ PublicaTon ¡
Streaming ¡ Streaming ¡ Streaming ¡
(Klein, ¡2013) ¡
2,0 ¡ 2,5 ¡ 3,0 ¡ 3,5 ¡ 4,0 ¡ A1 ¡ A2 ¡ A3 ¡ B1 ¡ B2 ¡ C1 ¡ C2 ¡ A1 ¡ A2 ¡ A3 ¡ B1 ¡ B2 ¡ C1 ¡ C2 ¡ A1 ¡ A2 ¡ A3 ¡ B1 ¡ B2 ¡ C1 ¡ C2 ¡ Finnland ¡ Irland ¡ Niederlande ¡ Means ¡and ¡95% ¡confidence ¡inervals ¡ ¡
5 ¡point ¡Likert ¡scale; ¡1 ¡= ¡not ¡at ¡all ¡true; ¡5 ¡= ¡totally ¡true ¡
A: ¡IntegraJng ¡exams ¡in ¡lessons ¡(exchange ¡of ¡experience, ¡synchronize ¡teaching ¡of ¡exam ¡content) ¡ B: ¡InstrucJonal ¡improvement ¡(using ¡exams ¡and ¡data ¡to ¡improve ¡teaching) ¡ C: ¡StandardizaJon ¡(use ¡of ¡older ¡exam ¡tasks, ¡adjustment ¡state ¡standards) ¡
(Klein, ¡2013) ¡
3,0 ¡ 3,5 ¡ 4,0 ¡ 4,5 ¡ 5,0 ¡ Improvement ¡ Assessment ¡ Improvement ¡ Assessment ¡ Improvement ¡ Assessment ¡ Finland ¡ Ireland ¡ Netherlands ¡
Finland ¡
Means ¡and ¡95% ¡confidence ¡intervals ¡ Use ¡of ¡exam ¡tasks ¡and ¡results ¡for... ¡
5-‑point ¡Likert ¡scale; ¡1 ¡= ¡strongly ¡disagree; ¡5 ¡= ¡strongly ¡agree ¡ *** ¡p ¡< ¡.001; ¡** ¡p ¡< ¡.01; ¡* ¡p ¡< ¡.05 ¡
MA-‑B ¡= ¡0,29 ¡
¡ ¡t ¡(128) ¡= ¡3.11**; ¡d ¡= ¡.31 ¡ ¡
MA-‑B ¡= ¡0,89 ¡
t ¡(148) ¡= ¡8.77***; ¡d ¡= ¡.92 ¡
MA-‑B ¡= ¡0,20 ¡
t ¡(53) ¡= ¡1.78, ¡n.s.; ¡d ¡= ¡.26 ¡
(Klein, ¡2013) ¡
FuncTon ¡of ¡ the ¡exams ¡ Formal ¡qualificaTon ¡ and ¡development ¡ Formal ¡ ¡ qualificaTon ¡ Formal ¡qualificaTon, ¡ moTvaTon, ¡and ¡ development ¡ Relevance ¡ ¡ in ¡schools ¡ lower ¡ higher ¡ higher ¡ School ¡ ¡ data ¡use ¡ Individualized ¡ ¡ rouTne ¡ One-‑dimensional ¡ purposive ¡ MulT-‑dimensional ¡ systemaTc ¡
(Klein, ¡2013) ¡
à ¡Heterogeneous ¡Inten@ons ¡à à ¡Heterogeneous ¡ Responses ¡ Ø The ¡“governing ¡effect” ¡of ¡the ¡exam ¡system ¡becomes ¡visible ¡through ¡ the ¡internaTonal ¡comparison ¡