Kniha (2022)/Relativní stanovení mezí pro průchod testem
Relativní standardizace je způsob vyhodnocení testu, při němž se výkon testovaného jedince porovnává s výkonem relevantní populace. Znamená to, že se zjišťuje, zda zkoušený jedinec dosahuje lepších nebo horších výsledků než ostatní testovaní. Testům, při nichž se výkon testovaného posuzuje v relaci k ostatním, se anglicky říká norm-referenced tests, (NRT). Tento přístup k hodnocení výsledku jednotlivce v kontextu výkonu ostatních používají například zkoušky SAT, používané jako rozhodující kritérium pro přijetí na mnohé vysoké školy v USA. V našem prostředí je relativní standardizace porovnávající výkon studentů mezi sebou běžnou součástí přijímacích zkoušek či různých rozřazovacích testů.
Relativní hodnocení je založeno na předpokladu, že výkonnost vzájemně srovnatelných studijních skupin (napříč prostorem a časem) je v zásadě stejná.
- Výhody relativního hodnocení
Relativní hodnocení se neváže na obsah testu, ale hodnotí jednotlivé účastníky mezi sebou. Výhodou tedy je, že zabraňuje inflaci nejvyšších hodnocení, zřetelně odliší nejlepší studenty a není nutné individuálně standardizovat každý test zvlášť.
- Nevýhody relativního hodnocení
Hodnocení studentů podle relativní standardizace odrazuje od spolupráce a týmové práce, protože si studenti uvědomují, že si navzájem konkurují o omezený počet nejvyšších hodnocení. Snižuje to i motivaci studentů ke studiu oslabením vztahu mezi jejich úsilím a výslednou známkou, protože ta závisí nejen na jejich vlastním výkonu, ale i na výkonu ostatních. Mezi nevýhody relativního hodnocení patří kolísání kvality úspěšných studentů podle kvality dané skupiny. Zejména u menších skupin se tedy může stát, že uspějí i studenti s úrovní znalostí, která neodpovídá našim požadavkům. A obráceně, část studentů nemusí v testu uspět, ani kdyby látku uměli sebelépe. Zvláště v menších a homogenních skupinách může relativní standardizace zveličit nepodstatné rozdíly. S ohledem na tato omezení bychom o užití relativního hodnocení měli uvažovat především ve velkých heterogenních skupinách, v nichž se nepředpokládá spolupráce. Relativní standardizace by se naopak neměla používat ve skupinách menších než 40 studentů.
Z pohledu studenta obsahuje tento způsob hodnocení zjevnou "nespravedlnost", protože hodnocení nezávisí jen na výkonu samotného studenta, ale i na výkonech ostatních, s nimž je porovnáván. Je tedy možné, že se stejnou mírou znalostí by student byl v jednom roce hodnocen lépe než v roce jiném. Pro minimalizaci tohoto rizika a zajištění meziroční porovnatelnosti se používá vyrovnávání obtížnosti testů, o kterém bude pojednáno v samostatné kapitole.
- Relativní hodnocení prakticky
Při relativní standardizaci se skupina rozčlení podle dosaženého počtu bodů a oznámkuje se. Pro stanovení konkrétních známek se používá např. z-skóre nebo percentilové pořadí. Při čtyřstupňové klasifikační stupnici pak hranicím mezi jednotlivými klasifikačními stupni odpovídají např. z-skóre –2, 0, 2, jak je naznačeno na obrázku X.X. Nastavení hraničního skóre při relativním hodnocení může mít arbitrární povahu, např. při přijímacích zkouškách danou kapacitou školy, pro níž přijímací testy realizujeme.

Percentilová škála zhruba udává, jaké procento testované populace dosahuje horších výsledků než daný student.
z-škála popisuje, jak daleko (měřeno směrodatnou odchylkou dat) je výsledek daného studenta od průměru.
T-škála používá stejnou metriku, ale vyjadřuje ji na stovkové stupnici.
Percentilová škála
Nejznámější metodou porovnávající vzájemně výkony testovaných je zobrazení jejich výkonů pomocí percentilové škály. K výsledku studenta se zjistí percentil, který zhruba říká, kolik procent studentů referenční skupiny mělo výsledek horší než daný student. Percentil tak přibližně určuje pořadí studenta přepočítané na interval 0 až 1 (resp. 0–100 %).
Při výpočtu percentilu dosaženého studentem se spočítá počet studentů, kteří měli výsledek horší než daný student, a přičte se polovina studentů, kteří měli stejný výsledek jako daný student. Pak se určí, jak velkou část celkového počtu studentů tvoří tato skupina. Percentilové pořadí pro osobu s i-tým nejhorším celkovým skóre lze odvodit prostřednictvím vztahu:
kde Ni je kumulativní četnost u daného výsledku, ni je četnost daného výsledku a n je počet testovaných studentů. Kumulativní četnost vyjadřuje počet studentů, kteří dosáhli daného nebo horšího výsledku.
z-skóre
Další metodou standardizace výsledku studenta je výpočet jeho z-skóre. Pro daného studenta jeho z-skór ukazuje, nakolik je jeho výsledek nad nebo pod průměrem (měřeno v jednotkách směrodatné odchylky). Jednoduše tedy můžeme z-skóre vypočítat jako rozdíl studentova hrubého skóre a průměru celé skupiny , vydělený směrodatnou odchylkou :
Pomocí z-skóre může vyučující snadno identifikovat žáky výtečné (z > 2) a naopak velmi slabé (z < −2). Snadno může také porovnat studentovy výsledky v různých částech testu.
Podrobnější rozbor dalších metod standardizace (např. C-škála a další) je k dispozici například v publikaci autorů Jeřábka a Bílka Teorie a praxe tvorby didaktických testů. [1]
Reference
- ↑ JEŘÁBEK, Ondřej a Martin BÍLEK. Teorie a praxe tvorby didaktických testů. Olomouc: Univerzita Palackého v Olomouci, 2010. ISBN 978-80-244-2494-1.