Kniha (2022)/Škálování

Z StaTest


Složitějším způsobem převodu skóre na jinou stupnici, vhodnější pro reportování, je škálování. Na rozdíl od předchozího přístupu, kdy byl přepočet založen na třech bodech (0 %, hranice úspěšnosti a 100 %), je škálování podrobnější. Slouží především k tomu, abychom mohli srovnatelným způsobem sdělit výsledky různých paralelních forem (variant) testu, které se mohou mírně lišit svou obtížností (viz též Vyrovnávání obtížnosti testů).

Řada důležitých testů jako jsou ACT, SAT, GRE a MCAT, je vykazována na stupnicích, které jsou zvoleny záměrně tak, aby nesly určitou informaci. SAT a GRE mají historicky nastaven nominální průměr 500 a směrodatnou odchylku 100, zatímco ACT má nominální průměr 18 a směrodatnou odchylku 6. Jedná se vlastně o stejné škály, protože nejsou ničím jiným než přepočteným z-skóre.

"Průměrné hodnoty" byly vybrány arbitrárně, a poté byly nastaveny hranice rozsahu skóre pomocí násobku směrodatných odchylek. Díky tomu se hodnocení v testech SAT a GRE se pohybují v rozmezí od 200 do 800 a v testech ACT v rozmezí od 0 do 36. Pro lepší pocit zkoušeného jsou stupnice nastavené tak, že za "odevzdání formuláře" u zkoušky SAT obdržel 200 bodů. Výsledek 300 bodů se může jevit jako povzbudivé číslo, ale je to jen 100 bodů nad minimem, což odpovídá pouhému 3. percentilu.

Často se vůbec neuvádí hrubé skóre dosažené v testu, ale výhradně některé přepočtené skóre. Pokud existuje více verzí testů, které se srovnávají, škálování vyrovná skutečnost, že se verze liší obtížností. Zvolená bodovací škála by měla být alespoň tak široká, jako je počet položek v testu, jinak by se ztratila část rozlišení, které výsledky testu přinášejí.

Při škálování se nejprve definuje rozsah, ve kterém mají ležet sdělované výsledky. Začíná se obvykle nalezením střední hodnoty a směrodatné odchylky hrubých skóre v testu, a ty se poté převedou na jinou, přepočtenou střední hodnotu a směrodatnou odchylku. Již zmiňované lineární a dvojitě lineární přepočty nemusí stačit, používají se proto i složitější transformace. Pro vyrovnávání paralelních forem testu je vhodná např. ekvipercentilní transformace (viz kapitola - Vyrovnávání obtížnosti testů).


Odkazy

Reference