Kniha (2022)/Formativní a sumativní testování

Aby test fungoval, jak si představujeme, musíme si nejprve ujasnit, co od něj očekáváme. V různých situacích se používají různé typy testů. Všechny jsou si v něčem podobné, pokaždé je ale kladen důraz na jiné vlastnosti a na některé vlastnosti se naopak rezignuje.

Podle toho, jaké fáze výuky je test součástí a čemu má ve výuce napomoci, můžeme testy dělit na formativní a sumativní. Účelem formativního hodnocení je především poskytnutí zpětné vazby studentům i učiteli o průběhu výuky. Test se stává součástí výukového dialogu, podporuje aktivní zapojení studentů do výuky, přispívá k jejich motivaci. Student se dozví, nakolik znalosti a dovednosti, které získal, odpovídají nárokům kurzu, a vyzkouší si jejich využití. Test mu pomůže identifikovat silné stránky i oblasti, na kterých musí ještě pracovat. Učiteli výsledky formativního testování pomáhají zefektivnit výuku, neboť mu ukáží, kterým oblastem je třeba se věnovat více a kde by to naopak bylo již zbytečné. Pro obě strany by mělo být formativní testování především orientační. Na formativní test se nekladou tak vysoké procedurální nároky. V některých případech může dokonce nedokonalost formativního testu výuce pomoci, neboť stimuluje diskusi a zapojení všech zúčastněných.

Cílem sumativního hodnocení je naproti tomu poskytnout celkový obraz o výsledku učení. Výsledky sumativních testů jsou často podkladem pro další postup ve studiu nebo kariéře. K tomuto typu hodnocení se nejčastěji přistupuje po nějaké celistvé části výuky nebo na závěr kurzu, anebo naopak může jít o testy, kterými se ověřuje způsobilost uchazeče nastoupit do kurzu či zahájit určitou práci.

V praxi jsou čistě formativní a čistě sumativní testy jen extrémy na spojité škále. Často se setkáme s tím, že i test, který je především formativní, se nějakým způsobem započítává do celkového hodnocení studenta a další postup se podmiňuje dosažením určitých výsledků. A obráceně, i sumativní testy a zkoušky by ve většině případů měly zahrnovat poskytnutí zpětné vazby studentovi i učiteli a pomáhat tak ke zkvalitňování kurzu a rozvoji studijních dovedností.

Při přípravě testu je také potřeba zvážit, v jakém rozsahu a do jaké hloubky se mají hodnotit dosažené znalosti a dovednosti.

Nejnáročnější jsou v tomto směru testy a zkoušky (odborné) způsobilosti (proficiency tests), hodnotící celkovou schopnost vykonávat nějakou činnost, například komunikovat cizím jazykem, provádět určité výkony apod. Zkoušky odborné způsobilosti většinou vyžadují nástroje praktického zkoušení (workplace based assessment) a samostatné písemné testování lze použít jen ve specifických případech nebo jako dílčí součást zkoušky způsobilosti.

Didaktické testy (achievement tests) hodnotí, do jaké míry student zvládl část kurzu nebo určitý úsek studia.

Cílem diagnostických testů je podrobněji popsat, jaká jsou silná a slabá místa testovaného.

Konečně prognostické testy a testy studijních předpokladů (aptitude tests) mají odhadnout, do jaké míry je testovaná osoba schopna úspěšně absolvovat určitý kurz a získat v něm cílové kompetence. Například Modern Language Aptitude Test (MLAT) měří studentův potenciál pro úspěšné zvládnutí cizích jazyků, Scholastic Aptitude Test (SAT) hodnotí akademické schopnosti a potenciál vystudovat vyšší nebo vysokou školu.

Standardizované provedení a hodnocení má zajistit prokazatelnost, reprodukovatelnost a dlouhodobou stabilitu výsledků nejdůležitějších zkoušek. U standardizovaného testu musí být zaručeno, že výsledek závisí především na schopnostech zkoušeného, nikoli na konkrétní variantě testu, prostředí, ve kterém se test píše, dohledu či hodnotitelích.

Pojem "standardizace" má v psychometrii celou řadu významů a podrobněji se jím budeme zabývat později v samostatné kapitole. Standardizace testu je požadována zejména tam, kde výstupem zkoušky bývá nějaký uznávaný certifikát či je výsledek důležitý pro další kariéru testovaného. Součástí standardizovaného testování je sběr dat o testování a jejich statistické zpracování, mimo jiné s cílem odhalit "nestandardní jevy" (opisování, únik položek, napovídání...). Mezi základní nástroje používané při přípravě standardizovaných testů patří použití kalibrovaných testových položek, jejichž psychometrické charakteristiky se kombinují tak, aby test jako celek měl požadované vlastnosti. Pro kontrolu porovnatelnosti mezi jednotlivými běhy testu se používá kotvících položek, díky kterým je možno porovnat obtížnost testů v jednotlivých termínech. Ke standardizaci patří i objektivní nastavení meze pro průchod testem a důsledné zajištění srovnatelných podmínek pro všechny testované. Standardizované testy musí být připraveny a provedeny tak, aby objektivitu jejich výsledků bylo možné prokázat, např. i před soudem. Požadavkem na standardizaci prudce rostou náklady. Vždy je proto třeba zvážit, kde jsou tyto náklady odůvodněné a kde by stačilo použít běžné, nestandardizované zkoušky a testy.

U nestandardizované zkoušky více záleží na konkrétním zkoušejícím nebo hodnotiteli. Ti se často soustředí více na individualitu zkoušeného a mohou lépe posoudit jeho osobní předpoklady a dosažené kompetence. Pro porovnávání zkoušených mezi sebou se však nehodí.

V situacích, kdy by byla standardizace neúčelná nebo dokonce neproveditelná (například pro příliš malý počet zkoušených), se často provádějí kroky, které vedou k objektivizaci nestandardizovaného hodnocení a tím ke snížení nežádoucích vlivů na hodnocení, především subjektivity zkoušejícího.

Převažující formou testování byly vždy testy prezenční, při nichž jsou studenti v přímém kontaktu s vyučujícím. V posledních letech nabyly kvůli pandemii na významu testy a zkoušky vedené distančně a došlo k rozvoji forem testování, které nevyžadují bezprostřední kontakt učitele a studenta. Zásadního pokroku se dosáhlo v metodách proktorovaného testování, rozvíjí se také testování s otevřenou knihou.

Odkazy

Reference