Reformering av foreldet testsystem

July 04, 2020
IMiscellanea

De potensielle målene for skolereform inkluderer læreplanen (hva som bør undervises), instruksjon (hvordan undervisning skjer og hvem som gjør det) og testing (metoden som læring måles). Siden jeg allerede har diskutert instruksjon, ønsker jeg å bruke denne delen for å diskutere hva som må endres om testing, en prosess som for tiden er så foreldet som klasseromsinstruksjonen i seg selv.

Mye av denne foreldelsen skyldes utdanningsprøveindustriens fortsatte avhengighet av forutsetningene som lå til grunn for den klassiske psykometriske modellen som pleide og ble avansert av tidlige forsøk på å utvikle tester av intelligens og egnethet. Antagelser som kan ha vært holdbare for konstruksjoner som (a) var av ukjent etiologi, (b) inneholdt varedomener som ikke kunne spesifiseres uttømmende, og (c) ble antatt (feil) å være både stabile og uforanderlige for instruksjon. Av like stor betydning kunne en perfekt score (eller en score på null) på de resulterende testene ikke tolkes kvantitativt fordi det var umulig for noe menneske å ha oppnådd perfeksjon på (eller være fullstendig blottet for) attributtene i spørsmål.

instagram viewer

Skolelæring har derimot ingen av disse begrensningene, selv om kommersielle "prestasjons" -tester er konstruert som om de gjør. Dette har vist seg som mest uheldig siden de virkelige formålene med pedagogisk testing er å identifisere hvor mye av pensum hver student har mestret og hva annet som må læres (eller læres på nytt).

Hvordan tester av skolelæring skal konstrueres

Siden vi vet hva som forårsaker læring (instruksjon) og hva som bør undervises på skolene våre (pensum), er vurderingen av skolelæring neppe rakettvitenskap. Forutsatt at testperioden vår fortsetter å være et skoleår, er "alt" vi trenger å gjøre:

1. Spesifiser hele grunnskoleplanen ved bruk av instruksjonsmål i tilstrekkelig detalj til at det kan skrives flere testelementer for hvert mål.

2. Konstruer læringsprøver på skolen etter en forsvarlig, gjennomsiktig prosedyre fra denne listen over instruksjonsmål og testelementer. Disse testene kan være basert på enkelt akademiske fag (f.eks. Matematikk, leseforståelse) eller mer spesialiserte instruksjonsemner innen et fag (f.eks. Ordlesing av synsleser).

3. Administrer hver test to ganger (helst via datamaskiner slik at resultatene kan være umiddelbart tilgjengelige, sikkert lagret og distribuert på riktig måte, en gang i begynnelsen av året og en gang ved året slutt. (Det er ikke nødvendig å vurdere identiske mål eller elementer to ganger, siden det ikke er vanskelig å sikre ekvivalens hvis de samme prøvetakingsprosedyrene brukes. Det er imidlertid nødvendig å administrere testene to ganger i løpet av det samme året, siden skolen foreløpig har liten kontroll over hva som skjer i sommermånedene.)

Forskjellen mellom begynnelsen av året og slutten av året testresultater vil da representere den absolutte mengden av læreplanen en gitt student har lært i løpet av det året. Det meste av dette vil være en funksjon av skolens instruksjon, selv om det er (og alltid vil være) en viss feil assosiert med konklusjoner basert på testresultater på grunn av prøvetaking, hvordan en student kan ha følt seg under en av testene, eksponering for ekstra skoleanvisning, og så videre. Ingen målinger som noen gang er utviklet (fysisk, psykologisk eller pedagogisk) er utført uten noen grad av feil.)

Testresultater konstruert på denne måten har en rekke interessante egenskaper, hvorav noen er:

1. Det er ikke nødvendig å bruke standard score (for eksempel likeverdier, persentilrekke osv.). Alle disse algebraiske manipulasjonene, inkludert selve den normale kurven, brukes utelukkende for å rangere rekkefølgescore for formålet å sammenligne dem med hverandre, noe som bare er nødvendig når en test ikke er i stand til å måle den absolutte mengden noe. Tester som vurderer skolelæring skal kunne gi meningsfylt nuller (indikerer at ingen av læreplanene ble lært) og perfekt score (dvs. 100% mestring av læreplanen). Med andre ord, score produsert av slike tester ville representere beløp av læring som foregår. Å redusere dem til en enkel rangordnet liste ville være idioti.

2. Tester som disse har direkte instruksjonsmessige implikasjoner i seg selv, siden hvert element representerer en instruksjonsmål og et savnet element representerer derfor et spesifikt ulært konsept som må læres (eller re lært). Den mest betydningsfulle analyseenheten blir derfor ofte en individuell students svar på hvert enkelt element.

3. Fordi alle interesserte (lærere, foreldre og elever) kunne ha tilgang til begge instruksjonene mål som bør læres og hvilke typer elementer som skal brukes til å vurdere læring: (a) lærere bør lære bort testen og bør benytte spottprøver basert på lignende (men ikke identiske) elementer for å konstatere hvilke studenter som har mestret hvilke mål umiddelbart etter instruksjon; (b) foreldre vil også ha evnen til å vurdere barnas fremgang i løpet av skoleåret; og (c) studenter vil bli kjent med både testprosessen og hvilke typer elementer de vil møte på slutten av året.

4. Ressurser som disse (dvs. eksistensen av en omfattende oversettelse av læreplanen via instruksjonsmål, hver av som vil bli ledsaget av eksempler på testelementer) kan også øke utviklingen av supplerende programvare for digital veiledning supplerende veiledning av mennesker mer effektiv, og redusere effekten av differensialtest for å ta ferdigheter som bidrar til sosioøkonomisk testgap.

Fra mitt perspektiv er det eneste ubesvarte spørsmålet hvorfor det bør være noen motstand, utenfor testbransjen, for å erstatte en slik prosess med vår for tiden foreldede testmodell.

For kapittel åtte av for en mer omfattende diskusjon av skoletesting For enkelt å mislykkes: en sak for utdanningsendring (Oxford University Press) [[email protected]]