Standardbaserad bedömning

I en utbildningsmiljö är standardbaserad bedömning en bedömning som bygger på utvärdering av elevernas förståelse med avseende på överenskomna standarder, även känd som "resultat". Standarderna sätter kriterierna för framgångsrik demonstration av förståelsen av ett koncept eller en färdighet.

Översikt

I det standardbaserade paradigmet har eleverna friheten att visa förståelse på olika sätt, inklusive (men inte begränsat till) valda svar (t.ex. flervalsprov), fysiska konstruktioner, skriftliga svar och prestationer. Det är förstås inga nya typer av bedömningar och inte heller begreppet differentierad bedömning . Läraren använder alla tillgängliga observationer och kvantitativ information för att sammanfatta lärande med hänvisning till en specifik standard. Med dessa data kan en lärare formulera de steg eller åtgärder som kan vidtas för att bemästra ett visst koncept. Det vill säga, det hjälper till med bedömning för lärande .

En av de viktigaste aspekterna av standardbaserad bedömning är återkoppling efter bedömning. Den feedback en student får från denna typ av bedömning betonar inte poäng, procent eller statistiskt medelvärde, utan information om förväntningar på prestation jämfört med standarden. Ett standardbaserat tillvägagångssätt avfärdar inte nödvändigtvis ett summativt betyg, procent eller ett mått på central tendens (som medelvärde eller median). En bedömning som inte hänvisar till eller ger feedback med avseende på en standard skulle dock inte vara standardbaserad. Det finns en stor mängd bevis som pekar på effektiviteten av lämplig feedback.

Syfte

Syftet med standardbaserad bedömning är att koppla bevis för lärande till läranderesultat (standarderna). När standarderna är tydliga och tydliga blir eleven medveten om sina prestationer med hänvisning till standarderna, och läraren kan använda bedömningsdata för att ge meningsfull feedback till eleverna om dessa framsteg. Medvetenheten om det egna lärandet gör det möjligt för eleverna att peka på en specifik prestationsstandard och stärker på så sätt självreglering och metakognition, två färdigheter som i allmänhet förstås vara effektiva inlärningsstrategier.

Ram för det standardbaserade tillvägagångssättet vid bedömning

En vanlig metod för standardbaserad bedömning (SBA) är:

  • Identifiera ett nyckelfaktum eller viktig kunskapsmassa (t.ex. en vetenskaplig teori, ett matematiskt samband), det väsentliga innehållet och begreppen.

Exempel från British Columbia Grade 3 Curriculum Package (september 2010):

"Det förväntas att eleverna ska se och visa förståelse för visuella texter (t.ex. tecknade serier, illustrationer, diagram, affischer)"

Exempel från det Nya Zeelands läroplansdokument Mathematics Standards for Years 1-8 , i slutet av år 5:

"I sammanhang som kräver att de löser problem eller modellsituationer, kommer eleverna att kunna skapa, fortsätta och förutsäga ytterligare medlemmar av sekventiella mönster med två variabler"
  • Identifiera de indikatorer (dvs. bevis) som eleverna kommer att visa när konceptet eller innehållet har förståtts.

Respektive exemplet från British Columbia Grade 3 Curriculum Package:

"beskriv nyckelbudskap och bilder och relevanta detaljer som svar på frågor eller aktiviteter"
  • Välj en samling bedömningar som gör det möjligt för eleverna att visa indikatorerna.
  • Använd en skala eller rubrik för att identifiera elevens skicklighet med avseende på standarden. Dessa framsteg görs tillgängliga för eleven för att ge meningsfull feedback. Eventuell återkoppling ska kunna ge information om hur färdigheten kan förbättras) och pedagogen behöver vara medveten om effekterna av beröm under återkoppling.
  • Upprepa instruktioner, bedömning och återkoppling tills eleven uppnår en förutbestämd nivå av behärskning.

Kännetecken

  • Standarder (dvs. läranderesultat) måste vara synliga och begripliga för eleverna
  • Uppgifter, aktiviteter och bedömningar ska vara tydliga med vilken standard som tillämpas
  • Formativ bedömning bör användas för att ge feedback till eleverna om deras framsteg mot en standard
  • Bedömning i allmänhet bör vara väl utformad, korrekt och hög i giltighet för att vara rättvis och tillgänglig
  • Exemplar bör användas för att ge eleverna en förståelse för hur prestation mot en standard mäts
  • Rubriker bör användas för att bedöma prestationer och konstruerade svar
  • Selektiv respons (t.ex. multiple choice) bör användas för att bedöma grundläggande förståelse och kunskap (som i Blooms taxonomi ) av en specifik standard (eller de underliggande förutsättningsbegreppen som är associerade med standarden)

Geografiska distinktioner

Förenta staterna

Ett normbaserat test är en bedömning baserad på den resultatbaserade utbildnings- eller prestationsbaserade utbildningsfilosofin. Bedömning är en viktig del av standardreformrörelsen. Den första delen är att sätta nya, högre krav som kan förväntas av varje elev. Då måste läroplanen anpassas till de nya normerna. Slutligen måste studenten bedömas om de uppfyller dessa krav på vad varje elev "måste kunna och kunna". I USA tilldelas ett gymnasieexamen som ges efter godkänd gymnasieexamen eller Certificate of Initial Mastery endast när dessa standarder uppnås. Det förväntas helt och hållet att varje barn kommer att bli skickligt inom alla områden av akademiska färdigheter i slutet av en period, vanligtvis 10 år i USA, men ibland längre, efter att en statlig lagstiftande församling har antagit lagförslaget om utbildningsreform. Förenta staternas federala regering, under No Child Left Behind, kan vidare kräva att alla skolor måste visa förbättringar bland alla elever, även om de redan är alltför skickliga.

Holistisk betygsättning

Istället för att använda datorer för att logga svar på flervalstester, ber rubriker för statliga bedömningar som i North Carolina poängtagare att titta på hela uppsatsen och göra bedömningar. Poängare får inte räkna fel, och rubriker innehåller inte numeriska mått på hur många stavnings- eller grammatikfel som utgör en "1" eller "2". Den analytiska skrivningsdelen av GRE- testet poängsätts med hjälp av en sexpunkts holistisk skala i halva poängs steg. Holistisk betygsättning är en av huvudorsakerna till oenighet mellan poängtagare, men av denna anledning får vissa test poäng mer än en gång för att kontrollera om de är överens.

Fördelar

  • Elever jämförs med en standard som alla kan nå, snarare än rankas på konstgjord väg i en klockkurva där vissa elever måste kallas misslyckanden, och bara ett fåtal tillåts att lyckas
  • Människor, inte datorer, kan utvärdera hela värdet av ett svar snarare än att påtvinga ett strikt rätt eller fel som inte är öppet för tolkning
  • Gratis responsanvändningar och tester för högre ordningstänkande , vilket är viktigt i de flesta nya utbildningsstandarder .
  • Flervalstest med datorpoäng har visat sig ha skadliga effekter för minoriteter och orättvist förneka möjligheter.
  • Endast ett standardbaserat test är anpassat till en standardbaserad utbildningsreform, som bygger på en övertygelse om att alla elever kan lyckas, inte bara ett fåtal.
  • Att klara ett prov i 10:e klass och tilldela ett Certificate of Initial Mastery säkerställer att alla elever tar examen med de färdigheter de behöver för att lyckas i 2000-talets världsklassekonomi.
  • Elever kommer inte längre att bli lurade genom att föra dem vidare till nästa årskurs utan att få det som varje barn på årskursnivå måste kunna och göra.
  • När alla elever klarar alla standarder, vilket är den centrala övertygelsen om standardbaserad utbildningsreform , kommer alla elever från alla demografier att uppnå samma testpoäng, vilket eliminerar den mystiska prestationsgap som tidigare har visat sig uppstå mellan alla grupper på alla test. Men från och med 2006 har ingen standardbaserad bedömning ännu uppnått detta optimistiska (kritiker kan kalla det omöjligt) mål, även om många visar stigande poäng.

Nackdelar

Jämfört med ett flervalstest med normreferens kan ett standardbaserat test kännas igen av:

  • Ett snittpoäng bestäms för olika prestationsnivåer. Det finns inga snittpoäng för normrefererade test. Det finns ingen underkänd poäng på SAT-testet . Varje högskola eller institution sätter sina egna poängstandarder för antagning eller utmärkelser.
  • Olika prestandanivåer ställs in. Vanligtvis är dessa över standard, uppfyller standard, under standard. Dessa nivåer ställs vanligtvis in i en benchmarkingprocess, även om en sådan process inte tar hänsyn till om provmomenten ens är lämpliga för betygsnivån.
  • Tester är holistiskt betygsatta mot ett friskrivet svar, ofta med bilder, snarare än betygsatt korrekt eller felaktigt bland flera val.
  • Tester är dyrare att betygsätta på grund av detta, vanligtvis $25–30 per test jämfört med $2–5, inklusive kostnaden för att utveckla testet, vanligtvis olika varje år för varje stat.
  • Test är svårare att betygsätta eftersom de vanligtvis betygsätts mot en handfull med högst ett eller två exempelpapper på varje poängnivå. De kan inte betygsättas med dator
  • Tester är mindre tillförlitliga. Överensstämmelse kan ligga mellan 60 och 80 procent på en 4-gradig skala och anses vara korrekt.
  • Graders behöver inte lärarlegitimation, bara en kandidatexamen inom något område, och betalas vanligtvis $8 till $11 per timme för deltidsarbete.
  • Misslyckanden så höga som 80 till 95 procent är inte bara inte ovanliga, de förväntas och tillkännages fullt ut när testprogram introduceras till lokalpressen. Enligt traditionella examenskriterier hade afroamerikaner uppnått nationella examensgrader inom några få poäng av vita. lovade tre fjärdedelar av afroamerikaner som inte klarade WASL av superintendent Terry Bergeson att de inte skulle få ett diplom om de inte klarade omprovet på två år, trots att hon tidigare hade lovat att "alla studenter" skulle få ett diplom i världsklass.
  • Misslyckanden för minoriteter och specialpedagogiska elever är vanligtvis två till fyra gånger högre än för majoritetsgrupper eftersom utökade svarsfrågor är svårare att besvara än flervalsfrågor
  • Innehåll är ofta svårt även för vuxna att snabbt svara på, även på så låga årskurser som i fjärde klass, särskilt i matematik. Professor Don Orlich kallade WASL en "katastrof", med matte- och naturvetenskapliga tester som faller långt över den normala utvecklingsnivån för elever på många årskurser.
  • Matematik har en hög andel statistik och geometri, och ett lågt innehåll av enkel aritmetik.
  • Skolor får noll för elever som inte gör provet.
  • Att klara ett sådant test på 10:e klass nivå är vanligtvis planerat som ett krav för att avlägga gymnasiet.
  • Att klara ett sådant test, snarare än den 50:e percentilen, definieras som prestation på betygsnivå .
  • En fråga med rätt svar kan bedömas som felaktig om den inte visar hur svaret har kommit fram. En fråga med en felaktig numerisk slutsats behöver inte nödvändigtvis bedömas som felaktig.
  • Kaliforniens första år av CLAS-testet tillät inga "4" höga matematikbetyg, inte ens i skolorna med högst poäng, för att lämna utrymme för förbättringar
  • North Carolina Writing-projektet gav mindre än 1 procent exemplariska '4' poäng. Sådana tidningar använde vokabulär och kunskap på en nivå som ibland överträffade nivån hos högskoleklassare och långt över den avsedda publiken för en gymnasieexamen. Denna nivå skulle vara ännu svårare än att uppnå ett SAT-poäng som är tillräckligt för inträde på ett privat college i Ivy League.
  • Poängen stiger vanligtvis mycket snabbare än standardiserade tester som NAEP eller SAT som ges under samma tidsperiod.

Se även

externa länkar