Förvirringsmatris


Terminologi och härledningar från en förvirringsmatris



tillstånd positivt (P)
antalet verkliga positiva fall i datavillkoret
negativa (N)
antalet verkliga negativa fall i datan
sant positiva (TP)
Ett testresultat som korrekt indikerar närvaron av ett tillstånd eller karakteristiskt
sant negativt (TN )
Ett testresultat som korrekt indikerar frånvaron av ett tillstånd eller karakteristiskt
falskt positivt (FP)
Ett testresultat som felaktigt indikerar att ett visst tillstånd eller attribut är närvarande
falskt negativt (FN)
Ett testresultat som felaktigt indikerar att ett visst tillstånd eller attribut är frånvarande
känslighet , återkallelse , träfffrekvens eller sann positiv frekvens (TPR)
specificitet , selektivitet eller sann negativ frekvens (TNR)
värde ( PPV )
negativt prediktivt värde (NPV)
missfrekvens eller falsk negativ frekvens (FNR)
fall-out eller falsk positiv frekvens (FPR)
falsk upptäcktsfrekvens (FDR)
falsk utelämnandefrekvens (FOR)
+ )
R
prevalenströskel (PT)
kritisk framgångsindex (CSI)
Prevalens
noggrannhet (ACC)
balanserad noggrannhet (BA)
F1-poäng
är övertonen medelvärde av precision och känslighet :
phi-koefficient (φ eller r φ ) eller Matthews korrelationskoefficient (MCC)
index (FM)
informeradhet eller bookmakerinformation (BM)
markering (MK) eller deltaP (Δp)
Diagnostiska odds ratio (DOR)

Källor: Fawcett (2006), Piryonesi och El-Diraby (2020), Powers (2011), Ting (2011), CAWCR, D. Chicco & G. Jurman (2020, 2021, 2023) , Tharwat (2018). Balayla (2020)

Inom området för maskininlärning och specifikt problemet med statistisk klassificering , är en förvirringsmatris , även känd som en felmatris, en specifik tabelllayout som möjliggör visualisering av prestandan hos en algoritm, vanligtvis en övervakad inlärning (vid oövervakad inlärning av den) kallas vanligtvis en matchande matris ). Varje rad i matrisen representerar instanserna i en faktisk klass medan varje kolumn representerar instanserna i en förutsagd klass, eller vice versa – båda varianterna finns i litteraturen. Namnet härrör från det faktum att det gör det lätt att se om systemet blandar ihop två klasser (dvs. brukar felmärka den ena som en annan).

Det är en speciell typ av beredskapstabell , med två dimensioner ("faktisk" och "förutspådd"), och identiska uppsättningar av "klasser" i båda dimensionerna (varje kombination av dimension och klass är en variabel i beredskapstabellen).

Exempel

Med ett urval av 12 individer, 8 som har diagnostiserats med cancer och 4 som är cancerfria, där individer med cancer tillhör klass 1 (positiv) och icke-cancerindivider tillhör klass 0 (negativ), kan vi visa att data enligt följande:

Individuellt nummer 1 2 3 4 5 6 7 8 9 10 11 12
Faktisk klassificering 1 1 1 1 1 1 1 1 0 0 0 0

Anta att vi har en klassificerare som på något sätt skiljer på individer med och utan cancer, vi kan ta de 12 individerna och köra dem genom klassificeraren. Klassificeraren gör sedan 9 korrekta förutsägelser och missar 3: 2 individer med cancer som felaktigt förutspåtts vara cancerfria (prov 1 och 2), och 1 person utan cancer som felaktigt förutspås ha cancer (prov 9).

Individuellt nummer 1 2 3 4 5 6 7 8 9 10 11 12
Faktisk klassificering 1 1 1 1 1 1 1 1 0 0 0 0
Förutspådd klassificering 0 0 1 1 1 1 1 1 1 0 0 0

Observera att om vi jämför den faktiska klassificeringsuppsättningen med den förutspådda klassificeringsuppsättningen, finns det fyra olika utfall som kan resultera i en viss kolumn. Ett, om den faktiska klassificeringen är positiv och den förutsagda klassificeringen är positiv (1,1), kallas detta ett sant positivt resultat eftersom det positiva provet identifierades korrekt av klassificeraren. Två, om den faktiska klassificeringen är positiv och den förutsagda klassificeringen är negativ (1,0), kallas detta ett falskt negativt resultat eftersom det positiva provet felaktigt identifieras av klassificeraren som negativt. För det tredje, om den faktiska klassificeringen är negativ och den förutsagda klassificeringen är positiv (0,1), kallas detta ett falskt positivt resultat eftersom det negativa provet felaktigt identifieras av klassificeraren som positivt. För det fjärde, om den faktiska klassificeringen är negativ och den förutsagda klassificeringen är negativ (0,0), kallas detta ett sant negativt resultat eftersom det negativa provet identifieras korrekt av klassificeraren.

Vi kan sedan utföra jämförelsen mellan faktiska och förutspådda klassificeringar och lägga till denna information i tabellen, så att korrekta resultat visas i grönt så att de är lättare att identifiera.

Individuellt nummer 1 2 3 4 5 6 7 8 9 10 11 12
Faktisk klassificering 1 1 1 1 1 1 1 1 0 0 0 0
Förutspådd klassificering 0 0 1 1 1 1 1 1 1 0 0 0
Resultat FN FN TP TP TP TP TP TP FP TN TN TN

Mallen för alla binära förvirringsmatriser använder de fyra typerna av resultat som diskuterats ovan (sanna positiva, falska negativa, falska positiva och sanna negativa) tillsammans med de positiva och negativa klassificeringarna. De fyra resultaten kan formuleras i en 2×2 förvirringsmatris , enligt följande:

Förutspått tillstånd Källor:

Total population = P + N
Positiv (PP) Negativt (PN)
Faktiskt skick
Positiv (P) Sant positiv (TP)
Falskt negativt (FN)
Negativt (N) Falskt positivt (FP)
Sant negativt (TN)

Färgkonventionen för de tre datatabellerna ovan valdes för att matcha denna förvirringsmatris, för att enkelt kunna differentiera data.

Nu kan vi helt enkelt summera varje typ av resultat, ersätta in i mallen och skapa en förvirringsmatris som kortfattat kommer att sammanfatta resultaten av att testa klassificeraren:

Förutspått tillstånd
Total

8 + 4 = 12


Cancer 7

Icke-cancer 5
Faktiskt skick

Cancer 8
6 2

Icke-cancer 4
1 3

I denna förvirringsmatris, av de 8 proverna med cancer, bedömde systemet att 2 var cancerfria, och av de 4 proverna utan cancer förutspådde det att 1 hade cancer. Alla korrekta förutsägelser finns i tabellens diagonal (markerade i grönt), så det är lätt att visuellt inspektera tabellen för förutsägelsefel, eftersom värden utanför diagonalen kommer att representera dem. Genom att summera de 2 raderna i förvirringsmatrisen kan man också härleda det totala antalet positiva (P) och negativa (N) prover i den ursprungliga datamängden, dvs och .

Tabell av förvirring

I prediktiv analys är en förvirringstabell (ibland även kallad förvirringsmatris ) en tabell med två rader och två kolumner som rapporterar antalet sanna positiva , falska negativa , falska positiva och sanna negativa . Detta möjliggör en mer detaljerad analys än att bara observera andelen korrekta klassificeringar (noggrannhet). Noggrannhet kommer att ge missvisande resultat om datamängden är obalanserad; det vill säga när antalet observationer i olika klasser varierar mycket.

Till exempel, om det fanns 95 cancerprover och endast 5 icke-cancerprover i data, kan en viss klassificerare klassificera alla observationer som att de har cancer. Den totala noggrannheten skulle vara 95 %, men mer detaljerat skulle klassificeraren ha en 100 % igenkänningsgrad ( känslighet ) för cancerklassen men en 0 % igenkänningsgrad för icke-cancerklassen. F1-poängen är ännu mer opålitlig i sådana fall, och här skulle ge över 97,4%, medan informeradhet tar bort sådan fördom och ger 0 som sannolikheten för ett välgrundat beslut för någon form av gissning (här alltid gissning av cancer).

Enligt Davide Chicco och Giuseppe Jurman är det mest informativa måttet för att utvärdera en förvirringsmatris Matthews korrelationskoefficient (MCC) .

Andra mätvärden kan inkluderas i en förvirringsmatris, var och en av dem har sin betydelse och användning.

Förutspått tillstånd Källor:

Total population = P + N
Positiv (PP) Negativt (PN)
Informedness , bookmaker informedness (BM) = TPR + TNR − 1

Prevalenströskel (PT) =
Faktiskt skick
Positiv (P)
Sann positiv (TP), träff

Falskt negativ (FN),
typ II fel , miss, underskattning

Sann positiv frekvens (TPR), återkallelse , känslighet (SEN), sannolikhet för upptäckt, träfffrekvens, effekt = TP / P = 1 − FNR


Falsk negativ frekvens (FNR), miss rate = FN / P = 1 − TPR
Negativt (N)
Falskt positivt (FP),
typ I-fel , falskt larm, överskattning

Sant negativ (TN), korrekt avslag


Falsk positiv frekvens (FPR), sannolikhet för falskt larm, fall-out = FP / N = 1 − TNR


Sann negativ frekvens (TNR), specificitet (SPC), selektivitet = TN / N = 1 − FPR

Prevalens = P / P + N

Positivt prediktivt värde (PPV), precision = TP / PP = 1 − FDR

Falsk utelämnandefrekvens (FOR) = FN / PN = 1 − NPV

Positiv sannolikhetskvot (LR+) = TPR / FPR

Negativ sannolikhetskvot (LR−) = FNR / TNR
Noggrannhet (ACC) = TP + TN / P + N
Falsk discovery rate (FDR) = FP / PP = 1 − PPV
Negativt prediktivt värde (NPV) = TN / PN = 1 − FOR
Markering (MK), deltaP (Δp) = PPV + NPV − 1
Diagnostisk oddskvot (DOR) = LR+ / LR−
Balanserad noggrannhet (BA) = TPR + TNR / 2
F 1 poäng = 2 PPV × TPR / PPV + TPR = 2 TP / 2 TP + FP + FN
Fowlkes–Mallows index (FM) =
Matthews korrelationskoefficient (MCC) =
Hotpoäng (TS), kritiskt framgångsindex (CSI), Jaccard-index = TP / TP + FN + FP

Förvirringsmatriser med fler än två kategorier

Förvirringsmatris är inte begränsad till binär klassificering och kan också användas i flerklassklassificerare. De ovan diskuterade förvirringsmatriserna har bara två villkor: positiva och negativa. Till exempel sammanfattar tabellen nedan kommunikation av ett visslat språk mellan två talare, nollvärden utelämnas för tydlighetens skull.


Uppfattad vokal

Vokal framställd
i e a o u
i 15 1
e 1 1
a 79 5
o 4 15 3
u 2 2

Se även