Förvirringsmatris
Källor: Fawcett (2006), Piryonesi och El-Diraby (2020), Powers (2011), Ting (2011), CAWCR, D. Chicco & G. Jurman (2020, 2021, 2023) , Tharwat (2018). Balayla (2020) |
Inom området för maskininlärning och specifikt problemet med statistisk klassificering , är en förvirringsmatris , även känd som en felmatris, en specifik tabelllayout som möjliggör visualisering av prestandan hos en algoritm, vanligtvis en övervakad inlärning (vid oövervakad inlärning av den) kallas vanligtvis en matchande matris ). Varje rad i matrisen representerar instanserna i en faktisk klass medan varje kolumn representerar instanserna i en förutsagd klass, eller vice versa – båda varianterna finns i litteraturen. Namnet härrör från det faktum att det gör det lätt att se om systemet blandar ihop två klasser (dvs. brukar felmärka den ena som en annan).
Det är en speciell typ av beredskapstabell , med två dimensioner ("faktisk" och "förutspådd"), och identiska uppsättningar av "klasser" i båda dimensionerna (varje kombination av dimension och klass är en variabel i beredskapstabellen).
Exempel
Med ett urval av 12 individer, 8 som har diagnostiserats med cancer och 4 som är cancerfria, där individer med cancer tillhör klass 1 (positiv) och icke-cancerindivider tillhör klass 0 (negativ), kan vi visa att data enligt följande:
Individuellt nummer | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
Faktisk klassificering | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 |
Anta att vi har en klassificerare som på något sätt skiljer på individer med och utan cancer, vi kan ta de 12 individerna och köra dem genom klassificeraren. Klassificeraren gör sedan 9 korrekta förutsägelser och missar 3: 2 individer med cancer som felaktigt förutspåtts vara cancerfria (prov 1 och 2), och 1 person utan cancer som felaktigt förutspås ha cancer (prov 9).
Individuellt nummer | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
Faktisk klassificering | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 |
Förutspådd klassificering | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 |
Observera att om vi jämför den faktiska klassificeringsuppsättningen med den förutspådda klassificeringsuppsättningen, finns det fyra olika utfall som kan resultera i en viss kolumn. Ett, om den faktiska klassificeringen är positiv och den förutsagda klassificeringen är positiv (1,1), kallas detta ett sant positivt resultat eftersom det positiva provet identifierades korrekt av klassificeraren. Två, om den faktiska klassificeringen är positiv och den förutsagda klassificeringen är negativ (1,0), kallas detta ett falskt negativt resultat eftersom det positiva provet felaktigt identifieras av klassificeraren som negativt. För det tredje, om den faktiska klassificeringen är negativ och den förutsagda klassificeringen är positiv (0,1), kallas detta ett falskt positivt resultat eftersom det negativa provet felaktigt identifieras av klassificeraren som positivt. För det fjärde, om den faktiska klassificeringen är negativ och den förutsagda klassificeringen är negativ (0,0), kallas detta ett sant negativt resultat eftersom det negativa provet identifieras korrekt av klassificeraren.
Vi kan sedan utföra jämförelsen mellan faktiska och förutspådda klassificeringar och lägga till denna information i tabellen, så att korrekta resultat visas i grönt så att de är lättare att identifiera.
Individuellt nummer | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
Faktisk klassificering | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 0 |
Förutspådd klassificering | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 0 | 0 | 0 |
Resultat | FN | FN | TP | TP | TP | TP | TP | TP | FP | TN | TN | TN |
Mallen för alla binära förvirringsmatriser använder de fyra typerna av resultat som diskuterats ovan (sanna positiva, falska negativa, falska positiva och sanna negativa) tillsammans med de positiva och negativa klassificeringarna. De fyra resultaten kan formuleras i en 2×2 förvirringsmatris , enligt följande:
Förutspått tillstånd | Källor: | ||||
Total population = P + N |
Positiv (PP) | Negativt (PN) | |||
Positiv (P) |
Sant positiv (TP) |
Falskt negativt (FN) |
|||
Negativt (N) |
Falskt positivt (FP) |
Sant negativt (TN) |
Färgkonventionen för de tre datatabellerna ovan valdes för att matcha denna förvirringsmatris, för att enkelt kunna differentiera data.
Nu kan vi helt enkelt summera varje typ av resultat, ersätta in i mallen och skapa en förvirringsmatris som kortfattat kommer att sammanfatta resultaten av att testa klassificeraren:
Förutspått tillstånd | |||
Total 8 + 4 = 12 |
Cancer 7 |
Icke-cancer 5 |
|
Cancer 8 |
6 | 2 | |
Icke-cancer 4 |
1 | 3 |
I denna förvirringsmatris, av de 8 proverna med cancer, bedömde systemet att 2 var cancerfria, och av de 4 proverna utan cancer förutspådde det att 1 hade cancer. Alla korrekta förutsägelser finns i tabellens diagonal (markerade i grönt), så det är lätt att visuellt inspektera tabellen för förutsägelsefel, eftersom värden utanför diagonalen kommer att representera dem. Genom att summera de 2 raderna i förvirringsmatrisen kan man också härleda det totala antalet positiva (P) och negativa (N) prover i den ursprungliga datamängden, dvs och .
Tabell av förvirring
I prediktiv analys är en förvirringstabell (ibland även kallad förvirringsmatris ) en tabell med två rader och två kolumner som rapporterar antalet sanna positiva , falska negativa , falska positiva och sanna negativa . Detta möjliggör en mer detaljerad analys än att bara observera andelen korrekta klassificeringar (noggrannhet). Noggrannhet kommer att ge missvisande resultat om datamängden är obalanserad; det vill säga när antalet observationer i olika klasser varierar mycket.
Till exempel, om det fanns 95 cancerprover och endast 5 icke-cancerprover i data, kan en viss klassificerare klassificera alla observationer som att de har cancer. Den totala noggrannheten skulle vara 95 %, men mer detaljerat skulle klassificeraren ha en 100 % igenkänningsgrad ( känslighet ) för cancerklassen men en 0 % igenkänningsgrad för icke-cancerklassen. F1-poängen är ännu mer opålitlig i sådana fall, och här skulle ge över 97,4%, medan informeradhet tar bort sådan fördom och ger 0 som sannolikheten för ett välgrundat beslut för någon form av gissning (här alltid gissning av cancer).
Enligt Davide Chicco och Giuseppe Jurman är det mest informativa måttet för att utvärdera en förvirringsmatris Matthews korrelationskoefficient (MCC) .
Andra mätvärden kan inkluderas i en förvirringsmatris, var och en av dem har sin betydelse och användning.
Förutspått tillstånd | Källor: | ||||
Total population = P + N |
Positiv (PP) | Negativt (PN) |
Informedness , bookmaker informedness (BM) = TPR + TNR − 1 |
Prevalenströskel (PT) = |
|
Positiv (P) |
Sann positiv (TP), träff |
Falskt negativ (FN), typ II fel , miss, underskattning |
Sann positiv frekvens (TPR), återkallelse , känslighet (SEN), sannolikhet för upptäckt, träfffrekvens, effekt = TP / P = 1 − FNR |
Falsk negativ frekvens (FNR), miss rate = FN / P = 1 − TPR |
|
Negativt (N) |
Falskt positivt (FP), typ I-fel , falskt larm, överskattning |
Sant negativ (TN), korrekt avslag |
Falsk positiv frekvens (FPR), sannolikhet för falskt larm, fall-out = FP / N = 1 − TNR |
Sann negativ frekvens (TNR), specificitet (SPC), selektivitet = TN / N = 1 − FPR |
|
Prevalens = P / P + N |
Positivt prediktivt värde (PPV), precision = TP / PP = 1 − FDR |
Falsk utelämnandefrekvens (FOR) = FN / PN = 1 − NPV |
Positiv sannolikhetskvot (LR+) = TPR / FPR |
Negativ sannolikhetskvot (LR−) = FNR / TNR |
|
Noggrannhet (ACC) = TP + TN / P + N |
Falsk discovery rate (FDR) = FP / PP = 1 − PPV |
Negativt prediktivt värde (NPV) = TN / PN = 1 − FOR |
Markering (MK), deltaP (Δp) = PPV + NPV − 1 |
Diagnostisk oddskvot (DOR) = LR+ / LR− | |
Balanserad noggrannhet (BA) = TPR + TNR / 2 |
F 1 poäng = 2 PPV × TPR / PPV + TPR = 2 TP / 2 TP + FP + FN |
Fowlkes–Mallows index (FM) = |
Matthews korrelationskoefficient (MCC) = |
Hotpoäng (TS), kritiskt framgångsindex (CSI), Jaccard-index = TP / TP + FN + FP |
Förvirringsmatriser med fler än två kategorier
Förvirringsmatris är inte begränsad till binär klassificering och kan också användas i flerklassklassificerare. De ovan diskuterade förvirringsmatriserna har bara två villkor: positiva och negativa. Till exempel sammanfattar tabellen nedan kommunikation av ett visslat språk mellan två talare, nollvärden utelämnas för tydlighetens skull.
Uppfattad vokal Vokal framställd |
i | e | a | o | u |
---|---|---|---|---|---|
i | 15 | 1 | |||
e | 1 | 1 | |||
a | 79 | 5 | |||
o | 4 | 15 | 3 | ||
u | 2 | 2 |
Se även