Relationstorg
I statistik är relationskvadraten en grafisk representation för användning i faktoranalys av en tabell individer x variabler . Denna representation kompletterar klassiska representationer som tillhandahålls av principal component analysis (PCA) eller multipel korrespondensanalys (MCA), nämligen de av individer, av kvantitativa variabler (korrelationscirkel) och av kategorierna av kvalitativa variabler (vid tyngdpunkten för de individer som har dem) ). Det är särskilt viktigt vid faktoranalys av blandad data (FAMD) och i multipelfaktoranalys (MFA).
Definition av relationsruta i MCA-ramen
Relationskvadratens första intresse är att representera variablerna själva, inte deras kategorier, vilket är desto mer värdefullt eftersom det finns många variabler. För detta beräknar vi för varje kvalitativ variabel och varje faktor ( , rang faktor, är vektorn av koordinater för individerna längs axeln för rang ; i PCA kallas huvudkomponenten av rang , kvadraten på korrelationsförhållande mellan och variabeln , vanligtvis betecknad: Till varje faktorplan kan vi alltså associera en representation av själva kvalitativa variabler. Deras koordinater är mellan 0 och 1 , variablerna visas i kvadraten som har punkterna (0,0), ( 0,1), (1,0) och (1,1).
Exempel i MCA
Sex individer ( beskrivs av tre variabler som har 3, 2 respektive 3 kategorier. Exempel: individen har kategorin av , av och av .
-a | -d | -f | |
-b | -d | -f | |
-c | -d | -g | |
-a | -e | -g | |
-b | -e | -h | |
-c | -e | -h |
Tillämpad på dessa data tillhandahåller MCA-funktionen som ingår i R-paketet FactoMineR den klassiska grafen i figur 1.
Relationskvadraten (Figur 2) underlättar avläsningen av det klassiska faktorplanet. Det indikerar att:
- Den första faktorn är relaterad till de tre variablerna men speciellt (som har en mycket hög koordinat längs första axeln) och sedan .
- Den andra faktorn är endast relaterad till och (och inte till som har en koordinat längs axel 2 lika med till 0) och det på ett starkt och jämställt sätt.
Allt detta syns på den klassiska grafiken men inte så tydligt. Relationstorgets roll är först att hjälpa till att läsa en konventionell grafik. Detta är värdefullt när variablerna är många och har många koordinater.
Tillägg
Denna representation kan kompletteras med de för kvantitativa variabler, varvid koordinaterna för de senare är kvadraten på korrelationskoefficienter (och inte på korrelationsförhållanden). Den andra fördelen med relationskvadraten ligger alltså i förmågan att representera kvantitativa och kvalitativa variabler samtidigt.
Relationskvadraten kan konstrueras från valfri faktoranalys av en tabell individer x variabler . I synnerhet används (eller bör) det systematiskt:
- i multipel korrespondensanalys (MCA);
- i principal komponentanalys (PCA) när det finns många kompletterande variabler;
- i faktoranalys av blandad data (FAMD).
En utökning av denna grafik till grupper av variabler (hur man representerar en grupp av variabler med en enda punkt?) används i Multipelfaktoranalys (MFA)
Historia
Idén att representera själva de kvalitativa variablerna med en punkt (och inte kategorierna) beror på Brigitte Escofier. Grafiken som den används nu har introducerats av Brigitte Escofier och Jérôme Pagès inom ramen för multipelfaktoranalys
Slutsats
I MCA ger relationkvadraten en syntetisk bild av sambanden mellan blandade variabler, desto mer värdefulla som det finns många variabler som har många kategorier. Denna representation kan vara användbar i alla faktoranalyser när det finns många blandade variabler, aktiva och/eller kompletterande.
externa länkar
- FactoMineR AR-programvara ägnad åt utforskande dataanalys.