Riskpoäng

Riskpoäng (eller riskpoäng ) är namnet på en allmän praxis inom tillämpad statistik , biostatistik , ekonometri och andra relaterade discipliner, för att skapa ett lättkalkylerat tal ( poängen ) som återspeglar risknivån i närvaro av vissa riskfaktorer (t.ex. risk för dödlighet eller sjukdom i närvaro av symtom eller genetisk profil, risk för ekonomisk förlust med tanke på kredit och ekonomisk historia, etc.).

Riskpoäng är utformade för att vara:

  • Enkelt att beräkna: I många fall behöver du bara en penna och ett papper för att beräkna poäng (även om vissa poäng använder mer sofistikerade eller mindre transparenta beräkningar som kräver ett datorprogram).
  • Lätttolkad: Resultatet av beräkningen är ett enda tal, och högre poäng betyder vanligtvis högre risk. Dessutom framtvingar många poängmetoder någon form av monotonitet längs de uppmätta riskfaktorerna för att möjliggöra en enkel tolkning av poängen (t.ex. risken för dödlighet ökar bara med åldern, risken för betalningsinställelse ökar bara med mängden av den totala skulden som kunden har, etc.).
  • Handlingsbar: Poäng är utformade kring en uppsättning möjliga åtgärder som bör vidtas som ett resultat av den beräknade poängen. Effektiva poängbaserade policyer kan utformas och utföras genom att sätta trösklar för poängens värde och associera dem med eskalerande åtgärder.

Formell definition

En typisk poängmetod består av tre komponenter:

  1. En uppsättning konsekventa regler (eller vikter) som tilldelar ett numeriskt värde ("poäng") till varje riskfaktor som återspeglar vår uppskattning av underliggande risk.
  2. En formel (vanligtvis en enkel summa av alla ackumulerade poäng) som beräknar poängen.
  3. En uppsättning tröskelvärden som hjälper till att översätta den beräknade poängen till en risknivå, eller en likvärdig formel eller uppsättning regler för att översätta den beräknade poängen tillbaka till sannolikheter (överlåter den nominella bedömningen av svårighetsgraden till utövaren).

Punkt 1 och 2 kan uppnås genom att använda någon form av regression , som ger både riskuppskattning och formel för att beräkna poängen. Punkt 3 kräver att en godtycklig uppsättning trösklar ställs in och kommer vanligtvis att involvera expertutlåtanden.

Beräkna risk med GLM

Riskpoäng är utformade för att representera en underliggande sannolikhet för en negativ händelse betecknad givet en vektor av som förklarar variabler som innehåller mätningar av relevanta riskfaktorer. För att fastställa sambandet mellan riskfaktorerna och sannolikheten uppskattar vi en uppsättning vikter uppskattas med hjälp av en generaliserad linjär modell :

Där är en reellt värderad, monotont ökande funktion som kartlägger värdena för den linjära prediktor till intervallet . GLM - metoder använder vanligtvis logit eller probit som länkfunktion .

Beräkna risk med andra metoder

Även om det är möjligt att uppskatta med andra statistiska eller maskininlärningsmetoder, kraven på enkelhet och Enkel tolkning (och monotoni per riskfaktor) gör de flesta av dessa metoder svåra att använda för poängsättning i detta sammanhang:

  • Med mer sofistikerade metoder blir det svårt att tillskriva enkla vikter för varje riskfaktor och att tillhandahålla en enkel formel för beräkningen av poängen. Ett anmärkningsvärt undantag är trädbaserade metoder som CART , som kan tillhandahålla en enkel uppsättning beslutsregler och beräkningar, men som inte kan säkerställa monotoniteten hos skalan över de olika riskfaktorerna.
  • Det faktum att vi uppskattar underliggande risk över hela befolkningen och därför inte kan tagga personer i förväg på en ordinalskala (vi kan inte i förväg veta om en person tillhör en "högrisk"-grupp, vi ser bara observerade förekomster [ stavning ? ] ) klassificeringsmetoder är bara relevanta om vi vill klassificera människor i 2 grupper eller 2 möjliga handlingar.

Konstruera poängen

När du använder GLM kan uppsättningen av uppskattade vikter användas för att tilldela olika värden (eller "poäng") till olika värden av riskfaktorerna i (kontinuerlig eller nominella som indikatorer). Poängen kan sedan uttryckas som en viktad summa:

  • Vissa poängmetoder kommer att översätta poängen till sannolikheter genom att använda (t.ex. SAPS II-poäng som ger en explicit funktion för att beräkna dödlighet från poängen) eller en uppslagstabell (t.ex. ABCD² eller ISM7 (NI) Scorecard) . Denna praxis gör processen att erhålla poängen mer komplicerad beräkningsmässigt men har fördelen av att översätta ett godtyckligt tal till en mer välbekant skala från 0 till 1.
  • Kolumnerna i kan representera komplexa transformationer av riskfaktorerna (inklusive flera interaktioner ) och inte bara själva riskfaktorerna.
  • Värdena för är ibland skalade eller avrundade för att tillåta arbete med heltal istället för mycket små bråk (gör beräkningen enklare). Även om skalning inte har någon inverkansförmåga hos poängen för att uppskatta risk, har avrundning potentialen att störa "optimaliteten" för GLM-uppskattningen.

Att fatta poängbaserade beslut

Låt m "eskalerande" åtgärder tillgängliga för beslutsfattare (t.ex. för kreditriskbeslut: = "godkänn automatiskt", = "kräv mer dokumentation och kontrollera manuellt", = "avvisa automatiskt"). För att definiera en beslutsregel vill vi definiera en karta mellan olika värden på poängen och de möjliga besluten i . Låt vara en partition av till på varandra följande, icke-överlappande intervall, så att .

Kartan definieras enligt följande:

  • Värdena för ställs in baserat på expertutlåtanden, typen och prevalensen av den uppmätta risken, konsekvenserna av missklassificering, etc. Till exempel kommer en risk på 9 av 10 vanligtvis att betraktas som " hög risk", men en risk på 7 av 10 kan betraktas som antingen "hög risk" eller "medelhög risk" beroende på sammanhang.
  • Definitionen av intervallen är på höger öppna intervall men kan definieras på motsvarande sätt med vänster öppna intervall .
  • För poängmetoder som redan är översatta poängen till sannolikheter definierar vi antingen partitionen direkt på intervallet eller översätter beslutskriterierna till , och monotoniteten hos säkerställer en 1-till-1-översättning.

Exempel

Biostatistik

(se fler exempel på kategorisidan Kategori:Medicinska poängsystem )

Finansiell industri

Den primära användningen av poäng i finanssektorn är för kreditstyrkort eller kreditpoäng :

Samhällsvetenskap

  •   Hastie, TJ; Tibshirani, RJ (1990). Generaliserade tillsatsmodeller . Chapman & Hall/CRC. ISBN 978-0-412-34390-2 .