Galton–Watson-processen
Galton -Watson-processen är en förgrenad stokastisk process som härrör från Francis Galtons statistiska undersökning av utrotningen av efternamn . Processen modellerar släktnamn som patrilinjära (övergår från far till son), medan avkommor är slumpmässigt antingen manliga eller kvinnliga, och namnen dör ut om släktnamnsraden dör ut (innehavare av släktnamnet dör utan manliga ättlingar). Detta är en korrekt beskrivning av Y-kromosomöverföring i genetik, och modellen är därför användbar för att förstå humana Y-kromosom-DNA-haplogrupper . På samma sätt, eftersom mitokondrier ärvs endast på moderlinjen, beskriver samma matematiska formulering överföring av mitokondrier. Formeln är av begränsad användbarhet för att förstå faktiska efternamnsfördelningar, eftersom efternamn i praktiken ändras av många andra skäl, och att dö ut från namnstreck bara är en faktor.
Historia
Det fanns en oro bland viktorianerna att aristokratiska efternamn [ exempel behövs ] håller på att dö ut. Galton ställde ursprungligen en matematisk fråga angående fördelningen av efternamn i en idealiserad befolkning i ett nummer 1873 av The Educational Times, och pastor Henry William Watson svarade med en lösning. Tillsammans skrev de sedan en artikel från 1874 med titeln "Om sannolikheten för familjers utplåning" i Journal of the Anthropological Institute of Great Britain and Ireland ( nu Journal of the Royal Anthropological Institute) . Galton och Watson verkar ha härlett sin process oberoende av det tidigare arbetet av IJ Bienaymé ; se Heyde och Seneta 1977. För en detaljerad historik se Kendall (1966 och 1975).
Begrepp
Antag, för modellens skull, att efternamn förs vidare till alla manliga barn av deras far. Antag att antalet en mans söner är en slumpvariabel fördelad på mängden { 0, 1, 2, 3, ... }. Antag vidare att antalet olika mäns söner är oberoende slumpvariabler, alla med samma fördelning.
Sedan är den enklaste väsentliga matematiska slutsatsen att om det genomsnittliga antalet av en mans söner är 1 eller mindre, så kommer deras efternamn nästan säkert att dö ut, och om det är mer än 1, då är det mer än noll sannolikhet att det kommer att överleva för vilket antal generationer som helst.
Moderna tillämpningar inkluderar överlevnadssannolikheterna för en ny mutant gen, eller initieringen av en nukleär kedjereaktion , eller dynamiken i sjukdomsutbrott i deras första generationer av spridning, eller riskerna för utrotning av en liten population av organismer ; samt att förklara (kanske närmast Galtons ursprungliga intresse) varför bara en handfull män i mänsklighetens djupa förflutna nu har några överlevande manliga ättlingar, vilket återspeglas i ett ganska litet antal distinkta mänskliga Y-kromosom-DNA-haplogrupper .
En följd av höga sannolikheter för utrotning är att om en härstamning har överlevt, har den sannolikt upplevt, rent av en slump, en ovanligt hög tillväxttakt i sina tidiga generationer åtminstone jämfört med resten av befolkningen.
Matematisk definition
0 En Galton–Watson-process är en stokastisk process { X n } som utvecklas enligt återfallsformeln X = 1 och
där är en uppsättning av oberoende och identiskt fördelade naturliga talvärderade slumpvariabler.
I analogi med släktnamn kan X n ses som antalet ättlingar (längs den manliga linjen) i n: e generationen, och kan ses som antalet (manliga) barn till den j :te av dessa ättlingar. Återkommande relationen anger att antalet ättlingar i n +1:a generationen är summan, över alla n :te generationens ättlingar, av antalet barn till den ättlingen.
Sannolikheten för utsläckning (dvs. sannolikheten för slutlig utsläckning) ges av
Detta är klart lika med noll om varje medlem av befolkningen har exakt en ättling. Med undantag för detta fall (vanligtvis kallat det triviala fallet) finns det ett enkelt nödvändigt och tillräckligt villkor, vilket ges i nästa avsnitt.
Utsläckningskriterium för Galton–Watson-processen
I det icke-triviala fallet är sannolikheten för slutlig utsläckning lika med 1 om E { ξ 1 } ≤ 1 och strikt mindre än 1 om E { ξ 1 } > 1.
Processen kan behandlas analytiskt med metoden för sannolikhetsgenererande funktioner .
Om antalet barn ξ j vid varje nod följer en Poisson-fördelning med parametern λ, kan ett särskilt enkelt återfall hittas för den totala utsläckningssannolikheten x n för en process som börjar med en enskild individ vid tidpunkten n = 0:
ger ovanstående kurvor.
Bisexuell Galton–Watson-process
I det klassiska familjeefternamnet Galton–Watson-processen som beskrivs ovan behöver endast män beaktas, eftersom endast män överför sitt efternamn till ättlingar. Detta innebär i praktiken att reproduktion kan modelleras som asexuell. (Likaså, om mitokondriell överföring analyseras, behöver endast kvinnor beaktas, eftersom endast kvinnor överför sina mitokondrier till ättlingar.)
En modell som närmare följer den faktiska sexuella reproduktionen är den så kallade "bisexuella Galton–Watson-processen", där endast par reproducerar sig. [ citat behövs ] ( Bisexuell avser i detta sammanhang antalet inblandade kön, inte sexuell läggning .) I denna process antas varje barn vara man eller kvinna, oberoende av varandra, med en specificerad sannolikhet, och en s.k. "parningsfunktion" avgör hur många par som kommer att bildas i en given generation. Liksom tidigare anses reproduktion av olika par vara oberoende av varandra. Nu motsvarar analogen till det triviala fallet fallet med varje hane och hona som reproducerar sig i exakt ett par, med en manlig och en kvinnlig ättling, och att parningsfunktionen tar värdet av minimum av antalet hanar och honor (som är sedan desamma från nästa generation och framåt).
Eftersom den totala reproduktionen inom en generation nu starkt beror på parningsfunktionen, finns det i allmänhet inga enkla nödvändiga och tillräckliga förutsättningar för slutlig utrotning som är fallet i den klassiska Galton-Watson-processen. [ citat behövs ] Emellertid, med undantag för det icke-triviala fallet , tillåter begreppet medelvärde för reproduktion (Bruss (1984)) ett allmänt tillräckligt villkor för slutlig utrotning, som behandlas i nästa avsnitt.
Utsläckningskriterium
Om i det icke-triviala fallet det genomsnittliga reproduktionsmedelvärdet per par förblir begränsat över alla generationer och inte kommer att överstiga 1 för en tillräckligt stor populationsstorlek, är sannolikheten för slutlig utrotning alltid 1.
Exempel
Att citera historiska exempel på Galton-Watson-processen är komplicerat på grund av att släktnamnens historia ofta avviker avsevärt från den teoretiska modellen. Noterbart kan nya namn skapas, befintliga namn kan ändras under en persons livstid, och människor har historiskt ofta antagit namn på obesläktade personer, särskilt adeln. Ett litet antal släktnamn i dagsläget är alltså inte i sig bevis för att namn har dött ut med tiden, eller att de gjort det på grund av att de dör ut ur släktnamnsrader – det kräver att det fanns fler namn tidigare och att de dör ut på grund av att raden dör ut, snarare än att namnet ändras av andra skäl, som att vasaller antar namnet på sin herre.
Kinesiska namn är ett väl studerat exempel på utrotning av efternamn: det finns för närvarande bara cirka 3 100 efternamn i bruk i Kina, jämfört med nära 12 000 registrerade tidigare, med 22 % av befolkningen som delar namnen Li , Wang och Zhang ( numrering ) nära 300 miljoner människor), och de 200 bästa namnen som täcker 96 % av befolkningen. Namn har ändrats eller har dött ut av olika anledningar som att människor tar namnen på sina linjaler, ortografiska förenklingar, tabun mot att använda tecken från en kejsarens namn, bland annat. Även om släktnamnsrader dör ut kan vara en faktor för att efternamnet försvinner, är det inte på något sätt den enda eller ens en betydande faktor. Faktum är att den viktigaste faktorn som påverkar efternamnsfrekvensen är andra etniska grupper som identifierar sig som Han och antar Han-namn. Samtidigt som nya namn har uppstått av olika anledningar har detta uppvägts av att gamla namn har försvunnit.
Däremot har vissa nationer antagit efternamn först nyligen. Det betyder både att de inte har upplevt efternamnsutrotning under en längre period, och att namnen antogs när nationen hade en relativt stor befolkning, snarare än de mindre populationerna under antiken. Dessutom har dessa namn ofta valts kreativt och är mycket olika. Exempel inkluderar:
- Japanska namn , som i allmänt bruk dateras endast till Meiji-restaureringen i slutet av 1800-talet (när befolkningen var över 30 000 000), har över 100 000 efternamn, efternamnen är väldigt varierande och regeringen begränsar gifta par att använda samma efternamn.
- Många holländska namn har inkluderat ett formellt efternamn först sedan Napoleonkrigen i början av 1800-talet. Tidigare kom efternamn från patronymer (t.ex. Jansen = Johns son), personliga egenskaper (t.ex. de Rijke = den rike), geografiska platser (t.ex. van Rotterdam) och yrken (t.ex. Visser = fiskaren), ibland t.o.m. kombinerat (t.ex. Jan Jansz van Rotterdam). Det finns över 68 000 holländska efternamn.
- Thailändska namn har endast inkluderat ett efternamn sedan 1920, och endast en enda familj kan använda ett givet efternamn; därför finns det ett stort antal thailändska namn. Dessutom ändrar thailändare sina efternamn med viss frekvens, vilket komplicerar analysen.
Å andra sidan beror några exempel på hög koncentration av efternamn inte i första hand på Galton–Watson-processen:
- Vietnamesiska namn har cirka 100 efternamn, med 60 % av befolkningen som delar tre efternamn. Bara namnet Nguyễn beräknas användas av nästan 40 % av den vietnamesiska befolkningen, och 90 % delar 15 namn. Men som historien om Nguyễn -namnet klargör, beror detta inte till en liten del på att namn tvingas på människor eller antas av skäl som inte är relaterade till genetiska relationer.
Se även
Vidare läsning
- F. Thomas Bruss (1984). "En anteckning om utrotningskriterier för bisexuella Galton-Watson-processer". Journal of Applied Probability 21 : 915–919.
- CC Heyde och E Seneta (1977). IJ Bienayme: Statistisk teori förväntad . Berlin, Tyskland.
- Kendall, DG (1966). "Förgreningsprocesser sedan 1873". Journal of the London Mathematical Society . s1-41: 385-406. doi : 10.1112/jlms/s1-41.1.385 . ISSN 0024-6107 .
- Kendall, DG (1975). "The Genealogy of Genealogy Branching Processes före (och efter) 1873". Bulletin från London Mathematical Society . 7 (3): 225–253. doi : 10.1112/blms/7.3.225 . ISSN 0024-6093 .