GEDCOM

GEDCOM
Filnamnstillägg
.ged , .gdz
Internet mediatyp
application/vnd.familysearch.gedcom application/vnd.familysearch.gedcom+zip
Utvecklad av LDS FHD
Initial release 1984 ; 39 år sedan ( 1984 )
Senaste släppningen

7.0.11 1 november 2022 ; 3 månader sedan ( 2022-11-01 )
Typ av format Släktforskningsdatautbyte _
Standard De facto
Öppna format ? ja
Fritt format? Nej
Hemsida gedcom .io github .com /familysearch /GEDCOM

GEDCOM ( / ˈ ɛ d k ɒ m / JED -kom ), fullständigt namn FamilySearch GEDCOM , är en de facto öppen filformatspecifikation för att lagra genealogisk data och importera eller exportera den mellan kompatibel släktforskningsprogramvara . GEDCOM är en akronym som står för Genealogical Data Communication. GEDCOM utvecklades av Jesu Kristi Kyrka av Sista Dagars Heliga (LDS Church) som ett hjälpmedel för släktforskning . De flesta släktforskningsprogram stöder import från och export till GEDCOM-format.

Från och med version 7.0 definieras en GEDCOM-fil som UTF-8- kodad vanlig text . Den här filen innehåller genealogisk information om individer såsom namn, händelser och relationer; metadata länkar samman dessa poster. GEDCOM 7.0 är den första versionen som använder semantisk versionering och är den senaste mindre versionen av specifikationen.

Föregångaren till 7.0, GEDCOM 5.5.1, släpptes som ett utkast 1999. Det har bara fått mindre uppdateringar under de efterföljande 20 åren. Bristen på uppdateringar av standarden och bristerna i dess kapacitet började se att vissa släktforskningsprogram lade till proprietära tillägg till formatet, som inte alltid känns igen av andra släktforskningsprogram, såsom GEDCOM 5.5 EL-specifikationen (Extended Locations). Andra standarder, såsom GEDCOM X, har föreslagits som kompletta ersättningar för GEDCOM.

GEDCOM 5.5.1 final, som släpptes 2019, är fortfarande branschens formatstandard för utbyte av genealogisk data. Med lanseringen av GEDCOM 7.0 2021 pågår dock en push för att se 7.0 antas. FamilySearch avser att vara GEDCOM 7.0-kompatibel under kvartal 3 av 2022, och Ancestry.com har 7.0-kompatibilitet på sin färdplan men har ännu inte specificerat ett implementeringsdatum. FamilySearch GEDCOM har ett GitHub-förråd

Modell

GEDCOM använder en härstamningslänkad datamodell, med länkens tonvikt på kärnfamiljen och de individer (barn) som produceras av den familjen. Dessa historiska mål beskrivs i 7.0-specifikationsdokumentet, " FAM- posten var ursprungligen strukturerad för att representera familjer där en manlig HUSB (man eller far) och kvinnlig WIFE (fru eller mor) producerar CHIL (barn)."

Dokumentet fortsätter med att säga att dessa registertyper kan användas mer flexibelt för att spegla olika familjekoncept. " FAM- posten kan också användas för kulturella paralleller till detta, inklusive kärnfamiljer, äktenskap, samlevnad, fosterhem, adoption och så vidare, oavsett kön på partnerna...De individer som HUSB och WIFE pekar är gemensamt kallade "partners", "föräldrar" eller "makar".

Filstruktur

En GEDCOM-fil består av en rubriksektion , poster och en trailersektion . Inom dessa sektioner register människor (INDI-post), familjer (FAM-poster), informationskällor (SOUR-poster) och andra diverse register, inklusive anteckningar. Varje rad i en GEDCOM-fil börjar med ett nivånummer där alla toppnivåposter (HEAD, TRLR, SUBN och varje INDI, FAM, OBJE, NOTE, REPO, SOUR och SUBM) börjar med en rad med nivå 0, medan andra nivåtal är positiva heltal .

Även om det är möjligt att skriva en GEDCOM-fil för hand, är formatet designat för att användas med programvara och är därför inte speciellt människovänligt. En GEDCOM-validator som kan användas för att validera strukturen för en GEDCOM-fil ingår som en del av PhpGedView -projektet, även om det inte är avsett att vara en fristående validator. För fristående validering kan "Windows GEDCOM Validator" användas. eller den äldre ounderhållna Gedchecken från LDS-kyrkan.

Under 2001 utvärderade GEDCOM TestBook Project hur väl fyra populära släktforskningsprogram överensstämde med GEDCOM 5.5-standarden med hjälp av Gedcheck-programmet. Resultaten visade att ett antal problem existerade och att "Det vanligaste felet som ledde till dataförlust var misslyckandet med att läsa NOTE-taggen på alla möjliga nivåer där den kan förekomma." År 2005 utvärderades Genealogical Software Report Card (av Bill Mumford som deltog i det ursprungliga GEDCOM Testbook Project ) och inkluderade testning av GEDCOM 5.5-standarden med hjälp av Gedcheck-programmet.

För att hjälpa till med införandet av GEDCOM 7.0 finns det nu även valideringsverktyg för den standarden.

Exempel

Följande är ett exempel på GEDCOM-fil.

sample.ged
 0 HEAD 1 SOUR PAF 2 NAMN Personlig Ancestral File 2 VERS 5.0 1 DATUM 30 NOV 2000 1 GEDC 2 VERS 5.5 2 FORM LINEAGE-LINKED 1 CHAR ANSEL 1 SUBM @U1@ 0 @I1@ INDI 1 NAMN John /Smith 1 SEX M 1 FAMS @F1@ 0 @I2@ INDI 1 NAMN Elizabeth /Stansfield/ 1 SEX F 1 FAMS @F1@ 0 @I3@ INDI 1 NAMN James /Smith/ 1 SEX M 1 FAMC @F1@ 0 @F1@ FAM 1 HUSB @I1@ 1 WIFE @I2@ 1 MARR 1 CHIL @I3@ 0 @U1@ SUBM 1 NAMN Insändare 0 TRLR 

Rubriken (HEAD) inkluderar källprogrammet och versionen (Personal Ancestral File, 5.0), GEDCOM-versionen (5.5), teckenkodningen ( ANSEL ) och en länk till information om insändaren av filen.

De individuella posterna (INDI) definierar John Smith (ID I1), Elizabeth Stansfield (ID I2) och James Smith (ID I3).

Familjeregistret (FAM) kopplar ihop mannen (HUSB), fru (WIFE) och barn (CHIL) med deras ID-nummer.

Versioner

Den nuvarande versionen av specifikationen i stor användning är GEDCOM 5.5.1 final , som släpptes den 15 november 2019. Dess föregångare, GEDCOM 5.5.1-utkastet gavs ut 1999, och introducerade nio nya attribut, taggar och lade till UTF-8 som en godkänd teckenkodning . Utkastet godkändes inte formellt, men dess bestämmelser antogs till viss del av ett antal släktforskningsprogram, inklusive FamilySearch.org.

Lineage-linked GEDCOM är den avsiktliga de facto gemensamma nämnaren. Trots att version 5.5 av GEDCOM-standarden först publicerades 1996, har många leverantörer av genealogiska mjukvaror aldrig fullt ut stött funktionen med flerspråkig Unicode-text (istället för ANSEL-teckenuppsättningen) som introducerades med den versionen av specifikationen. Enhetlig användning av Unicode skulle möjliggöra användning av internationella teckenuppsättningar. Ett exempel är lagringen av östasiatiska namn i deras ursprungliga kinesiska, japanska och koreanska (CJK) tecken, utan vilka de skulle kunna vara tvetydiga och till liten nytta för genealogisk eller historisk forskning. PAF 5.2 är ett exempel på programvara som använder UTF-8 som sin interna teckenuppsättning och kan mata ut en UTF-8 GEDCOM.

GEDCOM 7.0 kräver UTF-8-kodning genomgående och löser andra långvariga problem med GEDCOM 5.5.1. Multimediastöd i form av en associerad .zip-fil, kallad GEDZip, är en annan inkludering. Arbete pågår för att se 7.0 omfamnas som den nya utbytesstandarden. GEDCOM 7.0 gör det möjligt att uttryckligen identifiera vilka andra standarder än GEDCOM som kan gälla för en viss fil. GEDCOM har alltid varit utbyggbart , men före 7.0 fanns det inget standardsätt att identifiera sådana tillägg. Dessutom tillåter GEDCOM att uttryckligen markera en händelse som obefintlig. Detta gör det till exempel möjligt att dokumentera att en viss individ aldrig gifte sig.

Releasehistorik

GEDCOM version Utgivningsdatum Anteckningar
1984
december 1985 PAF 2.0
Gammal version, underhålls inte längre: 2.1 februari 1987 GEDCOM för PAF 2.1
Gammal version, underhålls inte längre: 2.3 Utkast 7 augusti 1985 med PAF2.0 GEDCOM implementeringskonventioner
Gammal version, underhålls inte längre: 2.4 Utkast 13 december 1985 med PAF2.0 GEDCOM implementeringskonventioner
9 oktober 1987 PAF 2.0 och 2.1 implementering av 3.0
Gammal version, underhålls inte längre: 4.0 Standard augusti 1989 PAF 2,1 – 2,31
25 januari 1990
31 december 1991 härstamningsbundna strukturer introducerades.
Gammal version, underhålls inte längre: 5.1 Utkast 18 september 1992
Gammal version, underhålls inte längre: 5.2 Utkast 22 januari 1992
Gammal version, underhålls inte längre: 5.3 Utkast 4 november 1993 Unicode- standarden ( ISO/IEC 10646 ) introducerades som en extra teckenuppsättning.
Gammal version, underhålls inte längre: 5.4 Utkast 21 augusti 1995
Gammal version, underhålls inte längre: 5.5 Standard 11 december 1995 PAF 3, 4 och 5
Äldre version, men fortfarande underhållen: 5.5 Standard 2 januari 1996 PAF 3, 4 och 5 / 5.5 Standard
1 maj 1998 "det använde en helt ny datamodell"
2 oktober 1999 Används av FamilySearch.org UTF-8 lagt till som en godkänd teckenkodning.
15 november 2019 nuvarande standard, smärre textändringar av 5.5.1 Utkast.
2 oktober 2019 Inofficiell uppdatering av Tamura Jones
Gammal version, underhålls inte längre: 5.6 Privat utkast - "Jed Allen skickade de två filerna till ett fåtal personer bara för typ av "privata kommentarer"
Gammal version, underhålls inte längre: 6.0 XML Draft 28 december 2001 Var inte en komplett specifikation, och rekommenderas inte att börja med programimplementeringar.
Gammal version, underhålls inte längre: 7.0.0-rc1 Utkast februari 2021 Releasekandidat avslöjad för RootsTech 2021, men sedan togs alla samtal, specifikationer och webbplatsen bort den 25 februari 2021
27 maj 2021 Modernisera teckenkodning, förtydliga oklarheter i 5.5.1-specifikationen, inför semantisk versionering, förbättra multimediahantering
Legend:
Gammal version
Äldre version, fortfarande underhållen
Senaste versionen
Senaste förhandsversionen
Framtida release

Begränsningar

Stöd för evenemang och källor för flera personer

En GEDCOM-fil kan innehålla information om händelser som födslar, dödsfall, folkräkningsregister, fartygsregister, äktenskap, etc.; en tumregel är att en händelse är något som ägt rum vid en specifik tidpunkt, på en specifik plats (även om tid och plats inte är kända). GEDCOM-filer kan också innehålla attribut som fysisk beskrivning, yrke och totalt antal barn; Till skillnad från händelser kan attribut i allmänhet inte associeras med en specifik tid eller plats.

GEDCOM-specifikationen kräver att varje händelse eller attribut är associerad med exakt en individ eller familj. Detta orsakar redundans för händelser som folkräkningsposter där den faktiska folkräkningsposten ofta innehåller information om flera individer. I GEDCOM-filen, för folkräkningsposter, måste en separat "CENS"-händelse läggas till för varje individ som refereras. Vissa släktforskningsprogram, som Gramps och The Master Genealogist , har utarbetade databasstrukturer för källor som bland annat används för att representera händelser med flera personer. När databaser exporteras från ett av dessa program till GEDCOM, kan dessa databasstrukturer inte representeras i GEDCOM på grund av denna begränsning, med resultatet att händelsen eller källinformationen inklusive all relevant referensinformation måste dupliceras varje plats den är. Begagnade. Denna dubblering gör det svårt för användaren att upprätthålla informationen relaterad till källor.

I GEDCOM-specifikationen lagras händelser som är associerade med en familj, såsom äktenskapsinformation, endast i en GEDCOM en gång, som en del av familjeregistret (FAM), och sedan kopplas båda makarna till den enskilda familjeregistret.

Tvetydighet i specifikationen

GEDCOM-specifikationen gjordes målmedvetet flexibel för att stödja många sätt att koda data, särskilt inom källområdet. Denna flexibilitet har lett till en hel del otydlighet och har gett bieffekten att vissa släktforskningsprogram som importerar GEDCOM inte importerar all data från en fil.

Stöd för olika definitioner av familjer och relationer

GEDCOM stöder inte uttryckligen datarepresentation av många typer av nära mellanmänskliga relationer , såsom samkönade äktenskap , inhemska partnerskap , samboskap , polyamori eller polygami . Sådana relationer kan endast representeras med den generiska ASSO-taggen som används för alla typer av relationer.

Beställning av evenemang som saknar datum

GEDCOM-specifikationen erbjuder inte uttryckligt stöd för att hålla en känd ordning på händelser. I synnerhet kan ordningen för relationer (FAMS) för en person och ordningen för barnen inom en relation (FAM) gå förlorad. I många fall kan händelseförloppet härledas från de associerade datumen. Men datum är inte alltid kända, i synnerhet när det handlar om data från århundraden sedan. Till exempel i det fall att en person har haft två relationer, båda med okända datum, men från beskrivningar är det känt att det andra verkligen är det andra. I vilken ordning dessa FAMS registreras i GEDCOMs INDI-post kommer att bero på exportprogrammet. I Aldfaer till exempel beror sekvensen på ordningen av data av användaren (alfabetisk, kronologisk, referens, etc.). Den föreslagna XML GEDCOM-standarden tar inte heller upp detta problem.

Mindre kända funktioner

GEDCOM har många funktioner som inte används ofta. Vissa programvarupaket stöder inte alla funktioner som GEDCOM-standarden tillåter.

Multimedia

GEDCOM-standarden stöder inkludering av multimediaobjekt (till exempel foton av individer). Sådana multimediaobjekt kan antingen inkluderas i själva GEDCOM-filen (kallad "inbäddad form") eller i en extern fil där namnet på den externa filen anges i GEDCOM-filen (kallad "länkad form"). Att bädda in multimedia direkt i GEDCOM-filen gör det lättare att överföra data, eftersom all information (inklusive multimediadata) finns i en fil, men den resulterande filen kan bli enorm. Länkning av multimedia håller storleken på GEDCOM-filen under kontroll, men när filen överförs måste multimediaobjekten antingen överföras separat eller arkiveras tillsammans med GEDCOM till en större fil. Stödet för att bädda in media direkt togs bort i utkastet till 5.5.1-standarden.

Motstridig information

GEDCOM-standarden tillåter specificering av flera åsikter eller motstridiga data, helt enkelt genom att specificera flera poster av samma typ. Till exempel, om en individs födelsedatum antecknades som den 10 januari 1800 på födelseattesten, men den 11 januari 1800 på dödsattesten, skulle två BIRT-poster för den personen inkluderas, den första med den 10 januari 1800 och anger födseln. intyg som källa, och det andra med datum den 11 januari 1800 och anger dödsattesten som källa. Den föredragna posten listas vanligtvis först.

Det här exemplet kodat i GEDCOM kan se ut så här:

0 @I1@ INDI 1 NAMN John /Doe/ 1 FÖDSEL 2 DATUM 10 JAN 1800 2 SOUR @S1@ 3 DATA 4 TEXT Transkription från födelseattest skulle gå hit 3 OBS Denna födelsebok är att föredra eftersom den kommer från födelseattesten 3 KAJ 2 1 FÖDELSE 2 DATUM 11 JAN 1800 2 SOUR @S2@ 3 DATA 4 TEXT Avskrift från dödsattest skulle gå hit 3 KAJ 2

Motstridiga data kan också vara resultatet av användarfel. Standarden anger inte på något sätt att innehållet ska vara konsekvent. Ett födelsedatum som "10 APR 1819" kan av misstag ha registrerats som "10 APR 1918" långt efter personens död. Det enda sättet att avslöja sådana inkonsekvenser är genom noggrann validering av innehållsdata .

Internationalisering

GEDCOM-standarden stödjer internationalisering på flera sätt. För det första tillåter nyare versioner av standarden att data lagras i Unicode (eller, på senare tid, UTF-8), så text på vilket språk som helst kan lagras. För det andra, på samma sätt som du kan ha flera händelser på en person, låter GEDCOM dig ha flera namn för en person, så namn kan lagras på flera språk (även om det inte finns något standardiserat sätt att indikera vilken instans som är på vilket språk ). Slutligen, i den senaste versionen (5.5.1, ännu inte i stor användning), stöder fältet NAME också en fonetisk variant (FONE) och en romaniserad variant (ROMN) av namnet.

GEDCOM X

I februari 2012 vid konferensen RootsTech 2012, beskrev FamilySearch ett nytt stort projekt kring genealogiska standarder som kallas GEDCOM X, och bjöd in till samarbete. Den inkluderar programvara utvecklad under Apaches öppen källkodslicens . Det inkluderar dataformat som underlättar att basera släktträd på källor och register (både fysiska artefakter och digitala artefakter), stöd för att dela och länka data online och ett API.

I augusti 2012 släppte den FamilySearch- anställde och GEDCOM X-projektledaren Ryan Heaton påståendet att GEDCOM X är den nya industristandarden, och ompositionerade GEDCOM X som ett annat FamilySearch- projekt med öppen källkod .

Efter lanseringen av GEDCOM 7, positionerade FamilySearch GEDCOM X som användbar för samverkan med dess FamilySearch Family Tree-programvara.

Alternativ

Commsoft, författarna till Roots -serien av släktforskningsprogram och Ultimate Family Tree, definierade en version som kallas Event-Oriented GEDCOM (även känd som "Event GEDCOM" och ursprungligen kallad InterGED), som inkluderade händelser som förstklassiga (nollnivå) objekt . Även om det är händelsebaserat är det fortfarande en modell som bygger på antagen verklighet snarare än bevis. Event GEDCOM var mer flexibelt, eftersom det möjliggjorde en viss åtskillnad mellan trodda händelser och deltagarna. Event GEDCOM användes dock inte allmänt av andra utvecklare på grund av dess semantiska skillnader. [ citat behövs ] Eftersom Roots and Ultimate Family Tree inte längre är tillgängliga är det väldigt få som idag använder Event GEDCOM.

Gramps XML är ett XML -baserat öppet format skapat av släktforskningsprojektet Gramps med öppen källkod och används även av PhpGedView .

Family History Information Standards Organisation bildades 2012 med syftet att utveckla internationella standarder för släkthistoria och genealogisk information. En av de standarder som organisationen föreslog var Extended Legacy Format (ELF), kompatibel med GEDCOM 5.5(.1) men inklusive en utökningsmekanism. Organisationen begärde offentliga kommentarer om den föreslagna standarden 2017. Den drog tillbaka förslaget eftersom release 7.0 av GEDCOM tog upp många av organisationens problem.

Se även

externa länkar

Allmän