GEDCOM
Filnamnstillägg |
.ged , .gdz
|
---|---|
Internet mediatyp |
application/vnd.familysearch.gedcom application/vnd.familysearch.gedcom+zip
|
Utvecklad av | LDS FHD |
Initial release | 1984 |
Senaste släppningen | 7.0.11 1 november 2022 |
Typ av format | Släktforskningsdatautbyte _ |
Standard | De facto |
Öppna format ? | ja |
Fritt format? | Nej |
Hemsida |
|
GEDCOM ( / ˈ dʒ ɛ d k ɒ m / JED -kom ), fullständigt namn FamilySearch GEDCOM , är en de facto öppen filformatspecifikation för att lagra genealogisk data och importera eller exportera den mellan kompatibel släktforskningsprogramvara . GEDCOM är en akronym som står för Genealogical Data Communication. GEDCOM utvecklades av Jesu Kristi Kyrka av Sista Dagars Heliga (LDS Church) som ett hjälpmedel för släktforskning . De flesta släktforskningsprogram stöder import från och export till GEDCOM-format.
Från och med version 7.0 definieras en GEDCOM-fil som UTF-8- kodad vanlig text . Den här filen innehåller genealogisk information om individer såsom namn, händelser och relationer; metadata länkar samman dessa poster. GEDCOM 7.0 är den första versionen som använder semantisk versionering och är den senaste mindre versionen av specifikationen.
Föregångaren till 7.0, GEDCOM 5.5.1, släpptes som ett utkast 1999. Det har bara fått mindre uppdateringar under de efterföljande 20 åren. Bristen på uppdateringar av standarden och bristerna i dess kapacitet började se att vissa släktforskningsprogram lade till proprietära tillägg till formatet, som inte alltid känns igen av andra släktforskningsprogram, såsom GEDCOM 5.5 EL-specifikationen (Extended Locations). Andra standarder, såsom GEDCOM X, har föreslagits som kompletta ersättningar för GEDCOM.
GEDCOM 5.5.1 final, som släpptes 2019, är fortfarande branschens formatstandard för utbyte av genealogisk data. Med lanseringen av GEDCOM 7.0 2021 pågår dock en push för att se 7.0 antas. FamilySearch avser att vara GEDCOM 7.0-kompatibel under kvartal 3 av 2022, och Ancestry.com har 7.0-kompatibilitet på sin färdplan men har ännu inte specificerat ett implementeringsdatum. FamilySearch GEDCOM har ett GitHub-förråd
Modell
GEDCOM använder en härstamningslänkad datamodell, med länkens tonvikt på kärnfamiljen och de individer (barn) som produceras av den familjen. Dessa historiska mål beskrivs i 7.0-specifikationsdokumentet, " FAM-
posten var ursprungligen strukturerad för att representera familjer där en manlig HUSB
(man eller far) och kvinnlig WIFE
(fru eller mor) producerar CHIL
(barn)."
Dokumentet fortsätter med att säga att dessa registertyper kan användas mer flexibelt för att spegla olika familjekoncept. " FAM-
posten kan också användas för kulturella paralleller till detta, inklusive kärnfamiljer, äktenskap, samlevnad, fosterhem, adoption och så vidare, oavsett kön på partnerna...De individer som HUSB och WIFE
pekar på
är gemensamt kallade "partners", "föräldrar" eller "makar".
Filstruktur
En GEDCOM-fil består av en rubriksektion , poster och en trailersektion . Inom dessa sektioner register människor (INDI-post), familjer (FAM-poster), informationskällor (SOUR-poster) och andra diverse register, inklusive anteckningar. Varje rad i en GEDCOM-fil börjar med ett nivånummer där alla toppnivåposter (HEAD, TRLR, SUBN och varje INDI, FAM, OBJE, NOTE, REPO, SOUR och SUBM) börjar med en rad med nivå 0, medan andra nivåtal är positiva heltal .
Även om det är möjligt att skriva en GEDCOM-fil för hand, är formatet designat för att användas med programvara och är därför inte speciellt människovänligt. En GEDCOM-validator som kan användas för att validera strukturen för en GEDCOM-fil ingår som en del av PhpGedView -projektet, även om det inte är avsett att vara en fristående validator. För fristående validering kan "Windows GEDCOM Validator" användas. eller den äldre ounderhållna Gedchecken från LDS-kyrkan.
Under 2001 utvärderade GEDCOM TestBook Project hur väl fyra populära släktforskningsprogram överensstämde med GEDCOM 5.5-standarden med hjälp av Gedcheck-programmet. Resultaten visade att ett antal problem existerade och att "Det vanligaste felet som ledde till dataförlust var misslyckandet med att läsa NOTE-taggen på alla möjliga nivåer där den kan förekomma." År 2005 utvärderades Genealogical Software Report Card (av Bill Mumford som deltog i det ursprungliga GEDCOM Testbook Project ) och inkluderade testning av GEDCOM 5.5-standarden med hjälp av Gedcheck-programmet.
För att hjälpa till med införandet av GEDCOM 7.0 finns det nu även valideringsverktyg för den standarden.
Exempel
Följande är ett exempel på GEDCOM-fil.
sample.ged |
0 HEAD 1 SOUR PAF 2 NAMN Personlig Ancestral File 2 VERS 5.0 1 DATUM 30 NOV 2000 1 GEDC 2 VERS 5.5 2 FORM LINEAGE-LINKED 1 CHAR ANSEL 1 SUBM @U1@ 0 @I1@ INDI 1 NAMN John /Smith 1 SEX M 1 FAMS @F1@ 0 @I2@ INDI 1 NAMN Elizabeth /Stansfield/ 1 SEX F 1 FAMS @F1@ 0 @I3@ INDI 1 NAMN James /Smith/ 1 SEX M 1 FAMC @F1@ 0 @F1@ FAM 1 HUSB @I1@ 1 WIFE @I2@ 1 MARR 1 CHIL @I3@ 0 @U1@ SUBM 1 NAMN Insändare 0 TRLR |
Rubriken (HEAD) inkluderar källprogrammet och versionen (Personal Ancestral File, 5.0), GEDCOM-versionen (5.5), teckenkodningen ( ANSEL ) och en länk till information om insändaren av filen.
De individuella posterna (INDI) definierar John Smith (ID I1), Elizabeth Stansfield (ID I2) och James Smith (ID I3).
Familjeregistret (FAM) kopplar ihop mannen (HUSB), fru (WIFE) och barn (CHIL) med deras ID-nummer.
Versioner
Den nuvarande versionen av specifikationen i stor användning är GEDCOM 5.5.1 final , som släpptes den 15 november 2019. Dess föregångare, GEDCOM 5.5.1-utkastet gavs ut 1999, och introducerade nio nya attribut, taggar och lade till UTF-8 som en godkänd teckenkodning . Utkastet godkändes inte formellt, men dess bestämmelser antogs till viss del av ett antal släktforskningsprogram, inklusive FamilySearch.org.
Lineage-linked GEDCOM är den avsiktliga de facto gemensamma nämnaren. Trots att version 5.5 av GEDCOM-standarden först publicerades 1996, har många leverantörer av genealogiska mjukvaror aldrig fullt ut stött funktionen med flerspråkig Unicode-text (istället för ANSEL-teckenuppsättningen) som introducerades med den versionen av specifikationen. Enhetlig användning av Unicode skulle möjliggöra användning av internationella teckenuppsättningar. Ett exempel är lagringen av östasiatiska namn i deras ursprungliga kinesiska, japanska och koreanska (CJK) tecken, utan vilka de skulle kunna vara tvetydiga och till liten nytta för genealogisk eller historisk forskning. PAF 5.2 är ett exempel på programvara som använder UTF-8 som sin interna teckenuppsättning och kan mata ut en UTF-8 GEDCOM.
GEDCOM 7.0 kräver UTF-8-kodning genomgående och löser andra långvariga problem med GEDCOM 5.5.1. Multimediastöd i form av en associerad .zip-fil, kallad GEDZip, är en annan inkludering. Arbete pågår för att se 7.0 omfamnas som den nya utbytesstandarden. GEDCOM 7.0 gör det möjligt att uttryckligen identifiera vilka andra standarder än GEDCOM som kan gälla för en viss fil. GEDCOM har alltid varit utbyggbart , men före 7.0 fanns det inget standardsätt att identifiera sådana tillägg. Dessutom tillåter GEDCOM att uttryckligen markera en händelse som obefintlig. Detta gör det till exempel möjligt att dokumentera att en viss individ aldrig gifte sig.
Releasehistorik
GEDCOM version | Utgivningsdatum | Anteckningar |
---|---|---|
1984 | – | |
december 1985 | PAF 2.0 | |
2.1 | februari 1987 | GEDCOM för PAF 2.1 |
2.3 Utkast | 7 augusti 1985 | med PAF2.0 GEDCOM implementeringskonventioner |
2.4 Utkast | 13 december 1985 | med PAF2.0 GEDCOM implementeringskonventioner |
9 oktober 1987 | PAF 2.0 och 2.1 implementering av 3.0 | |
4.0 Standard | augusti 1989 | PAF 2,1 – 2,31 |
– | – | |
25 januari 1990 | – | |
31 december 1991 | härstamningsbundna strukturer introducerades. | |
5.1 Utkast | 18 september 1992 | – |
5.2 Utkast | 22 januari 1992 | – |
5.3 Utkast | 4 november 1993 | Unicode- standarden ( ISO/IEC 10646 ) introducerades som en extra teckenuppsättning. |
5.4 Utkast | 21 augusti 1995 | – |
5.5 Standard | 11 december 1995 | PAF 3, 4 och 5 |
5.5 Standard | 2 januari 1996 | PAF 3, 4 och 5 / 5.5 Standard |
1 maj 1998 | "det använde en helt ny datamodell" | |
2 oktober 1999 | Används av FamilySearch.org UTF-8 lagt till som en godkänd teckenkodning. | |
15 november 2019 | nuvarande standard, smärre textändringar av 5.5.1 Utkast. | |
2 oktober 2019 | Inofficiell uppdatering av Tamura Jones | |
5.6 Privat utkast | - | "Jed Allen skickade de två filerna till ett fåtal personer bara för typ av "privata kommentarer" |
6.0 XML Draft | 28 december 2001 | Var inte en komplett specifikation, och rekommenderas inte att börja med programimplementeringar. |
7.0.0-rc1 Utkast | februari 2021 | Releasekandidat avslöjad för RootsTech 2021, men sedan togs alla samtal, specifikationer och webbplatsen bort den 25 februari 2021 |
27 maj 2021 | Modernisera teckenkodning, förtydliga oklarheter i 5.5.1-specifikationen, inför semantisk versionering, förbättra multimediahantering | |
Legend:
Gammal version
Äldre version, fortfarande underhållen
Senaste versionen
|
Begränsningar
Stöd för evenemang och källor för flera personer
En GEDCOM-fil kan innehålla information om händelser som födslar, dödsfall, folkräkningsregister, fartygsregister, äktenskap, etc.; en tumregel är att en händelse är något som ägt rum vid en specifik tidpunkt, på en specifik plats (även om tid och plats inte är kända). GEDCOM-filer kan också innehålla attribut som fysisk beskrivning, yrke och totalt antal barn; Till skillnad från händelser kan attribut i allmänhet inte associeras med en specifik tid eller plats.
GEDCOM-specifikationen kräver att varje händelse eller attribut är associerad med exakt en individ eller familj. Detta orsakar redundans för händelser som folkräkningsposter där den faktiska folkräkningsposten ofta innehåller information om flera individer. I GEDCOM-filen, för folkräkningsposter, måste en separat "CENS"-händelse läggas till för varje individ som refereras. Vissa släktforskningsprogram, som Gramps och The Master Genealogist , har utarbetade databasstrukturer för källor som bland annat används för att representera händelser med flera personer. När databaser exporteras från ett av dessa program till GEDCOM, kan dessa databasstrukturer inte representeras i GEDCOM på grund av denna begränsning, med resultatet att händelsen eller källinformationen inklusive all relevant referensinformation måste dupliceras varje plats den är. Begagnade. Denna dubblering gör det svårt för användaren att upprätthålla informationen relaterad till källor.
I GEDCOM-specifikationen lagras händelser som är associerade med en familj, såsom äktenskapsinformation, endast i en GEDCOM en gång, som en del av familjeregistret (FAM), och sedan kopplas båda makarna till den enskilda familjeregistret.
Tvetydighet i specifikationen
GEDCOM-specifikationen gjordes målmedvetet flexibel för att stödja många sätt att koda data, särskilt inom källområdet. Denna flexibilitet har lett till en hel del otydlighet och har gett bieffekten att vissa släktforskningsprogram som importerar GEDCOM inte importerar all data från en fil.
Stöd för olika definitioner av familjer och relationer
GEDCOM stöder inte uttryckligen datarepresentation av många typer av nära mellanmänskliga relationer , såsom samkönade äktenskap , inhemska partnerskap , samboskap , polyamori eller polygami . Sådana relationer kan endast representeras med den generiska ASSO-taggen som används för alla typer av relationer.
Beställning av evenemang som saknar datum
GEDCOM-specifikationen erbjuder inte uttryckligt stöd för att hålla en känd ordning på händelser. I synnerhet kan ordningen för relationer (FAMS) för en person och ordningen för barnen inom en relation (FAM) gå förlorad. I många fall kan händelseförloppet härledas från de associerade datumen. Men datum är inte alltid kända, i synnerhet när det handlar om data från århundraden sedan. Till exempel i det fall att en person har haft två relationer, båda med okända datum, men från beskrivningar är det känt att det andra verkligen är det andra. I vilken ordning dessa FAMS registreras i GEDCOMs INDI-post kommer att bero på exportprogrammet. I Aldfaer till exempel beror sekvensen på ordningen av data av användaren (alfabetisk, kronologisk, referens, etc.). Den föreslagna XML GEDCOM-standarden tar inte heller upp detta problem.
Mindre kända funktioner
GEDCOM har många funktioner som inte används ofta. Vissa programvarupaket stöder inte alla funktioner som GEDCOM-standarden tillåter.
Multimedia
GEDCOM-standarden stöder inkludering av multimediaobjekt (till exempel foton av individer). Sådana multimediaobjekt kan antingen inkluderas i själva GEDCOM-filen (kallad "inbäddad form") eller i en extern fil där namnet på den externa filen anges i GEDCOM-filen (kallad "länkad form"). Att bädda in multimedia direkt i GEDCOM-filen gör det lättare att överföra data, eftersom all information (inklusive multimediadata) finns i en fil, men den resulterande filen kan bli enorm. Länkning av multimedia håller storleken på GEDCOM-filen under kontroll, men när filen överförs måste multimediaobjekten antingen överföras separat eller arkiveras tillsammans med GEDCOM till en större fil. Stödet för att bädda in media direkt togs bort i utkastet till 5.5.1-standarden.
Motstridig information
GEDCOM-standarden tillåter specificering av flera åsikter eller motstridiga data, helt enkelt genom att specificera flera poster av samma typ. Till exempel, om en individs födelsedatum antecknades som den 10 januari 1800 på födelseattesten, men den 11 januari 1800 på dödsattesten, skulle två BIRT-poster för den personen inkluderas, den första med den 10 januari 1800 och anger födseln. intyg som källa, och det andra med datum den 11 januari 1800 och anger dödsattesten som källa. Den föredragna posten listas vanligtvis först.
Det här exemplet kodat i GEDCOM kan se ut så här:
0 @I1@ INDI 1 NAMN John /Doe/ 1 FÖDSEL 2 DATUM 10 JAN 1800 2 SOUR @S1@ 3 DATA 4 TEXT Transkription från födelseattest skulle gå hit 3 OBS Denna födelsebok är att föredra eftersom den kommer från födelseattesten 3 KAJ 2 1 FÖDELSE 2 DATUM 11 JAN 1800 2 SOUR @S2@ 3 DATA 4 TEXT Avskrift från dödsattest skulle gå hit 3 KAJ 2
Motstridiga data kan också vara resultatet av användarfel. Standarden anger inte på något sätt att innehållet ska vara konsekvent. Ett födelsedatum som "10 APR 1819" kan av misstag ha registrerats som "10 APR 1918" långt efter personens död. Det enda sättet att avslöja sådana inkonsekvenser är genom noggrann validering av innehållsdata .
Internationalisering
GEDCOM-standarden stödjer internationalisering på flera sätt. För det första tillåter nyare versioner av standarden att data lagras i Unicode (eller, på senare tid, UTF-8), så text på vilket språk som helst kan lagras. För det andra, på samma sätt som du kan ha flera händelser på en person, låter GEDCOM dig ha flera namn för en person, så namn kan lagras på flera språk (även om det inte finns något standardiserat sätt att indikera vilken instans som är på vilket språk ). Slutligen, i den senaste versionen (5.5.1, ännu inte i stor användning), stöder fältet NAME också en fonetisk variant (FONE) och en romaniserad variant (ROMN) av namnet.
GEDCOM X
I februari 2012 vid konferensen RootsTech 2012, beskrev FamilySearch ett nytt stort projekt kring genealogiska standarder som kallas GEDCOM X, och bjöd in till samarbete. Den inkluderar programvara utvecklad under Apaches öppen källkodslicens . Det inkluderar dataformat som underlättar att basera släktträd på källor och register (både fysiska artefakter och digitala artefakter), stöd för att dela och länka data online och ett API.
I augusti 2012 släppte den FamilySearch- anställde och GEDCOM X-projektledaren Ryan Heaton påståendet att GEDCOM X är den nya industristandarden, och ompositionerade GEDCOM X som ett annat FamilySearch- projekt med öppen källkod .
Efter lanseringen av GEDCOM 7, positionerade FamilySearch GEDCOM X som användbar för samverkan med dess FamilySearch Family Tree-programvara.
Alternativ
Commsoft, författarna till Roots -serien av släktforskningsprogram och Ultimate Family Tree, definierade en version som kallas Event-Oriented GEDCOM (även känd som "Event GEDCOM" och ursprungligen kallad InterGED), som inkluderade händelser som förstklassiga (nollnivå) objekt . Även om det är händelsebaserat är det fortfarande en modell som bygger på antagen verklighet snarare än bevis. Event GEDCOM var mer flexibelt, eftersom det möjliggjorde en viss åtskillnad mellan trodda händelser och deltagarna. Event GEDCOM användes dock inte allmänt av andra utvecklare på grund av dess semantiska skillnader. [ citat behövs ] Eftersom Roots and Ultimate Family Tree inte längre är tillgängliga är det väldigt få som idag använder Event GEDCOM.
Gramps XML är ett XML -baserat öppet format skapat av släktforskningsprojektet Gramps med öppen källkod och används även av PhpGedView .
Family History Information Standards Organisation bildades 2012 med syftet att utveckla internationella standarder för släkthistoria och genealogisk information. En av de standarder som organisationen föreslog var Extended Legacy Format (ELF), kompatibel med GEDCOM 5.5(.1) men inklusive en utökningsmekanism. Organisationen begärde offentliga kommentarer om den föreslagna standarden 2017. Den drog tillbaka förslaget eftersom release 7.0 av GEDCOM tog upp många av organisationens problem.
Se även
- FamilySearch
- GENDEX – Genealogiskt register
- Genealogiska numreringssystem
- GNTP – Genealogy Network Transfer Protocol
- Tiny Tafel Format – kodat "förfäderbord"
externa länkar
- Allmän