GEDCOM/UID

aus GenWiki, dem genealogischen Lexikon zum Mitmachen.
Zur Navigation springen Zur Suche springen

In GEDCOM-Dateien werden UID eingesetzt, um einen Datensatz eindeutig identifizieren zu können.[1] Eine UID ist 128 Bit lang und wird zufällig erzeugt. Bei der Länge einer UID ist es praktisch ausgeschlossen, dass zwei unabhängig voneinander erzeugte UID gleich sind.[2]

Das kann nun wie folgt genutzt werden: Wenn ein Datensatz (z.B. für eine Person) in einem Genealogieprogramm neu angelegt wird, erzeugt dieses zu diesem Datensatz eine UID. Wird der Datensatz nun exportiert und an anderer Stelle weiter verwendet und bearbeitet, ist über die UID immer noch erkennbar, dass der Datensatz vom ursprünglich erzeugten Datensatz abgeleitet wurde. Die UID weist also über Exporte, Bearbeitungen und Datensatzverschmelzungen in verschiedenen Programmen hinweg darauf hin, dass der Datensatz dasselbe Objekt (z.B. eine Person) beschreibt.

In Online-Datenbanken kann man das nutzen, um eine Person auch nach Updates oder bei ihrer Einstellung in verschiedene Datenbanken eindeutig wieder zu finden: Trotz der Änderungen bezüglich genealogischer Daten ist die UID immer noch dieselbe. Datenbank-Systeme wie GEDBAS und Online-OFB nutzen das, um dem Anwender das Wiederfinden der Personen zu ermöglichen.

Voraussetzungen für das Funktionieren ist, dass die Programme beim Import die UID für die Datensätze unverändert lassen und beim späteren Export sie genau so wieder exportieren, wie sie im Import vorgefunden wurden. Der neueste Stand des GEDCOM Standards (7.0)[3] hat dazu das GEDCOM-Kennzeichen UID in den Standard aufgenommen. Davor wurde es aber bereits seit langem in verschiedenen Genealogieprogrammen als nutzerdefiniertes Kennzeichen _UID verwendet. Durch die lange Historie trifft man in GEDCOM-Dateien auf durchaus verschiedene Darstellungen einer UID, teils mit unterschiedlicher Länge, mit und ohne Prüfkennziffern, unter Verwendung von Groß- oder Kleinbuchstaben, manchmal auch mit einem "-" Zeichen zur Untergliederung.

Eine UID kann nicht nur für Personendatensätze verwendet werden. Alle Datensatzarten in einer GEDCOM-Datei wie Quellen, Familien, Medienobjekte, Archive können mit einer UID eindeutig gekennzeichnet werden. Einem Datensatz können mehrere UID zugeordnet sein. Das kommt immer dann vor, wenn zwei Datensätze verschmolzen wurden, die zuvor unabhängig voneinander erzeugt worden sind.

Eine weitere Voraussetzung ist, dass Anwender nie einen bereits bestehenden Datensatz umfunktionieren, weil sie die alte Person (z.B. Max Müller) nicht mehr brauchen und diesen Datensatz nun einfach durch Überschreiben aller Daten zu einem Moritz Meyer machen. Für eine neu einzugebende Person muss immer ein frischer Datensatz mit einer für diesen Datensatz erzeugten UID eingesetzt werden!

Einzelnachweise

  1. siehe RFC 4122 der IETF im Artikel Internet Engineering Task Force. In: Wikipedia, Die freie Enzyklopädie.
  2. siehe Artikel Universally Unique Identifier#Kollisionen. In: Wikipedia, Die freie Enzyklopädie.
  3. siehe GEDCOM Standard 7.0