Künstliche Intelligenz
Künstliche Intelligenz[1] kann auf viele verschiedene Arten bei der Ahnen- und Familienforschung genutzt werden. Auf dieser Seite sollen solche Ansätze gesammelt und diskutiert werden.
Anwendungsfelder
Bei der genealogischen Arbeit gibt es eine Reihe von Tätigkeiten, die durch KI-Werkzeuge effizient unterstützt werden können. Der genealogische Prozess kann grob in die folgenden drei Tätigkeiten gegliedert werden
- Suchen und Sammeln (Auswerten von Quellen aller Art)
- Zuordnen, Behaupten und Bewerten
- Präsentieren und Archivieren.
Erkennung von Handschriften und alten Dokumenten
Mit einem System wie Transkribus lassen sich alte Texte erkennen und transkribieren. Dadurch entstehen Textdokumente, die das Durchsuchen von historischen Dokumenten möglich machen. Transkribus ist eine KI, die mit sehr vielen alten Texten trainiert worden ist, darunter befinden sich Dokumente mit Deutschen Handschriften (Kurrent, Sütterlin, Fraktur) sowie Schreibschriften und Druckschriften in verschiedenen Sprachen. Transkribus wird auch in einigen Projekten von CompGen eingesetzt.
Eine ähnliche, wenn auch interne, Anwendung verwendete Ancestry bei der Transkription des US Census von 1950. Innerhalb von nur 9 Tagen wurden die handschriftlichen Dokumente erfasst und über 150 Millionen durchsuchbare Datensätze erzeugt.[2]
FamilySearch nennt auf einer Wiki-Seite, dass sie mit Hilfe von "Computer Aided Indexing" mehr als 34 Millionen Bilder indiziert haben, die zu 174 Millionen Datensätzen führten (Stand 2022).
Verbesserung der Qualität von transkribierten Texten
Man kann mit einer text-basierten KI, wie etwa ChatGPT, die Qualität von transkribierten Texten verbessern, indem verbliebene Erkennungsfehler ausgemerzt werden. So wird aus einem durch OCR fehlerhaft erkannten "13aldur Schindler" etwa ein "Baldur Schindler".
ChatGPT kann Rechtschreibefehler, Worttrennungen an einem Zeilenende, falsche Satzzeichen, verwendete Abkürzungen und vieles mehr in sehr hoher Qualität auflösen. Allerdings müssen solche Änderungen dennoch sorgfältig überprüft werden, bevor sie übernommen werden.
Transkribieren von Audio- und Videoaufzeichnungen
Wenn man etwa mit Verwandten Interviews geführt hat und diese aufgezeichnet hat, können diese Inhalte mit einer KI-Funktion transkribiert und so für eine Suche oder die weitere Analyse erschlossen werden.
Übersetzung
KI-gestützte Übersetzungswerkzeuge können Ahnenforschern helfen, fremdsprachige Dokumente zu entschlüsseln und zu übersetzen. So kann man etwa lateinische Kirchenbuchtexte mit ChatGPT übersetzen lassen.[3]
Bearbeitung von Fotos
Der genealogische Web-Dienst MyHeritage nutzt Künstliche Intelligenz um Bilder zu bearbeiten.[4] So können etwa alte schwarzweiße Fotos nachträglich koloriert werden oder Fotos können in kleine Filme verwandelt werden in denen abgebildete Personen animiert werden.[5] So werden längst verstorbene Personen wieder lebendig, was gruselig sein kann.
Erzeugung von Avataren
Die KI Time Machine™ ist eine weitere Funktion auf MyHeritage, die Künstliche Intelligenz nutzt, um imaginäre Avatare (Bilder) einer Person zu erstellen, wie diese in verschiedenen Epochen der Geschichte ausgesehen haben könnte. Dazu nutzt sie echte Fotos der Person und verwandelt diese in hyperrealistische Avatare.
Es gibt KI-Webdienste, die aus Fotos und Sprachdateien einer (verstorbenen) Person einen Avatar erschaffen, mit dem man sich unterhalten kann. Wenn man diesen Avatar mit einer Person im FamilySearch-FamilyTree verknüpft, kann der Avatar Fragen zur näheren Familie aus Sicht der verstorbenen Person und mit ihrer Stimme und ihrem Video-Bild berichten. Ein kommerzielles Angebot dazu ist EmulateMe. Eine Anwendung von MyHeritage dazu ist Deep Story.[6]
Erzeugung von gesprochener Sprache mit einer künstlichen Stimme
Es ist möglich eine Person in einem von einer KI erzeugten Video Texte sprechen zu lassen, die sie nie gesagt hat. Dazu werden aus einer Stimmprobe der Person die charakteristischen Sprachmerkmale des Sprechers ermittelt. Sodann können der Person beliebige Texte in den Mund gelegt werden, die authentisch klingen. Wenn man etwa eine alte Tonaufzeichnung eines verstorbenen Verwandten hat, kann diese Technik dazu verwendet werden, dass die Biografie des Verwandten mit seiner Stimme vorgetragen wird.
Gesichtserkennung
Die Gesichtserkennungstechnik kann Fotos analysieren und sie mit anderen Bildern in einer Datenbank abgleichen. Diese Technik kann auch verwendet werden, um unbekannte Vorfahren in alten Familienfotos zu identifizieren.
Erkennung des Aufnahmedatums einer Fotografie
MyHeritage bietet eine Funktion an (PhotoDater™), die das Aufnahmedatum einer Fotografie schätzt und dieses mit einer Genauigkeit von rund fünf Jahren angibt. Dazu werden Bildelemente wie Kleidung, Haartracht, etc. von einer KI analysiert.[7]
Erkennung von genealogischen Daten in einer Abbildung
Mit einer KI wie ChatGPT kann man genealogische Daten aus einer Abbildungen extrahieren. Man kann gedruckte Stammbäume aus einem Buch in eine GEDCOM-Datei überführen. Auch Stammtafeln in der Form eines Fächerdiagramms lassen sich automatisch auswerten. Wenn man eine Todesanzeige mit dem Smartphone fotografiert, kann man die dort vorgefundenen Angaben direkt in eine kleine Geschichte in erzählender Form überführen, die die noch lebenden Familienangehörigen vorstellt. Auf Bildern von Grabsteinen lassen sich die Inschriften transkribieren, das wird bei BillionGraves eingesetzt.[8]
DNA-Analyse
Eine KI kann DNA-Testergebnisse analysieren, um genetische Übereinstimmungen zu finden und Beziehungen zwischen Familienmitgliedern zu identifizieren.
Suche nach genealogischen Quellen
Eine KI wie ChatGPT ist nicht gut geeignet als Suchmaschine bei der Suche nach Vorfahren genutzt zu werden, da sie dazu neigt zu halluzinieren, wenn sie die Antwort auf eine Frage nicht weiß; ggf. werden sogar angebliche Quelle täuschend echt dazu erfunden. Man kann aber PlugIn-s in ChatGPT installieren, die dann historische Archive durchsuchen und die Treffer für die weitere Auswertung durch diese KI verwendbar machen.[9]
Die Anwendung AI Record Finder™ von MyHeritage erlaubt eine interaktive Suche nach Quellen zu Personen im Stammbaum. Dabei werden nur diejenigen Quellen gefunden, die auch ansonsten bei MyHeritage zur Verfügung stehen, aber der interaktive Zugang und die Möglichkeit die gefundenen Angaben gleich in den Stammbaum zu integrieren ist für Anfänger sicherlich sehr interessant.[10]
Zuordnung von Angaben in Quellen zu Personen, Daten und Orten
Große Anbieter von Genealogiediensten wie FamilySearch, Ancestry und MyHeritage unterstützen ihre Nutzer bei der Zuordnung von Quellen zu Personen in einem Stammbaum des Nutzers. Ob die dabei verwendeten Programme auf einer KI basieren oder in herkömmlicher Weise algorithmisch programmiert worden sind, ist weitgehend ein jeweiliges Firmengeheimnis.
FamilySearch bietet mehrere Stammbäume an, die von einer KI automatisch aus Quellen erzeugt worden sind. Diese enthalten jeweils mehre Hunderttausende von Personen.
Auswertung von Texten zur Ermittlung genealogisch relevanter Angaben
Längere Texte, wie Biografien, Ortschroniken oder Gerichtsprotokolle, enthalten oft auch Informationen, die für eine Genealogie relevant sein können. Diese Daten aus den oft langen Texten zu destillieren, kann sehr mühsam sein. Daher bietet es sich an, die Texte durch eine KI, wie etwa ChatGPT, lesen und auswerten zu lassen. Mit geeigneten "Prompts" lassen sich so Tabellen erzeugen, die alle Personen in einem Text mit den zugehörigen Daten und Ereignissen auflisten. Ähnliches gilt für Todesanzeigen oder Zeitungsartikeln zu Familienereignissen. Eine KI kann die darin erwähnten Personen und ihre Beziehungen zueinander analysieren und tabellarisch aufbereiten. Diese Tabellen können dann automatisch in das GEDCOM-Format umgesetzt und in einem Genealogieprogramm weiter verarbeitet werden. Ein Beispiel zur Auswertung eines Artikels über eine besonders lange Heiratskette findet sich hier.
Eine textbasierte KI kann längere Texte auch zusammenfassen oder kann interaktive Fragen zu einem längeren Dokument beantworten. Man kann sich durch eine KI wie ChatGPT auch ein Programm erstellen lassen, das längere Texte auswertet und dann zum Beispiel eine Konkordanz erstellt, eine alphabetisch geordnete Liste der wichtigsten Wörter und Phrasen im Text.[11]
Man kann mit einer textbasierten KI auch andere Quellen, wie etwa historische Ortsverzeichnisse, auswerten und dann daraus Informationen gewinnen, die in das GOV per GOV-Quicktext eingepflegt werden können.
Erstellung einer GEDCOM-Datei aus einer Tabelle
Wenn man, wie im vorherigen Punkt beschrieben, aus einem Text mit ChatGPT eine Tabelle von Personen, Daten und Ereignissen destilliert hat, kann man diese Tabelle durch ChatGPT direkt in das GEDCOM-Format überführen lassen. Dann lässt sich das Ergebnis direkt in einem beliebigen Genealogieprogramm weiter analysieren, mit zusätzlichen Daten anreichern und natürlich auch als Stammbaum visualisieren.
Erstellung eines erzählenden Berichts aus einer GEDCOM-Datei
Eine KI, wie etwa ChatGPT, kann eine GEDCOM-Datei analysieren und daraus einen erzählenden Bericht zu den aufgeführten Personen erstellen. Dieser Bericht kann in seinem Sprachstil an die Bedürfnisse eines Nutzers angepasst werden. Es ist darauf zu achten, dass die KI keine Ereignisse zu den in der GEDCOM-Datei enthaltenen Angaben hinzuerfindet, also nicht halluziniert. Die Anwendung AI Biographer™ von MyHeritage nutzt Informationen aus Stammbäumen und historischen Aufzeichnungen zusammen mit KI-generierten Inhalten, um eine Erzählung über das Leben einer Person zu erstellen.[12]
Erstellung von Illustrationen für genealogische Berichte
Zur Erstellung von Abbildungen gibt es diverse KI-Anwendungen, die etwa fotorealistische Abbildungen erzeugen können oder Stammbäume in grafischer Form darstellen können. Solche Abbildungen können dann auf Webseiten, in genealogischen Berichten oder Büchern verwendet werden; sie sollten, als von einer KI erzeugt, gekennzeichnet werden.
Erstellung von Büchern
KIs wie etwa ChatGPT können auch dazu verwendet werden, Artikel und auch Bücher zu verfassen. Es ist nicht bekannt, ob solche Dokumente im Bereich der Ahnen- und Familienforschung bereits publiziert worden sind. Auch Artikel für das GenWiki oder CompGen-Blog-Beiträge können in Zusammenarbeit mit einer KI wie ChatGPT erstellt oder illustriert werden. Fragen zu Open Access und Urheberrecht sind derzeit noch in Diskussion. Es gibt keine Regeln, ob solche Beiträge einer KI hier im GenWiki speziell gekennzeichnet werden sollen. In der Wikimedia-Gemeinschaft werden derzeit diese Fragen intensiv und kontrovers diskutiert.[13]
Zukünftige Anwendungsfelder
Expertensystem für Fragen zur Ahnen- und Familienforschung
Es ist denkbar, eine KI mit Inhalten etwa aus dem GenWiki oder mit Inhalten aus den CompGen-Datenbanken zu trainieren. Wobei es nicht klar ist, ob das nicht bereits erfolgt ist, da etwa das GenWiki öffentlich zugänglich ist. Zumindest kann ChatGPT schon sehr gut auf "Erkläre mir bitte Ahnenschwund." antworten.
Darüber hinaus könnte man z.B. ein Plug-In zu GOV für ChatGPT entwickeln, so dass diese KI danach bei allen Fragen rings um historische Ortsdaten auf die in GOV gespeicherten Informationen zurückgreifen kann. Einfache Fragen wie "Welche Dörfer sind in Mönchengladbach aufgegangen?" beantwortet ChatGPT schon ganz gut, aber bei komplizierteren Fällen muss diese KI derzeit noch passen.
Natürlichsprachige Schnittstelle zu Ahnendatenbanken
Wenn eine KI auf Grundprinzipien und -begriffe zur Ahnen- und Familienforschung trainiert worden ist, könnte man sie als natürlichsprachige Schnittstelle zu einem privaten oder einem öffentlichen Datenbestand, etwa einem der Weltbäume nutzen. Sie könnte dann etwa folgende Fragen beantworten
- Wann ist meine Tante Erika geboren?
- Mit wem war Großonkel Siegfried verheiratet?
- Welche meiner Cousinen haben in der nächsten Woche Geburtstag?
- Nenne mir alle Nachkommen von Martin Luther, die in diesem Jahrzehnt in den den USA gestorben sind.
Erste Versuche dazu wurden unter Nutzung des Dienstes dante-ai bereits unternommen. Ein kommerzielles Angebot ist EmulateMe.
Vorteile
Im wesentlichen liegen die Vorteile beim Einsatz einer KI in den zu erzielenden Effizienzvorteilen. Aufgaben, die bisher entweder sehr viele Arbeitskräfte benötigen oder sehr lange dauern, lassen sich beim Einsatz einer KI erheblich effizienter umsetzen. Die erzielbaren Faktoren liegen im Bereich bis zu 100. Dadurch werden Arbeiten, die bisher aus Gründen mangelnder Ressourcen nicht machbar waren, nun machbar.
Risiken
Genealogie lebt davon, dass alle Aussagen und Schlussfolgerungen durch zuverlässige Quellen belegt sind. Genealogie ohne Quellen ist - wie man so schön sagt - Mythologie. Künstliche Intelligenz kann nun aber Quellen erfinden, die absolut echt aussehen, es aber nicht sind. Bei Text-basierten KIs, wie etwa ChatGPT, spricht man davon, dass die KI halluziniert, wenn sie Angaben oder Quellen einfach erfindet. Das liegt in der Natur dieser Art von KI, da sie kein faktenbasiertes Basiswissen verwendet, sondern nur "wahrscheinliche" Abfolgen von Wörtern und Sätzen erzeugt. Anwendungen, die fotorealistische künstliche Bilder und Filme erzeugen, können eventuell später einmal nicht mehr von tatsächlichen Quellen unterschieden werden. Daher ist eine Kennzeichnung von Inhalten, die von einer KI erzeugt wurden, sehr wichtig.
Was sagt ChatGPT selbst dazu?
Auf die Frage "Wie kann eine KI - wie Du - bei der Ahnen- und Familienforschung helfen?" antwortet ChatGPT 3.5 am 10.04.2023:
Als KI kann ich auf verschiedene Weise bei der Ahnen- und Familienforschung helfen:
- Datenanalyse und -verarbeitung: Ich kann große Mengen an Daten schnell und effektiv analysieren und verarbeiten, was bei der Durchführung von Ahnen- und Familienforschung hilfreich sein kann. Ich kann beispielsweise Stammbäume erstellen, Verbindungen zwischen Personen aufdecken und genealogische Daten aus verschiedenen Quellen extrahieren.
- Datensuche und -beschaffung: Ich kann bei der Suche nach relevanten genealogischen Daten und Informationen aus verschiedenen Quellen helfen. Ich kann beispielsweise öffentlich zugängliche Datenbanken, Archive und Bibliotheken durchsuchen und die relevanten Informationen für die Forschung zusammentragen.
- Unterstützung bei der Entscheidungsfindung: Ich kann bei der Entscheidungsfindung helfen, indem ich verschiedene Szenarien modelliere und visualisiere, um die besten Entscheidungen zu treffen. Ich kann beispielsweise dabei helfen, zu entscheiden, welcher Zweig eines Stammbaums am aussichtsreichsten ist, um weiter zu erforschen.
- Automatisierung von Aufgaben: Ich kann viele manuelle Aufgaben automatisieren, was Zeit und Ressourcen spart. Ich kann beispielsweise automatisch Stammbäume erstellen, die Verbindungen zwischen Personen identifizieren und Ahnenlinien verfolgen.
Es ist jedoch wichtig zu beachten, dass eine KI allein nicht in der Lage ist, alle Aspekte der Ahnen- und Familienforschung zu bewältigen. Erfolgreiche Forschung erfordert oft auch menschliche Expertise und Urteilsvermögen, insbesondere wenn es um Interpretation und Analyse von Daten geht. Eine KI kann jedoch eine wertvolle Unterstützung und Ergänzung sein.
Was dabei auffällt: die derzeit wichtigsten Anwendungsfelder (Erkennung von Handschriften und Bildbearbeitung) werden überhaupt nicht genannt, stattdessen werden vier eher generische Antworten erzeugt.
Am 9.06.2023 antwortet ChatGPT 4 auf die selbe Frage:
Als KI kann ich auf verschiedene Weisen bei der Ahnen- und Familienforschung helfen. Hier sind einige Beispiele:
- Suche und Analyse von Online-Informationen: Ich kann online nach relevanten Informationen suchen, die zu deiner Familien- und Ahnenforschung beitragen können. Dies könnte beinhalten, Datenbanken mit genealogischen Aufzeichnungen zu durchsuchen, historische Dokumente zu finden oder soziale Medien für Hinweise auf entfernte Verwandte zu durchsuchen.
- Organisation von Informationen: Sobald Informationen gesammelt sind, kann ich helfen, diese zu organisieren. Zum Beispiel könnte ich dabei helfen, einen Stammbaum zu erstellen oder bestehende Informationen in einer übersichtlichen und zugänglichen Weise zu katalogisieren.
- Analyse alter Fotos: Mit Hilfe von KI-Technologien können alte Familienfotos analysiert werden, um Personen zu identifizieren, das Alter des Fotos zu schätzen oder sogar die Farben in alten Schwarzweißfotos zu rekonstruieren.
- Transkription und Übersetzung: Ich kann helfen, alte Handschriften zu transkribieren oder Texte in andere Sprachen zu übersetzen, die für deine Forschung relevant sein könnten.
- Erkennung von Mustern und Verbindungen: Durch die Analyse großer Mengen von Daten kann ich dabei helfen, Muster und Verbindungen zu erkennen, die sonst möglicherweise übersehen würden. Dies könnte dazu beitragen, entfernte Verwandte zu finden oder Einblicke in die Migrationsmuster deiner Vorfahren zu gewinnen.
- Aufklärung über genetische Gesundheitsinformationen: Wenn du genetische Gesundheitsinformationen hast, kann ich dabei helfen, diese zu interpretieren und zu erklären, was sie für dich und deine Familie bedeuten könnten.
Es ist jedoch wichtig zu beachten, dass ich als KI immer auf die Datenschutzbestimmungen achten muss. Jegliche Informationen, die zur Familienforschung genutzt werden, sollten mit Sorgfalt und Respekt für die Privatsphäre und die Rechte aller beteiligten Personen behandelt werden.
Nun werden die Erkennung von Handschriften und die Bildbearbeitung genannt und es erfolgt ein Hinweis auf den Datenschutz. Das ganze klingt nicht mehr generisch, sondern ist deutlich konkreter.
Weitere Informationen
- CompGen Diskussionsforum Discourse zu KI
- „ChatGPT in der Genealogie mit praktischen Beispielen" von Hermann Hartenthaler: YouTube
- „ChatGPT hilft Einsteigern - Basiswissen für Ahnenforscher mit Hilfe künstlicher Intelligenz?“ von Georg Palmüller: Discourse und YouTube
- Facebook Gruppe: Genealogy and Artificial Intelligence
- AI Genealogy Insights
Literaturverzeichnis
- Hartenthaler, Hermann "Künstliche Intelligenz in der Genealogie - Wie könnte KI die Genealogie verändern?", in COMPUTERGENEALOGIE 1/2024, 39. Jahrgang, S. 6.
- Albrecht, Steffen "ChatGPT und andere Computermodelle zur Sprachverarbeitung – Grundlagen, Anwendungspotenziale und mögliche Auswirkungen", TAB-Hintergrundpapier, 2023, ISSN-Internet: 2199-7136.
Einzelnachweis
- ↑ Artikel Künstliche Intelligenz. In: Wikipedia, Die freie Enzyklopädie.
- ↑ siehe Blog-Beitrag bei Ancestry
- ↑ Discourse-Kategorie "oberschwaben-l" / Thema "Lesehilfe Latein"
- ↑ MyHeritage InColor™
- ↑ MyHeritage Deep Nostalgia™
- ↑ MyHeritage Deep Story
- ↑ siehe Blog-Beitrag im Familienarchiv Stein
- ↑ siehe Blog-Beitrag bei CompGen "Einsatz von Künstlicher Intelligenz bei BillionGraves verbessert die Erfassung von Grabsteininschriften"
- ↑ siehe Blog-Beitrag bei CompGen "ChatGPT kann auf Open Archives zugreifen."
- ↑ MyHeritage AI Record Finder™
- ↑ Steve Little: ChatGPT "Washington Will Concordance", 8.01.2024
- ↑ MyHeritage AI Biographer™
- ↑ siehe Blog-Beitrag bei wikimedia