Datenverknüpfung / Wahrscheinlichkeitsverknüpfung

Die Datenverknüpfung bzw. Record Linkage ist eine Methode zur Kombination zweier bestehender Datensätze, wenn kein eindeutiger Identifikator (z. B. eine Sozialversicherungsnummer) verfügbar ist. Wir wenden probabilistische Datensatzverknüpfungsmethoden an, um die Wahrscheinlichkeit zu ermitteln, dass zwei Datensätze zu derselben Person gehören. Die Wahrscheinlichkeiten werden auf der Grundlage der in beiden Datensätzen verfügbaren Informationen wie Name, Geburtsdatum, Geschlecht, Nationalität, Adresse usw. berechnet. Die probabilistische Datensatzverknüpfungsmethode berücksichtigt Tippfehler in Namen. Für Projekte, bei denen Namen oder andere identifizierende Informationen nicht an das Verknüpfungszentrum übermittelt werden dürfen, haben wir datenschutzkonforme probabilistische Datensatzverknüpfungsmethoden entwickelt, bei denen sensible Informationen verschlüsselt werden.