Couplage de données / Couplage de probabilités
Le couplage de données, ou couplage des cas, est une méthode permettant de combiner deux ensembles de données existants lorsqu'il n'existe pas d'identifiant unique (par exemple, le numéro de sécurité sociale). Nous appliquons des méthodes probabilistes de couplage d'enregistrements pour identifier la probabilité que deux enregistrements appartiennent à la même personne, sur la base des informations disponibles dans les deux ensembles de données, comme les noms, la date de naissance, le sexe, la nationalité, l'adresse, etc. La méthode probabiliste de couplage des cas tient compte des fautes de frappe dans les noms, car les similitudes sont calculées. Pour les projets dans lesquels les noms ou d'autres informations d'identification ne sont pas autorisés à être transmis au centre de couplage, nous avons développé des méthodes de couplage d'enregistrements probabilistes préservant la vie privée, dans lesquelles les informations sensibles sont cryptées.