|
La création de doublons
Si nous recherchons un client existant dans un fichier et que nous ne le retrouvons pas immédiatement, la probabilité est grande que nous allons l’encoder comme ´nouveau´ dans la base de données. C’est ainsi que des doublons apparaissent. Si un client existant se manifeste sous le nom du partenaire, la probabilité que nous ne retrouvons pas de données d´identification et que nous allons créer un nouvel enregistrement est grande. La même chose se passe avec les personnes qui ont déménagé. Sans changement d´adresse, vous perdez toute possibilité de contact avec le client qui a déménagé.
|
 |
La fusion des doublons
Lorsque des données de la clientèle doivent être échangées avec d´autres systèmes ou bases de données, le problème des doublons se pose à nouveau. Dans les datawarehouses, les données de différents fichiers sources sont fusionnées. Dans ce cas aussi, il est important d´établir correctement les correspondances.
Une recherche interne de doublons avec un maximum de clefs discriminantes est la seule à donner des résultats réellement satisfaisants pour résoudre ce problème.
|
 |