La consolidation de données : rapprochement

Cet article est la suite de notre série concernant la consolidation de données. Aujourd’hui, nous allons parler de rapprochement (identification de doublons, record linkage). Nous avions déjà évoqué le sujet il y a quelques temps (https://ithealth.io/rapprochement-de-donnees/, https://ithealth.io/dont-do-it-la-cle-fonctionnelle-business-key/), mais aujourd’hui, nous allons faire une révision des méthodes existantes tout en analysant …

Use case : Data Hub de synchronisation

Il était une fois une organisation qui avait besoin d’un Data Hub. La situation était d’apparence classique : plusieurs systèmes; un processus fonctionnel; besoin de synchroniser les systèmes plus ou moins en « temps réel humain »; time to production – « hier » (on a eu 3 à 5 semaines pour la v1 …