Un problème de RDM (gestion de la nomenclature)

Aujourd’hui je voudrais parler de RDM (Reference Data Management), i.e. gestion de la nomenclature dans les systèmes informatiques.

Au fond, qu’est ce vraiment une nomenclature ? C’est une classification méthodique et globalement partagé définie par autorité dans un domaine donné.

À titre d’exemple, regardons du côté de nos ami(e)s chimistes. Pour eux, la nomenclature proposée par l’IUPAC, une organisation centenaire spécifiquement créé pour cela, cherche à définir des noms de composés chimiques sans ambivalence, un même nom ne doit jamais servir à désigner deux composés chimiques différents.

C’est pareil dans l’informatique. La nomenclature cherche à classifier des objets métier ou des processus. Certains définissent la nomenclature (Reference Data) comme une partie du référentiel (Master Data). Contrairement à celui-ci, la nomenclature, par nature, se change bien plus lentement avec une valeur ajoutée finalement assez faible pour la société. Pour revenir à notre exemple, l’organisation IUPAC ne change pas tous les ans la classification utilisée par les chercheurs en chimie, imaginez un instant le bazar potentiel. La stabilité est le maître mot d’une nomenclature.

Pour être franc, il n’existe pas de limite exacte entre le « transactionnel », le « référentiel » et « la nomenclature », c’est plus diffus :

La théorie de RDM nous dit qu’il existe une nomenclature :

  • externe :
    • pays, états, etc – via le standard ISO ;
    • classification des sociétés – via SIC, NAF ;
    • classification des produits – via UNSPSC ;
    • devises ;
    • etc
  • interne :
    • régions de vente ;
    • secteurs d’industrie ;
    • statuts des clients ;
    • listes des compétences ;
    • etc.

C’est superbe, maintenant je sais tout à propos du RDM…

Prenons dans un cas qui illustre notre propos : le passeport d’un citoyen russe, et plus précisément son lieu de naissance :

USSR / URSS ? Mais ça n’existe plus ! Pourtant, dans le passeport, la notion est parfaitement correcte du point de vue historique (en même temps, pour des raisons politiques, vous ne trouverez pas la même mention sur les passeports ukrainiens, tchèques ou slovaques.

Mais ce n’est pas encore tout :

  • Royaume-Uni est un pays (avec un code ISO 3166-1 « GB »),
    • Angleterre est aussi un pays, mais fait partie de Royaume-Uni et n’a pas de code ISO 3166-1,
  • Chine est un pays (a un code ISO 3166-1 « CN »),
    • Hong Kong n’est pas un pays (c’est un SAR), mais a un code ISO 3166-1 « HK ».
  • Union Européen n’est pas un pays (encore ?), mais il existe un code « EU » réservé dans le standard ISO…
Image result for bsod kernel

Ces exemples nous montrent que la nomenclature (même externe, même existante sous la forme d’un standard international) n’est pas une « vérité absolue » car il existe le contexte d’utilisation, le « rôle » de la nomenclature.

Il vous faudra conserver plusieurs copies de la nomenclature « pays » pour pouvoir garder la référence aux objets géographiques et pour pouvoir saisir correctement les données personnelles… mais ce n’est pas tout.

Supposons que vous avez une société internationale qui a des bureaux en France, Etats-Unis, Chine, etc. Vous avez décidé de mettre en place la gestion unifiée de la nomenclature pour les adresses (pour pouvoir transmettre les biens) et vous avez pris ISO comme référence. Par contre, pour une raison ou une autre, quand vous envoyez les courriers entre la Chine (CN) continentale et le Hong Kong (HK), ils n’arrivent pas toujours… il peut se passer que c’est à cause de fait que Chine n’accepte pas l’indépendance de Hong Kong ? Il se trouve que vous allez devoir vous adapter aux régimes politiques des pays, avec lesquels vous souhaitez faire du business. Est-ce que dans ce contexte le RDM universel est possible ? Probablement, la solution sera de sous-diviser les pays aux régions et adresser ce problème comme un sujet « d’internationalisation »…

Supposons encore que votre business grandit et vous gagnez le marché de transport de British Petroleum. Maintenant vous devez delivrer les biens aux plateformes qui se trouvent… au milieu de nulle part. Que va-t-il se passer avec votre nomenclature ?

Je crois vraiment qu’il est toujours possible de mettre en place un RDM qui fonctionne, mais je pense que vous n’allez pas pouvoir prendre des listes déjà prêtes et clore aussi facilement le sujet. Ce n’est pas la question de tel ou tel outil, dans lequel vous allez gérer la nomenclature – c’est une question de définitions métier et de data gouvernance.

Bonne santé à vous et à vos référentiels.

2 commentaires

  1. Pingback: La consolidation de données : l’unification du modèle – Ordre d'informaticiens

  2. Pingback: Problèmes de modélisation : rôles – Ordre d'informaticiens

Commentaires ne sont pas disponibles.