Mon compte Je m'abonne
logo Fiches pratiques

Pourquoi la qualité des données est un enjeu clé ?

Publié par Didier Richaudeau le | Mis à jour le
Pourquoi la qualité des données est un enjeu clé ?

La qualité des données est un enjeu de toute société qui exploite intelligemment ses données. Paradoxalement, ce sujet est souvent traité à la légère, car il est potentiellement coûteux, sans fin, peu attractif. Pourtant, il a un impact majeur sur la performance de vos actions data-driven !


La qualité des données est un enjeu de toute société qui exploite intelligemment ses données. Paradoxalement, ce sujet est souvent traité à la légère, car il est potentiellement coûteux, sans fin, peu attractif. Pourtant, il a un impact majeur sur la performance de vos actions data-driven ! Avec la multiplication des usages de la donnée, ce sujet est amené à devenir central dans beaucoup d'entreprises !


La qualité de la donnée : un enjeu croissant pour les entreprises

Les problématiques autour de la qualité de données sont devenues critiques avec l'expansion des usages de la donnée et la mise en place d'infrastructure de type datalake, centralisant au même endroit l'ensemble des problèmes de qualité des systèmes sources. Avec l'accélération de la transformation data, ce sujet devient critique car il impacte directement la performance des cas d'usages déployés et donc le ROI des initiatives data.

Sur les activités marketing et vente, l'impact d'une mauvaise qualité de données se voit à plusieurs niveaux. Tout d'abord la performance commerciale est réduite : des cibles moins nombreuses car peu de contacts sont réellement sollicitables, un taux de délivrabilité réduit dépendant de la qualité des emails, adresses, téléphones collectés, un impact des communications amoindri si les ciblages ou la personnalisation est basée sur des critères mal renseignés comme la langue, le genre où l'âge. Elle impacte aussi l'efficacité opérationnelle, en suscitant des appels au service client ou en allongeant le temps de traitement des forces commerciales et de relation client. Cela a par ailleurs, un impact direct sur la satisfaction client et l'image de marque. Sur certaines campagnes fondées sur des données erronées ou incomplètes, la perte peut se chiffrer en millions d'euros. La gestion de la qualité doit donc être perçue comme un réel levier de performance et non un centre de coût.

Un enjeu transversal à l'entreprise qui requiert une gouvernance globale

Comme il est très difficile de concevoir tous ses systèmes selon les principes du « quality by design » initiée dans l'industrie pharmaceutique, l'enjeu est de les faire évoluer en ce sens, en intégrant des outils qui assistent la saisie ou des formulaires structurés : on améliore ainsi progressivement la qualité de la donnée collectée. En complément, des outils de monitoring de la qualité doivent être mis en place sur toute la chaîne de collecte et de traitement de la donnée afin de détecter au plus vite les problèmes et réaliser le diagnostic : rupture dans la collecte, non respect d'une norme ou d'une contrainte légale, bug sur une transformation de données....

Pour ce faire, la mise en place d'une gouvernance centralisée est incontournable : une seule personne dans l'entreprise ne peut clairement pas assumer la responsabilité du pilotage et de la résolution des problèmes de qualité. Soit la gouvernance qualité s'inscrit dans une gouvernance data existante, soit, la gouvernance qualité doit s'intégrer à la gouvernance business & IT existante. Il s'agit d'animer et coordonner les initiatives pour améliorer la qualité, mais aussi anticiper les évolutions de systèmes amenées à modifier ou enrichir la donnée collectée. Des relais qu'ils soient fonctionnels ou techniques, domain owner, solution owner, data stewards, seront identifiés dans chaque division pour veiller à la qualité et résoudre les problèmes rencontrés.

Définir ses priorités, le 2nd enjeu pour rapidement maximiser le ROI de la qualité

Le champ des possibles étant très large, le périmètre et les priorités se doivent d'être très claires. Plusieurs stratégies sont possibles : par exemple les données personnelles clients ou les données financières. D'autres aligneront les priorités sur les nouveaux cas d'usage. Par exemple, si le cas d'usage sur la détection de la fraude est prioritaire d'un point de vue business, il doit s'accompagner d'un plan d'amélioration de la qualité des données nécessaires. C'est le meilleur moyen de mobiliser tout le monde et de trouver les sources de financement associées à un projet DQM.

Les outils pour mieux gouverner la qualité de donnée, aide mais ne sont que des outils !

Les outils de DQM (data quality management), Data Catalog, Data Lineage... se sont développés pour mieux répondre à la demande d'une meilleure gouvernance de données. La mise en place de ces outils peut faciliter la mise en place de la gouvernance. En revanche, ils n'apporteront une réelle valeur ajoutée que si celle-ci est claire et validée, et si l'ensemble des acteurs ayant un rôle dans la chaîne de traitement de la donnée sont réellement mobilisés sur l'enjeu d'amélioration de sa qualité.

Les impacts de l'amélioration de la qualité doivent être mesurées et quantifiées via des AB tests, ou via des comparaisons de performance avant/après pour soutenir la mobilisation pérenne de chacun : revenus additionnels, amélioration du ROI des campagnes, réduction du risque, gain de temps au service client tout se mesure finalement, même l'impact de la qualité sur le business !


Cette contribution vous a été proposée par Didier Richaudeau, associé chez Equancy en charge des activités data, membre du Turing Club.