Skip to main content

La confiance dans les données est devenue plus importante que jamais à l’ère de l’IA. Avec la dépendance croissante vis-à-vis des données pour alimenter l’IA générative et d’autres applications d’intelligence artificielle, les organisations doivent évaluer leurs stratégies et cadres de gestion des données afin de mieux soutenir ce nouvel environnement en évolution.

La confiance dans les données garantit la fiabilité et l’exactitude des données d’une organisation. Il ne s’agit pas seulement d’investir dans des outils individuels d’observabilité, de catalogage ou de gouvernance — il s’agit de mettre en place un cadre complet qui garantit l’intégrité des données tout au long de la chaîne de valeur.

Par exemple, une entreprise de vente au détail qui utilise l’IA pour le marketing personnalisé doit s’assurer que ses données clients sont exactes et à jour pour éviter de cibler les mauvais segments démographiques avec des produits inappropriés.

Want more from The CTO Club?

Create a free account to finish this piece and join a community of CTOs and engineering leaders sharing real-world frameworks, tools, and insights for designing, deploying, and scaling AI-driven technology.

This field is for validation purposes and should be left unchanged.
Name*

Le défi des systèmes hérités

Le principal défi réside dans le fait que les technologies traditionnelles atteignent souvent leurs limites face à l’ampleur et à la complexité des écosystèmes de données modernes. Ces approches anciennes rencontrent des difficultés concernant la qualité des données, l’observabilité, le catalogage et la gouvernance — des aspects critiques qui restent fréquemment cloisonnés et désorganisés dans les systèmes hérités. Cette fragmentation peut entraîner des incohérences de données, des défis de gouvernance et un risque accru. 

Par exemple, une institution financière comme Equifax utilisant des systèmes obsolètes peut rencontrer des difficultés pour maintenir une qualité de données cohérente à travers différents services, ce qui peut conduire à des erreurs dans les rapports de conformité ou les prévisions financières.

Brian Weiss, Directeur technique, Hyperscience

Brian Weiss, Directeur technique, Hyperscience

“Établir la confiance dans les données est l’un des principaux obstacles à l’expansion de l’IA. La plupart des données d’entreprise sont non structurées et ne sont pas immédiatement exploitables par les systèmes d’IA. Bien que de nombreux outils prétendent résoudre ce problème, les organisations doivent garantir l’exactitude des données avant de les intégrer aux systèmes d’IA.

 

Les mécanismes d’ancrage, tels que les architectures RAG, exigent des données précisément étiquetées pour produire des résultats fiables et corrects. L’utilisation du ML pour créer des connexions entre les données embarquées souligne encore davantage la nécessité de disposer de données de qualité, compte tenu de l’impact considérable qu’une mauvaise qualité des données peut avoir sur les systèmes en aval.

 

Je crois que d’enseigner à GenAI le langage spécifique de votre entreprise, en s’appuyant sur des données de référence au cœur de l’organisation, est essentiel pour favoriser l’adoption et libérer la valeur. C’est particulièrement pertinent alors que les organisations passent des expérimentations GenAI à des projets générant un véritable ROI.”

Le cadre de maturité de la confiance dans les données

Pour relever ces défis et bâtir une base solide pour le succès de l’IA, les organisations devraient envisager d’adopter un cadre de maturité de la confiance dans les données, qui offre une feuille de route pour évoluer des premiers stades de la gestion des données à un écosystème de gouvernance de données sophistiqué et évolutif. 

Cette feuille de route comprend :

  • Phase initiale : les organisations se concentrent sur la gestion des métadonnées et les tests manuels des principaux actifs. Bien que réactif, ce stade est crucial pour poser les bases de pratiques plus avancées. Par exemple, une startup peut commencer par auditer manuellement ses données clients afin d’en vérifier l’exactitude avant de lancer son moteur de recommandation piloté par l’IA.

Vous pouvez rejoindre la révolution moderne des données en (1) mettant en place des contrôles pour garantir la qualité des données sources, (2) établissant des outils et des processus pour une compréhension partagée (sémantique) des données dès les premiers stades des flux de données de votre organisation, et (3) démocratisant le travail des données grâce à l’adoption d’outils low code / no code et d’outils d’IA générative pour la consommation des données.

eric best_soundcommerce
  • Phase de prise de conscience et de croissance À ce stade, l’organisation adopte une approche plus proactive, introduit un glossaire métier, suit la traçabilité des données, attribue la responsabilité des données et met en œuvre les premiers outils d’observabilité des données. Cette étape est essentielle pour établir un langage commun autour des données et encourager la collaboration entre les équipes data et les parties prenantes métier. Une entreprise de taille moyenne pourrait commencer à mettre en place un glossaire métier afin d’harmoniser les termes et définitions au sein de ses différents départements, garantissant ainsi que tous analysent les données de ventes sur la même base. 
  • Phase de passage à l’échelle Introduction de pratiques avancées comme le masquage des données personnelles (PII), la mise en place de structures de gouvernance formelle, la couverture de l’infrastructure globale, les contrats de données, ainsi que la création de produits et domaines de données. À cette étape, la donnée est considérée comme un produit, dont la conception et la maintenance sont réalisées délibérément pour répondre aux besoins de ses utilisateurs. Une grande entreprise pourrait, par exemple, instaurer une gouvernance de la donnée formelle afin de gérer les informations sensibles de ses clients à l’échelle de plusieurs marchés mondiaux, garantissant la conformité aux réglementations locales et renforçant la confiance de ses clients.

En partageant mon expérience d’accompagnement d’agences fédérales et d’organisations dans la meilleure gestion de leurs données, que ce soit dans le contexte des technologies émergentes comme l’IA ou non, je constate que la confiance dans la donnée à l’ère de l’IA repose sur la qualité des données, mais que l’atteinte et le maintien de cette qualité représentent des défis majeurs.

bryaneckle

La mise en place d’un tel cadre unifié de maturité de la confiance dans les données est essentielle pour surmonter les limites des technologies conventionnelles et naviguer efficacement dans les complexités de l’IA et de la transformation numérique. Un tel cadre doit couvrir plusieurs composants interconnectés :

  1. Découverte des données et gestion des métadonnées
  2. Classification et priorisation des domaines de données
  3. Observabilité des données pour la fiabilité et le suivi des performances
  4. Collaboration renforcée et contrats de données
  5. Stratégies de gouvernance de la donnée

En consolidant ces fonctions dans une même plateforme, les organisations peuvent bénéficier d’une intégration transparente, d’une moindre dépendance aux prestataires et d’une meilleure communication entre les acteurs de leur paysage data.

Une organisation de santé utilisant une plateforme unifiée peut simplifier le partage de données entre ses différents services, réduisant le risque de violation de données et améliorant les résultats pour les patients grâce à des décisions cliniques mieux informées.

Une bonne collecte de données doit être réalisée avec intentionnalité. Quelles sont les questions clés auxquelles vous demandez à l’IA de vous aider à répondre ? Quelles données sont nécessaires pour répondre à ces questions ? En concevant des processus métier orientés données de bout en bout, les organisations peuvent faire de la collecte de données une partie plus routinière de leurs opérations quotidiennes. Lorsque les utilisateurs finaux utilisent correctement les systèmes, les données qu’ils génèrent sont plus précises, et les informations générées à partir de modèles prédictifs ou utilisées pour améliorer les requêtes adressées aux grands modèles de langage peuvent réellement générer de la valeur commerciale significative.

 

Au final, les modèles d’IA ne valent guère plus qu’une expérience scientifique si leurs résultats ne servent pas à prendre de meilleures décisions. Pour s’en assurer, les organisations doivent donner la priorité à l’instauration de la confiance — et, en définitive, à l’adoption — de ces outils.

paul harmon

Surmonter les défis de l’IA générative

L’un des défis les plus importants auxquels sont confrontées les organisations aujourd’hui réside dans la complexité croissante des modèles d’IA générative. Ces modèles sont souvent entraînés sur d’énormes ensembles de données, ce qui rend difficile de comprendre comment ils parviennent à leurs conclusions. Ce manque de transparence peut ainsi rendre difficile la confiance dans les résultats produits par ces modèles.

Mike Finley, CTO et cofondateur de AnswerRocket, met en lumière ce défi : « Les modèles de langage introduisent un tout nouveau vecteur d’attaque pour les politiques de gouvernance des données. Envoyer des données vers un modèle débloque une valeur énorme mais expose aussi à de nouveaux vecteurs de menace. Les entreprises sont divisées sur la question : les équipes traditionnellement conservatrices comme l’IT et le service juridique avancent prudemment, tandis que les équipes stratégiques accélèrent. »

En plus des problèmes de transparence, les modèles d’IA générative peuvent également être sujets aux biais. Si les données utilisées pour entraîner ces modèles sont biaisées, le modèle le sera aussi. Cela peut conduire à des résultats injustes ou discriminatoires.

Pour relever ces défis, les organisations doivent être conscientes des limites des modèles d’IA générative et prendre des mesures pour atténuer les risques. Cela inclut la mise en place de pratiques rigoureuses de gouvernance des données, la garantie d’une absence de biais dans les données, et la transparence concernant les limites des modèles.

Blane Sims, CPO, Truebit

Blane Sims, CPO, Truebit

« L’intégrité des données, bien que souvent négligée dans la discussion sur l’IA, est une préoccupation primordiale. À mesure que les systèmes d’IA influencent de plus en plus les décisions critiques dans tous les secteurs, établir la confiance dans les données sous-jacentes est essentiel. Des processus de données transparents et vérifiables sont le socle sur lequel nous pouvons construire des systèmes d’IA qui soient non seulement puissants, mais aussi véritablement fiables.

 

En plaçant la confiance dans les données au premier plan, les organisations peuvent garantir que leurs initiatives IA fournissent des analyses précises, respectent la conformité réglementaire et gagnent la confiance des parties prenantes. Dans cette nouvelle ère, le véritable avantage concurrentiel ne réside pas seulement dans le déploiement de l’IA, mais dans celui d’une IA de confiance. »

Il est toutefois important de noter que la mise en place d’un cadre de confiance des données relève autant d’un changement culturel interne que d’outils et de processus : cela nécessite du temps, de la détermination et une évolution d’état d’esprit à l’échelle de l’organisation.

Comme le souligne Ted Vial, instaurer la confiance dans l’IA débute par les données utilisées pour l’entraîner.

L’IA est en passe de devenir le nouveau moteur de recherche, créant une formidable opportunité pour la diffusion de fausses informations. Les entreprises d’IA doivent instaurer la confiance avec leurs utilisateurs, en commençant d’abord et avant tout par les données qu’elles utilisent pour générer des réponses.

ted vial

La confiance dans les données comme avantage concurrentiel en IA

À mesure que la nouvelle ère de l’IA continue de croître et d’évoluer, la confiance dans les données devient la pierre angulaire de stratégies réussies basées sur l’IA. La transition des systèmes traditionnels vers un écosystème de données robuste, évolutif et digne de confiance requiert des évolutions culturelles, des investissements en gouvernance et une approche tournée vers l’avenir en matière de technologie.

Dans cette nouvelle ère, des données propres et fiables distingueront les leaders du marché des autres. Les organisations qui placent la confiance dans les données au cœur de leurs initiatives en intelligence artificielle seront bien positionnées pour innover plus rapidement, offrir des expériences plus personnalisées et assurer une croissance à long terme. En vous concentrant sur la confiance dans les données aujourd'hui, vous préparez le terrain pour le succès de demain, porté par l'IA.

Abonnez-vous à la newsletter The CTO Club pour plus d'analyses sur l'IA, la confiance dans les données et l'avenir du leadership technologique.