Jusqu'à récemment, la plupart des gros titres sur l’IA tournaient autour de la course au développement et à l’amélioration des grands modèles de langage (LLM) et autres modèles d’IA, ainsi que l’ascension de NVIDIA comme processeur d’IA de référence. À mesure que l’industrie de l’IA mûrit, deux ans après le lancement de ChatGPT, la tendance s’inverse et l’accent est mis davantage sur l’objectif final : utiliser l’IA – autrement dit, l’inférence. La plupart des organisations IT d’entreprise doivent réarchitecturer leur gestion des données afin d’assurer une bonne gouvernance des données lors de l’inférence de l’IA.
Voyons de plus près pourquoi.
La valeur commerciale de l’inférence de l’IA
L’inférence de l’IA n’est pas uniforme. Si certaines tâches, comme la rédaction de publications pour les réseaux sociaux, peuvent être accomplies en ouvrant simplement son application d’IA générative préférée et en saisissant une consigne, la plus grande valeur pour les entreprises réside dans l’exploitation de leurs propres données afin de personnaliser les résultats en fonction des besoins professionnels et clients. On retrouve ainsi la valeur ajoutée de l’IA avec les données d’entreprise.
Par exemple, analyser les échanges de chat pour déceler les tendances de satisfaction et de ressenti client, ou bien saisir les notes cliniques issues d’une prise en charge hospitalière pour résumer les cas et faire émerger des tendances sur le traitement et la prévention des maladies.
Pourquoi l’inférence de l’IA nécessite une nouvelle architecture de données
L’inférence de l’IA s’annonce comme un marché colossal ayant un impact tout aussi massif sur les infrastructures informatiques. « Plusieurs sources, dont des entreprises du secteur technologique comme Amazon ou NVIDIA, estiment que l’inférence peut dépasser le coût de l’entraînement dans les systèmes omniprésents, et que l’inférence représente jusqu’à 90 % des coûts du machine learning pour les systèmes d’IA déployés », selon des chercheurs publiés dans Science Direct.
Avec autant de temps, de coûts et d’énergie investis dans l’inférence de l’IA, les responsables IT devront analyser de près leur pile technologique, des plateformes de données à l’infrastructure du centre de données, que ce soit sur site ou dans le cloud – et même les ordinateurs portables et téléphones qui seront optimisés pour le traitement par l’IA. Il leur faudra potentiellement mettre à niveau leurs systèmes pour davantage d’efficacité, de performance, et d’optimisation des coûts afin de se préparer pour l’avenir.
-
Nanonets
Visit WebsiteThis is an aggregated rating for this tool including ratings from Crozdesk users and ratings from other sites.4.9 -
Athenic
Visit WebsiteThis is an aggregated rating for this tool including ratings from Crozdesk users and ratings from other sites.4.4 -
iguazio
Visit WebsiteThis is an aggregated rating for this tool including ratings from Crozdesk users and ratings from other sites.4.8
Décrypter les nouvelles exigences
Bien que l’inférence de l’IA constitue l’étape suivante après le développement du modèle, ses exigences sont suffisamment différentes pour imposer un nouveau paradigme de données – en particulier pour les données non structurées :
- Gérer l'utilisation courante des données d'entreprise : Commençons par examiner le processus général de l'inférence IA, tel qu'expliqué par IBM Research : « Lors de l'inférence, un modèle d'IA travaille sur des données en temps réel, comparant la requête de l'utilisateur avec les informations traitées lors de l'entraînement et stockées dans ses pondérations, ou paramètres. La réponse que le modèle fournit dépend de la tâche, qu'il s'agisse d'identifier des spams, de convertir la parole en texte, ou de résumer un long document en points clés. L'objectif de l'inférence IA est de calculer et de produire un résultat exploitable. » En d'autres termes, l'inférence IA et son utilisation nécessitent que les organisations complètent ce sur quoi le modèle a été entraîné avec des données d'entreprise pertinentes.
- Doit être facile pour tout employé, pas seulement les data scientists : alors que le développement de modèles est un marché d'IA hautement spécialisé réservé aux data scientists, l'inférence IA s'adresse à tout utilisateur et doit donc être facile à utiliser et à déployer. Comment faciliter la tâche des employés pour trouver et fournir les bonnes données d'entreprise au bon processus d'IA ? Comment s'assurer que le flux de travail des données soit capturé à des fins d'audit ? L'entraînement d'un modèle IA est comme la construction d'une centrale électrique : très peu de personnes possèdent l'expertise spécialisée et les ressources nécessaires pour créer des modèles IA. Mais l'inférence IA devrait être aussi simple que de consommer de l'électricité. Chacun devrait pouvoir allumer ou éteindre l'interrupteur selon ses besoins.
- Besoin de rechercher et d'alimenter des données non structurées pour l'IA : Aujourd'hui, avec l'IA et le ML, tout tourne autour des données non structurées — les millions ou milliards de fichiers tels que documents, messages, images, vidéos et données machine répartis dans les répertoires et partages de l'entreprise. En raison de leur volume important et de leur distribution sur de nombreux silos de données au sein de l'entreprise, il n'est pas viable de les déplacer vers un système, tant sur le plan du coût que du temps requis. Les utilisateurs s'appuient donc sur de nombreux outils d'IA plutôt qu'un énorme entrepôt de données.
- Déplacer les données en premier ne fonctionne plus : Puisque les données non structurées peuvent facilement atteindre des pétaoctets et sont coûteuses à déplacer, le paradigme traditionnel d'extraction, de transformation et de chargement (ETL) — qui consiste à déplacer d'abord les données vers un data lake ou un data lakehouse avant d'agir dessus — ne fonctionne plus. Les équipes informatiques ont besoin d'une méthode systématique pour accéder et gérer les données non structurées sans qu'elles soient centralisées. Elles nécessitent également des outils automatisés pour préparer les données — en filtrant les éléments obsolètes, en y ajoutant du contexte et de la structure grâce à l'enrichissement des métadonnées, et en créant des workflows sécurisés pour trouver et transférer les bons ensembles de données vers les bons outils. Un index global unifié constitue un point de départ pertinent pour obtenir de la visibilité et une recherche rapide sur l'ensemble des patrimoines de données hybrides.
- Gouvernance des données automatisée : De plus, la gouvernance des données pour l'IA devient une capacité essentielle dans la gestion des données. Afin d'éviter les fuites de données sensibles vers les outils d'IA, des résultats erronés, des hallucinations ou des poursuites pour violation de droits d'auteur, les organisations devront surveiller et tracer les mouvements de données vers les outils d'IA. Elles ont besoin de méthodes automatisées pour localiser les données sensibles telles que les PII et les déplacer vers des emplacements où elles ne pourront pas être accessibles pour l'IA par les employés. En automatisant les workflows d'accès à l'IA pour les utilisateurs, on s'assure que l'automatisation prenne en charge la traçabilité et la gestion de la gouvernance des données.
- Un nouveau modèle de gestion des données pour l'IA : La couche « base de données » émergente pour les données non structurées est virtuelle et ne stocke pas réellement toutes les données. Nous la verrons évoluer pour intégrer les capacités ci-dessus et bien plus encore. Elle devra fonctionner sur toutes les technologies de stockage et tous les environnements — du centre de données à la périphérie, jusqu'au cloud — et opérer efficacement sous la lourde charge de plusieurs pétaoctets de données de fichiers et d'objets.
Questions critiques à se poser avant l'adoption
Avant d'investir dans une nouvelle technologie d'IA, les parties prenantes doivent se rassembler pour définir les objectifs principaux et les contraintes imaginées pour gérer les risques. Voici quelques questions à considérer :
- Quels départements et/ou cas d'usage permettront d'obtenir des succès rapides offrant des opportunités d'apprentissage à moindre risque ?
- Quels sont les principaux objectifs à long terme et les résultats attendus de l'utilisation de l'IA, en particulier de l'utilisation des données d'entreprise avec l'IA ?
- Comment souhaite-t-on que les utilisateurs interagissent avec les systèmes d'IA ? Y aura-t-il des outils d'IA spécifiques autorisés ou les utilisateurs pourront-ils choisir ?
- Quelles politiques internes seront nécessaires pour l'utilisation de l'IA, et comment seront-elles appliquées ? Par exemple, une organisation peut souhaiter déterminer quels outils d'IA peuvent être utilisés au travail et/ou les types de données pouvant être introduites dans les systèmes. Elle pourra souhaiter restreindre, par exemple, les notes des réunions des comités de direction, des sessions de R&D ou des appels avec les principaux clients.
- Quelles réglementations sectorielles devront être respectées lors de l'utilisation des données d'entreprise avec l'IA ?
- Comment les résultats issus de l'IA ou les œuvres dérivées seront-ils évalués en termes de précision et de légitimité ?
- Comment les œuvres dérivées peuvent-elles être utilisées en interne ou en externe ?
- Quel cadre de gouvernance et de sécurité de l'IA sera nécessaire, et quelles lacunes dans l'infrastructure technologique de sécurité devront être comblées ?
- Quels systèmes peuvent fonctionner dans le cloud et lesquels doivent rester sur site ?
- Comment les utilisateurs rechercheront-ils, trouveront-ils et fourniront-ils les données de l'entreprise à l'IA ?
- Comment le résultat de l'IA est-il conservé ?
Lorsqu'elle est utilisée correctement, l’inférence par intelligence artificielle peut aider les organisations à acquérir un avantage concurrentiel significatif. Cependant, elle peut également créer des risques liés aux données, car il est nécessaire d’exposer les données d’entreprise. L’inférence par intelligence artificielle requiert une nouvelle architecture de données, car le modèle traditionnel consistant à charger les données dans un entrepôt ou un lac de données puis à les exploiter en un seul endroit n’est plus adapté. L’inférence par IA nécessite un indexage, une recherche, une curation et une mobilisation efficaces des données non structurées vers l’IA, avec une vérification et un suivi automatisés.
Abonnez-vous à la newsletter du CTO Club pour plus d’analyses et de bonnes pratiques autour des données.
