Skip to main content

La fiducia nei dati è diventata più importante che mai nell’era dell’IA. Con la crescente dipendenza dai dati per alimentare la gen AI e altre applicazioni di intelligenza artificiale, le organizzazioni devono valutare strategie e framework di gestione dei dati per supportare al meglio questo nuovo e mutevole scenario.

La fiducia nei dati garantisce l’affidabilità e l’accuratezza dei dati di un’organizzazione. Non si tratta solo di investire in singoli strumenti per l’osservabilità, la catalogazione o la governance: significa istituire un framework completo che assicuri dati attendibili lungo l’intera catena del valore.

Ad esempio, un’azienda retail che sfrutta l’IA per il marketing personalizzato deve assicurarsi che i dati dei clienti siano accurati e aggiornati per evitare di indirizzare prodotti inappropriati ai destinatari sbagliati.

Want more from The CTO Club?

Create a free account to finish this piece and join a community of CTOs and engineering leaders sharing real-world frameworks, tools, and insights for designing, deploying, and scaling AI-driven technology.

This field is for validation purposes and should be left unchanged.
Name*

La sfida dei sistemi legacy

La principale difficoltà è che le tecnologie tradizionali spesso non sono in grado di gestire la scala e la complessità degli ecosistemi di dati moderni. Questi metodi legacy faticano con qualità dei dati, osservabilità, catalogazione e governance – aspetti fondamentali che spesso risultano compartimentati e disgiunti nei sistemi obsoleti. Questa frammentazione può portare a incoerenza nei dati, problemi di governance e rischio aumentato. 

Per esempio, un istituto finanziario come Equifax che utilizza sistemi superati potrebbe incontrare difficoltà nel mantenere una qualità dei dati uniforme tra i vari reparti, con possibili errori nelle segnalazioni di conformità o nelle previsioni finanziarie.

Brian Wess, guest on the CTO podcast, discussing CTO-Field-CTO-vs-CTO-Brian-Weiss Featured Image

Brian Weiss, Chief Technology Officer, Hyperscience

“Stabilire la fiducia nei dati è uno dei più grandi ostacoli all’espansione dell’IA. La maggior parte dei dati aziendali è non strutturata e non immediatamente utilizzabile dai sistemi di intelligenza artificiale. Sebbene numerosi strumenti dichiarino di risolvere questo problema, le organizzazioni devono garantire l’accuratezza dei dati prima di integrarli nei sistemi di IA.

 

I meccanismi di grounding, come le architetture RAG, richiedono dati etichettati con precisione per generare output affidabili e corretti. L’impiego di ML per creare collegamenti tra i dati incorporati sottolinea ulteriormente la necessità di dati di qualità, dato il notevole impatto che una bassa qualità può avere sui sistemi a valle.

 

Credo che insegnare alla GenAI il linguaggio specifico della propria azienda, basandosi su dati di verità fondamentale al centro dell’organizzazione, sia fondamentale per favorire l’adozione e sbloccare valore. Questo è particolarmente importante ora che le organizzazioni stanno passando dagli esperimenti GenAI a progetti in grado di generare vero ROI.”

Il framework per la maturità della fiducia nei dati

Per affrontare queste sfide e costruire una solida base per il successo dell’IA, le organizzazioni dovrebbero considerare l’adozione di un framework di maturità per la fiducia nei dati, che fornisca una roadmap per evolvere dalle prime fasi di gestione dei dati verso un ecosistema di governance dati avanzato e scalabile. 

Questa roadmap include:

  • Le organizzazioni nelle prime fasi si concentrano sulla gestione dei metadati e sul testing manuale delle risorse chiave. Sebbene reattiva, questa fase è essenziale per porre le basi di pratiche più evolute. Ad esempio, una startup può iniziare verificando manualmente i dati dei clienti per garantirne l’accuratezza prima di lanciare il proprio motore di raccomandazione AI-driven.

Puoi unirti alla rivoluzione dei dati moderni (1) implementando controlli per garantire la qualità dei dati di origine, (2) stabilendo strumenti e processi per una comprensione condivisa (semantica) dei dati nelle prime fasi dei flussi di dati della tua organizzazione e (3) democratizzando il lavoro sui dati adottando strumenti low code / no code e generativi di AI per il consumo dei dati.

eric best_soundcommerce
  • Fase Consapevole e in Crescita In questa fase, l'attenzione di un'organizzazione si sposta verso un approccio più proattivo, introducendo un glossario aziendale, tracciando la provenienza dei dati (data lineage), assegnando la proprietà dei dati e implementando una osservabilità di base dei dati (gli strumenti di data observability offrono molti vantaggi per questo). Questo passaggio è essenziale per costruire un linguaggio dati comune e favorire la collaborazione tra i team dati e gli stakeholder aziendali. Un'azienda di medie dimensioni potrebbe iniziare a implementare un glossario aziendale per standardizzare termini e definizioni tra i vari dipartimenti, assicurando che tutti siano allineati nell’analisi dei dati di vendita. 
  • Fase di Scala Introduce pratiche avanzate come il mascheramento delle informazioni personali (PII masking), strutture formali di governance, copertura infrastrutturale completa, data contracts e la creazione di prodotti e domini di dati. In questa fase, i dati sono trattati come un prodotto, con progettazione e manutenzione mirate a soddisfare le esigenze degli utenti. Una grande azienda può istituire strutture formali di data governance per gestire informazioni sensibili dei clienti in diversi mercati globali, garantendo la conformità alle normative locali e rafforzando la fiducia dei clienti.

Parlando dalla mia esperienza nell’aiutare agenzie federali e organizzazioni a gestire meglio i loro dati sia all’interno che al di fuori del contesto di tecnologie emergenti come l’AI, il successo della fiducia nei dati nell’era dell’AI si basa su dati di alta qualità, ma raggiungere e mantenere questa qualità presenta sfide significative.

bryaneckle

L’implementazione di un framework unificato di maturità della fiducia dei dati è fondamentale per superare i limiti delle tecnologie convenzionali e affrontare efficacemente la complessità di AI e trasformazione digitale. Un tale framework dovrebbe considerare diversi componenti interconnessi:

  1. Scoperta dei Dati e Gestione dei Metadati
  2. Classificazione e Prioritizzazione dei Domini Dati
  3. Osservabilità dei Dati per il Monitoraggio di Affidabilità e Prestazioni
  4. Collaborazione Avanzata e Data Contracts
  5. Strategie di Data Governance

Consolidando queste funzioni in un'unica piattaforma, le organizzazioni possono godere di un'integrazione senza soluzione di continuità, minore dipendenza dai fornitori e comunicazione migliorata in tutto il loro ecosistema dati.

Un'organizzazione sanitaria che utilizza una piattaforma unificata può ottimizzare la condivisione dei dati tra diversi reparti, riducendo il rischio di violazioni dei dati e migliorando gli esiti per i pazienti tramite decisioni cliniche più informate.

La raccolta dei dati dovrebbe essere effettuata con intenzionalità. Quali sono le domande chiave che state ponendo all’IA affinché vi aiuti a risolverle? Di quali dati avete bisogno per rispondere a queste domande? Progettando processi aziendali guidati dai dati dall’inizio alla fine, le organizzazioni possono rendere la raccolta dei dati una parte più abituale delle attività quotidiane. Quando gli utenti finali utilizzano correttamente i sistemi, i dati generati sono più accurati e le intuizioni prodotte da modelli predittivi o utilizzate per migliorare i prompt degli LLM possono realmente guidare un valore significativo per il business.

 

Alla fine della giornata, i modelli di IA non sono altro che esperimenti scientifici se i loro risultati non vengono utilizzati per prendere decisioni migliori. Per garantire che ciò avvenga, le organizzazioni devono dare priorità alla costruzione della fiducia — e, in ultima analisi, all’adozione — di questi strumenti.

paul harmon

Superare le sfide della GenAI

Una delle sfide più significative che le organizzazioni si trovano ad affrontare oggi è la crescente complessità dei modelli GenAI. Questi modelli vengono spesso addestrati su set di dati enormi, rendendo difficile capire come arrivino alle loro conclusioni. Questa mancanza di trasparenza può rendere arduo fidarsi dei risultati prodotti dai modelli GenAI.

Mike Finley, CTO e Co-fondatore di AnswerRocket, sottolinea questa sfida: “I modelli linguistici introducono un nuovo livello di esposizione per le politiche di governance dei dati. Inviare i dati a un modello sblocca un enorme valore, ma espone anche a nuovi vettori di minaccia. Le aziende sono divise su questa tematica: reparti tradizionalmente conservatori come IT e Legale sono prudenti e attendono, mentre i team strategici spingono sull’acceleratore.”

Oltre alle problematiche di trasparenza, i modelli GenAI possono anche essere soggetti a bias. Se i dati utilizzati per addestrare un modello GenAI sono distorti, anche il modello lo sarà. Questo può portare a risultati ingiusti o discriminatori.

Per affrontare queste sfide, le organizzazioni devono essere consapevoli dei limiti dei modelli GenAI e prendere provvedimenti per mitigare i rischi. Questo include l’implementazione di solide pratiche di governance dei dati, la garanzia che i dati siano imparziali e la trasparenza riguardo ai limiti dei modelli GenAI.

È importante sottolineare, tuttavia, che l’implementazione di un framework di fiducia dei dati riguarda tanto il cambiamento culturale interno quanto gli strumenti e i processi; richiede tempo, dedizione e un cambiamento di mentalità in tutta l’organizzazione.

Come sottolinea Ted Vial, la costruzione della fiducia nell’IA parte dai dati utilizzati per addestrarla.

L’IA sta rapidamente diventando il nuovo motore di ricerca, creando una grande opportunità per la diffusione di informazioni false. Le aziende che sviluppano IA devono costruire fiducia con i propri utenti, partendo prima di tutto dai dati che utilizzano per generare le risposte.

ted vial

La fiducia nei dati come vantaggio competitivo nell’IA

Man mano che la nuova era dell’IA continua a crescere ed evolversi, la fiducia nei dati è una pietra angolare delle strategie di successo guidate dall’IA. Il percorso dai sistemi tradizionali a un ecosistema dati robusto, scalabile e affidabile richiede cambiamenti culturali, investimenti nella governance e un approccio tecnologico orientato al futuro.

In questa nuova era, dati puliti e affidabili distingueranno i leader di mercato dal resto. Le organizzazioni che pongono la fiducia nei dati al centro delle loro iniziative di intelligenza artificiale saranno ben posizionate per innovare più rapidamente, offrire esperienze più personalizzate e garantire una crescita a lungo termine. Concentrandovi oggi sulla fiducia nei dati, state gettando le basi per il successo di domani alimentato dall’IA.

Iscriviti alla newsletter di The CTO Club per ulteriori approfondimenti su IA, fiducia nei dati e il futuro della leadership tecnologica.