Fino a poco tempo fa, la maggior parte dei titoli sull’IA ruotava attorno alla competizione per sviluppare e migliorare LLM e altri modelli di intelligenza artificiale, insieme all’ascesa di NVIDIA come processore di riferimento per l’IA. Con la maturazione del settore due anni dopo il lancio di ChatGPT, assistiamo ora a un cambiamento di rotta con un’attenzione maggiore all’obiettivo finale: mettere l’IA in azione – ovvero l’inferenza. La maggior parte delle organizzazioni IT aziendali deve riprogettare la gestione dei dati per garantire una corretta governance delle inferenze AI.
Vediamo più da vicino il perché.
Il valore aziendale dell’inferenza AI
L’inferenza AI non è tutta uguale. Mentre alcune attività, come scrivere un testo per i social media, possono essere svolte semplicemente aprendo la propria applicazione di intelligenza artificiale generativa preferita e inserendo un prompt, il vero valore per le aziende risiede nell’utilizzo di dati interni per personalizzare i risultati in base alle esigenze del business e dei clienti. È possibile vedere il valore aziendale dell’IA grazie ai dati aziendali.
Ad esempio, analizzando le chat con i clienti si possono individuare tendenze nella soddisfazione e nel sentimento degli utenti, oppure inserendo note cliniche di incontri ospedalieri si possono riassumere i casi ed evidenziare trend di trattamento e prevenzione delle malattie.
Perché l’inferenza AI richiede una nuova architettura dati
L’inferenza AI si sta delineando come un mercato enorme con enormi conseguenze sull’infrastruttura IT. “Diverse fonti, incluse aziende del settore tecnologico come Amazon o NVIDIA, stimano che l’inferenza possa superare i costi di addestramento nei sistemi pervasivi e che fino al 90% dei costi di machine learning nei sistemi AI operativi sia dovuto all’inferenza”, secondo quanto riportato dai ricercatori pubblicati su Science Direct.
Dato l'enorme investimento di tempo, costi ed energia nell’inferenza AI, i responsabili IT vorranno analizzare attentamente il proprio stack tecnologico di supporto – dalle piattaforme dati all’infrastruttura del data center, che sia on-premise oppure in cloud – fino a laptop e smartphone sempre più ottimizzati per l’elaborazione AI. Potranno dover aggiornare i propri sistemi per renderli più efficienti e ottimizzati in termini di prestazioni e costi, per portarli verso il futuro.
-
Snowflake Data Cloud
Visit WebsiteThis is an aggregated rating for this tool including ratings from Crozdesk users and ratings from other sites.4.7 -
Dataiku
Visit WebsiteThis is an aggregated rating for this tool including ratings from Crozdesk users and ratings from other sites.4.6 -
Nanonets
Visit WebsiteThis is an aggregated rating for this tool including ratings from Crozdesk users and ratings from other sites.4.9
Analisi dei nuovi requisiti
Nonostante l’inferenza AI rappresenti il passo successivo allo sviluppo dei modelli, i requisiti per l’inferenza differiscono a tal punto da richiedere un nuovo paradigma dei dati – soprattutto per i dati non strutturati:
- Gestire l’uso routinario dei dati aziendali: Innanzitutto, analizziamo il processo ad alto livello che sta dietro l’inferenziazione AI, come spiegato da IBM Research: “Durante l'inferenza, un modello AI lavora su dati in tempo reale, confrontando la richiesta dell’utente con le informazioni elaborate durante l’addestramento e memorizzate nei suoi pesi, o parametri. La risposta che il modello fornisce dipende dal compito, che sia identificare spam, convertire voce in testo, oppure sintetizzare un lungo documento nei punti salienti. L’obiettivo dell’inferenza AI è calcolare e fornire un risultato concretamente utilizzabile.” In altre parole, l’inferenziazione AI e il suo utilizzo richiedono che le organizzazioni integrino ciò su cui il modello è stato addestrato con dati aziendali pertinenti.
- Deve essere facile per qualsiasi dipendente, non solo per i data scientist: Mentre lo sviluppo dei modelli è un mercato AI altamente specializzato per i data scientist, l’inferenziazione AI è destinata a qualsiasi utente e, quindi, deve essere semplice da utilizzare e distribuire. Come puoi facilitare la ricerca e il caricamento dei dati aziendali corretti nel processo AI appropriato per i dipendenti? Come puoi assicurarti che il flusso dei dati venga registrato per fini di audit? L’addestramento di un modello AI è come costruire una centrale elettrica: pochissimi hanno le competenze e le risorse specialistiche per creare modelli AI. Ma l’inferenziazione AI dovrebbe essere facile quanto consumare elettricità. Chiunque dovrebbe poter accendere o spegnere l’interruttore secondo le proprie esigenze.
- Necessità di cercare e fornire dati non strutturati all’AI: Oggi, con AI e ML, il tema principale sono i dati non strutturati—milioni o miliardi di file come documenti, messaggi, immagini, video e dati delle macchine sparsi su directory e condivisioni nell’impresa. A causa della loro grande dimensione e distribuzione su molti silos di dati dell’azienda, spostarli su un sistema unico non è fattibile né a livello di costo né di tempo. Gli utenti si affidano a molti strumenti AI piuttosto che a un enorme data warehouse.
- Spostare prima i dati non è più praticabile: Poiché i dati non strutturati possono facilmente raggiungere i petabyte e sono costosi da trasferire, il paradigma tradizionale di estrazione, trasformazione e caricamento (ETL) che prevede prima lo spostamento dei dati in un data lake o data lakehouse e poi la loro elaborazione non funziona più. I team IT necessitano di un modo sistematico per accedere e gestire i dati non strutturati senza centralizzarli. Sono anche necessari strumenti automatici per preparare i dati—dal filtraggio delle informazioni inutili, all’aggiunta di contesto e struttura tramite arricchimento dei metadati, fino alla creazione di workflow sicuri per trovare e destinare i giusti insiemi di dati agli strumenti più adatti. Un indice globale unificato rappresenta un punto di partenza ragionevole per ottenere visibilità sui dati e ricerca veloce in ambienti dati ibridi.
- Governance dei dati automatizzata: Inoltre, la governance dei dati AI sta diventando una caratteristica imprescindibile nella gestione dei dati. Per evitare che dati sensibili finiscano nei tools AI, risultati errati, allucinazioni e cause legali per violazione del copyright, le organizzazioni necessiteranno di strumenti per monitorare e tracciare il movimento dei dati verso l’AI. Servono metodi automatici per individuare dati sensibili come PII e spostarli dove non possano essere accessibili ai dipendenti tramite l’AI. Automatizzando i workflow di accesso all’AI per gli utenti, puoi garantire che l’automazione tracci e gestisca la governance dei dati.
- Un nuovo modello di gestione dati per l’AI: Il nuovo strato "database" emergente per i dati non strutturati è virtuale e non memorizza effettivamente tutti i dati. Vedremo questa soluzione evolversi per racchiudere le capacità sopra descritte e altro ancora. Dovrà funzionare su tutte le tecnologie di storage e ambienti—dal data center, all’edge, al cloud—e operare in modo efficiente anche sotto il peso di petabyte di file e dati oggetto.
Domande critiche da porsi prima dell’adozione
Prima di investire in qualsiasi nuova tecnologia per l’AI, gli stakeholder devono riunirsi per definire gli obiettivi principali e le restrizioni che prevedono per gestire i rischi. Ecco alcune domande da considerare:
- Quali dipartimenti e/o casi d’uso garantiranno risultati veloci per opportunità di apprendimento con il rischio più basso?
- Quali sono gli obiettivi principali a lungo termine e i risultati attesi dall’uso dell’AI, soprattutto in relazione all’uso dei dati aziendali con l’AI?
- Come desiderano che gli utenti possano interagire con i sistemi AI? Esisteranno strumenti AI specifici autorizzati all’uso o sarà lasciata libertà di scelta agli utenti?
- Quali policy interne saranno necessarie per l’utilizzo dell’AI e come verranno fatte rispettare? Ad esempio, un’organizzazione può voler stabilire quali strumenti AI possono essere utilizzati sul posto di lavoro e/o i tipi di dati che possono essere inseriti nei sistemi. Potrebbero voler, ad esempio, limitare l’elaborazione di note di riunioni del consiglio di amministrazione, sessioni di ricerca e sviluppo, o chiamate con i clienti principali.
- Quali normative di settore devono essere rispettate quando si usano dati aziendali con l’AI?
- Come saranno valutati gli output o i risultati derivati dall’AI per accuratezza e legittimità?
- Come possono essere sfruttati internamente o esternamente i risultati derivati?
- Quale framework di governance e sicurezza sull’AI sarà necessario e quali lacune nell’infrastruttura tecnologica di sicurezza dovranno essere colmate?
- Quali sistemi possono funzionare su cloud e quali dovrebbero rimanere on-premises?
- Come potranno gli utenti cercare, trovare e fornire dati aziendali all’AI?
- Come viene conservato il risultato dell’AI?
Se utilizzata correttamente, l'Inferenza AI può aiutare le organizzazioni a ottenere un vantaggio competitivo significativo. Tuttavia, può anche generare rischi per i dati, poiché i dati aziendali devono essere esposti. L'inferenza AI richiede una nuova architettura dei dati, perché il modello tradizionale di caricamento dei dati in un data warehouse o in un data lake e la successiva elaborazione centralizzata non è più efficace. L'Inferenza AI necessita di un'indicizzazione, ricerca, cura e mobilitazione efficienti dei dati non strutturati verso l'AI, con audit e tracciamento automatizzati.
Iscriviti alla newsletter di The CTO Club per ulteriori approfondimenti e migliori pratiche sui dati.
