Skip to main content

Le organizzazioni che intraprendono progetti di intelligenza artificiale non possono permettersi di attendere progetti di centralizzazione dei dati a lungo termine. Devono essere in grado di integrare dati di alta qualità, ovunque si trovino, nel modo più rapido possibile, affinché i loro strumenti di AI producano risultati contestualmente accurati sfruttando le informazioni dai dati più recenti.

I vecchi e ingombranti processi di estrazione e copia dei dati da più fonti verso una posizione centrale per essere utilizzati dagli strumenti di AI non sono necessari e comportano un notevole dispendio di risorse tecniche e finanziarie. 

L'ascesa del ripatriamento dei dati: dal cloud all'on-premise

Per molte organizzazioni, il trasferimento dei dati dall'archiviazione cloud a sistemi on-premise è già in pieno svolgimento. Questo fenomeno è noto come ripatriamento dei dati. Con l'aumento del volume di dati che le organizzazioni creano e gestiscono aumentano anche i costi associati alla gestione dei dati. Anche con pochi centesimi per gigabyte, i costi crescono rapidamente.

Want more from The CTO Club?

Create a free account to finish this piece and join a community of CTOs and engineering leaders sharing real-world frameworks, tools, and insights for designing, deploying, and scaling AI-driven technology.

This field is for validation purposes and should be left unchanged.
Name*

Bill Burnham, CTO per il Settore Pubblico USA presso Hewlett Packard Enterprise, osserva che i costi possono aumentare “in modo astronomico” con il passaggio alla gestione di petabyte di dati. Riportare i dati su storage on-premise, in particolare per applicazioni di intelligenza artificiale in cui nuovi dati vengono utilizzati per aggiornare e perfezionare i risultati, è sensato dal punto di vista economico. 

Dal punto di vista operativo, è ideale posizionare i dati il più vicino possibile a dove verranno utilizzati. I sistemi basati su cloud offrono molti vantaggi, ma non sono la soluzione a ogni problema. Quando si addestrano modelli di intelligenza artificiale, è fondamentale che abbiano accesso ai dati più aggiornati e accurati.

Proteggere i dati e i risultati dell'AI

Una ricerca di Gartner suggerisce che le configurazioni errate dei servizi cloud rappresentano una problematica significativa che può portare all'inclusione di dati sensibili da parte di modelli AI non autorizzati. Così come gli utenti finali sono avvertiti che le interrogazioni inserite nei servizi pubblici di AI generativa possono essere utilizzate, questo vale per qualsiasi dato esposto.

I sistemi on-premise non sono immuni dalle violazioni dei dati, ma il rischio che un modello AI non autorizzato acceda a dati aziendali e provochi una fuga di proprietà intellettuale può essere mitigato.

Risultati inaccurati dei modelli AI restano un problema importante. Esempi recenti, come l'AI di Google che suggerisce ai cuochi di usare colla per far aderire il formaggio sulla pizza o mangiare una pietra al giorno come fonte di vitamine e minerali, mostrano quanto sia fondamentale che i LLM siano alimentati con dati appropriati e contestuali. Utilizzando i propri dati e rendendoli disponibili rapidamente e in modo conveniente, il rischio di risultati fuorvianti o errati si riduce. 

Il ruolo dei dati contestuali nella precisione dell’AI

L'importanza delle informazioni contestuali non può essere sottovalutata. I migliori dati che la tua organizzazione può utilizzare per gli strumenti AI sono quelli che si riferiscono specificamente alle tue attività.

Per i rivenditori di abbigliamento, i dati sulla demografia servita sono fondamentali. Un outlet di abbigliamento che si concentra su un target femminile tra i 16 e i 25 anni necessita di input diversi rispetto a punti vendita che propongono abiti da uomo a una fascia d’età tra i 35 e i 50 anni.

I modelli AI che assorbono dati generici e che non comprendono le esigenze specifiche dell’azienda possono produrre risultati che portano a decisioni sbagliate. Se esempi come incollare il formaggio sulla pizza fanno sorridere, un buyer di una catena retail che ordina migliaia di unità di abiti che non verranno mai acquistati può causare danni costosi o addirittura catastrofici. 

Portare la tua AI on-premise

Posizionare i dati il più vicino possibile a dove verranno utilizzati per l’AI riduce complessità e costi. I progetti di intelligenza artificiale dipendono fortemente dai dati utilizzati per addestrare il modello. Avere dati di alta qualità e tempestivi è più prezioso che assumere ulteriori data scientist. Le organizzazioni devono dare priorità ai dati utilizzati per i propri modelli e renderli accessibili. 

L’approccio tipico alla gestione dei dati per applicazioni AI si basa sulla copia dei dati dalla fonte affinché possano essere utilizzati per addestrare i modelli. Ma quando i dati migliori sono distribuiti su più piattaforme, come CRM cloud, una piattaforma finanziaria on-premise e strumenti di produttività online, può essere difficile renderli accessibili. Spesso, il risultato è che vengono utilizzati solo i dati più facili da centralizzare, mentre il resto viene lasciato per quando tempo e budget lo consentiranno.

La domanda che i team di intelligenza artificiale devono porsi è come possano accedere a tutti i dati di cui hanno bisogno senza dover aspettare costosi e lunghi progetti di ripatrimonio dei dati. Hanno bisogno di un modo semplice per accedere a dati disparati in più sedi e di essere in grado di reindirizzare le query che accedono a quei dati man mano che i dati vengono spostati.

Gli strumenti di preparazione dei dati possono condizionare i dati per l’attivazione dell’IA riducendo al minimo le interruzioni durante la ripatrimonio dei dati. Sfruttando questi nuovi approcci all’avanguardia, i progetti di intelligenza artificiale possono avanzare rapidamente senza attendere la migrazione dei dati o la necessità di reingegnerizzare in modo significativo i sistemi. I dati di addestramento possono essere resi disponibili per i modelli di IA e gli LLM man mano che vengono creati, quasi in tempo reale.

Accelerare i progetti di intelligenza artificiale con hub di dati on-premise

I costi in aumento, le preoccupazioni sulla perdita di proprietà intellettuale e una maggiore agilità nello sviluppo degli strumenti di intelligenza artificiale stanno guidando il passaggio dalle piattaforme cloud a quelle on-premise. L’IA e gli LLM richiedono accesso a dati di alta qualità, contestuali e tempestivi per garantire i migliori risultati agli utenti. 

Un hub di dati per l’intelligenza artificiale che rappresenta la singola piattaforma centrale e zona di governance per tutti i progetti di integrazione dati e IA consente di accelerare i progetti di intelligenza artificiale in parallelo ai progetti di ripatrimonio del cloud, così che le organizzazioni possano sfruttare rapidamente i loro dati.

Allo stesso tempo, possono continuare a offrire agli utenti aziendali migliori insight sui clienti e analisi avanzate per aumentare i ricavi e superare la concorrenza in un ambiente di business estremamente competitivo.  

Iscriviti alla newsletter di The CTO Club per ulteriori approfondimenti e best practice sull’intelligenza artificiale.

Upgrade your inbox with more tech leadership wisdom for delivering better software and systems.

Upgrade your inbox with more tech leadership wisdom for delivering better software and systems.

This field is for validation purposes and should be left unchanged.
Name*