Skip to main content

Hasta hace poco, la mayoría de los titulares sobre IA giraban en torno a la competencia por desarrollar y mejorar los LLM y otros modelos de IA, junto con el ascenso de NVIDIA como el procesador preferido para IA. A medida que la industria de la IA madura, dos años después del lanzamiento de ChatGPT, estamos viendo un cambio de enfoque hacia el objetivo final: poner la IA en práctica, es decir, a la inferencia. La mayoría de las organizaciones de TI empresariales deben rediseñar su gestión de datos para garantizar una gobernanza de datos adecuada en la inferencia de IA.

Veamos más de cerca el porqué.

El Valor Empresarial de la Inferencia de IA

La inferencia de IA no es siempre igual. Mientras que algunas tareas, como redactar textos para redes sociales, pueden realizarse simplemente abriendo tu aplicación generativa de IA favorita y escribiendo un prompt, el mayor valor para las empresas radica en aprovechar los datos internos para personalizar los resultados y ajustarlos a las necesidades empresariales y de los clientes. Así se aprecia el valor empresarial de la IA con los datos corporativos.

¿Quieres más de The CTO Club?

Crea una cuenta gratuita para terminar de leer este contenido y unirte a una comunidad de CTOs y líderes de ingeniería que comparten marcos, herramientas y conocimientos reales para diseñar, desplegar y escalar tecnología impulsada por IA.

Este campo es un campo de validación y debe quedar sin cambios.
Name*

Por ejemplo, analizar registros de chat para detectar tendencias de satisfacción y sentimiento del cliente o introducir notas clínicas de los encuentros de pacientes en hospitales para resumir casos y descubrir tendencias en tratamientos y prevención de enfermedades.

Por Qué la Inferencia de IA Requiere una Nueva Arquitectura de Datos

La inferencia de IA se perfila como un mercado masivo con enormes consecuencias para la infraestructura de TI. “Varias fuentes, incluidas empresas del sector tecnológico como Amazon o NVIDIA, estiman que la inferencia puede superar el costo del entrenamiento en sistemas generalizados y que la inferencia representa hasta el 90% de los costos de aprendizaje automático para sistemas de IA desplegados”, según investigadores publicados en Science Direct.

Con tanto tiempo, dinero y energía invertidos en la inferencia de IA, los líderes de TI querrán analizar detenidamente su pila tecnológica de soporte—desde plataformas de datos hasta infraestructura de centros de datos, sean locales o en la nube—además de portátiles y teléfonos que estarán optimizados para el procesamiento de IA. Es posible que deban actualizar sus sistemas para mejorar la eficiencia, el rendimiento y la optimización de costes de cara al futuro.

Desglose de los Nuevos Requisitos

Aunque la inferencia de IA es el siguiente paso tras el desarrollo del modelo, los requisitos para la inferencia de IA son lo suficientemente diferentes como para exigir un nuevo paradigma de datos, especialmente para los datos no estructurados:

  • Gestionar el uso rutinario de datos corporativos: Primero, veamos el proceso de alto nivel detrás de la inferencia de IA, tal como lo explica IBM Research: “Durante la inferencia, un modelo de IA trabaja sobre datos en tiempo real, comparando la consulta del usuario con la información procesada durante el entrenamiento y almacenada en sus pesos o parámetros. La respuesta que proporciona el modelo depende de la tarea, ya sea identificar spam, convertir voz en texto o resumir un documento extenso en puntos clave. El objetivo de la inferencia de IA es calcular y generar un resultado accionable.” En otras palabras, la inferencia de IA y su uso requieren que las organizaciones complementen lo que el modelo ha aprendido con datos corporativos relevantes. 
  • Debe ser fácil para cualquier empleado, no solo para los científicos de datos: Mientras que el desarrollo de modelos es un mercado de IA altamente especializado para científicos de datos, la inferencia de IA está dirigida a cualquier usuario y, por lo tanto, debe ser fácil de usar y desplegar. ¿Cómo facilitar que los empleados encuentren y suministren los datos corporativos correctos al proceso de IA adecuado? ¿Cómo garantizar que el flujo de datos quede registrado para auditorías? El entrenamiento de modelos de IA es como construir una planta de energía; muy pocos tienen la experiencia y los recursos especializados para construir modelos de IA. Pero la inferencia de IA debería ser tan fácil como consumir electricidad. Cualquiera debería poder encender o apagar el interruptor para sus propios fines.  
  • Necesidad de buscar y suministrar datos no estructurados para la IA: Hoy en día, con la IA y el aprendizaje automático, todo gira en torno a los datos no estructurados—los millones o miles de millones de archivos como documentos, mensajes, imágenes, videos y datos de máquinas repartidos en directorios y recursos compartidos de la empresa. Debido a su gran tamaño y distribución en muchos silos de datos dentro de la empresa, trasladarlo a un sistema no es viable ni por costes ni por el tiempo que requeriría. Los usuarios dependen de muchas herramientas de IA en lugar de un inmenso almacén de datos. 
  • Mover los datos primero ya no funciona: Dado que los datos no estructurados pueden estar fácilmente en petabytes y su traslado es costoso, el paradigma tradicional de extracción, transformación y carga (ETL) para mover los datos primero a un data lake o data lakehouse y luego operar sobre ellos ya no es viable. Los equipos de TI necesitan una forma de acceder y gestionar sistemáticamente los datos no estructurados sin moverlos a un único lugar. También necesitan herramientas automatizadas para preparar sus datos: desde filtrar lo innecesario, agregar contexto y estructura a través del enriquecimiento de metadatos, y crear flujos de trabajo seguros para encontrar y mover los conjuntos de datos adecuados a las herramientas correctas. Un índice global unificado es un punto de partida sensato para lograr visibilidad de los datos y búsquedas rápidas en entornos de datos híbridos. 
  • Gobernanza automatizada de datos: Además, la gobernanza de datos para IA se está convirtiendo en una capacidad primordial para la gestión de datos. Para evitar filtraciones de datos sensibles en las herramientas de IA, resultados erróneos, alucinaciones y demandas por infracción de derechos de autor, las organizaciones necesitarán formas de monitorear y rastrear el movimiento de los datos hacia las herramientas de IA. Necesitan métodos automáticos para localizar datos sensibles como PII y moverlos a ubicaciones donde los empleados no puedan acceder a ellos para IA. Al automatizar los flujos de trabajo para que los usuarios accedan a la IA, se puede asegurar que la automatización rastrea y gestiona la gobernanza de datos.
  • Un nuevo modelo de gestión de datos para la IA: La capa emergente de “base de datos” para datos no estructurados es virtual y no almacena todos los datos realmente. Veremos cómo evoluciona para abarcar las capacidades descritas y más. Deberá funcionar en todas las tecnologías y entornos de almacenamiento, desde el centro de datos hasta el edge y la nube, y operar de manera eficiente bajo la pesada carga de petabytes de archivos y datos de objetos.

Preguntas Críticas a Realizar Antes de la Adopción

Antes de invertir en cualquier nueva tecnología para IA, las partes interesadas deben reunirse para determinar los principales objetivos y restricciones que prevén para gestionar los riesgos. Aquí tienes algunas preguntas a considerar:

  1. ¿Qué departamentos y/o casos de uso proporcionarán resultados rápidos para oportunidades de aprendizaje con el menor riesgo?
  2. ¿Cuáles son los principales objetivos a largo plazo y los resultados esperados del uso de la IA, especialmente en lo relativo al uso de datos corporativos con IA?
  3. ¿Cómo desean que los usuarios interactúen con los sistemas de IA? ¿Habrá herramientas de IA específicas autorizadas para su uso o podrán decidir los usuarios? 
  4. ¿Qué políticas internas serán necesarias para el uso de IA y cómo se aplicarán? Por ejemplo, una organización puede querer definir qué herramientas de IA se pueden usar en el trabajo y/o el tipo de datos que pueden ingresarse en los sistemas. Puede que deseen restringir, por ejemplo, las actas de reuniones de la junta directiva, sesiones de I+D o llamadas con los principales clientes.
  5. ¿Qué regulaciones del sector se deben cumplir al utilizar datos corporativos con IA?
  6. ¿Cómo se evaluarán los resultados o los trabajos derivados de la IA en cuanto a precisión y legitimidad?
  7. ¿Cómo se pueden aprovechar los trabajos derivados interna o externamente?
  8. ¿Qué marco de gobernanza y seguridad de IA será necesario y qué brechas en la infraestructura tecnológica de seguridad deberán ser cubiertas? 
  9. ¿Qué sistemas pueden operar en la nube y cuáles deben permanecer en las instalaciones?
  10. ¿Cómo buscarán, encontrarán y suministrarán los usuarios los datos corporativos a la IA?
  11. ¿Cómo se conserva el resultado de la IA?

Cuando se utiliza correctamente, la Inferencia de IA puede ayudar a las organizaciones a obtener una ventaja competitiva significativa. Sin embargo, también puede crear riesgos de datos, ya que se necesita exponer datos corporativos. La inferencia de IA requiere una nueva arquitectura de datos porque el modelo tradicional de cargar datos en un almacén de datos o un data lake y actuar sobre ellos en un solo lugar ya no funciona. La Inferencia de IA exige una indexación, búsqueda, curación y movilización eficiente de datos no estructurados hacia la IA con auditoría y seguimiento automatizados.

Suscríbete al boletín de The CTO Club para más información y mejores prácticas sobre datos.