Skip to main content

Datentreue ist im Zeitalter der KI wichtiger denn je geworden. Mit der rapide zunehmenden Abhängigkeit von Daten zur Unterstützung generativer KI und anderer KI-Anwendungen müssen Unternehmen ihre Strategien und Rahmenwerke für das Datenmanagement überdenken, um diese neue und sich ständig weiterentwickelnde Landschaft optimal zu unterstützen.

Datentreue gewährleistet die Zuverlässigkeit und Genauigkeit der Daten eines Unternehmens. Es geht über die Investition in einzelne Tools für Beobachtbarkeit, Katalogisierung oder Governance hinaus – es handelt sich um die Etablierung eines umfassenden Rahmenwerks, das vertrauenswürdige Daten über die gesamte Wertschöpfungskette hinweg sicherstellt.

Beispielsweise muss ein Einzelhandelsunternehmen, das KI für personalisiertes Marketing einsetzt, sicherstellen, dass seine Kundendaten korrekt und aktuell sind, um zu vermeiden, dass die falsche Zielgruppe mit unpassenden Produkten angesprochen wird.

Die Herausforderung durch Altsysteme

Die größte Herausforderung besteht darin, dass traditionelle Technologien oft nicht mit dem Umfang und der Komplexität moderner Datenökosysteme Schritt halten können. Diese veralteten Ansätze kämpfen mit Datenqualität, Beobachtbarkeit, Katalogisierung und Governance – kritische Aspekte, die in Altsystemen häufig isoliert und fragmentiert sind. Diese Fragmentierung kann zu Inkonsistenzen in den Daten, Problemen bei der Governance und erhöhtem Risiko führen. 

So kann beispielsweise ein Finanzinstitut wie Equifax, das auf veraltete Systeme setzt, Schwierigkeiten haben, eine konsistente Datenqualität über verschiedene Abteilungen hinweg sicherzustellen, was zu Fehlern in der Compliance-Berichterstattung oder bei Finanzprognosen führen kann.

Brian Weiss, Chief Technology Officer, Hyperscience

Brian Weiss, Chief Technology Officer, Hyperscience

“Die Etablierung von Datentreue ist eines der größten Hindernisse für die Skalierung von KI. Die meisten Unternehmensdaten sind unstrukturiert und nicht unmittelbar für KI-Systeme nutzbar. Obwohl zahlreiche Tools behaupten, dieses Problem zu lösen, müssen Unternehmen die Datenintegrität sicherstellen, bevor sie sie in KI-Systeme integrieren.

 

Verankerungsmechanismen wie RAG-Architekturen erfordern präzise gelabelte Daten, um zuverlässige und korrekte Ausgaben zu liefern. Der Einsatz von ML, um Verbindungen zwischen eingebetteten Daten herzustellen, unterstreicht zusätzlich die Notwendigkeit qualitativ hochwertiger Daten – denn schlechte Datenqualität kann erhebliche Auswirkungen auf nachgelagerte Systeme haben.

 

Ich bin der Meinung, dass es entscheidend ist, GenAI die spezielle Sprache Ihres Unternehmens beizubringen – basierend auf den verlässlichsten und überprüften Daten aus dem Kernbereich des Unternehmens. Nur so lassen sich Einführung und Wertschöpfung vorantreiben. Dies ist insbesondere dann von Bedeutung, wenn Organisationen von GenAI-Experimenten zu Projekten übergehen, die tatsächlich einen ROI liefern.”

Das Reifegradmodell der Datentreue

Um diese Herausforderungen zu bewältigen und eine solide Grundlage für KI-Erfolg zu schaffen, sollten Unternehmen die Einführung eines Reifegradmodells für Datentreue in Betracht ziehen. Dieses bietet einen Fahrplan, um sich von den Anfangsstadien des Datenmanagements hin zu einem ausgereiften, skalierbaren Ökosystem für Daten-Governance zu entwickeln. 

Dieser Fahrplan umfasst:

  • Frühe Phase: Organisationen konzentrieren sich auf Metadatenmanagement und manuelles Testen wichtiger Assets. Zwar ist dieser Ansatz reaktiv, aber er ist entscheidend, um die Grundlage für weiterführende Praktiken zu schaffen. So könnte ein Startup beispielsweise damit beginnen, seine Kundendaten manuell zu prüfen, um deren Genauigkeit sicherzustellen, bevor es eine KI-gestützte Empfehlungsmaschine einsetzt.

Sie können sich der modernen Datenrevolution anschließen, indem Sie (1) Kontrollen einführen, um die Qualität der Quelldaten sicherzustellen, (2) frühzeitig in den Datenflüssen Ihrer Organisation Werkzeuge und Prozesse für ein gemeinsames (semantisches) Datenverständnis etablieren und (3) Datenarbeit demokratisieren, indem Sie Low-Code/No-Code- und generative KI-Tools für die Datennutzung einführen.

eric best_soundcommerce
  • Stufe "Bewusst und im Wachstum" In dieser Phase verschiebt sich der Fokus einer Organisation hin zu einem proaktiveren Ansatz, indem ein Geschäftsglossar eingeführt, Datenherkunft nachverfolgt, Datenverantwortlichkeiten zugewiesen und grundlegende Datenbeobachtbarkeit implementiert werden. Dieser Schritt ist entscheidend für den Aufbau einer gemeinsamen Datensprache und die Förderung der Zusammenarbeit zwischen Datenteams und Unternehmensbeteiligten. Ein mittelständisches Unternehmen könnte damit beginnen, ein Geschäftsglossar einzuführen, um Begriffe und Definitionen in den verschiedenen Abteilungen zu standardisieren und sicherzustellen, dass beim Analysieren von Verkaufsdaten alle die gleiche Sprache sprechen. 
  • Skalierungsphase Führt fortgeschrittene Praktiken wie PII-Maskierung, formale Governance-Strukturen, umfassende Infrastrukturabdeckung, Datenverträge sowie die Erstellung von Datenprodukten und -domänen ein. In dieser Phase werden Daten wie ein Produkt behandelt – mit gezieltem Design und Wartung zum Nutzen der Anwender. Ein Großunternehmen könnte formelle Daten-Governance-Strukturen aufbauen, um sensible Kundendaten über mehrere globale Märkte hinweg zu verwalten, die Einhaltung lokaler Vorschriften sicherzustellen und das Vertrauen der Kunden zu stärken.

Aus meiner Erfahrung, in der ich Bundesbehörden und Organisationen dabei unterstütze, ihre Daten innerhalb und außerhalb des Kontexts neuer Technologien wie KI besser zu managen, hängt der Erfolg von Datentrust im KI-Zeitalter von der Qualität der Daten ab. Diese Qualität zu erreichen und aufrechtzuerhalten, ist jedoch eine große Herausforderung.

bryaneckle

Die Implementierung eines solchen einheitlichen Reifegradmodells für Datentrust ist entscheidend, um die Grenzen herkömmlicher Technologien zu überwinden und die Komplexität von KI und digitaler Transformation zu meistern. Ein solches Rahmenwerk sollte mehrere miteinander verbundene Komponenten abdecken:

  1. Datenentdeckung und Metadaten-Management
  2. Klassifizierung und Priorisierung von Datenbereichen
  3. Datenbeobachtbarkeit für Zuverlässigkeit und Performance-Monitoring
  4. Verbesserte Zusammenarbeit und Datenverträge
  5. Daten-Governance-Strategien

Durch die Bündelung dieser Funktionen auf einer einzelnen Plattform profitieren Organisationen von nahtloser Integration, reduzierter Abhängigkeit von Anbietern und verbesserter Kommunikation innerhalb ihrer Datenlandschaft.

Eine Organisation im Gesundheitswesen kann durch eine einheitliche Plattform den Datenaustausch zwischen verschiedenen Abteilungen optimieren, das Risiko von Datenpannen verringern und die Behandlungsergebnisse durch besser informierte klinische Entscheidungen verbessern.

Gute Datenerfassung sollte mit Absicht erfolgen. Welche Schlüsselfragen stellen Sie der KI, damit sie Ihnen bei deren Lösung hilft? Welche Daten werden benötigt, um diese Fragen zu beantworten? Indem Geschäftsprozesse von Anfang bis Ende datenorientiert gestaltet werden, können Organisationen die Datenerfassung zu einem routinemäßigen Bestandteil ihrer täglichen Abläufe machen. Wenn Endnutzer die Systeme korrekt verwenden, sind die von ihnen generierten Daten genauer, und die daraus gewonnenen Erkenntnisse aus prädiktiven Modellen oder zur Verbesserung von Aufforderungen für LLMs können tatsächlich einen echten geschäftlichen Mehrwert schaffen.

 

Letztlich bleiben KI-Modelle kaum mehr als wissenschaftliche Experimente, wenn deren Ergebnisse nicht genutzt werden, um bessere Entscheidungen zu treffen. Um sicherzustellen, dass dies passiert, müssen Unternehmen darauf abzielen, Vertrauen – und letztlich die Akzeptanz – dieser Tools zu fördern.

paul harmon

Bewältigung von GenAI-Herausforderungen

Eines der bedeutendsten Probleme, mit denen Organisationen heute konfrontiert sind, ist die zunehmende Komplexität von GenAI-Modellen. Diese Modelle werden häufig mit gewaltigen Datensätzen trainiert, sodass es schwierig ist nachzuvollziehen, wie sie zu ihren Schlussfolgerungen gelangen. Dieser Mangel an Transparenz kann es schwierig machen, den Ergebnissen von GenAI-Modellen zu vertrauen.

Mike Finley, CTO und Mitgründer von AnswerRocket, stellt diese Herausforderung heraus: „Sprachmodelle eröffnen eine ganz neue Angriffsfläche für Daten-Governance-Richtlinien. Daten an ein Modell zu senden, erschließt einen enormen Wert, bringt aber auch neue Bedrohungsszenarien mit sich. Unternehmen sind in dieser Frage gespalten: Traditionell konservative Teams wie IT und Rechtsabteilung treten auf die Bremse, während Strategie-Teams aufs Gaspedal drücken.“

Neben den Herausforderungen der Transparenz können GenAI-Modelle auch anfällig für Verzerrungen sein. Wenn die Daten, mit denen ein GenAI-Modell trainiert wird, voreingenommen sind, wird auch das Modell voreingenommen sein. Dies kann zu unfairen oder diskriminierenden Ergebnissen führen.

Um diese Herausforderungen zu bewältigen, müssen Unternehmen sich der Grenzen von GenAI-Modellen bewusst sein und Maßnahmen treffen, um die Risiken zu mindern. Dazu gehören die Umsetzung solider Daten-Governance-Praktiken, die Sicherstellung einer vorurteilsfreien Datenbasis und Transparenz im Hinblick auf die Grenzen von GenAI-Modellen.

Blane Sims, CPO, Truebit

Blane Sims, CPO, Truebit

“Datenintegrität, obwohl oft im KI-Kontext übersehen, ist von größter Bedeutung. Da KI-Systeme zunehmend Einfluss auf entscheidende Weichenstellungen in verschiedensten Branchen nehmen, ist der Aufbau von Vertrauen in die zugrunde liegenden Daten essenziell. Transparente und überprüfbare Datenprozesse sind das Fundament, auf dem wir KI-Systeme aufbauen können, die nicht nur leistungsstark, sondern auch nachweislich zuverlässig sind.

 

Wenn Organisationen die Vertrauenswürdigkeit ihrer Daten an erste Stelle setzen, können sie mit ihren KI-Initiativen präzise Erkenntnisse gewinnen, regulatorische Anforderungen erfüllen und das Vertrauen der Stakeholder sichern. In dieser neuen Ära liegt der wahre Wettbewerbsvorteil nicht nur in der Umsetzung von KI, sondern in der Implementierung vertrauenswürdiger KI.”

Es ist jedoch wichtig zu betonen, dass die Einführung eines Data-Trust-Frameworks ebenso sehr eine Frage des internen Kulturwandels ist wie eine Frage von Werkzeugen und Prozessen; sie erfordert Zeit, Engagement und einen grundsätzlichen Mentalitätswandel in der gesamten Organisation.

Wie Ted Vial herausstellt, beginnt der Aufbau von Vertrauen in KI mit den Daten, mit denen sie trainiert wird.

KI entwickelt sich rasch zur neuen Suchmaschine und eröffnet damit eine erhebliche Gefahr für die Verbreitung von Fehlinformationen. KI-Unternehmen müssen Vertrauen bei ihren Nutzern aufbauen, und zwar in erster Linie mit den Daten, die sie zur Generierung von Antworten verwenden.

ted vial

Vertrauenswürdigkeit von Daten als Wettbewerbsvorteil in der KI

Mit dem weiteren Wachstum und der Entwicklung der neuen KI-Ära ist Datenvertrauen das Fundament jeder erfolgreichen, KI-gesteuerten Strategie. Der Weg von traditionellen Systemen hin zu einem robusten, skalierbaren und vertrauenswürdigen Datenökosystem erfordert kulturellen Wandel, Investitionen in Governance und einen zukunftsorientierten Ansatz für Technologie.

In diesem neuen Zeitalter werden saubere, verlässliche Daten die Marktführer von den übrigen Unternehmen unterscheiden. Organisationen, die das Vertrauen in Daten in den Mittelpunkt ihrer KI-Initiativen stellen, werden besser in der Lage sein, schneller zu innovieren, personalisiertere Erlebnisse zu bieten und nachhaltiges Wachstum zu sichern. Wenn Sie heute den Fokus auf Datentreue legen, schaffen Sie das Fundament für den KI-gestützten Erfolg von morgen.

Abonnieren Sie den Newsletter des CTO Club, um weitere Einblicke zu KI, Datentreue und der Zukunft technologischer Führung zu erhalten.