Der Umgang mit Daten in den Unternehmen verändert sich gerade rasant. Treiber dieser Entwicklung sind dabei weniger die Technologieanbieter, sondern die User moderner Anwendungen – Unternehmen wie private Endkunden gleichermaßen. Welche Ansprüche sie alle an Applikationen stellen und was dies für das zeitgemäße Datenbankmanagement bedeutet, erklärt der Datenbankanbieter Aerospike.
Die Entwicklungen im Bereich Datenbanken sind derzeit von drei wesentlichen Strömungen geprägt. Die Künstliche Intelligenz (KI) spielt dabei eine wesentliche Rolle, ist jedoch nur einer der bestimmenden Faktoren.
Vektoren auf dem Vormarsch
Das Wissen um Künstliche Intelligenz und ihre Möglichkeiten ist in der Mitte der Gesellschaft angekommen. Der einfache Zugang zu Large Language Models (LLM) und generativer KI wie beispielweise ChatGPT hat nicht nur das Interesse daran, sondern vor allem die Nutzung von Künstlicher Intelligenz befeuert. Das wiederum lässt die Nachfrage nach Vektordatenbanken steigen.
Deren Stärke: Sie organisieren Daten in Form von mehrdimensionalen Vektoren. Damit lassen sich selbst unstrukturierte Daten wie Texte, Bilder oder Videos mit ihrer Vielzahl an Merkmalen detailreich beschreiben, und zwar in Form von geordneten Listen oder Zahlenfolgen.
Vektordatenbanken speichern diese Vektoren und ermöglichen komplexe Abfragen und Analysen, etwa um die Ähnlichkeit zwischen Datenpunkten in einem gegebenen Kontext zu bestimmen. Sie eignen sich daher ideal für die kontextbezogene Bild- und Texterkennung, die Suche nach ähnlichen Assets sowie für personalisierte Empfehlungen.
Datenbankanbieter bemühen sich derzeit, die Algorithmen für die Ähnlichkeitssuche weiter zu verfeinern. Gleichzeitig wird daran gearbeitet, die Datenbanken noch leistungsfähiger zu machen. Sie sollen innerhalb eines gegebenen Zeitraums deutlich mehr Vektoren aufnehmen, durchsuchen und die Ergebnisse daraus innerhalb eines zeitgebundenen Service Level Agreements (SLA) bereitstellen können.
Doch Vektoren bieten noch weitere Vorteile. Sie können zum Beispiel Large Language Models korrigieren und so das als „Halluzinieren“ bekannte „freie Erfinden“ von Inhalten verhindern. Außerdem lässt sich über Vektoren mehr unternehmensspezifischer Kontext einbinden – nicht zuletzt mittels Retrieval Augmented Generation (RAG). Und dies wiederum steigert den konkreten Nutzen von KI-Systemen.
Unternehmen, die eine Vektordatenbank implementieren möchten, sollten jedoch darauf achten, dass diese auch sehr komplexe Zusammenhänge abbilden und segmentieren kann. Denn jeder Webseitenbesucher und jedes angebotene Produkt befindet sich in einem bestimmten Kontext. Und die Datenbank muss in der Lage sein, kontextbezogen und unter Beachtung der Wünsche des Kunden und dessen Kohorte die passenden Ergebnisse zu liefern.
Forderungen nach Transaktionen in Echtzeit nehmen zu
Um den Anforderungen von Nutzern gerecht zu werden, müssen die Datenbereitstellung sowie Analysen und Transaktionen global in Echtzeit erfolgen. „Genau das ist einer der Gründe, weshalb aus Large Language Models vielerorts noch nicht der volle Nutzen gezogen wird“, sagt Lenley Hensarling, Chief Product Officer bei Aerospike.
„Echtzeit bedeutet in diesem Zusammenhang übrigens nicht binnen 20 Millisekunden. Für eine Proximity-Suche können auch 80 Millisekunden ausreichen. Aber diese Geschwindigkeit muss auch bei einem hohen Durchsatz gewährleistet sein, selbst wenn 100.000 Kunden gleichzeitig eine Website besuchen.“
Konsumenten empfinden sehr kurze Reaktionszeiten von Webseiten und Portalen bei ihren privaten Online-Einkäufen mittlerweile als ganz normal. Daraus entsteht eine Erwartungshaltung, die sich auf den B2B-Bereich ausweitet. Egal ob ein Großunternehmen Anschaffungen tätigt oder Lieferantenverträge verlängert werden: Es wird erwartet, dass Informationen sofort verfügbar sind, und das weltweit zur gleichen Zeit.
Auch hier gilt: Echtzeit ist relativ. Transaktionszeiten müssen im Businessumfeld nicht im Bereich von unter einer Millisekunde liegen. „Es geht eher um 100 oder 150 Millisekunden. Diese immer noch sehr hohe Geschwindigkeit ist allerdings zwingend erforderlich für Anwendungen im Finanzdienstleistungssektor oder dem Handel“, erklärt Hensarling.
Nachhaltigkeit und Kosteneffizienz im Doppelpack
Darüber hinaus genügt es heute nicht mehr, IT-Ressourcen effizient zu nutzen und Betriebskosten zu senken. Online-Transaktionen sollen zudem so nachhaltig wie möglich sein. Das Gebot der Stunde im Datenbankmanagement lautet daher, mehr Daten auf einem Node zu speichern, also mit einem geringeren Ressourceneinsatz mehr zu erreichen.
Dem französischen Ad-Tech-Spezialisten Criteo ist genau das gelungen. Das Unternehmen unterhielt eine Infrastruktur mit Tausenden von Servern. Nach dem Wechsel des Datenbankanbieters waren dafür nur noch einige Hundert Server nötig. Criteo konnte sogar ein ganzes Rechenzentrum schließen.
Dieses Beispiel zeigt, dass sich der Wechsel zu einer leistungsfähigeren Datenbank nicht nur finanziell bezahlt macht. Gleichzeitig erfüllt er die Forderungen nach einem umweltfreundlicheren Verhalten und bewussten Energieverbrauch. Denn heute liegt der Fokus auf beidem, mehr Effizienz und mehr Nachhaltigkeit – auch bei Datenbanken.
Fazit
Egal ob private Haushalte oder Unternehmen, Kunden setzen gegenüber Herstellern und Händlern hohe Maßstäbe an: effiziente Prozesse durch KI, Informationen in Echtzeit und eine IT, die neben dem Budget auch die Umwelt schont. Zeitgemäße Datenbanken müssen sich an diesem Anspruch messen lassen.