Databricks führt SQL Analytics ein, damit Data Analysten Workloads, anstatt in einem Data Warehouse, direkt in einem Data Lake durchführen können. Damit wird der traditionelle Umfang eines Data Lakes von Data Science und ML auf alle Daten-Workloads einschließlich BI und SQL ausgeweitet. Zudem vereinfacht eine Lakehouse-Architektur die Datenauswertung und die Nutzung der KI.
In der Vergangenheit mussten Data Teams proprietäre Data Warehouses für Business Intelligence Workloads und Data Lakes für Data Science- und ML-Workloads pflegen, da keine einzige Datenplattform die Leistungsanforderungen der BI Anwendungen und die Flexibilitätsanforderungen der Data Science Anwendungen erfüllen konnte.
Diese Koexistenz von Legacy-Architekturen, die teuer und kompliziert in der Wartung ist, hat Datensilos geschaffen, die die Innovation verlangsamen und die Produktivität der Data Teams behindern. Ein Lakehouse löst dieses Problem, indem alle Workloads über eine einzige Architektur laufen.
„Es geht nicht mehr darum, ob Unternehmen ihre Daten in die Cloud verlagern, sondern wann. Eine Lakehouse-Architektur, die auf einem Data Lake aufbaut, ist die ideale Datenarchitektur für datengetriebene Unternehmen, und diese Einführung bietet unseren Kunden eine weitaus bessere Option, wenn es um ihre Datenstrategie geht“, sagt Ali Ghodsi, CEO und Mitbegründer von Databricks.
„Wir haben mit Tausenden von Kunden zusammengearbeitet, um zu verstehen, wohin sie ihre Datenstrategie führen wollen, und die Antwort ist überwältigend zugunsten von Data Lakes. Tatsache ist, dass sie riesige Datenmengen in ihren Data Lakes haben, und mit SQL Analytics können sie diese Daten nun tatsächlich abfragen, indem sie eine direkte Verbindung zu ihren BI-Tools wie Tableau herstellen.“
SQL Analytics baut auf Delta Lake auf, einer auf einem offenen Format basierenden Daten-Engine, die Zuverlässigkeit, Qualität und Sicherheit zu dem vorhandenen Data Lake des Kunden hinzufügt. Unternehmen können es vermeiden mehrere Datenkopien zu speichern und Daten in proprietären Formaten vorhalten zu müssen.
Um BI-Performance auf einem Data Lake zu liefern, nutzt SQL Analytics zwei einzigartige Innovationen. Erstens bietet es benutzerfreundliche Endpunkte mit automatischer Skalierung, die die Abfragelatenz auch bei hoher Benutzerlast konstant niedrig halten. Zweitens verwendet es Delta Engine, die einzigartige Query Execution-Maschine von Databricks, um Abfragen sowohl für große als auch für kleine Datensätze extrem schnell auszuführen.
Mit nativen Konnektoren für alle wichtigen BI-Tools, einschließlich Tableau und Microsoft Power BI, können Kunden SQL Analytics problemlos in ihre bestehenden BI-Workflows integrieren, um Analysen mit wesentlich frischeren und vollständigeren Daten als je zuvor durchzuführen.
SQL Analytics bietet außerdem eine SQL-native Abfrage- und Visualisierungsoberfläche, die es Analysten, Data Scientists und Entwicklern ohne Zugriff auf herkömmliche BI-Tools ermöglicht, Dashboards und Berichte zu erstellen, die problemlos innerhalb des Unternehmens gemeinsam genutzt werden können.
„Mehr denn je benötigen Unternehmen heute eine Datenstrategie, die Schnelligkeit und Agilität ermöglicht, um anpassungsfähig zu sein „Da Unternehmen ihre Daten schnell in die Cloud verlagern, beobachten wir ein wachsendes Interesse an der Durchführung von Analysen auf dem Data Lake“, sagt Francois Ajenstat, Chief Product Officer bei Tableau.
„Die Einführung von SQL Analytics bietet den Kunden eine völlig neue Erfahrung, um Einblicke aus riesigen Datenmengen mit der Leistung, Zuverlässigkeit und Skalierbarkeit zu gewinnen, die sie benötigen. Wir sind stolz auf die Partnerschaft mit Databricks, um diese Möglichkeit zum Leben zu erwecken.“
Die Lakehouse-Architektur wird von folgenden Databricks-Partnern unterstützt:
- BI Partner: Tableau, Qlik, Looker, Thoughtspot
- Ingest Partner: Fivetran, Fishtown Analytics, Talend, Matillion
- Catalog Partner: Collibra, Alation
- Consulting-Partner: Slalom, Thorogood, Advancing Analytics