Snowflake kündigt mit Snowflake Arctic ein offenes Sprachmodell an, das speziell für Unternehmen entwickelt wurde. Durch die dahinterstehende Mixture-of-Experts-Architektur ist Arctic für komplexe Unternehmensaufgaben optimiert und übertrifft mehrere Branchen-Benchmarks, unter anderem beim Generieren von SQL-Abfragen oder beim Befolgen von Anweisungen.
Dabei brauchte Snowflakes KI-Team nur drei Monate und rund ein Achtel der durchschnittlichen Kosten vergleichbarer Modelle. Damit setzt Snowflake neue Maßstäbe für die Geschwindigkeit, in der moderne und offene Modelle für Unternehmen trainiert werden können und ermöglicht den Anwendern eigene angepasste Modelle kosteneffizient in großem Umfang zu erstellen. Unter einer quelloffenen Apache-2.0-Lizenz veröffentlicht Snowflake transparent die Parameter und Trainingsdetails von Arctic.
Arctic erlaubt offene und breit verfügbare Zusammenarbeit
Ein aktueller Bericht von Forrester ergab, dass etwa 46 Prozent der KI-Entscheidungsträger in Unternehmen auf bestehende Open-Source-Sprachmodelle für generative KI zurückgreifen. Die Dateninfrastruktur von Snowflake ermöglicht allen Anwendern, ihre Daten mit branchenführenden offenen Sprachmodellen zu nutzen und dabei flexibel zu entscheiden, auf welche Modelle sie konkret setzen.
Arctic ist ein eigenes, leistungsstarkes und quelloffenes Modell unter der Apache-2.0-Lizenz, die uneingeschränkt private, wissenschaftliche und kommerzielle Nutzung erlaubt. Außerdem bietet Snowflake Code-Vorlagen sowie flexible Inferenz- und Trainingsoptionen an, sodass Nutzer schnell damit beginnen können, Arctic auf ihre bevorzugten Frameworks anzupassen und zu nutzen.
Darunter zählen NVIDIA NIM mit NVIDIA TensorRT-LLM, vLLM und Hugging Face. Für die sofortige Anwendung steht für Arctic die serverlose Inferenz in Snowflake Cortex zur Verfügung, Snowflakes vollständig verwaltetem Dienst für Machine Learning- und KI-Lösungen in der Data Cloud. Zusätzlich wird Arctic auch auf Amazon Web Services (AWS), sowie auf Hugging Face, Lamini, Microsoft Azure, NVIDIA API catalog, Perplexity und Together AI verfügbar sein.
Arctic bietet höchste Intelligenz bei großer Ressourceneffizienz
Die Mixture-of-Experts-Architektur hinter Arctic stärkt sowohl die Trainingssysteme als auch die Modellleistung mit besonderem Augenmerk auf die Bedürfnisse von Unternehmen. So aktiviert Arctic 17 von 480 Milliarden Parametern gleichzeitig und erreicht damit branchenführende Qualität und Token-Effizienz. Während der Inferenz und des Trainings aktiviert Arctic rund 50 Prozent weniger Parameter als DBRX und 75 Prozent weniger als Llama 3 70B.
Zudem übertrifft Arctic andere führende offene Modelle wie DBRX, Llama 2 70B, Mixtral-8x7B beim Generieren von Code (HumanEval+, MBPP+) und von SQL (Spider- und Bird-SQL) – und bietet gleichzeitig starke Leistung beim allgemeinen Sprachverständnis (MMLU). Für das Training wurden die P5-Instances der Amazon Elastic Compute Cloud (Amazon C2) verwendet.
KI-Innovationen für alle Nutzer
Neben dem Sprachmodell beinhaltet die Snowflake Arctic Modell-Familie auch die kürzlich angekündigten „Arctic embed“-Embedding-Modelle, welche ebenfalls über die Open-Source-Lizenz Apache 2.0 angeboten werden. Diese fünf Embedding-Modelle sind ab sofort auf Hugging Face verfügbar und werden bald auch in der Private Preview als Teil der Snowflake Cortex Embed-Funktion nutzbar sein.
Die Embedding-Modelle sind so optimiert, dass sie bei nur einem Drittel der Größe vergleichbarer Modelle dennoch hohe Retrieval-Leistung erbringen. Unternehmen können diese als leistungsstarke und kosteneffiziente Lösung verwenden, wenn sie eigene Datensätze mit Sprachmodellen für Retrieval Augmented Generation oder einen semantischen Suchdienst kombinieren.
Snowflake priorisiert zudem für Kunden den Zugang zu den neuesten und leistungsstärksten Sprachmodellen über die Data Cloud, darunter die jüngsten Erweiterungen: die Modelle von Reka und Mistral AI. Außerdem hat Snowflake kürzlich eine Erweiterung der Partnerschaft mit NVIDIA angekündigt, die die NVIDIA Accelerated Plattform mit der Snowflake Data Cloud verbindet.
Diese Kombination aus Dateninfrastruktur und Rechenleistung dient dazu, die KI-Produktivität zu steigern. Vor diesem Hintergrund hat Snowflake Ventures zuletzt in Mistral AI, Reka und weitere Unternehmen investiert, um Kunden bei der Wertschöpfung ihrer Unternehmensdaten mithilfe von Sprachmodellen und KI zu unterstützen.