Generative KI und LLMs in Azure Databricks

Dieser Artikel enthält eine Übersicht über generative KI auf Databricks und enthält Links zu Beispielnotizbüchern und Demos.

Was ist generative KI?

Generative KI ist eine Art künstlicher Intelligenz, die sich auf die Fähigkeit von Computern konzentriert, Modelle zum Erstellen von Inhalten wie Bildern, Text, Code und synthetischen Daten zu verwenden.

Generative KI-Anwendungen basieren auf großen Sprachmodellen (LLMs) und Foundation-Modellen.

  • LLMs sind Deep Learning-Modelle, die massive Datasets nutzen und trainieren, um in Sprachverarbeitungsaufgaben zu excelieren. Sie erstellen neue Textkombinationen, die natürliche Sprache basierend auf ihren Schulungsdaten nachahmen.
  • Foundation-Modelle sind große ML-Modelle, die mit der Absicht geschult wurden, dass sie für spezifischere Sprachverständnis- und Generationsaufgaben optimiert werden sollen. Diese Modelle werden verwendet, um Muster innerhalb der Eingabedaten zu erkennen.

Nachdem diese Modelle ihre Lernprozesse abgeschlossen haben, generieren sie statistisch wahrscheinliche Ausgaben, wenn sie dazu aufgefordert werden, und sie können eingesetzt werden, um verschiedene Aufgaben auszuführen, darunter:

  • Die Bildgenerierung basiert auf vorhandenen Oder mithilfe der Formatvorlage eines Bilds, um ein neues Bild zu ändern oder zu erstellen.
  • Sprachaufgaben wie Transkription, Übersetzung, Frage-/Antwortgenerierung und Interpretation der Absicht oder Bedeutung von Text.

Wichtig

Während viele LLMs oder andere generative KI-Modelle Sicherheitsvorkehrungen haben, können sie weiterhin schädliche oder ungenaue Informationen generieren.

Generative KI hat die folgenden Entwurfsmuster:

  • Prompt Engineering: Erstellen spezieller Prompts zur Steuerung des LLM-Verhaltens
  • Retrieval Augmented Generation (RAG): Kombinieren eines LLM mit externem Wissensabruf
  • Optimierung: Anpassen eines vortrainierten LLM an bestimmte Datasets von Domänen
  • Vorabtraining: Trainieren eines LLM von Grund auf

Entwickeln von generativen KI und LLMs in Azure Databricks

Azure Databricks vereint den KI-Lebenszyklus von der Datensammlung und -vorbereitung bis hin zur Modellentwicklung und LLMOps zur Bereitstellung und Überwachung. Die folgenden Features sind speziell optimiert, um die Entwicklung von generativen KI-Anwendungen zu erleichtern:

Zusätzliche Ressourcen