Erfassungsclient mit Azure KI Services

Der Erfassungsclient ist ein Tool, das von Microsoft auf GitHub veröffentlicht wurde und mit dem Sie schnell eine für Call Center geeignete Transkriptionslösung für Azure mit einem programmierfreien Ansatz bereitstellen können.

Tipp

Sie können das Tool und die resultierende Lösung in der Produktionsumgebung verwenden, um eine große Menge von Audiodaten zu verarbeiten.

Der Erfassungsclient verwendet Azure KI Language, Azure KI Speech, Azure Storage und Azure Functions.

Erste Schritte mit dem Erfassungsclient

Zum Ausführen des Erfassungsclients sind ein Azure-Konto und eine Azure AI Services-Ressource für mehrere Diensten erforderlich.

Informationen zum Einrichten und Verwenden des Tools finden Sie im Leitfaden zu den ersten Schritten für den Erfassungsclient auf GitHub.

Features des Erfassungsclients

Der Erfassungsclient funktioniert, indem er eine serverlose Verbindung zwischen einem dedizierten Azure-Speicherkonto und benutzerdefiniertem Azure Functions herstellt, um Transkriptionsanforderungen an den Dienst zu übergeben. Die transkribierten Audiodateien werden im dedizierten Azure Storage-Container gespeichert.

Wichtig

Die Preise variieren je nach Betriebsmodus (Batch oder Echtzeit) und ausgewählter Azure-Funktions-SKU. Standardmäßig erstellt das Tool eine Azure-Premium-Funktions-SKU, um große Mengen zu verarbeiten. Weitere Informationen hierzu finden Sie in der Preisübersicht.

Intern verwendet das Tool die Speech- und Language-Dienste und folgt bewährten Methoden zur Handhabung von Hochskalierung, Wiederholungen und Failover. Das folgende Schema beschreibt die Ressourcen und Verbindungen.

Diagram that shows the Ingestion Client Architecture.

Das folgende Feature des Speech-Diensts wird vom Erfassungsclient verwendet:

  • Batch-Spracherkennung: Transkribiert große Mengen von Audiodateien asynchron, einschließlich Sprecherdiarisierung; wird typischerweise in Analyseszenarien nach einem Anruf verwendet. Diarisierung ist der Vorgang der Erkennung und Aufteilung von Sprechern in Monokanal-Audiodaten.

Hier sehen Sie einige Features des Sprachdiensts, die vom Erfassungsclient verwendet werden:

Neben Azure KI Services werden diese Azure-Produkte verwendet, um die Lösung zu vervollständigen:

  • Azure Storage: für die Speicherung von Telefoniedaten und der von der Batch-Transkriptions-API zurückgegebenen Transkripte. Dieses Speicherkonto sollte Benachrichtigungen verwenden, insbesondere wenn neue Dateien hinzugefügt werden. Mit diesen Benachrichtigungen wird der Transkriptionsprozess ausgelöst.
  • Azure Functions: zum Erstellen des SAS-URI (Shared Access Signatures) für jede Aufzeichnung und Auslösen der HTTP POST-Anforderung zum Starten einer Transkription. Darüber hinaus werden mit Azure Functions Anforderungen zum Abrufen und Löschen von Transkriptionen mit der Batch-Transkriptions-API erstellt.

Toolanpassung

Das Tool wurde erstellt, um den Kunden schnell Ergebnisse zu zeigen. Sie können das Tool an die von Ihnen bevorzugten SKUs und Einstellungen anpassen. Die SKUs können über das Azure-Portal bearbeitet werden und der Code selbst ist auf GitHub verfügbar.

Hinweis

Wir empfehlen, die Ressourcen in einer eigenen Ressourcengruppe zu erstellen, um die Kosten besser nachvollziehen und nachverfolgen zu können.

Nächste Schritte