Dostosowywanie modelu językowego przy użyciu interfejsu API usługi Azure AI Video Indexer

Artykuł
03/22/2024

Ważne

Ze względu na ogłoszenie wycofania usługi Azure Media Services usługa Azure AI Video Indexer ogłasza zmiany funkcji usługi Azure AI Video Indexer. Zobacz Zmiany związane z wycofaniem usługi Azure Media Service (AMS), aby dowiedzieć się, co to oznacza dla konta usługi Azure AI Video Indexer. Zobacz Przewodnik Przygotowywanie do wycofania usługi AMS: VI aktualizacji i migracji.

Usługa Azure AI Video Indexer umożliwia tworzenie niestandardowych modeli językowych w celu dostosowania rozpoznawania mowy przez przekazanie tekstu adaptacyjnego, a mianowicie tekstu z domeny, której słownictwo ma zostać dostosowane do aparatu. Po wytrenowaniu modelu zostaną rozpoznane nowe wyrazy pojawiające się w tekście adaptacji.

Aby zapoznać się ze szczegółowym omówieniem i najlepszymi rozwiązaniami dotyczącymi niestandardowych modeli językowych, zobacz Dostosowywanie modelu językowego za pomocą usługi Azure AI Video Indexer.

Interfejsy API usługi Azure AI Video Indexer umożliwiają tworzenie i edytowanie niestandardowych modeli językowych na koncie zgodnie z opisem w tym artykule. Możesz również użyć witryny internetowej zgodnie z opisem w temacie Dostosowywanie modelu językowego przy użyciu witryny internetowej usługi Azure AI Video Indexer.

Tworzenie modelu językowego

Interfejs API tworzenia modelu językowego tworzy nowy niestandardowy model językowy na określonym koncie. W tym wywołaniu możesz przekazać pliki dla modelu językowego. Alternatywnie możesz utworzyć tutaj model językowy i przekazać pliki dla modelu później, aktualizując model językowy.

Uwaga

Nadal musisz wytrenować model z włączonymi plikami dla modelu, aby poznać zawartość jego plików. Wskazówki dotyczące trenowania języka znajdują się w następnej sekcji.

Aby przekazać pliki do dodania do modelu językowego, należy przekazać pliki w treści przy użyciu metody FormData, a także podawać wartości dla powyższych wymaganych parametrów. Istnieją dwa sposoby wykonania tego zadania:

Klucz to nazwa pliku, a wartość to plik txt.
Klucz to nazwa pliku, a wartość jest adresem URL do pliku txt.

Response

Odpowiedź zawiera metadane nowo utworzonego modelu językowego wraz z metadanymi w każdym z plików modelu, które są następujące w formacie tego przykładowego kodu wyjściowego JSON:

{
    "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
    "name": "TestModel",
    "language": "En-US",
    "state": "None",
    "languageModelId": "00000000-0000-0000-0000-000000000000",
    "files": [
    {
        "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.6733333"
    },
    {
        "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
        "name": "worldfile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.86"
    }
    ]
}

Trenowanie modelu językowego

Trenowanie interfejsu API modelu językowego trenuje niestandardowy model językowy na określonym koncie z zawartością plików przekazanych do i włączonych w modelu językowym.

Uwaga

Najpierw należy utworzyć model językowy i przekazać jego pliki. Pliki można przekazać podczas tworzenia modelu językowego lub przez zaktualizowanie modelu językowego.

Response

Odpowiedź zawiera metadane nowo wytrenowanego modelu językowego wraz z metadanymi w każdym z plików modelu, które są następujące w formacie tego przykładowego danych wyjściowych JSON:

{
    "id": "41464adf-e432-42b1-8e09-f52905d7e29d",
    "name": "TestModel",
    "language": "En-US",
    "state": "Waiting",
    "languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
    "files": [
    {
        "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
        "name": "RenamedFile",
        "enable": false,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.5233333"
    },
    {
        "id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.68"
    }
    ]
}

Zwracany id jest unikatowym identyfikatorem używanym do rozróżniania modeli językowych, natomiast languageModelId służy zarówno do przekazywania wideo do indeksowania , jak i ponownego indeksowania interfejsów API wideo (znanych również jako linguisticModelId w interfejsach API przekazywania/ponownego indeksowania usługi Azure AI Video Indexer).

Usuwanie modelu językowego

Usunięcie interfejsu API modelu językowego powoduje usunięcie niestandardowego modelu językowego z określonego konta. Dowolny film wideo, który używał usuniętego modelu językowego, zachowuje ten sam indeks do momentu ponownego indeksowania wideo. Jeśli ponownie zaindeksujesz wideo, możesz przypisać nowy model języka do wideo. W przeciwnym razie usługa Azure AI Video Indexer używa domyślnego modelu do ponownego indeksowania wideo.

Response

Po pomyślnym usunięciu modelu językowego nie ma zwracanej zawartości.

Aktualizowanie modelu językowego

Aktualizacja interfejsu API modelu językowego aktualizuje niestandardowy model osoby językowej na określonym koncie.

Uwaga

Musisz już utworzyć model językowy. Za pomocą tego wywołania można włączyć lub wyłączyć wszystkie pliki w modelu, zaktualizować nazwę modelu językowego i przekazać pliki do dodania do modelu językowego.

Klucz to nazwa pliku, a wartość to plik txt.
Klucz to nazwa pliku, a wartość jest adresem URL do pliku txt.

Response

Odpowiedź zawiera metadane nowo wytrenowanego modelu językowego wraz z metadanymi w każdym z plików modelu, które są następujące w formacie tego przykładowego danych wyjściowych JSON:

{
    "id": "41464adf-e432-42b1-8e09-f52905d7e29d",
    "name": "TestModel",
    "language": "En-US",
    "state": "Waiting",
    "languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
    "files": [
    {
        "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
        "name": "RenamedFile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.5233333"
    },
    {
        "id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.68"
    }
    ]
}

id Użyj plików zwróconych w odpowiedzi, aby pobrać zawartość pliku.

Aktualizowanie pliku z modelu językowego

Aktualizacja pliku umożliwia zaktualizowanie nazwy i enable stanu pliku w niestandardowym modelu językowym na określonym koncie.

Response

Odpowiedź zawiera metadane w pliku, który został zaktualizowany zgodnie z formatem przykładowych danych wyjściowych JSON poniżej.

{
  "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
  "name": "RenamedFile",
  "enable": false,
  "creator": "John Doe",
  "creationTime": "2018-04-27T20:10:10.5233333"
}

id Użyj pliku zwróconego w odpowiedzi, aby pobrać zawartość pliku.

Pobieranie określonego modelu językowego

Interfejs API pobierania zwraca informacje o określonym modelu językowym na określonym koncie, takim jak język i pliki, które znajdują się w modelu językowym.

Response

Odpowiedź zawiera metadane określonego modelu językowego wraz z metadanymi w każdym z plików modelu po formacie tego przykładowego danych wyjściowych JSON:

{
    "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
    "name": "TestModel",
    "language": "En-US",
    "state": "None",
    "languageModelId": "00000000-0000-0000-0000-000000000000",
    "files": [
    {
        "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.6733333"
    },
    {
        "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
        "name": "worldfile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.86"
    }
    ]
}

id Użyj pliku zwróconego w odpowiedzi, aby pobrać zawartość pliku.

Pobieranie wszystkich modeli językowych

Funkcja get all API zwraca wszystkie niestandardowe modele językowe na określonym koncie na liście.

Response

Odpowiedź zawiera listę wszystkich modeli językowych na twoim koncie oraz każdy z ich metadanych i plików w formacie tego przykładowego danych wyjściowych JSON:

[
    {
        "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
        "name": "TestModel",
        "language": "En-US",
        "state": "None",
        "languageModelId": "00000000-0000-0000-0000-000000000000",
        "files": [
        {
            "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
            "name": "hellofile",
            "enable": true,
            "creator": "John Doe",
            "creationTime": "2018-04-28T11:55:34.6733333"
        },
        {
            "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
            "name": "worldfile",
            "enable": true,
            "creator": "John Doe",
            "creationTime": "2018-04-28T11:55:34.86"
        }
        ]
    },
    {
        "id": "dfae5745-6f1d-4edd-b224-42e1ab57a892",
        "name": "AnotherTestModel",
        "language": "En-US",
        "state": "None",
        "languageModelId": "00000000-0000-0000-0000-000000000001",
        "files": []
    }
]

Usuwanie pliku z modelu językowego

Interfejs API usuwania usuwa określony plik z określonego modelu językowego na określonym koncie.

Response

Po pomyślnym usunięciu pliku z modelu językowego nie ma zwracanej zawartości.

Pobieranie metadanych w pliku z modelu językowego

Pobieranie metadanych interfejsu API pliku zwraca zawartość pliku i metadanych w określonym pliku z wybranego modelu językowego na twoim koncie.

Response

Odpowiedź zawiera zawartość i metadane pliku w formacie JSON, podobnie jak w tym przykładzie:

{
    "content": "hello\r\nworld",
    "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
    "name": "Hello",
    "enable": true,
    "creator": "John Doe",
    "creationTime": "2018-04-27T20:10:10.5233333"
}

Uwaga

Zawartość tego przykładowego pliku to słowa "hello" i world" w dwóch oddzielnych wierszach.

Pobieranie pliku z modelu językowego

Pobieranie interfejsu API plików pobiera plik tekstowy zawierający zawartość określonego pliku z określonego modelu językowego na określonym koncie. Ten plik tekstowy powinien być zgodny z zawartością pliku tekstowego, który został pierwotnie przekazany.

Response

Odpowiedź to pobieranie pliku tekstowego z zawartością pliku w formacie JSON.

Udostępnij za pośrednictwem

Dostosowywanie modelu językowego przy użyciu interfejsu API usługi Azure AI Video Indexer

Tworzenie modelu językowego

Response

Trenowanie modelu językowego

Response

Usuwanie modelu językowego

Response

Aktualizowanie modelu językowego

Response

Aktualizowanie pliku z modelu językowego

Response

Pobieranie określonego modelu językowego

Response

Pobieranie wszystkich modeli językowych

Response

Usuwanie pliku z modelu językowego

Response

Pobieranie metadanych w pliku z modelu językowego

Response

Pobieranie pliku z modelu językowego

Response

Opinia

Opinia

Dodatkowe zasoby