Dowiedz się, jak wygenerować osadzanie za pomocą usługi Azure OpenAI

Osadzanie to specjalny format reprezentacji danych, który może być łatwo używany przez modele i algorytmy uczenia maszynowego. Osadzanie to gęsta reprezentacja semantycznego znaczenia tekstu. Każde osadzanie jest wektorem liczb zmiennoprzecinkowych, tak aby odległość między dwoma osadzaniami w przestrzeni wektorowej została skorelowana z podobieństwem semantycznym między dwoma danymi wejściowymi w oryginalnym formacie. Jeśli na przykład dwa teksty są podobne, ich reprezentacje wektorowe również powinny być podobne. Osadzanie wyszukiwania wektorów zasilania w bazach danych platformy Azure, takich jak Azure Cosmos DB for MongoDB vCore lub Azure Database for PostgreSQL — serwer elastyczny.

Jak uzyskać osadzanie

Aby uzyskać wektor osadzania dla fragmentu tekstu, wysyłamy żądanie do punktu końcowego osadzania, jak pokazano w poniższych fragmentach kodu:

curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings?api-version=2024-02-01\
  -H 'Content-Type: application/json' \
  -H 'api-key: YOUR_API_KEY' \
  -d '{"input": "Sample Document goes here"}'

Najlepsze rozwiązania

Sprawdź, czy dane wejściowe nie przekraczają maksymalnej długości

  • Maksymalna długość tekstu wejściowego dla naszych najnowszych modeli osadzania to 8192 tokeny. Przed złożeniem żądania należy sprawdzić, czy dane wejściowe nie przekraczają tego limitu.
  • W przypadku wysyłania tablicy danych wejściowych w jednym żądaniu osadzania maksymalny rozmiar tablicy to 2048.

Ograniczenia i czynniki ryzyka

Nasze modele osadzania mogą być zawodne lub stanowić zagrożenie społeczne w niektórych przypadkach i mogą powodować szkody w przypadku braku środków zaradczych. Zapoznaj się z naszą zawartością odpowiedzialnej sztucznej inteligencji, aby uzyskać więcej informacji na temat odpowiedzialnego podejścia do ich używania.

Następne kroki