Wybór technologii usług poznawczych firmy Microsoft

Usługi poznawcze firmy Microsoft to oparte na chmurze interfejsy API, których można używać w aplikacjach sztucznej analizy (AI) i przepływach danych. Udostępniają one modele, które są gotowe do użycia w aplikacji, ale nie wymagają żadnych danych ani nie mają szkolenia modeli. Usługi poznawcze są opracowywane przez zespół AI i badawczy firmy Microsoft oraz wykorzystują najnowsze algorytmy uczenia głębokiego. Są one używane przez interfejsy REST protokołu HTTP. Ponadto zestawy SDK są dostępne dla wielu typowych platform programistycznych aplikacji.

Usługi poznawcze obejmują:

  • Analiza tekstu
  • Przetwarzanie obrazów
  • Analiza wideo
  • Rozpoznawanie mowy i generowanie
  • Interpretacja języka naturalnego
  • Inteligentne wyszukiwanie

Najważniejsze zalety:

  • Minimalne nakłady programistyczne dla najnowocześniejszych usług AI.
  • Łatwa integracja z aplikacjami za pośrednictwem interfejsów REST protokołu HTTP.
  • Wbudowana obsługa konsumowania usług poznawczych w Azure Data Lake Analytics.

Zagadnienia do rozważenia:

  • Dostępne tylko w sieci Web. Połączenie z Internetem jest zwykle wymagane. Wyjątkiem jest Custom Vision Service, którego model szkolony można eksportować w celu przewidywania na urządzeniach i w usłudze IoT Edge.

  • Chociaż jest obsługiwane znaczące dostosowanie, dostępne usługi mogą nie spełniać wszystkich wymagań analizy predykcyjnej.

Jakie opcje są dostępne podczas wybierania usług poznawczych?

Na platformie Azure dostępne są dziesiątki Cognitive Services dostępnych. Aktualna lista tych elementów jest dostępna w katalogu pogrupowanym według obszaru funkcjonalnego, który obsługuje:

Kryteria wyboru klucza

Aby zawęzić opcje, Zacznij od udzielenia odpowiedzi na następujące pytania:

  • Jakiego typu dane chcesz się zastanowić? Zawęź opcje w zależności od typu danych wejściowych, z którymi pracujesz. Na przykład, jeśli dane wejściowe to tekst, wybierz pozycję z usług, które mają typ danych wejściowych.

  • Czy masz dane do uczenia modelu? Jeśli tak, weź pod uwagę niestandardowe usługi, które umożliwiają uczenie modeli źródłowych z danymi, które zapewniasz, aby zwiększyć dokładność i wydajność.

Macierz możliwości

W poniższej tabeli zestawiono kluczowe różnice w możliwościach.

Używa wstępnie skompilowanych modeli

Możliwość Typ danych wejściowych Najważniejsze korzyści
Interfejs API analizy tekstu Tekst Oceń tonacji i tematy, aby zrozumieć, czego chcą użytkownicy.
Interfejs API łączenia jednostek Tekst Włącz linki do danych aplikacji przy użyciu nazwanego rozpoznawania jednostek i uściślania.
Language Understanding Intelligent Service (LUIS) Tekst Pouczyj swoje aplikacje, aby poznać polecenia od użytkowników.
Usługa QnA Maker Tekst W artykule pozostała często zadawane pytania informacje są wyświetlane na konwersacje i łatwe do nawigowania.
Interfejs API analizy językowej Tekst Uprość złożone koncepcje językowe i Analizuj tekst.
Usługa Knowledge Exploration Tekst Włącz interaktywne wyszukiwanie za pośrednictwem danych ze strukturą za pomocą wejść w języku naturalnym.
Interfejs API modelu języka sieci Web Tekst Używaj modeli języka predykcyjnego przeszkolonych na danych w skali sieci Web.
Academic Knowledge API Tekst Skorzystaj z bogactwa zawartości akademickiej w Microsoft Academic Graph wypełnionej przez usługę Bing.
Interfejs API automatycznego sugerowania Bing Tekst Nadaj aplikacji inteligentne opcje automatycznego sugerowania dla wyszukiwania.
Interfejs API sprawdzania pisowni Bing Tekst Wykrywaj i Poprawiaj błędy pisowni w aplikacji.
Interfejs API tekstu usługi Translator Tekst Tłumaczenie maszynowe.
Interfejs API zaleceń Tekst Przewidywanie i zalecanie elementów potrzebnych klientom.
Interfejs API wyszukiwania jednostek Bing Tekst (kwerenda wyszukiwania w sieci Web) Zidentyfikuj i uzupełnij informacje o jednostkach z sieci Web.
Interfejs API wyszukiwania obrazów Bing Tekst (kwerenda wyszukiwania w sieci Web) Wyszukaj obrazy.
Interfejs API wyszukiwania wiadomości Bing Tekst (kwerenda wyszukiwania w sieci Web) Wyszukaj wiadomości.
Interfejs API wyszukiwania wideo Bing Tekst (kwerenda wyszukiwania w sieci Web) Wyszukaj filmy wideo.
Interfejs API wyszukiwania w Internecie Bing Tekst (kwerenda wyszukiwania w sieci Web) Uzyskaj rozszerzone informacje o wyszukiwaniu z miliardów dokumentów w sieci Web.
Interfejs API rozpoznawania mowy Bing Tekst lub mowę Konwertuj mowę na tekst i wróć ponownie.
Interfejs API rozpoznawania osoby mówiącej Mowa Użyj mowy, aby identyfikować i uwierzytelniać poszczególne głośniki.
Interfejs API tłumaczenia mowy w usłudze Translator Mowa Wykonaj Tłumaczenie mowy w czasie rzeczywistym.
Interfejs API przetwarzania obrazów Obrazy (lub ramki z filmu wideo) Informacje o poddanej reakcji z obrazów, automatyczne tworzenie opisu zdjęć, tagów pochodnych, rozpoznawanie osobistości, Wyodrębnianie tekstu i tworzenie dokładnych miniatur.
Content Moderator Tekst, obrazy lub wideo Automatyczne moderowanie obrazów, tekstu i wideo.
Interfejs API rozpoznawania emocji Obrazy (fotografie z podmiotami ludzkimi) Zidentyfikuj zakres emocji osób ludzkich.
Interfejs API rozpoznawania twarzy Obrazy (fotografie z podmiotami ludzkimi) Wykrywaj, Identyfikuj, Analizuj, Organizuj i oznaczaj twarze na zdjęciach.
Video Indexer Wideo Szczegółowe informacje wideo, takie jak tonacji, transkrypcja mowy, Tłumaczenie mowy, rozpoznawanie twarzy i emocji oraz wyodrębnianie słów kluczowych.

Przeszkolony z danymi niestandardowymi, które udostępniasz

Możliwość Typ danych wejściowych Najważniejsze korzyści
Custom Vision Service Obrazy (lub ramki z filmu wideo) Dostosuj własne modele przetwarzania obrazów.
Custom Speech Service Mowa Pokonaj bariery rozpoznawania mowy, takie jak styl mówiący, hałas w tle i słownictwo.
Custom Decision Service Zawartość sieci Web (na przykład źródła danych RSS) Użyj uczenia maszynowego, aby automatycznie wybrać odpowiednią zawartość strony głównej
Interfejs API wyszukiwania niestandardowego Bing Tekst (kwerenda wyszukiwania w sieci Web) Narzędzie wyszukiwania jakości komercyjnej.