Välja en Microsoft Cognitive Services-teknik

Microsofts kognitiva tjänster är molnbaserade API:er som du kan använda i AI-program och -dataflöden. De ger dig tränade modeller som är redo att användas i ditt program, vilket kräver inga data och ingen modellträning från din sida. De kognitiva tjänsterna utvecklas av Microsofts AI- och forskningsteam och utnyttjar de senaste djupinlärningsalgoritmerna. De används via HTTP REST-gränssnitt. Dessutom är -SDK:er tillgängliga för många vanliga programutvecklingsramverk.

De kognitiva tjänsterna omfattar:

  • Textanalys
  • Datorvision
  • Videoanalys
  • Taligenkänning och generering
  • Förståelse för naturligt språk
  • Intelligent sökning

Viktiga fördelar:

  • Minimalt med utvecklingsarbete för de senaste AI-tjänsterna.
  • Enkel integrering i appar via HTTP REST-gränssnitt.
  • Inbyggt stöd för att använda kognitiva tjänster i Azure Data Lake Analytics.

Överväganden:

  • Endast tillgängligt via webben. Internetanslutning krävs vanligtvis. Ett undantag är Custom Vision Service, vars tränade modell du kan exportera för förutsägelse på enheter och på IoT Edge.

  • Även om det finns stöd för betydande anpassning, kanske de tillgängliga tjänsterna inte passar alla krav för förutsägelseanalys.

Vilka alternativ har du när du väljer bland de kognitiva tjänsterna?

Det finns dussintals tillgängliga Cognitive Services Azure. Den aktuella listan över dessa är tillgänglig i en katalog kategoriserad efter det funktionella område som de stöder:

Nyckelurvalsvillkor

Börja med att besvara de här frågorna för att begränsa alternativen:

  • Vilken typ av data hanterar du? Begränsa alternativen baserat på vilken typ av indata du arbetar med. Om dina indata till exempel är text väljer du bland de tjänster som har en textinmatningstyp.

  • Har du data för att träna en modell? Om ja, överväg de anpassade tjänster som gör att du kan träna deras underliggande modeller med data som du tillhandahåller, för bättre noggrannhet och prestanda.

Kapacitetsmatris

I följande tabeller sammanfattas de viktigaste skillnaderna i funktioner.

Använder fördefinierade modeller

Funktion Indatatyp Viktig fördel
API för textanalys Text Utvärdera sentiment och ämnen för att förstå vad användarna vill ha.
API för entitetslänkning Text Driva appens datalänkar med namngiven entitetsigenkänning och tvetydighet.
LUIS (Language Understanding Intelligent Service) Text Lär dina appar att förstå kommandon från användarna.
QnA Maker Service Text Destillera vanliga frågor och svar formaterad information till konversationsbaserade, lättnavigerade svar.
API för språkanalys Text Förenkla komplexa språkbegrepp och parsa text.
Utforskningstjänst för Knowledge Text Aktivera interaktiva sökupplevelser över strukturerade data via indata på naturligt språk.
Web Language Model API Text Använda förutsägelsespråkmodeller som tränats på webbskaliga data.
Academic Knowledge API Text Utnyttja den stora mängd akademiskt innehåll i Microsoft Academic Graph som fylls av Bing.
API för automatiska förslag i Bing Text Ge din app intelligenta automatiska förslag för sökningar.
Stavningskontrolls-API i Bing Text Identifiera och korrigera stavfel i din app.
Translator Text API Text Maskinöversättning.
API för rekommendationer Text Förutse och rekommendera objekt som dina kunder vill ha.
API för entitetsökning i Bing Text (webbsökfråga) Identifiera och utöka entitetsinformation från webben.
API för bildsökning i Bing Text (webbsökfråga) Sök efter bilder.
API för nyhetssökning i Bing Text (webbsökfråga) Sök efter nyheter.
API för videosökning i Bing Text (webbsökfråga) Sök efter videor.
API för webbsökning i Bing Text (webbsökfråga) Få förbättrad sökinformation från miljarder webbdokument.
API för Bing-taligenkänning Text eller tal Konvertera tal till text och tillbaka igen.
Talarigenkännings-API Speech Använd tal för att identifiera och autentisera enskilda talare.
Translator Speech API Speech Utföra talöversättning i realtid.
API:et för Visuellt innehåll Bilder (eller bildrutor från video) Hämta åtgärdsbar information från bilder, skapa automatiskt en beskrivning av foton, härled taggar, identifiera kändisar, extrahera text och skapa korrekta miniatyrbilder.
Content Moderator Text, bilder eller video Automatiserad bild-, text- och videomoderering.
Känslo-API Bilder (foton med mänskliga ämnen) Identifiera de mänskliga ämnenas känsloomfång.
Ansikts-API Bilder (foton med mänskliga ämnen) Identifiera, identifiera, analysera, organisera och tagga ansikten i foton.
Video Indexer Video Videoinsikter som sentiment, avskriftstal, översätta tal, känna igen ansikten och känslor och extrahera nyckelord.

Tränad med anpassade data som du anger

Funktion Indatatyp Viktig fördel
Custom Vision Service Bilder (eller bildrutor från video) Anpassa dina egna modeller för datorseende.
Tjänst för anpassat tal Speech Du kan lösa hinder för taligenkänning som talstil, bakgrundsbrus och vokabulär.
Custom Decision Service Webbinnehåll (till exempel RSS-feed) Använd maskininlärning för att automatiskt välja lämpligt innehåll för din startsida
API för anpassad Bing-sökning Text (webbsökfråga) Sökverktyg i kommersiell klass.