Välja en Microsoft Cognitive Services-teknik
Microsofts kognitiva tjänster är molnbaserade API:er som du kan använda i AI-program och -dataflöden. De ger dig tränade modeller som är redo att användas i ditt program, vilket kräver inga data och ingen modellträning från din sida. De kognitiva tjänsterna utvecklas av Microsofts AI- och forskningsteam och utnyttjar de senaste djupinlärningsalgoritmerna. De används via HTTP REST-gränssnitt. Dessutom är -SDK:er tillgängliga för många vanliga programutvecklingsramverk.
De kognitiva tjänsterna omfattar:
- Textanalys
- Datorvision
- Videoanalys
- Taligenkänning och generering
- Förståelse för naturligt språk
- Intelligent sökning
Viktiga fördelar:
- Minimalt med utvecklingsarbete för de senaste AI-tjänsterna.
- Enkel integrering i appar via HTTP REST-gränssnitt.
- Inbyggt stöd för att använda kognitiva tjänster i Azure Data Lake Analytics.
Överväganden:
Endast tillgängligt via webben. Internetanslutning krävs vanligtvis. Ett undantag är Custom Vision Service, vars tränade modell du kan exportera för förutsägelse på enheter och på IoT Edge.
Även om det finns stöd för betydande anpassning, kanske de tillgängliga tjänsterna inte passar alla krav för förutsägelseanalys.
Vilka alternativ har du när du väljer bland de kognitiva tjänsterna?
Det finns dussintals tillgängliga Cognitive Services Azure. Den aktuella listan över dessa är tillgänglig i en katalog kategoriserad efter det funktionella område som de stöder:
Nyckelurvalsvillkor
Börja med att besvara de här frågorna för att begränsa alternativen:
Vilken typ av data hanterar du? Begränsa alternativen baserat på vilken typ av indata du arbetar med. Om dina indata till exempel är text väljer du bland de tjänster som har en textinmatningstyp.
Har du data för att träna en modell? Om ja, överväg de anpassade tjänster som gör att du kan träna deras underliggande modeller med data som du tillhandahåller, för bättre noggrannhet och prestanda.
Kapacitetsmatris
I följande tabeller sammanfattas de viktigaste skillnaderna i funktioner.
Använder fördefinierade modeller
| Funktion | Indatatyp | Viktig fördel |
|---|---|---|
| API för textanalys | Text | Utvärdera sentiment och ämnen för att förstå vad användarna vill ha. |
| API för entitetslänkning | Text | Driva appens datalänkar med namngiven entitetsigenkänning och tvetydighet. |
| LUIS (Language Understanding Intelligent Service) | Text | Lär dina appar att förstå kommandon från användarna. |
| QnA Maker Service | Text | Destillera vanliga frågor och svar formaterad information till konversationsbaserade, lättnavigerade svar. |
| API för språkanalys | Text | Förenkla komplexa språkbegrepp och parsa text. |
| Utforskningstjänst för Knowledge | Text | Aktivera interaktiva sökupplevelser över strukturerade data via indata på naturligt språk. |
| Web Language Model API | Text | Använda förutsägelsespråkmodeller som tränats på webbskaliga data. |
| Academic Knowledge API | Text | Utnyttja den stora mängd akademiskt innehåll i Microsoft Academic Graph som fylls av Bing. |
| API för automatiska förslag i Bing | Text | Ge din app intelligenta automatiska förslag för sökningar. |
| Stavningskontrolls-API i Bing | Text | Identifiera och korrigera stavfel i din app. |
| Translator Text API | Text | Maskinöversättning. |
| API för rekommendationer | Text | Förutse och rekommendera objekt som dina kunder vill ha. |
| API för entitetsökning i Bing | Text (webbsökfråga) | Identifiera och utöka entitetsinformation från webben. |
| API för bildsökning i Bing | Text (webbsökfråga) | Sök efter bilder. |
| API för nyhetssökning i Bing | Text (webbsökfråga) | Sök efter nyheter. |
| API för videosökning i Bing | Text (webbsökfråga) | Sök efter videor. |
| API för webbsökning i Bing | Text (webbsökfråga) | Få förbättrad sökinformation från miljarder webbdokument. |
| API för Bing-taligenkänning | Text eller tal | Konvertera tal till text och tillbaka igen. |
| Talarigenkännings-API | Speech | Använd tal för att identifiera och autentisera enskilda talare. |
| Translator Speech API | Speech | Utföra talöversättning i realtid. |
| API:et för Visuellt innehåll | Bilder (eller bildrutor från video) | Hämta åtgärdsbar information från bilder, skapa automatiskt en beskrivning av foton, härled taggar, identifiera kändisar, extrahera text och skapa korrekta miniatyrbilder. |
| Content Moderator | Text, bilder eller video | Automatiserad bild-, text- och videomoderering. |
| Känslo-API | Bilder (foton med mänskliga ämnen) | Identifiera de mänskliga ämnenas känsloomfång. |
| Ansikts-API | Bilder (foton med mänskliga ämnen) | Identifiera, identifiera, analysera, organisera och tagga ansikten i foton. |
| Video Indexer | Video | Videoinsikter som sentiment, avskriftstal, översätta tal, känna igen ansikten och känslor och extrahera nyckelord. |
Tränad med anpassade data som du anger
| Funktion | Indatatyp | Viktig fördel |
|---|---|---|
| Custom Vision Service | Bilder (eller bildrutor från video) | Anpassa dina egna modeller för datorseende. |
| Tjänst för anpassat tal | Speech | Du kan lösa hinder för taligenkänning som talstil, bakgrundsbrus och vokabulär. |
| Custom Decision Service | Webbinnehåll (till exempel RSS-feed) | Använd maskininlärning för att automatiskt välja lämpligt innehåll för din startsida |
| API för anpassad Bing-sökning | Text (webbsökfråga) | Sökverktyg i kommersiell klass. |