Volba technologie služeb Microsoft Cognitive Services

Microsoft Cognitive Services jsou cloudová rozhraní API, která můžete použít v aplikacích umělé inteligence (AI) a tocích dat. Poskytují předem vytrénované modely, které jsou připravené k použití ve vaší aplikaci a nevyžadují žádná data ani trénování modelu. Kognitivní služby vyvíjí tým Microsoftu pro AI a výzkum a využívá nejnovější algoritmy hlubokého učení. Využívají se přes rozhraní HTTP REST. Kromě toho jsou k dispozici pro mnoho běžných architektur vývoje aplikací.

Mezi kognitivní služby patří:

  • Analýza textu
  • Počítačové zpracování obrazu
  • Analýza videa
  • Rozpoznávání a generování řeči
  • Porozumění přirozenému jazyku
  • Inteligentní vyhledávání

Klíčové výhody:

  • Minimální úsilí při vývoji moderních služeb AI
  • Snadná integrace do aplikací prostřednictvím rozhraní HTTP REST
  • Integrovaná podpora využívání kognitivních služeb v Azure Data Lake Analytics.

Požadavky:

  • K dispozici pouze přes web. Připojení k internetu se obvykle vyžaduje. Výjimkou je služba Custom Vision, jejíž vytrénovaný model můžete exportovat pro predikce na zařízeních a na hraničních zařízeních IoT.

  • I když je podporováno značné přizpůsobení, nemusí dostupné služby vyhovovat všem požadavkům prediktivní analýzy.

Jaké máte možnosti při výběru mezi kognitivními službami?

V Azure jsou k dispozici desítky Cognitive Services zařízení. Aktuální výpis je k dispozici v adresáři, který je rozdělený podle funkční oblasti, kterou podporují:

Klíčová kritéria výběru

Pokud chcete tyto volby zúžit, začněte zodpovězením těchto otázek:

  • S jakým typem dat se jedná? Zužte možnosti na základě typu vstupních dat, se kterou pracujete. Pokud je váš vstup například text, vyberte ze služeb, které mají vstupní typ textu.

  • Máte data pro trénování modelu? Pokud ano, zvažte vlastní služby, které vám umožní trénovat jejich základní modely s daty, která poskytnete, a zajistit tak vyšší přesnost a výkon.

Matice schopností

Následující tabulky shrnují hlavní rozdíly v možnostech.

Používá předem sestavené modely.

Schopnost Typ vstupu Klíčová výhoda
Analýza textu Text Vyhodnoťte mínění a témata, abyste pochopili, co uživatelé chtějí.
Rozhraní API pro propojování entit Text Vyladíte datová propojení vaší aplikace pomocí rozpoznávání pojmenovaných entit a jednoznačnosti.
Language Understanding Intelligent Service (LUIS) Text Naučte své aplikace porozumět příkazům od uživatelů.
QnA Maker Service Text Zformátované informace z nejčastějších dotazů můžete vyvarovat konverzačními a snadno procházetými odpověďmi.
Rozhraní API pro jazykovou analýzu Text Zjednodušte komplexní koncepty jazyka a parsování textu.
Služba Knowledge Exploration Text Povolení interaktivního vyhledávání u strukturovaných dat prostřednictvím vstupů v přirozeném jazyce
Rozhraní Web Language Model API Text Použití prediktivních jazykových modelů natrénovaných na datech ve webovém měřítku
Rozhraní Academic Knowledge API Text Můžete využít velké množství akademického obsahu v Microsoft Academic Graph naplněných Bing.
Rozhraní API pro automatické návrhy Bingu Text Dejte aplikaci inteligentní možnosti automatickýchestů pro vyhledávání.
Rozhraní API pro kontrolu pravopisu Bingu Text Rozpoznání a oprava pravopisných chyb v aplikaci
Translator Text API Text Strojový překlad.
Rozhraní Recommendations API Text Predikce a doporučování položek, které vaši zákazníci chtějí
Rozhraní API Bingu pro vyhledávání entit Text (vyhledávací dotaz na webu) Identifikace a rozšířené informace o entitách z webu
Rozhraní API Bingu pro vyhledávání obrázků Text (vyhledávací dotaz na webu) Vyhledejte obrázky.
Rozhraní API pro vyhledávání zpráv Bingu Text (vyhledávací dotaz na webu) Vyhledejte zprávy.
Rozhraní API Bingu pro vyhledávání videí Text (vyhledávací dotaz na webu) Vyhledejte videa.
Rozhraní API Bingu pro vyhledávání na webu Text (vyhledávací dotaz na webu) Získejte rozšířené podrobnosti hledání z miliard webových dokumentů.
Rozhraní API pro zpracování řeči Bingu Text nebo řeč Převod řeči na text a zpět
Rozhraní API pro rozpoznání mluvčího Řeč Rozpoznávání a ověřování jednotlivých mluvčích pomocí řeči
Translator Speech API Řeč Překlad řeči v reálném čase
Rozhraní API pro počítačové zpracování obrazu Obrázky (nebo snímky z videa) Vytvořte z obrázků užitečné informace, automaticky vytvořte popis fotek, odvozujte značky, rozpoznáte celebrity, extrahujte text a vytvářejte přesné miniatury.
Content Moderator Text, obrázky nebo video Automatizované moderování obrázků, textu a videa.
Rozhraní API pro rozpoznávání emocí Obrázky (fotky s lidskými předměty) Identifikujte emoce v oblasti lidských témat.
Rozhraní API pro rozpoznávání tváře Obrázky (fotky s lidskými předměty) Rozpoznání, identifikace, analýza, uspořádání a označení tváří na fotkách
Video Indexer Video Přehledy videa, jako jsou mínění, přepis řeči, překlad řeči, rozpoznávání tváří a emocí a extrakce klíčových slov

Trénování s vlastními daty, která poskytnete

Schopnost Typ vstupu Klíčová výhoda
Custom Vision Service Obrázky (nebo snímky z videa) Přizpůsobte si vlastní modely počítačového zpracování obrazu.
Custom Speech Service Řeč Překonáte překážky rozpoznávání řeči, jako je styl řeči, šum na pozadí a slovní zásoba.
Custom Decision Service Webový obsah (například informační kanál RSS) Použití strojového učení k automatickému výběru vhodného obsahu pro domovskou stránku
Rozhraní API pro vlastní vyhledávání Bingu Text (vyhledávací dotaz na webu) Nástroj pro vyhledávání na komerční úrovni.