Co je rozhraní Web Language Model API?What is the Web Language Model API? (Preview)(Preview)

Důležité

Rozhraní Web Language Model ve verzi Preview je od 9. srpna 2018 vyřazené z provozu.The Web Language Model preview was decommissioned on August 9, 2018. Ke zpracování a analýze textu doporučujeme používat moduly analýzy textu služby Azure Machine Learning.We recommend using Azure Machine Learning text analytics modules for text processing and analysis.

Rozhraní API Microsoft Web Language Model je cloudová služba založená na REST, která poskytuje moderní nástroje pro zpracování přirozeného jazyka.The Microsoft Web Language Model API is a REST-based cloud service providing state-of-the-art tools for natural language processing. Při použití tohoto rozhraní API může vaše aplikace využívat sílu velkých objemů dat prostřednictvím jazykových modelů trénovaných na webových korpusech shromážděných Bingem na americkém trhu.Using this API, your application can leverage the power of big data through language models trained on web-scale corpora collected by Bing in the en-US market.

Tyto vyhlazené jazykové modely na pozadí, které využívají n-gramy a podporují Markovovy řetězce až do pátého stupně, jsou trénované na těchto korpusech:These smoothed backoff N-gram language models, supporting up to fifth-order Markov chains, are trained on the following corpora:

  • Text obsahu webové stránkyWeb page body text
  • Text nadpisu webové stránkyWeb page title text
  • Text ukotvení webové stránkyWeb page anchor text
  • Text webového vyhledávacího dotazuWeb search query text

Rozhraní API Web Language Model podporuje čtyři operace vyhledávání:The Web Language Model API supports four lookup operations:

  1. Sdružená pravděpodobnost (log10) posloupnosti slovJoint (log10) probability of a sequence of words.
  2. Podmíněná pravděpodobnost (log10) jednoho slova vzhledem k posloupnosti předchozích slovConditional (log10) probability of one word given a sequence of preceding words.
  3. Seznam slov (dokončení), která nejpravděpodobněji následují po konkrétní posloupnosti slovList of words (completions) most likely to follow a given sequence of words.
  4. Dělení slov z řetězců, které neobsahují žádné mezeryWord breaking of strings that contain no spaces.

ZačínámeGetting Started

  1. Přihlaste se k odběru služby.Subscribe to the service.
  2. Stáhněte si sadu SDK.Download the SDK.
  3. Spusťte vzorek kódu SDK.Run the SDK sample code.
  4. Úplné podrobnosti o koncových bodech, včetně fragmentů kódu v různých jazycích, najdete v referenčních informacích o rozhraní API.Refer to the API Reference for full details of the endpoints, including code snippets in a variety of languages.

Základní technologieUnderlying Technology

Následující dokument obsahuje podrobné informace o vývoji těchto jazykových modelů a měl by být citovaný ve výzkumných publikacích, které tuto službu využívají:The following paper provides details on the development of these language models, and should be cited in research publications that use this service:

Kliknutím sem zobrazíte aktuální seznam dokumentů, které tuto práci citují.Click here for a current list of papers citing this work.