Vad är Azure AI Vision?

Kommentar

Från och med juli 2023 omfattar Azure AI-tjänster alla vad som tidigare kallades Cognitive Services och Azure Applied AI Services. Det finns inga ändringar i prissättningen. Namnen Cognitive Services och Azure Applied AI fortsätter att användas i Azure-fakturering, kostnadsanalys, prislista och pris-API:er. Det finns inga icke-bakåtkompatibla ändringar i programprogrammeringsgränssnitt (API:er) eller SDK:er.

Azures Azure AI Vision-tjänst ger dig åtkomst till avancerade algoritmer som bearbetar bilder och returnerar information baserat på de visuella funktioner som du är intresserad av.

Tjänst beskrivning
Optisk teckenigenkänning (OCR) OCR-tjänsten (Optical Character Recognition) extraherar text från bilder. Du kan använda det nya Läs-API:et för att extrahera tryckt och handskriven text från foton och dokument. Den använder djupinlärningsbaserade modeller och fungerar med text på olika ytor och bakgrunder. Dessa omfattar affärsdokument, fakturor, kvitton, affischer, visitkort, brev och whiteboards. OCR-API:erna stöder extrahering av tryckt text på flera språk. Följ OCR-snabbstarten för att komma igång.
Bildanalys Tjänsten Bildanalys extraherar många visuella funktioner från bilder, till exempel objekt, ansikten, innehåll för vuxna och automatiskt genererade textbeskrivningar. Följ snabbstarten Bildanalys för att komma igång.
Ansiktsigenkänning Ansiktstjänsten tillhandahåller AI-algoritmer som identifierar, känner igen och analyserar mänskliga ansikten i bilder. Programvara för ansiktsigenkänning är viktig i många olika scenarier, till exempel identifiering, beröringsfri åtkomstkontroll och ansiktsutsuddning för sekretess. Följ snabbstarten Ansiktsigenkänning för att komma igång.
Videoanalys Videoanalys innehåller videorelaterade funktioner som spatial analys och videohämtning. Rumslig analys analyserar närvaron och förflyttningen av personer i ett videoflöde och genererar händelser som andra system kan svara på. Installera containern Spatial Analysis för att komma igång. Med videohämtning kan du skapa ett index med videor som du kan söka med naturligt språk.

Azure AI Vision för hantering av digitala tillgångar

Azure AI Vision kan driva många scenarier för hantering av digitala tillgångar (DAM). DAM är affärsprocessen för att organisera, lagra och hämta omfattande medietillgångar och hantera digitala rättigheter och behörigheter. Ett företag kanske till exempel vill gruppera och identifiera bilder baserat på synliga logotyper, ansikten, objekt, färger och så vidare. Eller så kanske du vill generera bildtext automatiskt för bilder och bifoga nyckelord så att de kan sökas. En allt-i-ett-DAM-lösning med Hjälp av Azure AI-tjänster, Azure AI Search och intelligent rapportering finns i Guiden för lösningsaccelerator för kunskapsutvinning på GitHub. Andra DAM-exempel finns i lagringsplatsen för Azure AI Vision Solution Templates .

Komma igång

Använd Vision Studio för att snabbt prova Azure AI Vision-funktioner i webbläsaren.

Följ en snabbstart för att komma igång med att skapa Azure AI Vision i din app.

Bildkrav

Azure AI Vision kan analysera bilder som uppfyller följande krav:

  • Bilden måste vara i JPEG-, PNG-, GIF- eller BMP-format
  • Filstorleken måste vara mindre än 4 megabyte (MB)
  • Bildens dimensioner måste vara större än 50 x 50 bildpunkter
    • För läs-API:et måste bildens dimensioner vara mellan 50 x 50 och 10 000 x 10 000 bildpunkter.

Datasekretess och säkerhet

Precis som med alla Azure AI-tjänster bör utvecklare som använder Azure AI Vision-tjänsten vara medvetna om Microsofts principer för kunddata. Mer information finns på sidan Azure AI-tjänster i Microsoft Trust Center.

Nästa steg

Följ en snabbstart för att implementera och köra en tjänst på önskat utvecklingsspråk.