Vad är nytt i Visuellt innehåll

Lär dig vad som är nytt i tjänsten. Dessa objekt kan vara viktig information, videor, blogginlägg och andra typer av information. Bokmärk den här sidan för att hålla dig uppdaterad med tjänsten.

September 2021

OCR(Read) API Public Preview stöder 122 språk

Visuellt innehåll OCR-API (läsa) utökar språk som stöds till 122 med den senaste förhandsversionen:

  • OCR-stöd för utskrift av text på 49 nya språk, inklusive ryska, rumänska och andra kyrilliska och mer latinska språk.
  • OCR-stöd för handskriven text på 6 nya språk som inkluderar engelska, förenklad kinesiska, franska, tyska, italienska, portugisiska och spanska.
  • Förbättringar för bearbetning av digitala PDF-filer och MRZ-text (Machine Readable Zone) i identitetsdokument.
  • Allmänna prestanda- och AI-kvalitetsförbättringar

Se OCR-guiden för att lära dig hur du använder de nya förhandsgranskningsfunktionerna.

Augusti 2021

Språkexpansion för bildtaggning

Den senaste versionen (v3.2) av bildtaggaren har nu stöd för taggar på 50 språk. Mer information finns på språksupportsidan.

Maj 2021

Uppdatering av container för rumslig analys

En ny version av containern spatial analys har släppts med en ny funktionsuppsättning. Med den här Docker-containern kan du analysera strömmande video i realtid för att förstå rumsliga relationer mellan människor och deras förflyttning via fysiska miljöer.

  • Åtgärder för rumslig analys kan nu konfigureras för att identifiera orienteringen som en person har.

    • En orienteringsklassare kan aktiveras för åtgärderna personcrossingline och genom att konfigurera personcrossingpolygon enable_orientation parametern . Det är inställt på av som standard.
  • Åtgärder för rumslig analys erbjuder nu även konfiguration för att identifiera en persons hastighet under gående/körning

    • Hastigheten kan identifieras för åtgärderna personcrossingline och genom att aktivera personcrossingpolygon enable_speed klassificeraren, som är inaktiverad som standard. Utdata visas i speed utdata avgSpeed för , och minSpeed .

April 2021

Visuellt innehåll v3.2 GA

Den Visuellt innehåll API v3.2 är nu allmänt tillgänglig med följande uppdateringar:

Mars 2021

Visuellt innehåll 3.2 offentlig förhandsversion

Den offentliga Visuellt innehåll API v3.2 har uppdaterats. Förhandsversionen innehåller alla funktioner Visuellt innehåll uppdaterade API:er för läsning och analys.

Februari 2021

Läs den offentliga förhandsversionen av API v3.2 med OCR-stöd för 73 språk

Den offentliga Visuellt innehåll API v3.2, som är tillgänglig som molntjänst och Docker-container, innehåller följande uppdateringar:

  • OCR för 73 språk, inklusive förenklad och traditionell kinesiska, japanska, koreanska och latinska språk.
  • Naturlig läsordning för textradsutdata (endast latinska språk)
  • Klassificering av handskriftsstil för textrader tillsammans med en konfidenspoäng (endast latinska språk).
  • Extrahera endast text för valda sidor för ett dokument med flera sidor.
  • Tillgänglig som en distrolös container för lokal distribution.

Mer information finns i läs-API-guiden.

Januari 2021

Uppdatering av container för rumslig analys

En ny version av containern spatial analys har släppts med en ny funktionsuppsättning. Med den här Docker-containern kan du analysera strömmande video i realtid för att förstå rumsliga relationer mellan människor och deras förflyttning via fysiska miljöer.

  • Åtgärder för rumslig analys kan nu konfigureras för att identifiera om en person bär ett skyddande ansikte, till exempel en mask.
    • En maskerings klassificerare kan aktiveras för åtgärderna personcount , och genom att konfigurera personcrossingline personcrossingpolygon ENABLE_FACE_MASK_CLASSIFIER parametern .
    • Attributen face_mask och face_noMask returneras som metadata med förtroendepoäng för varje person som identifieras i videoströmmen
  • Åtgärden personcrossingpolygon har utökats för att tillåta beräkning av den tid en person tillbringar i en zon. Du kan ange parametern i zonkonfigurationen för åtgärden till och en ny händelse av typen type zonedwelltime personZoneDwellTimeEvent innehåller fältet ifylld med det antal millisekunder som personen spenderade i durationMs zonen.
  • Icke-ändring: Händelsen personZoneEvent har bytt namn till personZoneEnterExitEvent. Den här händelsen utlöses av åtgärden personcrossingpolygon när en person kommer in i eller lämnar zonen och ger riktningsinformation med den numrerade sidan av zonen som korsades.
  • Video-URL kan anges som "Privat parameter/fördruppad" i alla åtgärder. Fördring är valfritt nu och fungerar bara om KEY IV och tillhandahålls som miljövariabler.
  • Kalibrering är aktiverat som standard för alla åtgärder. Ange för do_calibration: false att inaktivera den.
  • Stöd har lagts till för automatisk omcalibration (som standard inaktiverad) via parametern . Mer information finns i Åtgärder för enable_recalibration rumslig analys
  • Parametrar för kameraavparametrar för DETECTOR_NODE_CONFIG . Mer information finns i Åtgärder för rumslig analys.

Oktober 2020

Visuellt innehåll API v3.1 GA

Den Visuellt innehåll API:et i allmän tillgänglighet har uppgraderats till v3.1.

September 2020

Förhandsversion av container för rumslig analys

Containern Spatial Analysis är nu i förhandsversion. Med funktionen spatial analys i Visuellt innehåll kan du analysera strömmande video i realtid för att förstå rumsliga relationer mellan människor och deras rörelser via fysiska miljöer. Rumslig analys är en Docker-container som du kan använda lokalt.

Read API v3.1 Public Preview lägger till OCR för japanska

Den offentliga Visuellt innehåll API v3.1 för Read lägger till följande funktioner:

  • OCR för japanska

  • För varje textrad anger du om utseendet är Handskrift eller Utskriftsformat, tillsammans med en konfidenspoäng (endast latinska språk).

  • För ett dokument med flera sidor ska du endast extrahera text för valda sidor eller sidintervall.

  • Den här förhandsversionen av Api:et Read stöder engelska, nederländska, franska, tyska, italienska, japanska, portugisiska, förenklad kinesiska och spanska.

Mer information finns i läs-API-guiden.

Juli 2020

Läs den offentliga förhandsversionen av API v3.1 med OCR för förenklad kinesiska

Den Visuellt innehåll Read API v3.1 public preview lägger till stöd för förenklad kinesiska.

  • Den här förhandsversionen av API:et Read stöder engelska, nederländska, franska, tyska, italienska, portugisiska, förenklad kinesiska och spanska.

Mer information finns i läs-API-guiden.

Maj 2020

Visuellt innehåll API v3.0 har angetts för allmän tillgänglighet, med uppdateringar av API:et Read:

  • Stöd för engelska, nederländska, franska, tyska, italienska, portugisiska och spanska
  • Förbättrad noggrannhet
  • Förtroendepoäng för varje extraherat ord
  • Nytt utdataformat

Mer information finns i ÖVERSIKT ÖVER OCR.

Mars 2020

Januari 2020

Read API 3.0 Public Preview

Nu kan du använda version 3.0 av API:et Läsa för att extrahera tryckt eller handskriven text från bilder. Jämfört med tidigare versioner ger 3.0:

  • Förbättrad noggrannhet
  • Nytt utdataformat
  • Förtroendepoäng för varje extraherat ord
  • Stöd för både spanska och engelska språk med språkparametern

Följ snabbstarten Extrahera text för att komma igång med 3.0-API:et.

Cognitive Service-uppdateringar

Azure-uppdateringsmeddelanden för Cognitive Services