Vad är nytt i Visuellt innehåll
Lär dig vad som är nytt i tjänsten. Dessa objekt kan vara viktig information, videor, blogginlägg och andra typer av information. Bokmärk den här sidan för att hålla dig uppdaterad med tjänsten.
September 2021
OCR(Read) API Public Preview stöder 122 språk
Visuellt innehåll OCR-API (läsa) utökar språk som stöds till 122 med den senaste förhandsversionen:
- OCR-stöd för utskrift av text på 49 nya språk, inklusive ryska, rumänska och andra kyrilliska och mer latinska språk.
- OCR-stöd för handskriven text på 6 nya språk som inkluderar engelska, förenklad kinesiska, franska, tyska, italienska, portugisiska och spanska.
- Förbättringar för bearbetning av digitala PDF-filer och MRZ-text (Machine Readable Zone) i identitetsdokument.
- Allmänna prestanda- och AI-kvalitetsförbättringar
Se OCR-guiden för att lära dig hur du använder de nya förhandsgranskningsfunktionerna.
Augusti 2021
Språkexpansion för bildtaggning
Den senaste versionen (v3.2) av bildtaggaren har nu stöd för taggar på 50 språk. Mer information finns på språksupportsidan.
Maj 2021
Uppdatering av container för rumslig analys
En ny version av containern spatial analys har släppts med en ny funktionsuppsättning. Med den här Docker-containern kan du analysera strömmande video i realtid för att förstå rumsliga relationer mellan människor och deras förflyttning via fysiska miljöer.
Åtgärder för rumslig analys kan nu konfigureras för att identifiera orienteringen som en person har.
- En orienteringsklassare kan aktiveras för åtgärderna
personcrossinglineoch genom att konfigurerapersoncrossingpolygonenable_orientationparametern . Det är inställt på av som standard.
- En orienteringsklassare kan aktiveras för åtgärderna
Åtgärder för rumslig analys erbjuder nu även konfiguration för att identifiera en persons hastighet under gående/körning
- Hastigheten kan identifieras för åtgärderna
personcrossinglineoch genom att aktiverapersoncrossingpolygonenable_speedklassificeraren, som är inaktiverad som standard. Utdata visas ispeedutdataavgSpeedför , ochminSpeed.
- Hastigheten kan identifieras för åtgärderna
April 2021
Visuellt innehåll v3.2 GA
Den Visuellt innehåll API v3.2 är nu allmänt tillgänglig med följande uppdateringar:
- Förbättrad bildtaggningsmodell: Analyserar visuellt innehåll och genererar relevanta taggar baserat på objekt, åtgärder och innehåll som visas i bilden. Den här modellen är tillgänglig via Taggavbildnings-API:et. Mer information finns i i guiden och översikten för bildanalys.
- Uppdaterad innehållsmodereringsmodell: identifierar förekomst av vuxet innehåll och tillhandahåller flaggor för att filtrera bilder som innehåller vuxet, ojämnt och gory-visuellt innehåll. Den här modellen är tillgänglig via API:et Analysera. Mer information finns i i guiden och översikten för bildanalys.
- OCR (Read) är tillgängligt för 73 språk, inklusive förenklad och traditionell kinesiska, japanska, koreanska och latinska språk.
- OCR (Read) är också tillgängligt som en distrolös container för lokal distribution.
Mars 2021
Visuellt innehåll 3.2 offentlig förhandsversion
Den offentliga Visuellt innehåll API v3.2 har uppdaterats. Förhandsversionen innehåller alla funktioner Visuellt innehåll uppdaterade API:er för läsning och analys.
Februari 2021
Läs den offentliga förhandsversionen av API v3.2 med OCR-stöd för 73 språk
Den offentliga Visuellt innehåll API v3.2, som är tillgänglig som molntjänst och Docker-container, innehåller följande uppdateringar:
- OCR för 73 språk, inklusive förenklad och traditionell kinesiska, japanska, koreanska och latinska språk.
- Naturlig läsordning för textradsutdata (endast latinska språk)
- Klassificering av handskriftsstil för textrader tillsammans med en konfidenspoäng (endast latinska språk).
- Extrahera endast text för valda sidor för ett dokument med flera sidor.
- Tillgänglig som en distrolös container för lokal distribution.
Mer information finns i läs-API-guiden.
Januari 2021
Uppdatering av container för rumslig analys
En ny version av containern spatial analys har släppts med en ny funktionsuppsättning. Med den här Docker-containern kan du analysera strömmande video i realtid för att förstå rumsliga relationer mellan människor och deras förflyttning via fysiska miljöer.
- Åtgärder för rumslig analys kan nu konfigureras för att identifiera om en person bär ett skyddande ansikte, till exempel en mask.
- En maskerings klassificerare kan aktiveras för åtgärderna
personcount, och genom att konfigurerapersoncrossinglinepersoncrossingpolygonENABLE_FACE_MASK_CLASSIFIERparametern . - Attributen
face_maskochface_noMaskreturneras som metadata med förtroendepoäng för varje person som identifieras i videoströmmen
- En maskerings klassificerare kan aktiveras för åtgärderna
- Åtgärden personcrossingpolygon har utökats för att tillåta beräkning av den tid en person tillbringar i en zon. Du kan ange parametern i zonkonfigurationen för åtgärden till och en ny händelse av typen
typezonedwelltimepersonZoneDwellTimeEvent innehåller fältet ifylld med det antal millisekunder som personen spenderade idurationMszonen. - Icke-ändring: Händelsen personZoneEvent har bytt namn till personZoneEnterExitEvent. Den här händelsen utlöses av åtgärden personcrossingpolygon när en person kommer in i eller lämnar zonen och ger riktningsinformation med den numrerade sidan av zonen som korsades.
- Video-URL kan anges som "Privat parameter/fördruppad" i alla åtgärder. Fördring är valfritt nu och fungerar bara om
KEYIVoch tillhandahålls som miljövariabler. - Kalibrering är aktiverat som standard för alla åtgärder. Ange för
do_calibration: falseatt inaktivera den. - Stöd har lagts till för automatisk omcalibration (som standard inaktiverad) via parametern . Mer information finns i Åtgärder för
enable_recalibrationrumslig analys - Parametrar för kameraavparametrar för
DETECTOR_NODE_CONFIG. Mer information finns i Åtgärder för rumslig analys.
Oktober 2020
Visuellt innehåll API v3.1 GA
Den Visuellt innehåll API:et i allmän tillgänglighet har uppgraderats till v3.1.
September 2020
Förhandsversion av container för rumslig analys
Containern Spatial Analysis är nu i förhandsversion. Med funktionen spatial analys i Visuellt innehåll kan du analysera strömmande video i realtid för att förstå rumsliga relationer mellan människor och deras rörelser via fysiska miljöer. Rumslig analys är en Docker-container som du kan använda lokalt.
Read API v3.1 Public Preview lägger till OCR för japanska
Den offentliga Visuellt innehåll API v3.1 för Read lägger till följande funktioner:
OCR för japanska
För varje textrad anger du om utseendet är Handskrift eller Utskriftsformat, tillsammans med en konfidenspoäng (endast latinska språk).
För ett dokument med flera sidor ska du endast extrahera text för valda sidor eller sidintervall.
Den här förhandsversionen av Api:et Read stöder engelska, nederländska, franska, tyska, italienska, japanska, portugisiska, förenklad kinesiska och spanska.
Mer information finns i läs-API-guiden.
Juli 2020
Läs den offentliga förhandsversionen av API v3.1 med OCR för förenklad kinesiska
Den Visuellt innehåll Read API v3.1 public preview lägger till stöd för förenklad kinesiska.
- Den här förhandsversionen av API:et Read stöder engelska, nederländska, franska, tyska, italienska, portugisiska, förenklad kinesiska och spanska.
Mer information finns i läs-API-guiden.
Maj 2020
Visuellt innehåll API v3.0 har angetts för allmän tillgänglighet, med uppdateringar av API:et Read:
- Stöd för engelska, nederländska, franska, tyska, italienska, portugisiska och spanska
- Förbättrad noggrannhet
- Förtroendepoäng för varje extraherat ord
- Nytt utdataformat
Mer information finns i ÖVERSIKT ÖVER OCR.
Mars 2020
- TLS 1.2 tillämpas nu för alla HTTP-begäranden till den här tjänsten. Mer information finns i Azure Cognitive Services säkerhet.
Januari 2020
Read API 3.0 Public Preview
Nu kan du använda version 3.0 av API:et Läsa för att extrahera tryckt eller handskriven text från bilder. Jämfört med tidigare versioner ger 3.0:
- Förbättrad noggrannhet
- Nytt utdataformat
- Förtroendepoäng för varje extraherat ord
- Stöd för både spanska och engelska språk med språkparametern
Följ snabbstarten Extrahera text för att komma igång med 3.0-API:et.