Wat is er nieuw in Computer Vision?
Meer informatie over nieuwe functies in de service. Dit kunnen opmerkingen bij de release, video's, blogposts en andere soorten informatie zijn. Voeg een bladwijzer toe voor deze pagina om up-to-date te blijven over de service.
September 2021
Openbare preview van OCR(Read) API ondersteunt 122 talen
Computer Vision OCR-API (Lezen) breidt ondersteunde talen uit naar 122 met de meest recente preview:
- OCR-ondersteuning voor afdruktekst in 49 nieuwe talen, waaronder Russisch, Grieks en andere Cyrillische en meer Latijnse talen.
- OCR-ondersteuning voor handgeschreven tekst in zes nieuwe talen, waaronder Engels, Vereenvoudigd Chinees, Frans, Duits, Italiaans, Portugees en Spaans.
- Verbeteringen voor het verwerken van digitale PDF's en MRZ-tekst (Machine Readable Zone) in identiteitsdocumenten.
- Algemene prestatie- en AI-kwaliteitsverbeteringen
Zie de handleiding voor OCR voor meer informatie over het gebruik van de nieuwe preview-functies.
Augustus 2021
Taaluitbreiding voor taggen van afbeeldingen
De nieuwste versie (v3.2) van de tagger Image ondersteunt nu tags in 50 talen. Zie de pagina voor taalondersteuning voor meer informatie.
Mei 2021
Containerupdate voor ruimtelijke analyse
Er is een nieuwe versie van de spatial analysis-container uitgebracht met een nieuwe functieset. Met deze Docker-container kunt u realtime streaming-video analyseren om inzicht te krijgen in de ruimtelijke relaties tussen mensen en hun bewegingen door fysieke omgevingen.
Ruimtelijke analysebewerkingen kunnen nu worden geconfigureerd om de richting te detecteren waarmee een persoon wordt geconfronteerd.
- Een oriëntatieclassificator kan worden ingeschakeld voor de bewerkingen
personcrossinglineen door de parameter tepersoncrossingpolygonenable_orientationconfigureren. Deze is standaard uitgeschakeld.
- Een oriëntatieclassificator kan worden ingeschakeld voor de bewerkingen
Bewerkingen voor ruimtelijke analyse bieden nu ook configuratie voor het detecteren van de snelheid van een persoon tijdens het lopen/lopen
- Snelheid kan worden gedetecteerd voor de bewerkingen en door de classificatie in te schakelen. Deze
personcrossinglinepersoncrossingpolygonis standaardenable_speeduitgeschakeld. De uitvoer wordt weergegeven inspeedde uitvoer , enavgSpeedminSpeed.
- Snelheid kan worden gedetecteerd voor de bewerkingen en door de classificatie in te schakelen. Deze
April 2021
Computer Vision v3.2 GA
De Computer Vision API v3.2 is nu algemeen beschikbaar met de volgende updates:
- Verbeterd model voor het taggen van afbeeldingen: analyseert visuele inhoud en genereert relevante tags op basis van objecten, acties en inhoud die in de afbeelding worden weergegeven. Dit model is beschikbaar via de Tag Image-API. Zie de handleiding en overzicht voor afbeeldingsanalyse voor meer informatie.
- Bijgewerkt model voor inhoudsbeheer: detecteert de aanwezigheid van inhoud voor volwassenen en biedt vlaggen voor het filteren van afbeeldingen met erotische, racy- en gory-visuele inhoud. Dit model is beschikbaar via de Analyse-API. Zie de handleiding en overzicht voor afbeeldingsanalyse voor meer informatie.
- OCR (Lezen) is beschikbaar voor 73 talen, waaronder vereenvoudigd en traditioneel Chinees, Japans, Koreaans en Latijns.
- OCR (Lezen) is ook beschikbaar als een distroloze container voor on-premises implementatie.
Maart 2021
Computer Vision 3.2 Openbare preview-update
De openbare Computer Vision API v3.2 is bijgewerkt. De preview-versie bevat alle Computer Vision samen met bijgewerkte Read- en Analyze-API's.
Februari 2021
Lees-API v3.2 Openbare preview met OCR-ondersteuning voor 73 talen
De Computer Vision read-API v3.2 openbare preview, beschikbaar als cloudservice en Docker-container, bevat de volgende updates:
- OCR voor 73 talen, waaronder vereenvoudigd en traditioneel Chinees, Japans, Koreaans en Latijns.
- Natuurlijke leesorde voor de uitvoer van de tekstregel (alleen Latijnse talen)
- Classificatie van handschriftstijl voor tekstregels, samen met een betrouwbaarheidsscore (alleen Latijnse talen).
- Extraheren van alleen tekst voor geselecteerde pagina's voor een document met meerdere pagina's.
- Beschikbaar als een distributieloze container voor on-premises implementatie.
Zie de handleiding api lezen voor meer informatie.
Januari 2021
Containerupdate voor ruimtelijke analyse
Er is een nieuwe versie van de spatial analysis-container uitgebracht met een nieuwe functieset. Met deze Docker-container kunt u realtime streaming-video analyseren om inzicht te krijgen in de ruimtelijke relaties tussen mensen en hun bewegingen door fysieke omgevingen.
- Ruimtelijke analysebewerkingen kunnen nu worden geconfigureerd om te detecteren of een persoon een beschermend gezicht draagt, zoals een masker.
- Voor de bewerkingen
personcount,personcrossinglineenpersoncrossingpolygonkan een maskerclassificatie worden ingeschakeld door parameterENABLE_FACE_MASK_CLASSIFIERte configureren. - De kenmerken
face_maskenface_noMaskworden geretourneerd als metagegevens met een betrouwbaarheidsscore voor elke persoon die in de videostroom wordt gedetecteerd
- Voor de bewerkingen
- De personcrossingpolygon-bewerking is uitgebreid om de berekening toe te staan van de tijd die een persoon in een zone doorgeeft. U kunt de parameter in de zoneconfiguratie voor de bewerking instellen op en een nieuwe gebeurtenis van het
typezonedwelltimetype personZoneDwellTimeEvent bevat het veld dat wordt gevuld met het aantal milliseconden dat de persoon in de zone heeftdurationMsuitgegeven. - Wijziging die een wijziging doorbreekt: de naam van de gebeurtenis personZoneEvent is gewijzigd in personZoneEnterExitEvent. Deze gebeurtenis wordt veroorzaakt door de personcrossingpolygon-bewerking wanneer een persoon de zone binnenkomt of verlaat en directionele informatie biedt met de genummerde kant van de zone die is kruist.
- Video-URL kan in alle bewerkingen worden opgegeven als 'Privéparameter/verdukt'. Obfuscation is nu optioneel en werkt alleen als
KEYen worden geleverd alsIVomgevingsvariabelen. - Kalibratie is standaard ingeschakeld voor alle bewerkingen. Stel de in
do_calibration: falseom dit uit te schakelen. - Ondersteuning toegevoegd voor automatische hercalibratie (standaard uitgeschakeld) via de parameter . Raadpleeg Spatial Analysis operations (Bewerkingen voor ruimtelijke
enable_recalibrationanalyse) voor meer informatie - Parameters voor camera-kalibratie voor de
DETECTOR_NODE_CONFIG. Raadpleeg Bewerkingen voor ruimtelijke analyse voor meer informatie.
Oktober 2020
Algemene beschikbaarheid van Computer Vision API v3.1
De Computer Vision-API in Algemene beschikbaarheid is bijgewerkt naar v3.1.
September 2020
Voorbeeld van ruimtelijke analysecontainer
De ruimtelijke analysecontainer is nu beschikbaar als preview-versie. Met de functie ruimtelijke analyse van Computer Vision kunt u realtime streamingvideo analyseren om inzicht te krijgen in ruimtelijke relaties tussen personen en hun verplaatsing door fysieke omgevingen. Ruimtelijke analyse is een Docker-container die u on-premises kunt gebruiken.
Met de openbare preview-versie van Lees-API v3.1 wordt OCR voor Japans toegevoegd
De Computer Vision read-API v3.1 openbare preview voegt de volgende mogelijkheden toe:
OCR voor de Japanse taal
Geef voor elke tekstregel aan of het met de hand geschreven of gedrukte tekst is, samen met een betrouwbaarheidsscore (alleen Latijnse talen).
Extraheer alleen tekst voor de geselecteerde pagina's of het paginabereik voor een document met meerdere pagina's.
Deze preview-versie van de lees-API ondersteunt de talen Engels, Nederlands, Frans, Duits, Italiaans, Japans, Portugees, vereenvoudigd Chinees en Spaans.
Zie de handleiding api lezen voor meer informatie.
Juli 2020
Lees-API v3.1 (openbare preview-versie) met OCR voor vereenvoudigd Chinees
De Computer Vision Read API v3.1 (openbare preview) voegt ondersteuning toe voor vereenvoudigd Chinees.
- Deze preview-versie van de lees-API ondersteunt de talen Engels, Nederlands, Frans, Duits, Italiaans, Portugees, vereenvoudigd Chinees en Spaans.
Zie de handleiding api lezen voor meer informatie.
Mei 2020
Computer Vision API v3.0 is algemeen beschikbaar, met updates voor de Read-API:
- Ondersteuning voor Engels, Nederlands, Frans, Duits, Italiaans, Portugees en Spaans
- Verbeterde nauwkeurigheid
- Betrouwbaarheidsscore voor elk geëxtraheerd woord
- Nieuwe uitvoerindeling
Zie het OCR-overzicht voor meer informatie.
Maart 2020
- TLS 1.2 wordt nu afgedwongen voor alle HTTP-aanvragen bij deze service. Zie Beveiliging van Azure Cognitive Services voor meer informatie.
Januari 2020
Openbare preview van lees-API 3.0
U kunt nu versie 3.0 van de Read-API gebruiken om gedrukte of handgeschreven tekst uit afbeeldingen te extraheren. Vergeleken met eerdere versies biedt 3.0 de volgende mogelijkheden:
- Verbeterde nauwkeurigheid
- Nieuwe uitvoerindeling
- Betrouwbaarheidsscore voor elk geëxtraheerd woord
- Ondersteuning voor spaans en Engels met de taalparameter
Volg een quickstart over tekstextractie om aan de slag te gaan met de 3.0-API.