Wat is er nieuw in Computer Vision?

Meer informatie over nieuwe functies in de service. Dit kunnen opmerkingen bij de release, video's, blogposts en andere soorten informatie zijn. Voeg een bladwijzer toe voor deze pagina om up-to-date te blijven over de service.

September 2021

Openbare preview van OCR(Read) API ondersteunt 122 talen

Computer Vision OCR-API (Lezen) breidt ondersteunde talen uit naar 122 met de meest recente preview:

  • OCR-ondersteuning voor afdruktekst in 49 nieuwe talen, waaronder Russisch, Grieks en andere Cyrillische en meer Latijnse talen.
  • OCR-ondersteuning voor handgeschreven tekst in zes nieuwe talen, waaronder Engels, Vereenvoudigd Chinees, Frans, Duits, Italiaans, Portugees en Spaans.
  • Verbeteringen voor het verwerken van digitale PDF's en MRZ-tekst (Machine Readable Zone) in identiteitsdocumenten.
  • Algemene prestatie- en AI-kwaliteitsverbeteringen

Zie de handleiding voor OCR voor meer informatie over het gebruik van de nieuwe preview-functies.

Augustus 2021

Taaluitbreiding voor taggen van afbeeldingen

De nieuwste versie (v3.2) van de tagger Image ondersteunt nu tags in 50 talen. Zie de pagina voor taalondersteuning voor meer informatie.

Mei 2021

Containerupdate voor ruimtelijke analyse

Er is een nieuwe versie van de spatial analysis-container uitgebracht met een nieuwe functieset. Met deze Docker-container kunt u realtime streaming-video analyseren om inzicht te krijgen in de ruimtelijke relaties tussen mensen en hun bewegingen door fysieke omgevingen.

  • Ruimtelijke analysebewerkingen kunnen nu worden geconfigureerd om de richting te detecteren waarmee een persoon wordt geconfronteerd.

    • Een oriëntatieclassificator kan worden ingeschakeld voor de bewerkingen personcrossingline en door de parameter te personcrossingpolygon enable_orientation configureren. Deze is standaard uitgeschakeld.
  • Bewerkingen voor ruimtelijke analyse bieden nu ook configuratie voor het detecteren van de snelheid van een persoon tijdens het lopen/lopen

    • Snelheid kan worden gedetecteerd voor de bewerkingen en door de classificatie in te schakelen. Deze personcrossingline personcrossingpolygon is standaard enable_speed uitgeschakeld. De uitvoer wordt weergegeven in speed de uitvoer , en avgSpeed minSpeed .

April 2021

Computer Vision v3.2 GA

De Computer Vision API v3.2 is nu algemeen beschikbaar met de volgende updates:

  • Verbeterd model voor het taggen van afbeeldingen: analyseert visuele inhoud en genereert relevante tags op basis van objecten, acties en inhoud die in de afbeelding worden weergegeven. Dit model is beschikbaar via de Tag Image-API. Zie de handleiding en overzicht voor afbeeldingsanalyse voor meer informatie.
  • Bijgewerkt model voor inhoudsbeheer: detecteert de aanwezigheid van inhoud voor volwassenen en biedt vlaggen voor het filteren van afbeeldingen met erotische, racy- en gory-visuele inhoud. Dit model is beschikbaar via de Analyse-API. Zie de handleiding en overzicht voor afbeeldingsanalyse voor meer informatie.
  • OCR (Lezen) is beschikbaar voor 73 talen, waaronder vereenvoudigd en traditioneel Chinees, Japans, Koreaans en Latijns.
  • OCR (Lezen) is ook beschikbaar als een distroloze container voor on-premises implementatie.

Maart 2021

Computer Vision 3.2 Openbare preview-update

De openbare Computer Vision API v3.2 is bijgewerkt. De preview-versie bevat alle Computer Vision samen met bijgewerkte Read- en Analyze-API's.

Februari 2021

Lees-API v3.2 Openbare preview met OCR-ondersteuning voor 73 talen

De Computer Vision read-API v3.2 openbare preview, beschikbaar als cloudservice en Docker-container, bevat de volgende updates:

  • OCR voor 73 talen, waaronder vereenvoudigd en traditioneel Chinees, Japans, Koreaans en Latijns.
  • Natuurlijke leesorde voor de uitvoer van de tekstregel (alleen Latijnse talen)
  • Classificatie van handschriftstijl voor tekstregels, samen met een betrouwbaarheidsscore (alleen Latijnse talen).
  • Extraheren van alleen tekst voor geselecteerde pagina's voor een document met meerdere pagina's.
  • Beschikbaar als een distributieloze container voor on-premises implementatie.

Zie de handleiding api lezen voor meer informatie.

Januari 2021

Containerupdate voor ruimtelijke analyse

Er is een nieuwe versie van de spatial analysis-container uitgebracht met een nieuwe functieset. Met deze Docker-container kunt u realtime streaming-video analyseren om inzicht te krijgen in de ruimtelijke relaties tussen mensen en hun bewegingen door fysieke omgevingen.

  • Ruimtelijke analysebewerkingen kunnen nu worden geconfigureerd om te detecteren of een persoon een beschermend gezicht draagt, zoals een masker.
    • Voor de bewerkingen personcount, personcrossingline en personcrossingpolygon kan een maskerclassificatie worden ingeschakeld door parameter ENABLE_FACE_MASK_CLASSIFIER te configureren.
    • De kenmerken face_mask en face_noMask worden geretourneerd als metagegevens met een betrouwbaarheidsscore voor elke persoon die in de videostroom wordt gedetecteerd
  • De personcrossingpolygon-bewerking is uitgebreid om de berekening toe te staan van de tijd die een persoon in een zone doorgeeft. U kunt de parameter in de zoneconfiguratie voor de bewerking instellen op en een nieuwe gebeurtenis van het type zonedwelltime type personZoneDwellTimeEvent bevat het veld dat wordt gevuld met het aantal milliseconden dat de persoon in de zone heeft durationMs uitgegeven.
  • Wijziging die een wijziging doorbreekt: de naam van de gebeurtenis personZoneEvent is gewijzigd in personZoneEnterExitEvent. Deze gebeurtenis wordt veroorzaakt door de personcrossingpolygon-bewerking wanneer een persoon de zone binnenkomt of verlaat en directionele informatie biedt met de genummerde kant van de zone die is kruist.
  • Video-URL kan in alle bewerkingen worden opgegeven als 'Privéparameter/verdukt'. Obfuscation is nu optioneel en werkt alleen als KEY en worden geleverd als IV omgevingsvariabelen.
  • Kalibratie is standaard ingeschakeld voor alle bewerkingen. Stel de in do_calibration: false om dit uit te schakelen.
  • Ondersteuning toegevoegd voor automatische hercalibratie (standaard uitgeschakeld) via de parameter . Raadpleeg Spatial Analysis operations (Bewerkingen voor ruimtelijke enable_recalibration analyse) voor meer informatie
  • Parameters voor camera-kalibratie voor de DETECTOR_NODE_CONFIG . Raadpleeg Bewerkingen voor ruimtelijke analyse voor meer informatie.

Oktober 2020

Algemene beschikbaarheid van Computer Vision API v3.1

De Computer Vision-API in Algemene beschikbaarheid is bijgewerkt naar v3.1.

September 2020

Voorbeeld van ruimtelijke analysecontainer

De ruimtelijke analysecontainer is nu beschikbaar als preview-versie. Met de functie ruimtelijke analyse van Computer Vision kunt u realtime streamingvideo analyseren om inzicht te krijgen in ruimtelijke relaties tussen personen en hun verplaatsing door fysieke omgevingen. Ruimtelijke analyse is een Docker-container die u on-premises kunt gebruiken.

Met de openbare preview-versie van Lees-API v3.1 wordt OCR voor Japans toegevoegd

De Computer Vision read-API v3.1 openbare preview voegt de volgende mogelijkheden toe:

  • OCR voor de Japanse taal

  • Geef voor elke tekstregel aan of het met de hand geschreven of gedrukte tekst is, samen met een betrouwbaarheidsscore (alleen Latijnse talen).

  • Extraheer alleen tekst voor de geselecteerde pagina's of het paginabereik voor een document met meerdere pagina's.

  • Deze preview-versie van de lees-API ondersteunt de talen Engels, Nederlands, Frans, Duits, Italiaans, Japans, Portugees, vereenvoudigd Chinees en Spaans.

Zie de handleiding api lezen voor meer informatie.

Juli 2020

Lees-API v3.1 (openbare preview-versie) met OCR voor vereenvoudigd Chinees

De Computer Vision Read API v3.1 (openbare preview) voegt ondersteuning toe voor vereenvoudigd Chinees.

  • Deze preview-versie van de lees-API ondersteunt de talen Engels, Nederlands, Frans, Duits, Italiaans, Portugees, vereenvoudigd Chinees en Spaans.

Zie de handleiding api lezen voor meer informatie.

Mei 2020

Computer Vision API v3.0 is algemeen beschikbaar, met updates voor de Read-API:

  • Ondersteuning voor Engels, Nederlands, Frans, Duits, Italiaans, Portugees en Spaans
  • Verbeterde nauwkeurigheid
  • Betrouwbaarheidsscore voor elk geëxtraheerd woord
  • Nieuwe uitvoerindeling

Zie het OCR-overzicht voor meer informatie.

Maart 2020

Januari 2020

Openbare preview van lees-API 3.0

U kunt nu versie 3.0 van de Read-API gebruiken om gedrukte of handgeschreven tekst uit afbeeldingen te extraheren. Vergeleken met eerdere versies biedt 3.0 de volgende mogelijkheden:

  • Verbeterde nauwkeurigheid
  • Nieuwe uitvoerindeling
  • Betrouwbaarheidsscore voor elk geëxtraheerd woord
  • Ondersteuning voor spaans en Engels met de taalparameter

Volg een quickstart over tekstextractie om aan de slag te gaan met de 3.0-API.

Updates van Cognitive Services

Meldingen van Azure-updates voor Cognitive Services