Az Azure AI Vision újdonságai

Az Azure AI Vision újdonságai. Ezen a lapon naprakész maradhat az új funkciókkal, fejlesztésekkel, javításokkal és dokumentációs frissítésekkel.

2024. február

Multimodális beágyazások – GA: új többnyelvű modell

A multimodális beágyazási API frissült, és általánosan elérhető. Az új 2024-02-01 API egy új modellt tartalmaz, amely 102 nyelven támogatja a szöveges keresést. Az eredeti csak angol nyelvű modell továbbra is elérhető, de nem kombinálható az új modellel ugyanabban a keresési indexben. Ha csak angol nyelvű modellel vektorizált szöveget és képeket, ezek a vektorok nem kompatibilisek a többnyelvű szöveg- és képvektorokkal.

A támogatott nyelvek listáját a nyelvtámogatási oldalon találja.

2024. január

Új képelemzési SDK 1.0.0-beta.1 (kompatibilitástörő változások)

Az Image Analysis SDK 1.0.0-beta.1 verzióban lett újraírva, hogy jobban igazodjon más Azure SDK-khoz. Minden API megváltozott. Az új SDK használatával kapcsolatos információkért tekintse meg a frissített rövid útmutatókat, mintákat és útmutatókat .

Főbb változások:

2023. november

Kép elemzése 4.0 GA

Az Analyze Image 4.0 REST API mostantól általánosan elérhető. Első lépésként kövesse az Analyze Image 4.0 rövid útmutatót .

A képelemzés egyéb funkciói, például a modell testreszabása, a háttér eltávolítása és a multimodális beágyazások nyilvános előzetes verzióban maradnak.

Arc ügyféloldali SDK az élőség észleléséhez

A Face Liveness SDK támogatja az élőség észlelését a felhasználók mobil- vagy peremeszközein. Elérhető a Java/Kotlin for Android és a Swift/Objective-C for iOS rendszerben.

Az élőség-észlelési szolgáltatás megfelel az iBeta 1. és 2. szintű ISO/IEC 30107-3 szabványnak.

2023. szeptember

Elavult Computer Vision API-verziók elavulása

A Computer Vision API 1.0-s, 2.0-s, 3.0-s és 3.1-es verziói 2026. szeptember 13-án megszűnnek. A fejlesztők ezen dátum után nem tudnak API-hívásokat kezdeményezni ezekhez az API-khoz. Javasoljuk, hogy az összes érintett ügyfél a lehető leghamarabb telepítse át számítási feladatait az általánosan elérhető Computer Vision 3.2 API-ba. Az ügyfeleknek érdemes megfontolni az Image Analysis 4.0 API-ra (előzetes verzió) való migrálást is, amely a legújabb és legnagyobb képelemzési képességekkel rendelkezik.

Ha kérdése van, látogasson el a Q&A-nkba.

2023. május

Image Analysis 4.0 Termékfelismerés (nyilvános előzetes verzió)

A Termékfelismerés API-k segítségével elemezheti a kiskereskedelmi üzletek polcainak fényképeit. Észlelheti a termékek jelenlétét és hiányát, és lekérheti a határolókeret koordinátáit. A modell testreszabásával kombinálva betanítanak egy modellt az adott termékek azonosítására. A termékfelismerési eredményeket összehasonlíthatja az áruház planogram-dokumentumához is. Termékfelismerés.

2023. április

Korlátozott hozzáférési jogkivonatok

A független szoftvergyártók (ISV-k) kezelhetik ügyfeleik Face API-használatát olyan hozzáférési jogkivonatok kibocsátásával, amelyek hozzáférést biztosítanak a Face-funkciókhoz, amelyek általában kapuval vannak elzárva. Ez lehetővé teszi, hogy az ügyfélvállalatok anélkül használják a Face API-t, hogy végig kellene mennie a hivatalos jóváhagyási folyamaton. Korlátozott hozzáférési jogkivonatok használata.

2023. március

Az Azure AI Vision Image Analysis 4.0 SDK nyilvános előzetes verziója

A Firenze alapmodell most már integrálva van az Azure AI Visionbe. A továbbfejlesztett Vision-szolgáltatások lehetővé teszik a fejlesztők számára, hogy piackész, felelős Azure AI Vision-alkalmazásokat hozzanak létre különböző iparágakban. Az ügyfelek mostantól zökkenőmentesen digitalizálhatják, elemezhetik és csatlakoztathatják adataikat a természetes nyelvi interakciókhoz, hatékony betekintést nyerhetnek a kép- és videótartalmakból az akadálymentesség támogatásához, a Standard kiadás O-n keresztüli beszerzéshez, megvédhetik a felhasználókat a káros tartalmaktól, növelhetik a biztonságot, és javíthatják az incidensekre adott válaszidőket. További információ: A Microsoft Firenze alapmodelljének bejelentése.

Image Analysis 4.0 SDK (nyilvános előzetes verzió)

Az Image Analysis 4.0 mostantól elérhető az ügyfélkódtár SDK-ján keresztül C#, C++ és Python nyelven. Ez a frissítés tartalmazza a Firenze-alapú kép képaláírás és sűrű képaláírás az emberi paritás teljesítménye.

Képelemzés v4.0 feliratozás és sűrű feliratozás (nyilvános előzetes verzió):

A "Felirat" a V4.0-s verzióban a "Leírás" helyett a továbbfejlesztett kép képaláírás funkció, amely részletes és szemantikai ismeretekkel rendelkezik. A sűrű feliratok a teljes kép leírásán kívül a kép legfeljebb 10 régiójának egy mondatos leírásával nyújtanak részletesebb tájékoztatást. A sűrű feliratok a leírt képterületek határolókeret-koordinátáit is visszaadják. Egy új, nem-semleges paraméter is lehetővé teszi az ügyfelek számára, hogy eldönthessék, engedélyezik-e az alt-text és a Seeing AI-alkalmazások valószínűségi nemi következtetését. A digitális tartalmak támogatásához automatikusan biztosít gazdag képaláírás, akadálymentes helyettesítő szöveget, Standard kiadás O-optimalizálást és intelligens fotókontúrálást. Kép képaláírás.

Videóösszegzés és képkockakereső (nyilvános előzetes verzió):

A videótartalmak keresése és használata ugyanúgy, mint a gondolkodás és az írás. Keresse meg a releváns tartalmat további metaadatok nélkül. Csak a Vision Studióban érhető el.

Image Analysis 4.0-modell testreszabása (nyilvános előzetes verzió)

Most már létrehozhatja és betanítheti saját egyéni képbesorolási és objektumészlelési modelljeit a Vision Studióval vagy a v4.0 REST API-kkal.

Multimodális beágyazási API-k (nyilvános előzetes verzió)

A Képelemzés 4.0 API részét képező multimodális beágyazási API-k lehetővé teszik a képek és szöveges lekérdezések vektorizálását . Lehetővé teszik képek és szöveg koordinátákká konvertálását többdimenziós vektortérben. A vektoros hasonlóság keresésével mostantól természetes nyelven kereshet, és releváns képeket kereshet.

Háttér eltávolítási API-k (nyilvános előzetes verzió)

A Képelemzés 4.0 API részeként a Háttér eltávolítása API lehetővé teszi a kép hátterének eltávolítását. Ez a művelet megjelenítheti az észlelt előtérobjektum képét átlátszó háttérrel, vagy egy szürkeárnyalatos alfa matt képet, amely az észlelt előtérobjektum átlátszóságát mutatja.

Az Azure AI Vision 3.0 & 3.1 előzetes verzió elavulása

Az Azure AI Vision 3.0 és 3.1 API-k előzetes verziói a tervek szerint 2023. szeptember 30-án megszűnnek. Az ügyfelek ezen a napon túl nem tudnak hívásokat kezdeményezni ezekhez az API-khoz. Az ügyfeleknek javasoljuk, hogy inkább az általánosan elérhető (GA) 3.2 API-ra migrálják a számítási feladataikat. Az előzetes verzióról a 3.2 API-ra való migráláskor kövesse az alábbi módosításokat:

  • Az Analyze Image and Read API-hívások egy választható modellverziós paramétert használnak, amellyel megadhatja, hogy melyik AI-modellt használja. Alapértelmezés szerint a legújabb modellt használják.
  • Az Analyze Image and Read API-hívások egy mezőt is visszaadnak model-version a sikeres API-válaszokban. Ez a mező azt jelenti, hogy melyik modellt használták.
  • Az Azure AI Vision 3.2 API más hibajelentési formátumot használ. Tekintse meg az API referenciadokumentációját , amelyből megtudhatja, hogyan módosíthatja a hibakezelési kódot.

2022. október

Azure AI Vision Image Analysis 4.0 (nyilvános előzetes verzió)

Az Image Analysis 4.0 nyilvános előzetes verzióban jelent meg. Az új API tartalmazza a kép képaláírás, a képcímkézést, az objektumészlelést, az intelligens növényeket, a személyek észlelését és az OCR olvasási funkcióját, mindezt egyetlen képelemzési művelettel. Az OCR általános nem dokumentumképekhez van optimalizálva egy teljesítmény-továbbfejlesztett szinkron API-ban, amely megkönnyíti az OCR-alapú szolgáltatások beágyazását a munkafolyamatokban.

Szeptember 2022.

Az Azure AI Vision 3.0/3.1 Olvasási előzetes verzió elavulása

Az Azure AI Vision 3.0 és 3.1 Read API előzetes verziói 2023. január 31-én megszűnnek. Az ügyfeleknek javasoljuk, hogy a Read API általánosan elérhető (GA) verziójának használatbavételéhez tekintse meg az útmutatókat és a rövid útmutatókat. A legújabb GA-verziók a következő előnyöket biztosítják:

  • 2022 legújabb általánosan elérhető OCR-modell
  • Az OCR nyelvi lefedettségének jelentős bővítése, beleértve a kézzel írt szövegek támogatását
  • Továbbfejlesztett OCR-minőség

2022. június

A Vision Studio indítása

A Vision Studio egy olyan felhasználói felületi eszköz, amely lehetővé teszi az Azure AI Vision funkcióinak felfedezését, létrehozását és integrálását az alkalmazásokba.

A Vision Studio számos szolgáltatásfunkció kipróbálására kínál platformot, és vizuálisan is megtekintheti, hogy mit térnek vissza. A Studio használatával anélkül kezdheti el az első lépéseket, hogy kódokat kellene írnia, majd használhatja az alkalmazásban elérhető ügyfélkódtárakat és REST API-kat.

Felelős AI a Face-hoz

Arc áttetszőségi megjegyzése

  • Az átláthatósági megjegyzés útmutatást nyújt ahhoz, hogy segítsük ügyfeleinket a rendszerek pontosságának és méltányosságának javításában azáltal, hogy értelmes emberi felülvizsgálatot vezetnek be a félrevezetési vagy egyéb hibák eseteinek észleléséhez és megoldásához, támogatást nyújtanak azoknak, akik úgy vélik, hogy eredményeik helytelenek voltak, és azonosítják és kezelik a pontosság ingadozását a működési feltételek változása miatt.

Bizalmas attribútumok kivonása

  • Megszüntettük az arcelemzési képességeket, amelyek arra szolgálnak, hogy érzelmi állapotokat és identitástulajdonságokat, például nemet, kort, mosolyt, arcszőrzetet, hajat és sminket vonjanak le.
  • Az arcfelismerési képességek (beleértve az elmosódást, az expozíciót, a szemüveget, az átjárót, a tájékozódási pontot, a zajt, az elzáródást, az arc határolókeretét) általánosan elérhetők maradnak, és nem igényelnek alkalmazást.

Fairlearn-csomag és a Microsoft Méltányossági irányítópultja

Korlátozott hozzáférési szabályzat

  • A Face a frissített Felelős AI Standardhoz való igazításának részeként egy új korlátozott hozzáférési szabályzatot implementált a Face API-hoz és az Azure AI Visionhez. A meglévő ügyfeleknek egy évük van az arcfelismerési szolgáltatásokhoz való folyamatos hozzáférés kérelmezésére és jóváhagyására a megadott használati esetek alapján. A Face korlátozott hozzáféréséről és az Azure AI Visionről itt talál részleteket.

Az Azure AI Vision 3.2 előzetes verziójának elavulása

A 3.2 API előzetes verzióinak kivonása 2022 decemberében várható. Az ügyfeleknek javasoljuk, hogy inkább az API általánosan elérhető (GA) verzióját használják. A 3.2-verziójú verziókból való migráláskor vegye figyelembe az alábbi változásokat:

  1. Az Analyze Image and Read API-hívások mostantól egy választható modellverziós paramétert használnak, amellyel megadhatja, hogy melyik AI-modellt használja. Alapértelmezés szerint a legújabb modellt használják.
  2. Az Analyze Image and Read API-hívások egy mezőt is visszaadnak model-version a sikeres API-válaszokban. Ez a mező azt jelenti, hogy melyik modellt használták.
  3. A képelemzési API-k mostantól eltérő hibajelentési formátumot használnak. Tekintse meg az API referenciadokumentációját , amelyből megtudhatja, hogyan módosíthatja a hibakezelési kódot.

2022. május

Az OCR (Olvasás) API-modell általánosan elérhető (GA)

Az Azure AI Vision OCR (Read) API legújabb modellje 164 támogatott nyelvvel már általánosan elérhető felhőszolgáltatásként és -tárolóként.

  • A nyomtatott szövegek OCR-támogatása 164 nyelvre terjed ki, beleértve az orosz, arab, hindi és más, cirill, arab és devanagari szkripteket használó nyelveket.
  • A kézzel írt szövegek OCR-támogatása 9 nyelvre terjed ki angol, egyszerűsített kínai, francia, német, olasz, japán, koreai, portugál és spanyol nyelven.
  • Az önálló karakterek, kézzel írt dátumok, összegek, nevek, egyéb, a nyugtákban és számlákban gyakran megtalálható entitások fokozott támogatása.
  • A digitális PDF-dokumentumok jobb feldolgozása.
  • A bemeneti fájl méretkorlátja 10x-ről 500 MB-ra nőtt.
  • Teljesítmény- és késésbeli fejlesztések.
  • Felhőszolgáltatásként és Docker-tárolóként érhető el.

A GA-modell használatának megismeréséhez tekintse meg az OCR útmutatóját.

február 2022.

Az OCR (Olvasás) API nyilvános előzetes verziója 164 nyelvet támogat

Az Azure AI Vision OCR (Read) API a támogatott nyelveket 164-esre bővíti a legújabb előzetes verzióval:

  • A nyomtatott szövegek OCR-támogatása 42 új nyelvre terjed ki, beleértve az arab, a hindi és más arab és devanagari szkripteket használó nyelveket.
  • A kézzel írt szövegek OCR-támogatása az angol, a kínai egyszerűsített, a francia, a német, az olasz, a portugál és a spanyol mellett japán és koreai nyelvre is kiterjed.
  • Fejlesztések, beleértve a kézzel írt dátumok, összegek, nevek és egykarakteű mezők kinyerését.
  • Általános teljesítmény- és AI-minőségi fejlesztések

Az OCR útmutatójában megtudhatja, hogyan használhatja az új előzetes verziójú funkciókat.

Új minőségi attribútum Detection_01 és Detection_03

  • Annak érdekében, hogy a rendszerépítők és ügyfeleik kiváló minőségű képeket rögzíthessenek, amelyek a Face API kiváló minőségű kimeneteihez szükségesek, bevezetünk egy új minőségi attribútumot , a QualityForRecognitiont , amely segít eldönteni, hogy egy kép megfelelő minőségű-e az arcfelismerési kísérlethez. Az érték alacsony, közepes vagy magas nem hivatalos minősítés. Az új attribútum csak észlelési modellek vagy felismerési modellek detection_01recognition_03recognition_04vagy .detection_03 Azonosítási forgatókönyvek esetében csak "magas" minőségű képek használata ajánlott a személyregisztrációhoz, és a "közepes" fölötti minőség ajánlott. Az új minőségi attribútummal kapcsolatos további információkért tekintse meg az Arcfelismerés és -attribútumok című témakört, és ismerje meg, hogyan használható a Gyorsútmutatóval.

2021. szeptember

Az OCR (Olvasás) API nyilvános előzetes verziója 122 nyelvet támogat

Az Azure AI Vision OCR (Read) API a támogatott nyelveket 122-esre bővíti a legújabb előzetes verzióval:

  • Az OCR 49 új nyelven támogatja a nyomtatott szöveget, beleértve az orosz, a bolgár és más cirill és több latin nyelvet.
  • AZ OCR támogatása kézzel írt szövegekhez 6 új nyelven, amelyek közé tartozik az angol, a kínai egyszerűsített, a francia, a német, az olasz, a portugál és a spanyol.
  • Fejlesztések a digitális PDF-fájlok és a gépi olvasható zóna (MRZ) szövegének az identitásdokumentumokban való feldolgozásához.
  • Általános teljesítmény- és AI-minőségi fejlesztések

Az OCR útmutatójában megtudhatja, hogyan használhatja az új előzetes verziójú funkciókat.

2021. augusztus

Képcímkéző nyelvbővítés

Az Image tagger legújabb verziója (v3.2) mostantól 50 nyelven támogatja a címkéket. További információért tekintse meg a nyelvi támogatási oldalt.

2021. július

Új headPose és Landmarks fejlesztések Detection_03

  • A Detection_03 modell frissült, hogy támogassa az arc tájékozódási pont.
  • A tájékozódási pontok funkció Detection_03 sokkal pontosabb, különösen a szemgolyó tájékozódási pontok, amelyek elengedhetetlenek a tekintet nyomon követéséhez.

május 2021.

Térinformatikai tároló frissítése

A Térinformatikai tároló új verziója új funkciókészlettel lett kiadva. Ezzel a Docker-tárolóval valós idejű streamelési videót elemezhet az emberek közötti térbeli kapcsolatok és azok fizikai környezeteken keresztüli mozgásának megértéséhez.

  • A térinformatikai műveletek mostantól konfigurálhatók úgy, hogy észleljék az adott személy által tapasztalt tájolást.

    • A paraméter konfigurálásával enable_orientation a tájolás-osztályozók és personcrossingpolygon műveletek personcrossingline engedélyezhetők. Alapértelmezés szerint ki van kapcsolva.
  • A térinformatikai műveletek mostantól konfigurálást is kínálnak az adott személy sebességének észleléséhez séta/futás közben

    • Az osztályozó alapértelmezés szerint ki van kapcsolvaenable_speed, és personcrossingpolygon a műveletek sebessége észlelhetőpersoncrossingline. A kimenet a , avgSpeedés minSpeed a speedkimenetekben is tükröződik.

április 2021.

Azure AI Vision v3.2 GA

Az Azure AI Vision API 3.2-es verzió már általánosan elérhető a következő frissítésekkel:

  • Továbbfejlesztett képcímkézési modell: elemzi a vizualizáció tartalmát, és releváns címkéket hoz létre a képen megjelenített objektumok, műveletek és tartalmak alapján. Ez a modell a Tag Image API-val érhető el. További információért tekintse meg a Képelemzés útmutatót és az áttekintést .
  • Frissített con sátormód ration modell: észleli a felnőtt tartalom jelenlétét, és jelzőket biztosít a felnőtt, a racy és a gory vizualizációs tartalmakat tartalmazó képek szűréséhez. Ez a modell az Analyze API-n keresztül érhető el. További információért tekintse meg a Képelemzés útmutatót és az áttekintést .
  • Az OCR (Olvasás) 73 nyelven érhető el, beleértve az egyszerűsített és hagyományos kínai, japán, koreai és latin nyelveket.
  • Az OCR (Olvasás) disztribúciós tárolóként is elérhető a helyszíni üzembe helyezéshez.

PersonDirectory adatstruktúra (előzetes verzió)

  • Az olyan arcfelismerési műveletek végrehajtásához, mint az Azonosság és a Hasonló keresése, a Face API-ügyfeleknek létre kell hozniuk a Person objektumok válogatott listáját. Az új PersonDirectory egy olyan adatstruktúra, amely egyedi azonosítókat, választható névsztringeket és opcionális felhasználói metaadat-sztringeket tartalmaz a címtárhoz hozzáadott egyes személyidentitásokhoz . A Face API jelenleg a LargePersonGroup struktúrát kínálja, amely hasonló funkcionalitással rendelkezik, de legfeljebb 1 millió identitással rendelkezik. A PersonDirectory struktúra akár 75 millió identitást is felskálázhat.
  • A PersonDirectory és a korábbi adatstruktúrák közötti másik jelentős különbség az, hogy többé nem kell betanítási hívásokat kezdeményeznie, miután arcokat ad hozzá egy Személy objektumhoz – a frissítési folyamat automatikusan megtörténik. További részletekért lásd : A PersonDirectory-struktúra használata.

2021. március

Az Azure AI Vision 3.2 nyilvános előzetes verziójának frissítése

Frissült az Azure AI Vision API 3.2-es nyilvános előzetes verziója. Az előzetes kiadás tartalmazza az Összes Azure AI Vision-funkciót, valamint a frissített Olvasási és elemzési API-kat.

február 2021.

Az API 3.2-es nyilvános előzetes verziójának olvasása OCR-támogatással 73 nyelven

Az Azure AI Vision Read API 3.2-es nyilvános előzetes verziója, amely felhőszolgáltatásként és Docker-tárolóként érhető el, a következő frissítéseket tartalmazza:

  • OCR 73 nyelvhez , beleértve az egyszerűsített és hagyományos kínai, japán, koreai és latin nyelveket.
  • A szövegsor kimenetének természetes olvasási sorrendje (csak latin nyelvű)
  • A szövegsorok kézírásstílus-besorolása a megbízhatósági pontszámmal együtt (csak latin nyelvek esetén).
  • Csak többoldalas dokumentum kijelölt lapjaihoz bontsa ki a szöveget.
  • Disztribúciós tárolóként érhető el a helyszíni üzembe helyezéshez.

További információkért tekintse meg a Read API útmutatójában található útmutatót .

Új Face API-észlelési modell

  • Az új Detection 03 modell a jelenleg elérhető legpontosabb észlelési modell. Ha Ön új ügyfél, javasoljuk, hogy használja ezt a modellt. A 03 észlelés javítja a visszahívást és a pontosságot a képeken található kisebb arcokon (64x64 képpont). További fejlesztések közé tartozik a hamis pozitív értékek általános csökkentése és az elforgatott arc tájolások jobb észlelése. Az Észlelés 03 és az új Recognition 04 modell kombinálásával jobb felismerési pontosságot is biztosít. További részletekért lásd: Arcészlelési modell megadása.

Új észlelhető Face-attribútumok

  • Az faceMask attribútum a legújabb Detection 03 modellel érhető el, valamint a hozzáadott attribútummal "noseAndMouthCovered", amely azt észleli, hogy az arcmaszk a kívánt módon van-e viselve, az orrra és a szájra is kiterjed. A legújabb maszkészlelési képesség használatához a felhasználóknak meg kell adniuk az észlelési modellt az API-kérelemben: rendelje hozzá a modell verzióját az detectionModel paraméterrel detection_03. További részletekért lásd: Arcészlelési modell megadása.

Új Face API-felismerési modell

  • Az új Recognition 04 modell a jelenleg elérhető legpontosabb felismerési modell. Ha Ön új ügyfél, javasoljuk, hogy ezt a modellt használja ellenőrzésre és azonosításra. Javítja a Recognition 03 pontosságát, beleértve az arcfedőt viselő felhasználók (sebészeti maszkok, N95 maszkok, ruhamaszkok) jobb felismerését is. Javasoljuk, hogy ne regisztrálja az arcfedőt viselő felhasználók képeit, mivel ez csökkenti a felismerés minőségét. Mostantól az ügyfelek biztonságos és zökkenőmentes felhasználói élményeket hozhatnak létre, amelyek észlelik, hogy a felhasználó arcvédőt visel-e a legújabb Detection 03 modellel, és felismerheti őket a legújabb Recognition 04 modellel. További részletekért lásd: Arcfelismerési modell megadása.

Január 2021.

Térinformatikai tároló frissítése

A Térinformatikai tároló új verziója új funkciókészlettel lett kiadva. Ezzel a Docker-tárolóval valós idejű streamelési videót elemezhet az emberek közötti térbeli kapcsolatok és azok fizikai környezeteken keresztüli mozgásának megértéséhez.

  • A térinformatikai műveletek mostantól úgy konfigurálhatók, hogy észleljék, ha egy személy védő arcot, például maszkot visel.
    • A paraméter konfigurálásával egy maszkosztályozó engedélyezhető a personcount, personcrossingline és personcrossingpolygon a ENABLE_FACE_MASK_CLASSIFIER műveletek számára.
    • Az attribútumok face_mask , és face_noMask a rendszer a videóstreamben észlelt minden személy megbízhatósági pontszámával rendelkező metaadatként adja vissza
  • A personcrossingpolygon művelet ki lett terjesztve, hogy lehetővé tegye az adott személy által a zónában töltött tartózkodási idő kiszámítását. A művelet zónakonfigurációjában beállíthatja a type paramétert, és egy personZoneDwellTimeEvent típusú új esemény tartalmazza a durationMs zónában töltött ezredmásodperc számával kitöltött mezőt.zonedwelltime
  • Kompatibilitástörő változás: A personZoneEvent eseményt átnevezték personZoneEnterExitEvent eseményre. Ezt az eseményt a personcrossingpolygon művelet aktiválja, amikor egy személy belép a zónába, vagy kilép a zónából, és irányadatokat biztosít a átlépett zóna számozott oldalával.
  • A videó URL-címe "Private Parameter/obfuscated" (Privát paraméter/obfuscated) néven is megadható minden műveletben. Az elfedés most már nem kötelező, és csak akkor működik, ha KEY környezeti IV változóként van megadva.
  • A kalibrálás alapértelmezés szerint engedélyezve van minden műveletnél. Állítsa be a do_calibration: false letiltásához.
  • Az automatikus újraszámítás (alapértelmezés szerint letiltva) támogatása a paraméteren keresztül, a részletekért tekintse meg a enable_recalibrationtérinformatikai műveleteket .
  • Kamera kalibrációs paramétereket a DETECTOR_NODE_CONFIG. Részletekért tekintse meg a térinformatikai műveleteket .

Késés csökkentése

  • A Face csapata közzétett egy új cikket, amely ismerteti a késés lehetséges okait a szolgáltatás használatakor és a lehetséges kockázatcsökkentési stratégiákat. Lásd: Késés csökkentése a Face szolgáltatás használatakor.

2020. december

Ügyfélkonfiguráció a Face ID Storage-hoz

  • Bár a Face Service nem tárolja az ügyfélképeket, a kinyert arcfunkció(ka)t a rendszer a kiszolgálón tárolja. A Face ID az arcfunkció azonosítója, és a Face – Azonosítás, Arc – Ellenőrzés és Arc – Hasonló keresés funkcióban lesz használva. A tárolt arcfunkciók az eredeti észlelési hívás után 24 órával lejárnak és törlődnek. Az ügyfelek most már meg tudják határozni, hogy mennyi ideig legyenek gyorsítótárazva ezek a Face-azonosítók. A maximális érték még mindig legfeljebb 24 óra, de most már megadható egy minimum 60 másodperces érték. A gyorsítótárazott Arcazonosítók új időtartományai bármilyen 60 másodperc és 24 óra közötti érték. További részleteket a Face – Detect API-referencia (a faceIdTimeToLive paraméter) tartalmaz.

2020. november

Minta arcregisztrációs alkalmazás

  • A csapat közzétett egy minta Face-regisztrációs alkalmazást, amely bemutatja azokat az ajánlott eljárásokat, amelyekkel értelmes hozzájárulást hozhat létre, és magas pontosságú arcfelismerő rendszereket hozhat létre kiváló minőségű regisztrációkon keresztül. A nyílt forráskódú minta a regisztrációs alkalmazás összeállítása útmutatóban és a GitHubon található, amely készen áll a fejlesztők üzembe helyezésére vagy testreszabására.

Október 2020.

Azure AI Vision API v3.1 GA

Az Általános rendelkezésre állású Azure AI Vision API-t frissítették a 3.1-es verzióra.

2020. szeptember

Térinformatikai tároló előzetes verziója

A Térinformatikai tároló előzetes verzióban érhető el. Az Azure AI Vision térinformatikai funkciója lehetővé teszi a valós idejű streamelési videó elemzését, hogy megértse az emberek közötti térbeli kapcsolatokat és azok fizikai környezeteken keresztüli mozgását. A térinformatikai elemzés egy helyszíni Docker-tároló.

A Read API 3.1 nyilvános előzetes verziója ocR-t ad hozzá japánhoz

Az Azure AI Vision Read API 3.1-es nyilvános előzetes verziója a következő képességeket adja hozzá:

  • OCR japán nyelvhez

  • Az egyes szövegsorok esetében adja meg, hogy a megjelenés kézírásos vagy nyomtatási stílus-e, valamint egy megbízhatósági pontszámot (csak latin nyelvű).

  • Többoldalas dokumentum esetén csak a kijelölt oldalak vagy oldaltartományok szövegének kinyerése.

  • A Read API ezen előzetes verziója támogatja az angol, holland, francia, német, olasz, japán, portugál, egyszerűsített kínai és spanyol nyelveket.

További információkért tekintse meg a Read API útmutatójában található útmutatót .

2020. augusztus

Inaktív adatok ügyfél által felügyelt titkosítása

  • A Face szolgáltatás automatikusan titkosítja az adatokat a felhőben való megőrzésekor. A Face szolgáltatás titkosítása védi az adatokat, hogy megfeleljen a szervezeti biztonsági és megfelelőségi követelményeknek. Alapértelmezés szerint az előfizetés a Microsoft által felügyelt titkosítási kulcsokat használja. Az előfizetést saját, ügyfél által felügyelt kulcsokkal (CMK) is kezelheti. További részletek az ügyfél által felügyelt kulcsok között találhatók.

2020. július

Az API 3.1-es nyilvános előzetes verziójának olvasása az egyszerűsített kínai OCR-vel

Az Azure AI Vision Read API 3.1-es nyilvános előzetes verziója támogatja az egyszerűsített kínai nyelvet.

  • A Read API ezen előzetes verziója támogatja az angol, holland, francia, német, olasz, portugál, egyszerűsített kínai és spanyol nyelveket.

További információkért tekintse meg a Read API útmutatójában található útmutatót .

május 2020.

Az Azure AI Vision API 3.0-s verziójú általános rendelkezésre állása a Read API frissítéseivel történt:

  • Angol, holland, francia, német, olasz, portugál és spanyol támogatás
  • Nagyobb pontosság
  • Megbízhatósági pontszám minden kinyert szóhoz
  • Új kimeneti formátum

További információért tekintse meg az OCR áttekintését .

április 2020.

Új Face API-felismerési modell

  • Az új recognition 03 modell a jelenleg elérhető legpontosabb modell. Ha Ön új ügyfél, javasoljuk, hogy használja ezt a modellt. A 03-ás felismerés jobb pontosságot biztosít a hasonlóság-összehasonlításokhoz és a személyegyeztetési összehasonlításokhoz. További részleteket az Arcfelismerési modell megadása című témakörben talál.

2020. március

Január 2020.

Az API 3.0 nyilvános előzetes verziójának olvasása

Mostantól a Read API 3.0-s verziójával nyomtatott vagy kézzel írt szöveget nyerhet ki képekből. A korábbi verziókhoz képest a 3.0 a következőt biztosítja:

  • Nagyobb pontosság
  • Új kimeneti formátum
  • Megbízhatósági pontszám minden kinyert szóhoz
  • Spanyol és angol nyelv támogatása a nyelvi paraméterrel

Kövesse a Szöveg kinyerése rövid útmutatót a 3.0 API használatának megkezdéséhez.

június 2019.

Új Face API-észlelési modell

április 2019.

Továbbfejlesztett attribútumpontosság

Továbbfejlesztett feldolgozási sebesség

2019. március

Új Face API-felismerési modell

Január 2019.

Face Snapshot funkció

  • Ez a funkció lehetővé teszi, hogy a szolgáltatás támogassa az előfizetések közötti adatmigrálást: Pillanatkép.

Fontos

2023. június 30-tól megszűnik a Face Snapshot API.

október 2018.

API-üzenetek

2018. május

Továbbfejlesztett attribútumpontosság

Fájlméretkorlát növelése

2018. március

Új adatstruktúra

2017. május

Új észlelhető Face-attribútumok

2017. március

Új észlelhető Face-attribútum

Megoldott problémák

2016. november

Új előfizetési szint

  • A Face Storage Standard-előfizetéssel további tartós arcokat tárolhat a PersonGroup Person használata során – Arc vagy FaceList hozzáadása – Arc hozzáadása azonosításhoz vagy hasonlóság-egyeztetéshez. A tárolt képek díja 1000 arconként 0,5 dollár és a díjszabás napi lebontású. Az ingyenes szintű előfizetések továbbra is 1000 főre korlátozódnak.

2016. október

API-üzenetek

2016. július

Új funkciók

  • Támogatott személyközi objektumhitelesítés a Face alkalmazásban – Ellenőrzés.
  • Nem kötelező mode paraméter hozzáadva, amely lehetővé teszi két munkamód kiválasztását: matchPerson a matchFace Face - Find Similar (Hasonló keresése) és az alapértelmezett (matchPersonHasonló keresése) beállításban.
  • Opcionális confidenceThreshold paraméter hozzáadva a felhasználóhoz annak beállításához, hogy az egyik arc egy Személy objektumhoz tartozik-e a Face – Identify fájlban.
  • Választható és top paraméterek hozzáadva start a PersonGroup - List elemhez, hogy a felhasználó meg tudja adni a kezdőpontot és a listához tartozó teljes PersonGroups-számot.

1.0-s verzió változásai a V0-ről

  • Frissített szolgáltatásgyökér végpontja a helyről https://westus.api.cognitive.microsoft.com/face/v0/ a .https://westus.api.cognitive.microsoft.com/face/v1.0/ A következőre alkalmazott módosítások: Face – Detect, Face – Identify, Face – Find Similar and Face – Group.
  • A minimálisan észlelhető arcméret 36x36 képpontra frissült. A 36x36 képpontnál kisebb arcok nem lesznek észlelhetők.
  • A PersonGroup és a Person adatok elavultak a Face V0-ben. Ezek az adatok nem érhetők el a Face V1.0 szolgáltatással.
  • 2016. június 30-án elavult a Face API V0-végpontja.

Azure AI-szolgáltatások frissítései

Azure-frissítési közlemények az Azure AI-szolgáltatásokhoz