Wat is afbeeldingsanalyse?

De Azure AI Vision Image Analysis-service kan een groot aantal visuele functies uit uw afbeeldingen extraheren. Het kan bijvoorbeeld bepalen of een afbeelding inhoud voor volwassenen bevat, specifieke merken of objecten zoekt of menselijke gezichten zoekt.

De nieuwste versie van Afbeeldingsanalyse, 4.0, die nu algemeen beschikbaar is, heeft nieuwe functies zoals synchrone OCR en detectie van personen. U wordt aangeraden deze versie in de toekomst te gebruiken.

U kunt Afbeeldingsanalyse gebruiken via een clientbibliotheek-SDK of door de REST API rechtstreeks aan te roepen. Volg de quickstart om aan de slag te gaan.

U kunt ook de mogelijkheden van Afbeeldingsanalyse snel en eenvoudig uitproberen in uw browser met behulp van Vision Studio.

Deze documentatie bevat de volgende typen artikelen:

  • De quickstarts zijn stapsgewijze instructies waarmee u aanroepen naar de service kunt maken en resultaten in een korte periode kunt krijgen.
  • De instructiegidsen bevatten instructies voor het gebruik van de service op specifiekere of aangepaste manieren.
  • De conceptuele artikelen bieden uitgebreide uitleg over de functionaliteit en functies van de service.
  • De zelfstudies zijn langere handleidingen die u laten zien hoe u deze service als onderdeel in bredere bedrijfsoplossingen kunt gebruiken.

Volg een trainingsmodule voor afbeeldingsanalyse voor een meer gestructureerde benadering.

Versies van afbeeldingsanalyse

Belangrijk

Selecteer de VERSIE van de Afbeeldingsanalyse-API die het beste bij uw vereisten past.

Versie Beschikbare functies Aanbeveling
versie 4.0 Tekst, bijschriften, dichte onderschrift s, tags, objectdetectie, aangepaste afbeeldingsclassificatie/objectdetectie, Mensen, Slim bijsnijden Betere modellen; gebruik versie 4.0 als deze uw use-case ondersteunt.
versie 3.2 Tags, Objecten, Beschrijvingen, Merken, Gezichten, Afbeeldingstype, Kleurenschema, Oriëntatiepunten, Beroemdheden, Inhoud voor volwassenen, Slim bijsnijden Een breder scala aan functies; versie 3.2 gebruiken als uw use-case nog niet wordt ondersteund in versie 4.0

U wordt aangeraden de Afbeeldingsanalyse 4.0-API te gebruiken als deze ondersteuning biedt voor uw use-case. Gebruik versie 3.2 als uw use-case nog niet wordt ondersteund door 4.0.

U moet ook versie 3.2 gebruiken als u installatiekopieën wilt uitvoeren onderschrift en uw Vision-resource zich buiten deze Azure-regio's bevindt: VS - oost, Frankrijk - centraal, Korea - centraal, Europa - noord, Azië - zuidoost, Europa - west en VS - west, Azië - oost. De afbeelding onderschrift functie in Afbeeldingsanalyse 4.0 wordt alleen ondersteund in deze Azure-regio's. Afbeelding onderschrift in versie 3.2 is beschikbaar in alle Azure AI Vision-regio's.

Analyze Image

U kunt afbeeldingen analyseren om inzicht te krijgen in de visuele kenmerken en eigenschappen van die afbeeldingen. Alle functies in deze lijst worden geleverd door de Analyze Image-API. Volg een snelstart om aan de slag te gaan.

Name Beschrijving Conceptpagina
Modelaanpassing (alleen v4.0 preview) U kunt aangepaste modellen maken en trainen om afbeeldingsclassificatie of objectdetectie uit te voeren. Gebruik uw eigen afbeeldingen, label ze met aangepaste tags en afbeeldingsanalyse traint een model dat is aangepast voor uw use-case. Modelaanpassing
Tekst lezen uit afbeeldingen (alleen v4.0) Versie 4.0 preview van afbeeldingsanalyse biedt de mogelijkheid om leesbare tekst uit afbeeldingen te extraheren. Vergeleken met de asynchrone Computer Vision 3.2 Read-API biedt de nieuwe versie de vertrouwde Read OCR-engine in een geïntegreerde synchrone API die het gemakkelijk maakt OM OCR samen met andere inzichten in één API-aanroep te krijgen. OCR voor afbeeldingen
Personen in afbeeldingen detecteren (alleen v4.0) Versie 4.0 van afbeeldingsanalyse biedt de mogelijkheid om personen in afbeeldingen te detecteren. De coördinaten van het begrenzingsvak van elke gedetecteerde persoon worden geretourneerd, samen met een betrouwbaarheidsscore. detectie van Mensen
Installatiekopieën genereren onderschrift s Genereer een onderschrift van een afbeelding in een door mensen leesbare taal, met behulp van volledige zinnen. Met de algoritmen van Computer Vision worden onderschrift gegenereerd op basis van de objecten die in de afbeelding zijn geïdentificeerd.

De installatiekopieën van versie 4.0 onderschrift ing zijn een geavanceerdere implementatie en werken met een breder scala aan invoerafbeeldingen. Het is alleen beschikbaar in de volgende geografische regio's: VS - oost, Frankrijk - centraal, Korea - centraal, Europa - noord, Azië - zuidoost, Europa - west, VS - west.

Met versie 4.0 kunt u ook compacte onderschrift ing gebruiken, waarmee gedetailleerde onderschrift s worden gegenereerd voor afzonderlijke objecten die in de afbeelding worden gevonden. De API retourneert de coördinaten van het begrenzingsvak (in pixels) van elk object in de afbeelding, plus een onderschrift. U kunt deze functionaliteit gebruiken om beschrijvingen te genereren van afzonderlijke onderdelen van een installatiekopie.

Photo of cows with a simple description on the right.
Installatiekopieën genereren onderschrift s (v3.2)
(v4.0)
Objecten detecteren Objectdetectie is vergelijkbaar met het gebruik van tags, maar de API retourneert de coördinaten van de omsluitende box voor elke tag die wordt toegepast. Als een afbeelding bijvoorbeeld een hond, kat en persoon bevat, worden deze objecten samen met hun coördinaten in de afbeelding vermeld. U kunt deze functie gebruiken om verdere relaties tussen de objecten in een afbeelding te verwerken. Ook weet u daardoor wanneer er meerdere exemplaren van dezelfde tag in een afbeelding voorkomen.

Photo of an office with a rectangle drawn around a laptop.
Objecten detecteren (v3.2)
(v4.0)
Visuele kenmerken taggen Identificeer en tag visuele kenmerken in een afbeelding op basis van een set met duizenden herkenbare objecten, levende wezens, landschappen en acties. Als de tags dubbelzinnig of niet algemeen bekend zijn, worden via de API-reactie tips gegeven om de context van de tag te verduidelijken. U kunt tagging niet alleen gebruiken voor het hoofdonderwerp, zoals een persoon op de voorgrond, maar ook voor de omgeving (binnen of buiten), meubels, gereedschap, planten, dieren, accessoires, gadgets en enzovoort.

Photo of a skateboarder with tags listed on the right.
Visuele kenmerken taggen (v3.2)
(v4.0)
Het interessegebied /slim bijsnijden ophalen Analyseer de inhoud van een afbeelding om de coördinaten te retourneren van het interessegebied dat overeenkomt met een opgegeven hoogte-breedteverhouding. Computer Vision retourneert de coördinaten van het begrenzingsvak van de regio, zodat de aanroepende toepassing de oorspronkelijke afbeelding naar wens kan wijzigen.

Het model voor slim bijsnijden van versie 4.0 is een geavanceerdere implementatie en werkt met een breder scala aan invoerafbeeldingen. Het is alleen beschikbaar in de volgende geografische regio's: VS - oost, Frankrijk - centraal, Korea - centraal, Europa - noord, Azië - zuidoost, Europa - west, VS - west.
Een miniatuur genereren (v3.2)
(v4.0 preview)
Merken detecteren (alleen v3.2) Identificeer commerciële merken in afbeeldingen of video's met behulp van een database met duizenden logo's. U kunt deze functie bijvoorbeeld gebruiken om te ontdekken welke merken het populairst zijn op sociale media of het meest voorkomen in productplaatsing in de media. Merken detecteren
Een afbeelding categoriseren (alleen v3.2) Identificeer en categoriseer een volledige afbeelding met behulp van een categorietaxonomie met bovenliggende/onderliggende erfelijke hiërarchieën. Categorieën kunnen zelfstandig worden gebruikt of met onze nieuwe tagmodellen.

Engels is momenteel de enige ondersteunde taal voor het taggen en categoriseren van afbeeldingen.
Een afbeelding categoriseren
Gezichten detecteren (alleen v3.2) Detecteer gezichten in een afbeelding en geef informatie op over elk gedetecteerd gezicht. Azure AI Vision retourneert de coördinaten, rechthoek, geslacht en leeftijd voor elk gedetecteerd gezicht.

U kunt ook de toegewezen Face-API gebruiken voor deze doeleinden. Het biedt gedetailleerdere analyse, zoals gezichtsidentificatie en posedetectie.
Gezichten detecteren
Afbeeldingstypen detecteren (alleen v3.2) Detecteer kenmerken van een afbeelding, bijvoorbeeld of een afbeelding een lijntekening of een illustratie is. Afbeeldingstypen detecteren
Domeinspecifieke inhoud detecteren (alleen v3.2) Gebruik domeinmodellen om domeinspecifieke inhoud in een afbeelding te detecteren en te identificeren, zoals beroemdheden en oriëntatiepunten. Als een afbeelding bijvoorbeeld personen bevat, kan Azure AI Vision een domeinmodel voor beroemdheden gebruiken om te bepalen of de personen die in de afbeelding zijn gedetecteerd bekende beroemdheden zijn. Domeinspecifieke inhoud detecteren
Het kleurenschema detecteren (alleen v3.2) Analyseer het kleurgebruik in een afbeelding. Azure AI Vision kan bepalen of een afbeelding zwart-wit of kleur is en, voor kleurenafbeeldingen, de dominante en accentkleuren identificeren. Het kleurenschema detecteren
Inhoud beheren in afbeeldingen (alleen v3.2) U kunt Azure AI Vision gebruiken om inhoud voor volwassenen in een afbeelding te detecteren en betrouwbaarheidsscores te retourneren voor verschillende classificaties. De drempel voor het markeren van inhoud kan worden ingesteld met een glijdende schaal om uw voorkeuren aan te geven. Inhoud voor volwassenen detecteren

Tip

U kunt de functies Tekst lezen en Objectdetectie van Afbeeldingsanalyse gebruiken via de Azure OpenAI-service . Met het GPT-4 Turbo met Vision-model kunt u chatten met een AI-assistent die de afbeeldingen die u deelt kan analyseren. De optie Vision-uitbreiding maakt gebruik van Afbeeldingsanalyse om de AI-hulp meer informatie te geven (leesbare tekst- en objectlocaties) over de afbeelding. Zie de snelstartgids GPT-4 Turbo met Vision voor meer informatie.

Productherkenning (alleen v4.0 preview)

Met de Product Recognition-API's kunt u foto's van planken in een winkel analyseren. U kunt de aanwezigheid of afwezigheid van producten detecteren en hun begrenzingsvakcoördinaten ophalen. Gebruik deze in combinatie met modelaanpassing om een model te trainen om uw specifieke producten te identificeren. U kunt productherkenningsresultaten ook vergelijken met het planogramdocument van uw winkel.

Productherkenning

Multimodale insluitingen (alleen v4.0)

De multimodale insluitings-API's maken de vectorisatie van afbeeldingen en tekstquery's mogelijk. Ze converteren afbeeldingen naar coördinaten in een multidimensionale vectorruimte. Vervolgens kunnen binnenkomende tekstquery's ook worden geconverteerd naar vectoren en kunnen afbeeldingen worden vergeleken met de tekst op basis van semantische nabijheid. Hierdoor kan de gebruiker in een set afbeeldingen zoeken met behulp van tekst, zonder dat ze afbeeldingstags of andere metagegevens hoeven te gebruiken. Semantische closeness produceert vaak betere resultaten in de zoekopdracht.

De 2024-02-01 API bevat een multi-lingual model dat ondersteuning biedt voor zoeken in tekst in 102 talen. Het oorspronkelijke engelse model is nog steeds beschikbaar, maar kan niet worden gecombineerd met het nieuwe model in dezelfde zoekindex. Als u tekst en afbeeldingen met het model alleen-Engels vectoren gebruikt, zijn deze vectoren niet compatibel met meertalige tekst- en afbeeldingsvectoren.

Deze API's zijn alleen beschikbaar in de volgende geografische regio's: VS - oost, Frankrijk - centraal, Korea - centraal, Europa - noord, Azië - zuidoost, Europa - west, VS - west.

Multimodale insluitingen

Achtergrond verwijderen (alleen v4.0 preview)

Afbeeldingsanalyse 4.0 (preview) biedt de mogelijkheid om de achtergrond van een afbeelding te verwijderen. Met deze functie kan een afbeelding van het gedetecteerde voorgrondobject worden uitgevoerd met een transparante achtergrond of een grijswaarden alfamatte afbeelding met de dekking van het gedetecteerde voorgrondobject. Achtergrond verwijderen

Oorspronkelijke afbeelding Als de achtergrond is verwijderd Alfa matte
Photo of a group of people using a tablet. Photo of a group of people using a tablet; background is transparent. Alpha matte of a group of people.

Afbeeldingsvereisten

Afbeeldingsanalyse werkt voor afbeeldingen die voldoen aan de volgende vereisten:

  • De afbeelding moet worden weergegeven in de indeling JPEG, PNG, GIF, BMP, WEBP, ICO, TIFF of MPO
  • De bestandsgrootte van de afbeelding moet kleiner zijn dan 20 MEGABYTES (MB)
  • De afmetingen van de afbeelding moeten groter zijn dan 50 x 50 pixels, en kleiner dan 16.000 x 16.000 pixels

Tip

Invoervereisten voor multimodale insluitingen verschillen en worden vermeld in multimodale insluitingen

Gegevensprivacy en -beveiliging

Net als bij alle Azure AI-services moeten ontwikkelaars die de Azure AI Vision-service gebruiken, rekening houden met het beleid van Microsoft voor klantgegevens. Zie de pagina Azure AI-services in het Vertrouwenscentrum van Microsoft voor meer informatie.

Volgende stappen

Ga aan de slag met Afbeeldingsanalyse door de snelstartgids te volgen in de ontwikkeltaal van uw voorkeur: