Megosztás a következőn keresztül:


Mi az "emberi adatok", és miért fontos felelősen forrást adni?

ÉRVÉNYES:Azure CLI ml-bővítmény v2 (aktuális)Python SDK azure-ai-ml v2 (aktuális)

Az emberi adatok közvetlenül személyektől vagy személyekről gyűjtött adatok. Az emberi adatok tartalmazhatnak személyes adatokat, például neveket, életkort, képeket vagy hangklipeket, valamint bizalmas adatokat, például genetikai adatokat, biometrikus adatokat, nemi identitást, vallási meggyőződéseket vagy politikai hovatartozásokat.

Az adatok gyűjtése fontos lehet az összes felhasználó számára működő AI-rendszerek létrehozásához. Azonban el kell kerülni bizonyos gyakorlatokat, különösen azokat, amelyek fizikai és pszichés károsodást okozhatnak az adatszolgáltatók számára.

A cikkben ismertetett ajánlott eljárások segítenek manuális adatgyűjtési projekteket végezni olyan önkéntesektől, akik minden érintettet tisztelettel kezelnek, és a potenciális károkat – különösen a sebezhető csoportokkal szemben – várhatóan és mérsékelik. This means that:

  • Kapcsolatok közreműködő adatok semmilyen módon nem lesznek kényszerítve vagy kihasználva, és szabályozhatják, hogy milyen személyes adatokat gyűjtenek.
  • Kapcsolatok adatgyűjtés és címkézés megfelelő betanítással rendelkezik.

Ezek a gyakorlatok segíthetnek a kiegyensúlyozottabb és jobb minőségű adathalmazok biztosításában, valamint az emberi adatok jobb gondnokságában.

Ezek új eljárások, és folyamatosan tanulunk. A következő szakaszban ismertetett ajánlott eljárások kiindulópontként szolgálnak a saját felelős emberi adatgyűjtések megkezdésekor. Ezeket az ajánlott eljárásokat csak tájékoztatás céljából biztosítjuk, és nem szabad jogi tanácsként kezelni. Minden emberi adatgyűjtésnek külön adatvédelmi és jogi felülvizsgálaton kell átesnie.

Általános ajánlott eljárások

Javasoljuk az alábbi ajánlott eljárásokat az emberi adatok közvetlenül személyektől történő manuális gyűjtéséhez.

Ajánlott eljárás

Hogy miért?


Önkéntes tájékoztatáson alapuló hozzájárulás beszerzése.

  • A résztvevőknek tisztában kell lenniük az adatgyűjtéssel és az adatok felhasználásának módjával.
  • Az adatokat csak olyan célokra szabad tárolni, feldolgozni és felhasználni, amelyek az eredeti, dokumentált tájékoztatáson alapuló hozzájárulás részét képezik.
  • A hozzájárulási dokumentációt megfelelően kell tárolni és társítani az összegyűjtött adatokkal.

Az adatszolgáltatók megfelelő kompenzálása.

  • Az adatszolgáltatókat nem szabad az adatgyűjtésekbe kényszeríteni vagy kényszeríteni, és az idő és az adatok megfelelő ellentételezéseként kell őket kompenzálni.
  • A nem megfelelő kártérítés lehet kizsákmányoló vagy kényszerítő.

Lehetővé teszi a közreműködők számára a demográfiai adatok önazonosítását.

  • Az adatszolgáltatók által nem önként jelentett, de az adatgyűjtők által hozzárendelt demográfiai információk 1) pontatlan metaadatokat eredményeznek, és 2) tiszteletlenek az adatszolgáltatókkal.

A sebezhető csoportok toborzása során várható károk.

  • A sebezhető népességcsoportokból származó adatok gyűjtése kockázatot jelent az adatszolgáltatókra és a szervezetre nézve.

Az adatszolgáltatókat tisztelettel kezelje.

  • Az adatgyűjtés bármely szakaszában az adatszolgáltatókkal folytatott helytelen interakciók negatívan befolyásolhatják az adatminőséget, valamint az adatszolgáltatók és adatgyűjtők általános adatgyűjtési élményét.

A külső szállítókat gondosan minősítse.

  • A nem minősített beszállítókkal végzett adatgyűjtések rossz minőségű adatokat, rossz adatkezelést, szakmaiatlan eljárásokat és potenciálisan káros kimeneteleket eredményezhetnek az adatszolgáltatók és adatgyűjtők számára (beleértve az emberi jogok megsértését is).
  • A nem minősített beszállítókkal végzett széljegyzet- vagy címkézési munkák (például hangátiratok, képcímkézés) gyenge minőségű vagy elfogult adathalmazokat, nem biztonságos adatkezelést, szakmaiatlan eljárásokat és potenciálisan káros eredményeket eredményezhetnek az adatszolgáltatók számára (beleértve az emberi jogok megsértését is).

A beszállítókkal kötött munkanyilatkozatban (SOW) egyértelműen közölheti az elvárásokat.

  • A felelős adatgyűjtési munkákra vonatkozó követelményekkel nem rendelkező szerződések rossz minőségű vagy rosszul gyűjtött adatokat eredményezhetnek.

Gondosan minősítse a földrajzi helyeket.

  • Adott esetben a magas geopolitikai kockázatú és/vagy ismeretlen földrajzi területeken történő adatgyűjtés használhatatlan vagy gyenge minőségű adatokat eredményezhet, és hatással lehet az érintett felek biztonságára.

Legyen jó ügyintézője az adathalmazoknak.

  • A helytelen adatkezelés és a rossz dokumentáció adatmeg nem rendeltetésszerű használatot eredményezhet.

Megjegyzés:

Ez a cikk az emberi adatokra vonatkozó javaslatokkal foglalkozik, beleértve a személyes adatokat és a bizalmas adatokat, például a biometrikus adatokat, az egészségügyi adatokat, a faji vagy etnikai adatokat, a nyilvános vagy a vállalati alkalmazottak által manuálisan gyűjtött adatokat, valamint az emberi jellemzőkkel kapcsolatos metaadatokat, például az életkort, a származást és a nemi identitást, amelyek széljegyzetekkel vagy címkézéssel hozhatók létre.

Itt töltheti le a teljes javaslatokat

Ajánlott eljárások az életkor, a származás és a nemi identitás gyűjtéséhez

Annak érdekében, hogy az AI-rendszerek mindenki számára jól működjenek, a képzéshez és az értékeléshez használt adathalmazoknak tükrözniük kell a rendszerek által használni vagy érintett személyek sokféleségét. Sok esetben az életkor, a származás és a nemi identitás segíthet megközelíteni azokat a tényezőket, amelyek befolyásolhatják, hogy egy termék milyen jól teljesít a különböző emberek számára; azonban az információk összegyűjtése különös figyelmet igényel.

Ha mégis összegyűjti ezeket az adatokat, mindig hagyja, hogy az adatszolgáltatók önazonosodjanak (válassza ki a saját válaszaikat) ahelyett, hogy az adatgyűjtők feltételezéseket tennének, ami helytelen lehet. Minden kérdéshez adjon meg egy "inkább ne válaszoljon" lehetőséget is. Ezek a gyakorlatok tiszteletben tartják az adatszolgáltatókat, és kiegyensúlyozottabb és jobb minőségű adatokat eredményeznek.

Ezeket az ajánlott eljárásokat három évnyi kutatás és a Microsoft számos csapatával folytatott együttműködés alapján fejlesztették ki: méltányosság és befogadás munkacsoportok, globális sokszínűség és befogadás, globális felkészültség, Felelős AI-hivatal és mások.

Az önazonosítás engedélyezéséhez fontolja meg az alábbi felmérési kérdések használatát.

Kor

Mennyi idős vagy?

Válassza ki a kortartományt

[A projektcél, a földrajzi régió és a tartományi szakértők útmutatása alapján meghatározott megfelelő kortartományok belefoglalása]

  • # #
  • # #
  • # #
  • Inkább ne válaszoljon

Származású

Válassza ki azokat a kategóriákat, amelyek a legjobban írják le a származását

Több lehetőséget is kijelölhet

[A projektcél, a földrajzi régió és a tartományi szakértők útmutatása alapján meghatározott megfelelő kategóriák belefoglalása]

  • Őscsoport
  • Őscsoport
  • Őscsoport
  • Többszörös (többszintű, vegyes eredetű)
  • Nem szerepel a listán, úgy írom le magam, mint: _________________
  • Inkább ne válaszoljon

Nemi identitás

Hogyan azonosítja?

Több lehetőséget is kijelölhet

[A projektcél, a földrajzi régió és a tartományi szakértők útmutatása alapján meghatározott nemi identitások belefoglalása]

  • Nemi identitás
  • Nemi identitás
  • Nemi identitás
  • Inkább saját leírást szeretne: ___________________
  • Inkább ne válaszoljon

Figyelem

A világ egyes részein vannak olyan törvények, amelyek bizonyos nemi kategóriákat kriminalizálnak, ezért veszélyes lehet az adatszolgáltatók számára, hogy őszintén válaszoljanak erre a kérdésre. Mindig adjon módot az embereknek, hogy kikapcsolják. A regionális szakértőkkel és ügyvédekkel együttműködve körültekintően áttekintheti minden olyan hely törvényeit és kulturális normáit, ahol adatokat szeretne gyűjteni, és ha szükséges, ne tegye fel teljesen ezt a kérdést.

A teljes útmutatót itt töltheti le.

További lépések

További információ az adatokkal való munkáról:

Az alábbi útmutatók segítségével dolgozhat az adataival az adatgyűjtés után: