Share via


"İnsan verileri" nedir ve sorumlu bir şekilde kaynak sağlamak neden önemlidir?

ŞUNLAR IÇIN GEÇERLIDIR: Azure CLI ml uzantısı v2 (geçerli)Python SDK azure-ai-ml v2 (geçerli)

İnsan verileri doğrudan kişilerden veya kişilerden toplanan verilerdir. İnsan verileri adlar, yaş, resimler veya ses klipleri gibi kişisel verileri ve genetik veriler, biyometrik veriler, cinsiyet kimliği, dini inançlar veya siyasi bağlantılar gibi hassas verileri içerebilir.

Bu verilerin toplanması, tüm kullanıcılara uygun yapay zeka sistemleri oluşturmak için önemli olabilir. Ancak özellikle veri katılımcılarına fiziksel ve psikolojik zararlar verebilen uygulamalardan kaçınılmalıdır.

Bu makaledeki en iyi uygulamalar, katılan herkesin saygıyla ele alındığı ve özellikle savunmasız grupların karşılaştığı olası zararların tahmin edildiği ve azaltıldığı gönüllülerden el ile veri toplama projeleri yürütmenize yardımcı olacaktır. Bu şu anlama gelir:

  • Kişiler katkıda bulunan veriler hiçbir şekilde zorlamaz veya kötüye kullanılamaz ve hangi kişisel verilerin toplandığı üzerinde denetime sahiptir.
  • Kişiler verileri toplama ve etiketleme yeterli eğitime sahiptir.

Bu uygulamalar, daha dengeli ve daha kaliteli veri kümeleri ile insan verilerinin daha iyi idare edilmesini sağlamaya da yardımcı olabilir.

Bunlar yeni ortaya çıkan uygulamalardır ve sürekli öğreniyoruz. Sonraki bölümdeki en iyi yöntemler, sorumlu insan veri koleksiyonlarınızı başlatırken bir başlangıç noktasıdır. Bu en iyi uygulamalar yalnızca bilgilendirme amaçlıdır ve yasal tavsiye olarak değerlendirilmemelidir. Tüm insan verileri koleksiyonları belirli gizlilik ve yasal incelemelerden geçirilmelidir.

Genel en iyi uygulamalar

Doğrudan kişilerden el ile insan verileri toplamak için aşağıdaki en iyi yöntemleri öneririz.

En İyi Yöntemler

Neden?


Gönüllü olarak bilgilendirilmiş onay alın.

  • Katılımcılar veri toplamayı ve verilerinin nasıl kullanılacağını anlamalı ve onay vermelidir.
  • Veriler yalnızca özgün belgelenmiş bilgilendirilmiş onayın parçası olan amaçlarla depolanmalı, işlenmeli ve kullanılmalıdır.
  • Onay belgeleri düzgün bir şekilde depolanmalı ve toplanan verilerle ilişkilendirilmelidir.

Veri katkıda bulunanlarını uygun şekilde telafi edin.

  • Veri katkıda bulunanları veri koleksiyonlarına sıkıştırılmamalı veya zorlanmamalı ve zamanları ve verileri için oldukça telafi edilmelidir.
  • Uygunsuz tazminat sömürülücü veya zorlayıcı olabilir.

Katkıda bulunanların demografik bilgileri kendi tanımlamasına izin verin.

  • Veri katkıda bulunanları tarafından kendi kendine bildirilmeyen ancak veri toplayıcılar tarafından atanan demografik bilgiler 1) yanlış meta verilere neden olur ve 2) veri katkıda bulunanlarına saygısızlık eder.

Savunmasız grupları işe alırken zararları tahmin edin.

  • Savunmasız popülasyon gruplarından veri toplamak, veri katkıda bulunanlarına ve kuruluşunuza risk oluşturur.

Veri katkıda bulunanlarına saygılı davranın.

  • Veri toplamanın herhangi bir aşamasında veri katkıda bulunanlarıyla yanlış etkileşimler, veri kalitesini ve veri katkıda bulunanları ve veri toplayıcıları için genel veri toplama deneyimini olumsuz etkileyebilir.

Dış tedarikçileri dikkatli bir şekilde niteleme.

  • Nitelenmemiş tedarikçilerle veri koleksiyonları düşük kaliteli verilere, kötü veri yönetimine, profesyonel olmayan uygulamalara ve veri katkıda bulunanları ve veri toplayıcıları için zararlı olabilecek sonuçlara (insan hakları ihlalleri dahil) neden olabilir.
  • Nitelenmemiş tedarikçilerle yapılan ek açıklama veya etiketleme çalışmaları (ses transkripsiyonu, görüntü etiketleme gibi) düşük kaliteli veya taraflı veri kümelerine, güvenli olmayan veri yönetimine, profesyonel olmayan uygulamalara ve veri katkıda bulunanları için zararlı olabilecek sonuçlara (insan hakları ihlalleri dahil) neden olabilir.

İş Bildirimi'nde (SOW) (sözleşmeler veya sözleşmeler) tedarikçilerle beklentileri net bir şekilde iletin.

  • Sorumlu veri toplama çalışmaları için gereksinimleri olmayan bir sözleşme, düşük kaliteli veya düşük toplanmış verilere neden olabilir.

Coğrafyaları dikkatli bir şekilde nitele.

  • Uygun olduğunda, yüksek jeopolitik risk ve/veya yabancı coğrafyalarda veri toplamak kullanılamayan veya düşük kaliteli verilere neden olabilir ve ilgili tarafların güvenliğini etkileyebilir.

Veri kümelerinizin iyi bir temsilcisi olun.

  • Hatalı veri yönetimi ve kötü belgeler, verilerin kötüye kullanılmasına neden olabilir.

Dekont

Bu makale, kişisel veriler ve biyometrik veriler, sağlık verileri, ırksal veya etnik veriler gibi hassas veriler, genel kamu veya şirket çalışanlarından el ile toplanan veriler ve ek açıklama veya etiketleme yoluyla oluşturulabilecek yaş, ata ve cinsiyet kimliği gibi insan özellikleriyle ilgili meta veriler de dahil olmak üzere insan verilerine yönelik önerilere odaklanmaktadır.

Önerilerin tamamını buradan indirin

Yaş, ata ve cinsiyet kimliğini toplamak için en iyi yöntemler

Yapay zeka sistemlerinin herkes için iyi çalışması için eğitim ve değerlendirme için kullanılan veri kümeleri, bu sistemleri kullanacak veya etkilenecek kişilerin çeşitliliğini yansıtmalıdır. Çoğu durumda yaş, ata ve cinsiyet kimliği, bir ürünün çeşitli kişiler için ne kadar iyi performans sergilediğini etkileyebilecek faktörlerin yaklaşık olarak yakın olmasına yardımcı olabilir; ancak, bu bilgilerin toplanması özel bir değerlendirme gerektirir.

Bu verileri toplarsanız, veri toplayıcılarının varsayımlarda bulunması yerine veri katılımcılarının her zaman kendi kendilerini tanımlamalarına (kendi yanıtlarını seçmelerine) izin verin; bu yanlış olabilir. Ayrıca her soru için "yanıtlamayı tercih etme" seçeneğini de ekleyin. Bu uygulamalar, veri katkıda bulunanlarına saygı gösterir ve daha dengeli ve daha yüksek kaliteli veriler verir.

Bu en iyi uygulamalar, amaçlanan proje katılımcılarıyla yapılan üç yıllık araştırmalara ve Microsoft'taki birçok ekiple işbirliğine dayalı olarak geliştirilmiştir: eşitlik ve kapsayıcılık çalışma grupları, Küresel Çeşitlilik ve Kapsayıcılık, Küresel Hazırlık, Sorumlu Yapay Zeka Ofisi ve diğerleri.

Kişilerin kendi kendini tanımlamasını sağlamak için aşağıdaki anket sorularını kullanmayı göz önünde bulundurun.

Yaş

Kaç yaşındasınız?

Yaş aralığınızı seçin

[Proje amacı, coğrafi bölge ve etki alanı uzmanlarının yönergeleriyle tanımlanan uygun yaş aralıklarını dahil edin]

  • # #
  • # #
  • # #
  • Yanıtlamayı tercih etme

Kökenli

Lütfen atalarınızı en iyi açıklayan kategorileri seçin

Birden çok seçilebilir

[Proje amacı, coğrafi bölge ve etki alanı uzmanlarının rehberliğinde tanımlandığı şekilde uygun kategorileri ekleyin]

  • Ancestry grubu
  • Ancestry grubu
  • Ancestry grubu
  • Birden çok (çok ırklı, karmaAncestry)
  • Listelenmiyor, kendimi şu şekilde tanımluyorum: ___________________
  • Yanıtlamayı tercih etme

Cinsiyet kimliği

Nasıl tanımlayabilirsiniz?

Birden çok seçilebilir

[Proje amacı, coğrafi bölge ve etki alanı uzmanlarının rehberliğinde tanımlanan uygun cinsiyet kimliklerini dahil edin]

  • Cinsiyet kimliği
  • Cinsiyet kimliği
  • Cinsiyet kimliği
  • Kendi kendine açıklamayı tercih edin: ___________________
  • Yanıtlamayı tercih etme

Dikkat

Dünyanın bazı yerlerinde belirli cinsiyet kategorilerini suç sayan yasalar vardır, bu nedenle veri katılımcılarının bu soruyu dürüst bir şekilde yanıtlaması tehlikeli olabilir. İnsanlara her zaman geri çevirmeleri için bir yol verin. Ayrıca, veri toplamayı planladığınız her yerin yasaları ve kültürel normlarını dikkatli bir şekilde gözden geçirmek için bölge uzmanları ve avukatlarıyla birlikte çalışın ve gerekirse bu soruyu tamamen sormaktan kaçının.

Kılavuzun tamamını buradan indirin.

Sonraki adımlar

Verilerinizle çalışma hakkında daha fazla bilgi için:

Verileri topladıktan sonra verilerinizle çalışmak için şu nasıl yapılır kılavuzlarını izleyin: