Share via


Azure OpenAI Hizmeti'nde eklemeleri anlama

Ekleme, makine öğrenmesi modellerinin ve algoritmalarının kolayca kullanabileceği özel bir veri gösterimi biçimidir. Ekleme, bir metin parçasının anlamsal anlamının yoğun bilgi gösterimidir. Her ekleme, kayan nokta sayılarından oluşan bir vektördür; böylece vektör uzayında iki ekleme arasındaki uzaklık, özgün biçimdeki iki giriş arasındaki anlamsal benzerlikle ilişkilendirilir. Örneğin, iki metin benzerse, vektör gösterimleri de benzer olmalıdır. MongoDB için Azure Cosmos DB sanal çekirdeği, Azure SQL Veritabanı veya PostgreSQL için Azure Veritabanı - Esnek Sunucu gibi Azure Veritabanlarında güç vektör benzerlik araması ekler.

Modelleri ekleme

Belirli bir görevde iyi olmak için farklı Azure OpenAI ekleme modelleri oluşturulur:

  • Benzerlik eklemeleri , iki veya daha fazla metin parçası arasındaki anlamsal benzerliği yakalamada iyidir.
  • Metin araması eklemeleri , uzun belgelerin kısa bir sorguyla ilgili olup olmadığını ölçmeye yardımcı olur.
  • Kod arama eklemeleri , kod parçacıkları eklemek ve doğal dil arama sorgularını eklemek için kullanışlıdır.

Eklemeler, vektör uzayında anlamsal benzerlikleri yakalayarak sözcükleri temsil eden büyük girişlerde makine öğrenmesi yapmayı kolaylaştırır. Bu nedenle, iki metin öbeğinin birbiriyle ilişkili mi yoksa benzer mi olduğunu belirlemek ve benzerliği değerlendirmek için bir puan sağlamak için eklemeleri kullanabilirsiniz.

Kosinüs benzerliği

Azure OpenAI ekleme işlemleri, belgelerle sorgu arasındaki işlem benzerliğine kosinüs benzerliğine dayanır.

Matematik açısından bakıldığında kosinüs benzerliği, çok boyutlu bir alanda öngörülen iki vektör arasındaki açının kosinüsünü ölçer. Bu ölçüm faydalıdır, çünkü iki belge Öklid uzaklığı nedeniyle birbirinden uzaksa, aralarında daha küçük bir açı olabilir ve bu nedenle kosinüs benzerliği daha yüksek olabilir. Kosinüs benzerlik denklemleri hakkında daha fazla bilgi için bkz . Kosinüs benzerliği.

Benzer belgeleri tanımlamanın alternatif bir yöntemi, belgeler arasındaki ortak sözcüklerin sayısını saymaktır. Belge boyutundaki bir genişleme, farklı konular arasında bile daha fazla sayıda ortak sözcük algılanmasına neden olacağından bu yaklaşım ölçeklendirilmiyor. Bu nedenle kosinüs benzerliği daha etkili bir alternatif sunabilir.

Sonraki adımlar

  • Eklemeler öğreticimizle belge araması yapmak için Azure OpenAI ve eklemeleri kullanma hakkında daha fazla bilgi edinin.
  • MongoDB sanal çekirdeği için Azure Cosmos DB, NoSQLiçin Azure Cosmos DB, Azure SQL Veritabanı veya PostgreSQL için Azure Veritabanı - Esnek Sunucu kullanarak eklemelerinizi depolayın ve vektör (benzerlik) araması yapın.