Azure Bilişsel Arama’da anlamsal arama

Önemli

Semantik arama, ek kullanım koşulları altında genel önizlemededir. Azure portal, önizleme REST API ve beta SDK'ları aracılığıyla kullanılabilir. Bu özellikler faturalanabilir. hakkında daha fazla bilgi için bkz. Kullanılabilirlik ve fiyatlandırma.

Semantik arama, arama sonuçlarına semantik ilgi düzeyi ve dil anlama özellikleri getiren sorguyla ilgili özelliklerden bir koleksiyondur. Bu makale, her özelliğin açıklamaları ve bunların birlikte nasıl çalışmalarına ilişkin genel bir açıklamayla birlikte semantik arama özelliğine üst düzey bir giriştir. Ekli videoda teknoloji açık, sonunda ise kullanılabilirlik ve fiyatlandırma yer almaktadır.

Semantik arama premium bir özelliktir. Arka plan için bu makaleyi öneririz, ancak başlamayı tercih edersanız şu adımları izleyin:

Semantik arama, arama sonuçlarının kalitesini geliştiren özellikler koleksiyonudur. Arama hizmetiniz etkinleştirildiğinde sorgu yürütme işlem hattını iki şekilde genişletebilir. İlk olarak, ilk sonuç kümesine ikincil derecelendirme ekler ve en alakalı sonuçları listenin en üstüne ekler. İkincisi, kullanıcının arama deneyimini geliştirmek için bir arama sayfasında işleyebilirsiniz yanıtta açıklamalı alt yazıları ve yanıtları ayıklar ve döndürür.

Özellik Açıklama
Semantik yeniden derecelendirme Mevcut sonuçlar üzerinde yeni bir ilgi puanı hesaplamak için bağlamı veya anlamsal anlamı kullanır.
Semantik açıklamalı alt yazılar ve vurgular Kolay tarama için önemli metinler üzerinde vurgular ile içeriği en iyi özetleyen belgeden cümleleri ve tümcecikleri ayıklar. Sonuçları özetleyen açıklamalı alt yazılar, sonuçlar sayfası için tek tek içerik alanları fazla yoğun olduğunda kullanışlıdır. Vurgulanan metin en ilgili terimleri ve tümcecikleri yükseltebilir, böylece kullanıcılar bir eşleşmenin neden uygun olarak kabul edildiklerini hızla tespit etmiş olur.
Semantik yanıtlar Bir semantik sorgudan döndürülen isteğe bağlı ve ek bir alt yapı. Soru gibi görünen bir sorguya doğrudan yanıt sağlar. Belgenin yanıt özelliklerine sahip metinlere sahip olduğunu gerektirir.
Yazım denetimi Sorgu terimleri arama motoruna ulaşmadan önce yazım hatalarını düzelter.

Semantik derecelendirme nasıl çalışır?

Anlamsal derecelendirme, terimler arasındaki bağlamı ve ilgililiği, sorguya göre daha anlamlı olan eşleşmeleri yükseltmeyi ele alır. Dil anlama, içeriğinizin içindeki özetlemeleri veya açıklamalı alt yazıları ve yanıtları bulur ve bunları yanıta dahil eder. Daha sonra daha üretken bir arama deneyimi için arama sonuçları sayfasında işleyebilirsiniz.

Özetleme ve derecelendirme için en son teknolojiyle eğitilmemiş modeller kullanılır. Kullanıcıların aramadan beklenilen hızlı performansı korumak için, varsayılan benzerlik puanlama algoritması tarafından puanlandı olarak yalnızca ilk 50 sonuçlara semantik özetleme ve derecelendirme uygulanır. Bu sonuçları belge corpus olarak kullanarak, semantik derecelendirme bu sonuçları eşleşmenin semantik gücüne göre yeniden puanlar.

Temel alınan teknoloji Bing Microsoft Research'e ve Bilişsel Arama altyapısına eklenti özelliği olarak tümleştirilmiştir. Semantik aramalara destek olan araştırma ve AI yatırımları hakkında daha fazla bilgi için bkz. Bing'den gelen AI Azure Bilişsel Arama (Microsoft Research Blog).

Aşağıdaki videoda özelliklere genel bir bakış ve açıklama yer atır.

İşlem sırası

Semantik arama bileşenleri, mevcut sorgu yürütme işlem hattını her iki yönde de genişletmektedir. Yazım düzeltmeyi etkinleştirirsanız, terimler arama motoruna ulaşmadan önce yazım hatası sorgu kümesinde düzeltin.

Sorgu yürütmede semantik bileşenler

Sorgu yürütme, terim ayrıştırma, analiz ve ters dizinler üzerinde tarama ile her zamanki gibi devam eder. Altyapı, belirteç eşleştirmeyi kullanarak belgeleri alır ve varsayılan benzerlik puanlama algoritmasını kullanarak sonuçları puanlar. Puanlar, sorgu terimleri ile dizinde eşleşen terimler arasındaki dilsel benzerlik derecesine göre hesaplanır. Bunları tanımladıysanız puanlama profilleri de bu aşamada uygulanır. Sonuçlar daha sonra semantik arama alt sistemine geçirildi.

Hazırlık adımlarında, ilk sonuç kümesinden döndürülen belge corpus tümce ve paragraf düzeyinde analiz edilir ve her bir belgeyi özetleyen tümceleri bulur. Anahtar sözcük aramanın aksine, bu adım içeriği değerlendirmek için makine okuma ve anlama kullanır. bir semantik sorgu, içerik işlemenin bu aşamasında açıklamalı alt yazılar ve yanıtlar döndürür. Bunları formüle etmek için semantik arama, bir sonucu en iyi özetleyen anahtar geçitleri ayıklamak ve vurgulamak için dil gösterimini kullanır. Arama sorgusu bir soru ise ve yanıtlar istenecekse yanıt, arama sorgusu tarafından ifade edilen soruyu en iyi şekilde yanıta getiren bir metin metni de içerir.

Hem açıklamalı alt yazılar hem de yanıtlar için formülde mevcut metin kullanılır. Semantik modeller, kullanılabilir içerikten yeni cümleler veya tümcecikler oluşturmaz ve yeni sonuçlara varmak için mantık uygulamaz. Kısacası sistem hiçbir zaman mevcut olmayan içerikleri geri dönmez.

Sonuçlar daha sonra sorgu terimlerinin kavramsal benzerliği temel alarak yeniden puanlar.

Sorgularda semantik özellikleri kullanmak için arama isteğinde küçük değişiklikler yapılması gerekir,ancak ek yapılandırma veya yeniden dizine ekleme gerekmez.

Semantik özellikler ve sınırlamalar

Semantik arama daha yeni bir teknolojidir, bu nedenle neler yapa ve neleri yapamaylarına ilişkin beklentiler ayarlamak önemlidir. Şu şekilde arama kalitesini geliştirerek bunu yapabiliriz:

  • Özgün sorgunun amacına daha yakın olan eşleşmeleri tanıtma.

  • Her sonuçta açıklamalı alt yazı olarak kullanılaabilecek dizeleri bulma ve olası yanıtlar, arama sonuçları sayfasında işlenecektir.

Bunu yapmayan şey, ilgili sonuçları bulmak için sorguyu tüm corpus üzerinde yeniden çalıştırmaktır. Semantik arama, varsayılan derecelendirme algoritması tarafından puanlandı olarak en iyi 50 sonuçdan oluşan mevcut sonuç kümesine yeniden derecelendirme sağlar. Ayrıca, semantik arama yeni bilgi veya dizeler oluşturamaz. İçerikten açıklamalı alt yazılar ve yanıtlar ayıklanır. Bu nedenle, sonuçlar yanıta benzer metinleri içermezse dil modelleri bir metin üretmez.

Semantik arama her senaryoda yararlı olsa da, belirli içerik özelliklerinden önemli ölçüde yararlanabilir. Semantik arama dil modelleri, bilgi açısından zengin ve prose olarak yapılandırılmış aranabilir içerikler üzerinde en iyi şekilde çalışır. Açıklayıcı içerik içeren bir bilgi bankası, çevrimiçi belgeler veya belgeler, semantik arama özelliklerinden en çok kazançları görebilir.

Kullanılabilirlik ve fiyatlandırma

Semantik arama kayıt kaydı aracılığıyla kullanılabilir. Hem semantik arama hem de yazım denetimi için bir kayıt vardır.

Özellik Katman Bölge Kaydolma Fiyatlandırma
Semantik arama (sıralama, açıklamalı alt yazılar, vurgular, yanıtlar) Standart katman (S1, S2, S3) Orta Kuzey ABD, Batı ABD, Batı ABD 2, Doğu ABD 2, Kuzey Avrupa, Batı Avrupa Gerekli Bilişsel Arama fiyatlandırma sayfası
Yazım denetimi Temel1 ve üzeri Tümü Hiçbiri Hiçbiri (ücretsiz)

1 Paylaşılan (ücretsiz) arama hizmetlerinin sağlama mekanizmaları ve yaşam süresi nedeniyle, az sayıda hizmet ücretsiz katmanda yazım denetimine sahiptir. Ancak ücretsiz katman hizmetlerinde yazım denetimi kullanılabilirliği garanti edilemez ve beklenmiyor.

Sorgu istekleri "queryType=semantic" ifadesini içermesi ve arama dizesinin boş (örneğin, "new york'ta search=pet friendly hotels" gibi) içermesi semantik arama ücretlerinin ücretlerini alır. Arama dizeniz boşsa ("search=*"), queryType değeri "semantik" olarak ayarlanmış olsa bile ücret ödemezsiniz.

Yanlışlıkla kullanım ve ücretlere karşı tam koruma için, arama hizmetinizde oluşturma veya güncelleştirme hizmeti API 'sini kullanarak anlamsal aramayı devre dışı bırakabilirsiniz. Özellik devre dışı bırakıldıktan sonra semantik sorgu türünü içeren tüm istekler reddedilir.

  • Yönetim REST API sürüm 2021-04-01-önizleme bu seçeneği sağlar

  • Özellikleri devre dışı bırakmak için sahip veya katkıda bulunan izinleri gerekir

PUT https://management.azure.com/subscriptions/{{subscriptionId}}/resourcegroups/{{resource-group}}/providers/Microsoft.Search/searchServices/{{search-service-name}}?api-version=2021-04-01-Preview
    {
      "location": "{{region}}",
      "sku": {
        "name": "standard"
      },
      "properties": {
        "semanticSearch": "disabled"
      }
    }

Anlamsal aramayı yeniden etkinleştirmek için yukarıdaki isteği yeniden çalıştırın, "semanticSearch" ayarını "ücretsiz" (varsayılan) veya "standart" olarak yapın.

İpucu

Yönetim REST API çağrılarının kimliği Azure Active Directory aracılığıyla doğrulanır. Bir güvenlik ilkesini ve isteği ayarlamaya yönelik yönergeler için bkz. Azure REST API 'Leri Postman ile gönderme (2021). Önceki örnek, blog gönderisine sunulan yönergeler ve Postman koleksiyonu kullanılarak test edilmiştir.

Sonraki adımlar

Önceki bölümde belirtilen katman ve bölgesel gereksinimleri karşılayan bir arama hizmeti önizlemesine kaydolun .

İsteğin işlenmesi iki iş gününe kadar sürebilir. Hizmetiniz hazırlandıktan sonra, içeriğinizin performansını değerlendirmek için bir anlam sorgusu oluşturun .