Memuat data ke dalam indeks pencarian di Azure AI Search

Artikel ini menjelaskan cara mengimpor, menyegarkan, dan mengelola konten dalam indeks pencarian yang telah ditentukan sebelumnya. Di Pencarian Azure AI, indeks pencarian dibuat terlebih dahulu, dengan impor data berikut sebagai langkah kedua. Pengecualiannya adalah wizard Impor Data dan alur pengindeks, yang membuat dan memuat indeks dalam satu alur kerja.

Layanan pencarian mengimpor dan mengindeks teks dan vektor di JSON, digunakan dalam pencarian teks lengkap, pencarian vektor, pencarian hibrid, dan skenario penambangan pengetahuan. Konten teks dapat diperoleh dari bidang alfanumerik di sumber data eksternal, metadata yang berguna dalam skenario pencarian, atau konten yang diperkaya yang dibuat oleh set keterampilan (keterampilan dapat mengekstrak atau menyimpulkan deskripsi tekstual dari gambar dan konten yang tidak terstruktur). Konten vektor di-vektorisasi menggunakan model penyematan eksternal atau vektorisasi terintegrasi (pratinjau).

Setelah data diindeks, struktur data fisik indeks dikunci. Untuk panduan tentang apa yang dapat dan tidak dapat diubah, lihat Menghilangkan dan membangun kembali indeks.

Pengindeksan bukan proses latar belakang. Layanan pencarian akan menyeimbangkan beban kerja pengindeksan dan kueri, tetapi jika latensi kueri terlalu tinggi, Anda dapat menambahkan kapasitas atau mengidentifikasi periode aktivitas kueri rendah untuk memuat indeks.

Muat dokumen

Layanan pencarian menerima dokumen JSON yang sesuai dengan skema indeks.

Anda dapat menyiapkan dokumen ini sendiri, tetapi jika konten berada di sumber data yang didukung, menjalankan pengindeks atau wizard Impor data dapat mengotomatiskan pengambilan dokumen, serialisasi JSON, dan pengindeksan.

Di portal Azure, gunakan wizard Impor Data untuk membuat dan memuat indeks dalam alur kerja yang mulus. Jika Anda ingin memuat indeks yang ada, pilih pendekatan alternatif.

  1. Masuk ke portal Azure dengan akun Azure Anda.

  2. Temukan layanan pencarian Anda dan pada halaman Gambaran Umum, pilih Impor data atau Impor dan vektorisasi data pada bilah perintah untuk membuat dan mengisi indeks pencarian. Anda dapat mengikuti tautan ini untuk meninjau alur kerja: Mulai Cepat: Membuat indeks Pencarian Azure AI dan Mulai Cepat: Vektorisasi terintegrasi (pratinjau).

    Screenshot of the Import data command

Jika pengindeks sudah ditentukan, Anda dapat mengatur ulang dan menjalankan pengindeks dari portal Azure, yang berguna jika Anda menambahkan bidang secara bertahap. Reset memaksa pengindeks untuk memulai kembali, mengambil semua bidang dari semua dokumen sumber.

Menghapus dokumen yatim piatu

Azure AI Search mendukung operasi tingkat dokumen sehingga Anda dapat mencari, memperbarui, dan menghapus dokumen tertentu dalam isolasi. Contoh berikut menunjukkan cara menghapus dokumen. Dalam layanan pencarian, dokumen tidak terkait sehingga menghapusnya tidak akan berdampak pada indeks lainnya.

  1. Identifikasi bidang mana yang merupakan kunci dokumen. Di portal, Anda dapat melihat bidang setiap indeks. Kunci dokumen adalah bidang string dan ditandai dengan ikon kunci untuk membuatnya lebih mudah dilihat.

  2. Periksa nilai bidang kunci dokumen: search=*&$select=HotelId. String sederhana mudah, tetapi jika indeks menggunakan bidang berkode base-64, atau jika dokumen pencarian dihasilkan dari parsingMode pengaturan, Anda mungkin bekerja dengan nilai yang tidak Anda kenal.

  3. Cari dokumen untuk memverifikasi nilai ID dokumen dan meninjau kontennya sebelum menghapusnya. Tentukan ID kunci atau dokumen dalam permintaan. Contoh berikut mengilustrasikan string sederhana untuk indeks sampel Hotel dan string yang dikodekan base-64 untuk kunci metadata_storage_path indeks cog-search-demo.

    GET https://[service name].search.windows.net/indexes/hotel-sample-index/docs/1111?api-version=2023-11-01
    
    GET https://[service name].search.windows.net/indexes/cog-search-demo/docs/aHR0cHM6Ly9oZWlkaWJsb2JzdG9yYWdlMi5ibG9iLmNvcmUud2luZG93cy5uZXQvY29nLXNlYXJjaC1kZW1vL2d1dGhyaWUuanBn0?api-version=2023-11-01
    
  4. Hapus dokumen untuk menghapusnya dari indeks pencarian.

    POST https://[service name].search.windows.net/indexes/hotels-sample-index/docs/index?api-version=2023-11-01
    Content-Type: application/json   
    api-key: [admin key] 
    {  
      "value": [  
        {  
          "@search.action": "delete",  
          "id": "1111"  
        }  
      ]  
    }
    

Lihat juga