Mulai cepat: Analitik Teks kustom untuk kesehatan

Artikel
01/10/2024

Gunakan artikel ini untuk mulai membuat proyek Text Analytics for health kustom tempat Anda dapat melatih model kustom di atas Text Analytics untuk kesehatan untuk pengenalan entitas kustom. Model adalah perangkat lunak kecerdasan buatan yang dilatih untuk melakukan tugas tertentu. Untuk sistem ini, model mengekstrak entitas bernama terkait perawatan kesehatan dan dilatih dengan belajar dari data berlabel.

Dalam artikel ini, kami menggunakan Language Studio untuk menunjukkan konsep utama Text Analytics kustom untuk kesehatan. Sebagai contoh, kita akan membuat model Text Analytics for health kustom untuk mengekstrak Fasilitas atau lokasi perawatan dari catatan pembuangan singkat.

Nama	Deskripsi
Langganan	Langganan Azure Anda.
Grup sumber daya	Grup sumber daya yang akan berisi sumber daya Anda. Anda dapat menggunakan ruang kerja yang sudah ada atau membuat baru.
Wilayah	Wilayah sumber daya Bahasa Anda. Misalnya, "US Barat 2".
Nama	Nama sumber daya Anda.
Tingkatan harga	Tingkat harga untuk sumber daya Bahasa Anda. Anda dapat menggunakan tingkat Gratis (F0) untuk mencoba layanan.

Nilai akun penyimpanan	Nilai yang direkomendasikan
Nama akun penyimpanan	Nama apa pun
Jenis akun penyimpanan	LRS Standar

Placeholder	Value	Contoh
`{ENDPOINT}`	Titik akhir untuk mengautentikasi permintaan API Anda.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Nama untuk proyek Anda. Nilai ini peka huruf besar/kecil.	`myProject`
`{API-VERSION}`	Versi API yang Anda panggil. Nilai yang dirujuk di sini adalah untuk versi terbaru yang dirilis. Lihat Siklus hidup model untuk mempelajari selengkapnya tentang versi API lain yang tersedia.	`2022-05-01`

Tombol	Placeholder	Value	Contoh
`multilingual`	`true`	Nilai boolean yang memungkinkan Anda memiliki dokumen dalam beberapa bahasa dalam himpunan data Anda dan ketika model Anda disebarkan, Anda dapat membuat kueri model dalam bahasa apa pun yang didukung (tidak harus disertakan dalam dokumen pelatihan Anda). Lihat dukungan bahasa untuk mempelajari selengkapnya tentang dukungan multi-bahasa.	`true`
`projectName`	`{PROJECT-NAME}`	Nama proyek	`myproject`
`storageInputContainerName`	`{CONTAINER-NAME}`	Nama kontainer	`mycontainer`
`entities`		Array yang berisi semua jenis entitas yang Anda miliki dalam proyek. Ini adalah jenis entitas yang akan diekstraksi dari dokumen Anda.
`category`		Nama jenis entitas, yang dapat ditentukan pengguna untuk definisi entitas baru, atau ditentukan sebelumnya untuk entitas bawaan.
`compositionSetting`	`{COMPOSITION-SETTING}`	Aturan yang menentukan cara mengelola beberapa komponen di entitas Anda. Opsinya adalah `combineComponents` atau `separateComponents`.	`combineComponents`
`list`		Array yang berisi semua sublist yang Anda miliki dalam proyek untuk entitas tertentu. Daftar dapat ditambahkan ke entitas bawaan atau entitas baru dengan komponen yang dipelajari.
`sublists`	`[]`	Array yang berisi sublist. Setiap sublist adalah kunci dan nilai terkaitnya.	`[]`
`listKey`	`One`	Nilai yang dinormalisasi untuk daftar sinonim yang akan dipetakan kembali dalam prediksi.	`One`
`synonyms`	`[]`	Array yang berisi semua sinonim	sinonim
`language`	`{LANGUAGE-CODE}`	String yang menentukan kode bahasa untuk sinonim dalam sublist Anda. Jika proyek Anda adalah proyek multibahasa dan Anda ingin mendukung daftar sinonim untuk semua bahasa dalam proyek Anda, Anda harus secara eksplisit menambahkan sinonim Anda ke setiap bahasa. Lihat Dukungan bahasa untuk informasi selengkapnya tentang kode bahasa yang didukung.	`en`
`values`	`"EntityNumberone"`, `"FirstEntity"`	Daftar string yang dipisahkan koma yang akan dicocokkan persis untuk ekstraksi dan petakan ke kunci daftar.	`"EntityNumberone"`, `"FirstEntity"`
`prebuilts`	`MedicationName`	Nama komponen bawaan yang mengisi entitas bawaan. Entitas bawaan secara otomatis dimuat ke dalam proyek Anda secara default tetapi Anda dapat memperluasnya dengan komponen daftar dalam file label Anda.	`MedicationName`
`documents`		Array yang berisi semua dokumen dalam proyek Anda dan daftar entitas yang diberi label dalam setiap dokumen.	[]
`location`	`{DOCUMENT-NAME}`	Lokasi dokumen dalam kontainer penyimpanan. Karena semua dokumen berada di akar kontainer, ini akan menjadi nama dokumen.	`doc1.txt`
`dataset`	`{DATASET}`	Set pengujian tempat file ini akan masuk ketika dibagi sebelum pelatihan. Nilai yang mungkin untuk bidang ini adalah `Train` dan `Test`.	`Train`
`regionOffset`		Posisi karakter inklusif dari awal teks.	`0`
`regionLength`		Panjang kotak pembatas dalam hal karakter UTF16. Pelatihan hanya mempertimbangkan data di wilayah ini.	`500`
`category`		Jenis entitas yang terkait dengan rentang teks yang ditentukan.	`Entity1`
`offset`		Posisi awal untuk teks entitas.	`25`
`length`		Panjang entitas dalam hal karakter UTF16.	`20`
`language`	`{LANGUAGE-CODE}`	String yang menentukan kode bahasa untuk dokumen yang digunakan dalam proyek Anda. Jika proyek Anda adalah proyek multi-bahasa, pilih kode bahasa dari sebagian besar dokumen. Lihat Dukungan bahasa untuk informasi selengkapnya tentang kode bahasa yang didukung.	`en`

Tombol	Placeholder	Value	Contoh
modelLabel	`{MODEL-NAME}`	Nama model yang ditetapkan ke model Anda setelah berhasil dilatih.	`myModel`
trainingConfigVersion	`{CONFIG-VERSION}`	Ini adalah versi model yang digunakan untuk melatih model.	`2022-05-01`
evaluationOptions		Opsi untuk membagi data Anda di seluruh set pelatihan dan pengujian.	`{}`
jenis	`percentage`	Memisahkan metode. Nilai yang mungkin adalah `percentage` atau `manual`. Lihat Cara melatih model untuk informasi selengkapnya.	`percentage`
trainingSplitPercentage	`80`	Persentase data Anda yang diberi tag untuk disertakan dalam set pelatihan. Nilai yang disarankan adalah `80`.	`80`
testingSplitPercentage	`20`	Persentase data Anda yang diberi tag untuk disertakan dalam set pengujian. Nilai yang disarankan adalah `20`.	`20`

Tombol	Placeholder	Value	Contoh
`displayName`	`{JOB-NAME}`	Nama pekerjaan Anda.	`MyJobName`
`documents`	[{},{}]	Daftar dokumen untuk menjalankan tugas.	`[{},{}]`
`id`	`{DOC-ID}`	ID atau nama dokumen.	`doc1`
`language`	`{LANGUAGE-CODE}`	String yang menentukan kode bahasa untuk dokumen. Jika kunci ini tidak ditentukan, layanan akan menggunakan bahasa default proyek yang dipilih saat pembuatan proyek. Lihat dukungan bahasa untuk daftar kode bahasa yang didukung.	`en-us`
`text`	`{DOC-TEXT}`	Tugas dokumen untuk menjalankan tugas.	`Lorem ipsum dolor sit amet`
`tasks`		Daftar tugas yang ingin kami jalankan.	`[]`
`taskName`	`Custom Text Analytics for Health Test`	Nama tugas	`Custom Text Analytics for Health Test`
`kind`	`CustomHealthcare`	Jenis proyek atau tugas yang kami coba lakukan	`CustomHealthcare`
`parameters`		Daftar parameter untuk diteruskan ke tugas.
`project-name`	`{PROJECT-NAME}`	Nama untuk proyek Anda. Nilai ini peka huruf besar/kecil.	`myProject`
`deployment-name`	`{DEPLOYMENT-NAME}`	Nama penyebaran Anda. Nilai ini peka huruf besar/kecil.	`prod`

Tombol	Nilai Sampel	Deskripsi
entities	[]	Array yang berisi semua entitas yang diekstrak.
entityComponentKind	`prebuiltComponent`	Variabel yang menunjukkan komponen mana yang mengembalikan entitas tertentu. Nilai yang memungkinkan: `prebuiltComponent`, `learnedComponent`, `listComponent`
offset	`0`	Angka yang menunjukkan titik awal entitas yang diekstrak dengan mengindeks karakter
length	`10`	Angka yang menunjukkan panjang entitas yang diekstrak dalam jumlah karakter.
text	`first entity`	Teks yang diekstrak untuk entitas tertentu.
category	`MedicationName`	Nama jenis atau kategori entitas yang sesuai dengan teks yang diekstrak.
confidenceScore	`0.9`	Angka yang menunjukkan tingkat kepastian model dari entitas yang diekstrak mulai dari 0 hingga 1 dengan jumlah yang lebih tinggi menunjukkan kepastian yang lebih tinggi.
assertion	`certainty`	Pernyataan yang terkait dengan entitas yang diekstrak. Pernyataan hanya didukung untuk Text Analytics bawaan untuk entitas kesehatan.
nama	`Ibuprofen`	Nama yang dinormalisasi untuk penautan entitas yang terkait dengan entitas yang diekstrak. Penautan entitas hanya didukung untuk Text Analytics bawaan untuk entitas kesehatan.
links	[]	Array yang berisi semua hasil dari penautan entitas yang terkait dengan entitas yang diekstrak. Penautan entitas hanya didukung untuk Text Analytics bawaan untuk entitas kesehatan.
dataSource	`UMLS`	Standar referensi yang dihasilkan dari penautan entitas yang terkait dengan entitas yang diekstrak. Penautan entitas hanya didukung untuk Text Analytics bawaan untuk entitas kesehatan.
ID	`C0020740`	Kode referensi yang dihasilkan dari penautan entitas yang terkait dengan entitas yang diekstrak milik sumber data yang diekstrak. Penautan entitas hanya didukung untuk Text Analytics bawaan untuk entitas kesehatan.
Hubungan	[]	Array yang berisi semua hubungan yang diekstrak. Ekstraksi hubungan hanya didukung untuk Text Analytics bawaan untuk entitas kesehatan.
relationType	`DosageOfMedication`	Kategori hubungan yang diekstrak. Ekstraksi hubungan hanya didukung untuk Text Analytics bawaan untuk entitas kesehatan.
entities	`"Dosage", "Medication"`	Entitas yang terkait dengan hubungan yang diekstrak. Ekstraksi hubungan hanya didukung untuk Text Analytics bawaan untuk entitas kesehatan.

Bagikan melalui

Mulai cepat: Analitik Teks kustom untuk kesehatan

Prasyarat

Membuat sumber daya Bahasa Azure AI baru dan akun penyimpanan Azure

Buat sumber daya baru menggunakan portal Microsoft Azure

Unggah data sampel ke kontainer blob

Membuat Text Analytics kustom untuk proyek kesehatan

Melatih model

Sebarkan model anda

Uji model Anda

Membersihkan sumber daya

Prasyarat

Membuat sumber daya Bahasa Azure AI baru dan akun penyimpanan Azure

Buat sumber daya baru menggunakan portal Microsoft Azure

Unggah data sampel ke kontainer blob

Dapatkan kunci sumber daya dan titik akhir Anda

Membuat Text Analytics kustom untuk proyek kesehatan

Memicu pekerjaan proyek impor

Header

Isi

Mendapatkan status pekerjaan impor

Minta URL

Header

Melatih model

Mulai pekerjaan pelatihan

Header

Isi permintaan

Dapatkan status pekerjaan pelatihan

Minta URL

Header

Isi Respons

Sebarkan model anda

Mulai pekerjaan penyebaran

Header

Isi permintaan

Dapatkan status pekerjaan penyebaran

Header

Isi Respons

Membuat prediksi dengan model terlatih Anda

Mengirimkan Text Analytics kustom untuk tugas kesehatan

Header

Isi

Respons

Mendapatkan hasil tugas

Header

Isi Respons

Membersihkan sumber daya

Header

Langkah berikutnya

Sumber Daya Tambahan: