Referensi algoritma & komponen untuk perancang Azure Machine Learning

BERLAKU UNTUK: Python SDK azure-ai-ml v2 (saat ini)

Catatan

Perancang mendukung dua jenis komponen, komponen bawaan klasik, dan komponen kustom. Kedua jenis komponen ini tidak kompatibel.

Komponen bawaan klasik menyediakan komponen bawaan sebagian besar untuk pemrosesan data dan tugas pembelajaran mesin tradisional seperti regresi dan klasifikasi. Jenis komponen ini terus didukung tetapi tidak akan ada komponen baru yang ditambahkan.

Komponen kustom memungkinkan Anda menyediakan kode Anda sendiri sebagai komponen. Komponen ini mendukung berbagi di seluruh ruang kerja dan penulisan tanpa hambatan di seluruh antarmuka Studio, CLI, dan SDK.

Artikel ini berlaku untuk komponen bawaan klasik.

Konten referensi ini menyediakan latar belakang teknis pada setiap komponen bawaan klasik yang tersedia di perancang Azure Pembelajaran Mesin.

Setiap komponen mewakili satu kumpulan kode yang dapat berjalan secara independen dan melakukan tugas pembelajaran mesin, dengan input yang diperlukan. Komponen mungkin berisi algoritma tertentu, atau melakukan tugas yang penting dalam pembelajaran mesin, seperti penggantian nilai yang hilang, atau analisis statistik.

Untuk bantuan dalam memilih algoritma, lihat

Tip

Dalam alur apa pun di perancang, Anda bisa mendapatkan informasi tentang komponen tertentu. Pilih tautan Pelajari selengkapnya di kartu komponen saat mengarahkan ke komponen di daftar komponen, atau di panel kanan komponen.

Komponen penyiapan data

Fungsionalitas Deskripsi komponen
Input dan output data Pindahkan data dari sumber cloud ke alur Anda. Tulis hasil atau data perantara Anda ke Azure Storage, atau Database SQL, saat menjalankan alur, atau gunakan penyimpanan cloud untuk bertukar data antar alur. Memasukkan Data Secara Manual
Mengekspor data
Impor Data
Transformasi Data Operasi pada data yang unik untuk pembelajaran komputer, seperti menormalkan atau mengikat data, pengurangan dimensi, dan mengonversi data di antara berbagai format file. Menambahkan kolom
Menambahkan Baris
Menerapkan Operasi Matematika
Terapkan Transformasi SQL
Membersihkan Data Yang Hilang
Nilai Klip
Mengonversi ke CSV
Mengonversi ke Himpunan Data
Mengonversi ke Nilai Indikator
Mengedit Metadata
Mengelompokkan Data ke dalam Bin
Data Gabungan
Menormalkan Data
Partisi dan Sampel
Menghapus Baris Duplikat
SMOTE
Memilih Transformasi Kolom
Memilih Kolom di Himpunan Data
Memisahkan Data
Pemilihan Fitur Pilih subset fitur yang relevan dan berguna untuk digunakan untuk membangun model analitik. Pilihan Fitur Berbasis Filter
Pentingnya Fitur Permutasi
Fungsi statistik Menyediakan berbagai metode statistik yang terkait dengan ilmu data. Meringkas Data

Algoritma pembelajaran mesin

Fungsionalitas Deskripsi komponen
Regresi Memprediksi nilai. Regresi Pohon Keputusan yang Ditingkatkan
Regresi Hutan Keputusan
Regresi Kuantil Hutan Cepat
Regresi Linear
Regresi Jaringan Saraf
Regresi Poisson
Pengklusteran Mengelompokkan data bersama-sama. Pengklusteran K-Means
Klasifikasi Memprediksi kelas. Pilih dari algoritma biner (dua kelas) atau multi kelas. Pohon Keputusan yang Didorong Multikelas
Hutan Keputusan Multikelas
Regresi Logistik Multi kelas
Jaringan Neural Multi kelas
Satu vs. Semua Multi kelas
Satu vs. Satu Multikelas
Perceptron Rata-Rata Dua Kelas
Pohon Keputusan yang Didorong Dua Kelas
Hutan Keputusan Dua Kelas
Regresi Logistik Dua Kelas
Jaringan Neural Dua Kelas
Komputer Vektor Dukungan Dua Kelas

Komponen untuk membangun dan mengevaluasi model

Fungsionalitas Deskripsi komponen
Pelatihan model Jalankan data melalui algoritma. Melatih Model Pengklusteran
Model Latihan
Melatih Model Pytorch
Sesuaikan Hyperparameter Model
Penilaian dan Evaluasi Model Mengukur akurasi model terlatih. Terapkan Transformasi
Tetapkan Data ke Kluster
Model Validasi Silang
Evaluasi Model
Model Gambar Skor
Model Penilaian
Bahasa Python Tulis kode dan sematkan dalam komponen untuk mengintegrasikan Python dengan alur Anda. Buat Model Python
Jalankan Skrip Python
Bahasa R Tulis kode dan sematkan dalam komponen untuk mengintegrasikan R dengan alur Anda. Jalankan Skrip R
Text Analytics Menyediakan alat komputasi khusus untuk bekerja dengan teks terstruktur dan tidak terstruktur. Mengonversi Word menjadi Vektor
Mengekstrak Fitur N-Gram dari Teks
Hashing Fitur
Teks Praproses
Alokasi Latent Dirichlet
Skor Model Wabbit Vowpal
Melatih Model Vowpal Wabbit
Computer Vision Prapemrosesan data gambar dan komponen terkait pengenalan Gambar. Terapkan Transformasi Gambar
Konversi ke Direktori Gambar
Transformasi Gambar Init
Pisahkan Direktori Gambar
DenseNet
ResNet
Rekomendasi Buat model rekomendasi. Evaluasi Pemberi Rekomendasi
Skor Pemberi Rekomendasi SVD
Skor Pemberi Rekomendasi yang Luas dan Mendalam
Melatih Pemberi Rekomendasi SVD
Melatih Pemberi Rekomendasi yang Luas dan Mendalam
Deteksi Anomali Membangun model deteksi anomali. PCA-Based Deteksi Anomali
Melatih Model Deteksi Anomali

Layanan web

Pelajari komponen layanan web, yang diperlukan untuk inferensi waktu nyata di desainer Azure Machine Learning.

Pesan kesalahan

Pelajari pesan kesalahan dan kode pengecualian yang mungkin Anda temui saat menggunakan komponen di perancang Azure Machine Learning.

Lingkungan komponen

Semua komponen bawaan dalam perancang akan dijalankan pada lingkungan tetap yang disediakan oleh Microsoft.

Sebelumnya, lingkungan ini didasarkan pada Python 3.6, dan kini telah ditingkatkan ke Python 3.8. Peningkatan ini transparan karena komponen akan berjalan secara otomatis pada lingkungan Python 3.8 dan tidak memerlukan tindakan dari pengguna. Pembaruan lingkungan dapat memengaruhi output komponen dan menyebarkan titik akhir real-time dari inferensi real-time, lihat bagian berikut untuk mempelajari lebih lanjut.

Output komponen berbeda dari hasil sebelumnya

Setelah versi Python ditingkatkan dari 3.6 ke 3.8, dependensi komponen bawaan juga dapat ditingkatkan. Oleh karena itu, Anda mungkin menemukan beberapa output komponen berbeda dari hasil sebelumnya.

Jika Anda menggunakan komponen Jalankan Skrip Python dan sebelumnya telah menginstal paket yang terkait dengan Python 3.6, Anda mungkin mengalami kesalahan seperti:

  • "Tidak dapat menemukan versi yang memenuhi persyaratan."
  • "Tidak ditemukan distribusi yang cocok." Kemudian Anda harus menentukan versi paket yang disesuaikan dengan Python 3.8, dan menjalankan alur Anda lagi.

Menyebarkan titik akhir real time dari masalah alur inferensi real-time

Jika Anda langsung menyebarkan titik akhir real-time dari alur inferensi real-time yang diselesaikan sebelumnya, itu mungkin mengalami kesalahan.

Rekomendasi: kloning alur inferensi dan kirimkan lagi, lalu sebarkan ke titik akhir real time.

Langkah berikutnya