Ringkasan
Dalam modul ini, Anda belajar cara:
- Membuat buku catatan di Azure Databricks
- Mengimpor data ke dalam buku catatan menggunakan
curl
- Gunakan Panda untuk membersihkan dan menyiapkan data
- Gunakan scikit-learn untuk membangun model pembelajaran mesin
- Gunakan Matplotlib untuk memvisualisasikan hasilnya
Panda, scikit-learn, dan Matplotlib adalah salah satu pustaka Python paling populer di planet ini. Dengannya, Anda dapat menyiapkan data untuk digunakan dalam pembelajaran mesin, membangun model mesin pembelajaran yang canggih dari data, dan bagan outputnya. Notebook Jupyter menyediakan lingkungan siap pakai untuk menggunakan pustaka ini, dan Notebooks memberi Anda akses mudah ke notebook Jupyter tanpa mengharuskan Anda memasang perangkat lunak apa pun atau menyiapkan lingkungan Jupyter di server.