Ringkasan

Selesai

Dalam modul ini, Anda belajar cara:

  • Membuat buku catatan di Azure Databricks
  • Mengimpor data ke dalam buku catatan menggunakan curl
  • Gunakan Panda untuk membersihkan dan menyiapkan data
  • Gunakan scikit-learn untuk membangun model pembelajaran mesin
  • Gunakan Matplotlib untuk memvisualisasikan hasilnya

Panda, scikit-learn, dan Matplotlib adalah salah satu pustaka Python paling populer di planet ini. Dengannya, Anda dapat menyiapkan data untuk digunakan dalam pembelajaran mesin, membangun model mesin pembelajaran yang canggih dari data, dan bagan outputnya. Notebook Jupyter menyediakan lingkungan siap pakai untuk menggunakan pustaka ini, dan Notebooks memberi Anda akses mudah ke notebook Jupyter tanpa mengharuskan Anda memasang perangkat lunak apa pun atau menyiapkan lingkungan Jupyter di server.

Uji pengetahuan Anda

1.

Metode apa yang digunakan dalam Panda untuk mengimpor file CSV? Asumsikan panda dimuat sebagai import pandas as pd.

2.

Apa tujuan tahapan data sebelum melatih model pembelajaran mesin?

3.

Dengan asumsi Anda telah mengimpor Matplotlib sebagai 'plt', apa metode di Matplotlib yang akan Anda gunakan untuk memplot bagan batang?