Apa itu Azure Data Catalog?

Penting

Azure Data Catalog dihentikan pada 15 Mei 2024.

Akun Azure Data Catalog baru tidak dapat lagi dibuat.

Untuk fitur katalog data, silakan gunakan layanan Microsoft Purview , yang menawarkan tata kelola data terpadu untuk seluruh data estate Anda.

Jika Anda sudah menggunakan Azure Data Catalog, Anda harus membuat rencana migrasi agar organisasi Anda pindah ke Microsoft Purview sebelum 15 Mei 2024.

Azure Data Catalog adalah layanan cloud terkelola sepenuhnya yang memungkinkan pengguna menemukan sumber data yang mereka butuhkan dan memahami sumber data yang ditemukan. Pada saat yang sama, Data Catalog membantu organisasi mendapatkan nilai lebih dari investasi yang ada.

Dengan Data Catalog, setiap pengguna (analis, ilmuwan data, atau pengembang) dapat menemukan, memahami, dan menggunakan sumber data di lanskap data mereka. Data Catalog mencakup model metadata dan anotasi crowdsourcing, sehingga semua orang dapat berkontribusi untuk membuat data dapat ditemukan dan digunakan. Ini adalah satu tempat terpusat bagi semua pengguna organisasi untuk menyumbangkan pengetahuan mereka dan membangun komunitas dan budaya data.

Tantangan penemuan untuk pelanggan data

Secara tradisional, menemukan sumber data perusahaan telah menjadi proses organik berdasarkan pengetahuan suku. Bagi perusahaan yang ingin mendapatkan nilai maksimal dari aset informasi mereka, pendekatan ini menghadirkan banyak tantangan:

  • Pengguna mungkin tidak tahu bahwa sumber data keluar kecuali mereka bersentuhan dengannya sebagai bagian dari proses lain. Tidak ada lokasi pusat tempat sumber data didaftarkan.
  • Kecuali pengguna mengetahui lokasi sumber data, mereka tidak dapat terhubung ke data dengan menggunakan aplikasi klien. Pengalaman konsumsi data mengharuskan pengguna untuk mengetahui string atau jalur koneksi.
  • Kecuali pengguna mengetahui lokasi dokumentasi sumber data, mereka tidak dapat memahami penggunaan data yang dimaksudkan. Sumber data dan dokumentasi mungkin tinggal di berbagai tempat dan dikonsumsi melalui berbagai pengalaman.
  • Jika pengguna memiliki pertanyaan tentang aset informasi, mereka harus menemukan ahli atau tim yang bertanggung jawab atas data dan melibatkan mereka secara offline. Tidak ada hubungan eksplisit antara data dan para ahli yang memiliki perspektif tentang penggunaannya.
  • Kecuali pengguna memahami proses untuk meminta akses ke sumber data, menemukan sumber data dan dokumentasinya masih tidak membantu mereka mengakses data.

Tantangan penemuan bagi pembuat data

Meskipun konsumen data menghadapi tantangan yang disebutkan sebelumnya, pengguna yang bertanggung jawab untuk memproduksi dan memelihara aset informasi menghadapi tantangan mereka sendiri:

  • Menganotasi sumber data dengan metadata deskriptif seringkali merupakan upaya yang sia-sia. Aplikasi klien biasanya mengabaikan deskripsi yang disimpan dalam sumber data.
  • Membuat dokumentasi untuk sumber data seringkali merupakan upaya yang sia-sia. Menjaga dokumentasi tetap sinkron dengan sumber data adalah tanggung jawab yang berkelanjutan. Pengguna mungkin tidak memiliki kepercayaan dalam dokumentasi yang dianggap kedaluarsa.
  • Membuat dan memelihara dokumentasi untuk sumber data adalah kompleks dan memakan waktu. Membuat dokumentasi yang tersedia untuk semua orang yang menggunakan sumber data bisa lebih dari itu.
  • Membatasi akses ke sumber data dan memastikan bahwa konsumen data mengetahui cara meminta akses adalah tantangan yang sedang berlangsung.

Ketika tantangan tersebut digabungkan, mereka menghadirkan hambatan yang signifikan bagi perusahaan yang ingin mendorong dan mempromosikan penggunaan dan pemahaman data perusahaan.

Azure Data Catalog bisa membantu

Data Catalog dirancang untuk mengatasi masalah ini dan untuk membantu perusahaan mendapatkan nilai maksimal dari aset informasi yang ada. Data Catalog membuat sumber data dengan mudah dapat ditemukan dan dimengerti oleh pengguna yang mengelola data.

Data Catalog menyediakan layanan berbasis cloud tempat sumber data dapat didaftarkan. Data tetap berada di lokasi yang sudah ada, tetapi salinan metadatanya ditambahkan ke Data Catalog, bersama dengan referensi ke lokasi sumber data. Metadata juga diindeks untuk membuat setiap sumber data mudah ditemukan melalui pencarian dan dapat dimengerti oleh pengguna yang menemukannya.

Setelah sumber data tekah terdaftar, metadatanya kemudian dapat diperkaya. Metadata dapat ditambahkan baik oleh pengguna yang mendaftarkannya atau oleh pengguna lain di perusahaan. Setiap pengguna dapat menganotasi sumber data dengan memberikan deskripsi, tag, atau metadata lainnya, seperti dokumentasi dan proses untuk meminta akses sumber data. Metadata deskriptif ini melengkapi metadata struktural, seperti nama kolom dan jenis data, yang terdaftar dari sumber data.

Menemukan dan memahami sumber data dan penggunaannya adalah tujuan utama mendaftarkan sumber data. Pengguna perusahaan mungkin memerlukan data untuk inteligensi bisnis, pengembangan aplikasi, ilmu data, atau tugas lain yang membutuhkan data yang tepat. Mereka dapat menggunakan pengalaman penemuan Data Catalog untuk dengan cepat menemukan data yang sesuai dengan kebutuhan mereka, memahami data untuk mengevaluasi keseringannya untuk tujuan tersebut, dan mengonsumsi data dengan membuka sumber data di alat pilihan mereka.

Pada saat yang sama, pengguna dapat berkontribusi ke katalog dengan menandai, mendokumentasikan, dan membuat anotasi sumber data yang telah didaftarkan. Mereka juga dapat mendaftarkan sumber data baru, yang kemudian dapat ditemukan, dipahami, dan dikonsumsi oleh komunitas pengguna katalog.

Kapabilitas Data Catalog

Pelajari selengkapnya tentang Data Catalog

Untuk mempelajari selengkapnya tentang kapabilitas Data Catalog, lihat:

Langkah berikutnya