العمل مع DataFrames في Azure Databricks

متوسط
مهندس بيانات
Databricks

تتم معالجة البيانات الخاصة بك في Azure Databricks عن طريق تعريف DataFrames لقراءة البيانات ومعالجتها. تعلم كيفية إجراء تحويلات البيانات في DataFrames وتنفيذ الإجراءات لعرض البيانات المحولة.

الأهداف التعليمية

خلال هذه الوحدة، سوف تتمكن مما يلي:

  • استخدام أسلوب count()‎ لحساب الصفوف في DataFrame
  • استخدام الدالة display()‎ لعرض DataFrame في دفتر الملاحظات
  • التخزين المؤقت لـ DataFrame لإجراء عمليات أسرع إذا كانت البيانات مطلوبة مرة ثانية
  • استخدام دالة limit لعرض مجموعة صغيرة من الصفوف من DataFrame أكبر
  • استخدام select()‎ لتحديد مجموعة فرعية من الأعمدة من DataFrame
  • استخدام دالتي distinct()‎ وdropDuplicates لإزالة البيانات المكررة
  • استخدام drop()‎ لإزالة الأعمدة من DataFrame

المتطلبات الأساسية

بلا