تكامل DataGrip مع قاروسات البيانات Azure

DataGrip هو بيئة تطوير متكاملة (IDE) لمطوري قاعدة البيانات التي توفر وحدة تحكم الاستعلام ، والملاحة المخطط ، وشرح الخطط ، والانتهاء من التعليمات البرمجية الذكية ، وتحليل في الوقت الحقيقي والإصلاحات السريعة ، وإعادة بناء التعليمات البرمجية ، والتكامل التحكم في الإصدار ، وغيرها من الميزات.

توضح هذه المقالة كيفية استخدام جهاز التطوير المحلي لتثبيت وتكوين واستخدام DataGrip للعمل مع قواعد البيانات في Azure Databricks.

ملاحظة

تم اختبار هذه المقالة مع macOS و Databricks JDBC Driver الإصدار 2.6.17 و DataGrip الإصدار 2021.1.

المتطلبات

قبل تثبيت DataGrip، يجب أن يلبي جهاز التطوير المحلي المتطلبات التالية:

الخطوة 1: تثبيت DataGrip

تحميل وتثبيت DataGrip.

  • لينكس: تحميل الملف، استخراج محتوياته، ومن ثم اتبع الإرشادات الواردة في Install-Linux-tar.txt الملف.
  • macOS: تحميل وتشغيل الملف.
  • Windows: تحميل وتشغيل الملف.

لمزيد من المعلومات، راجع تثبيت DataGrip على موقع DataGrip.

الخطوة 2: تكوين برنامج تشغيل JDBC Databricks ل DataGrip

إعداد DataGrip مع معلومات حول برنامج تشغيل JDBC Databricks التي قمت بتحميلها في وقت سابق.

  1. بدء تشغيل DataGrip.
  2. انقر فوق مصادر بيانات الملف.
  3. في مربع الحوار مصادر البيانات وبرامج التشغيل انقر فوق علامة التبويب برامج التشغيل.
  4. انقر فوق + الزر (+) لإضافة برنامج تشغيل.
  5. للاسم، أدخل .
  6. في علامة التبويب عام، في قائمة ملفات برنامج التشغيل، انقر فوق الزر (إضافة).
  7. انقر فوق JARs مخصص.
  8. استعرض وحدد SparkJDBC42.jar الملف الذي قمت باستخراجه سابقا، ثم انقر فوق SparkJDBC42.jar.
  9. للفئة، حدد com.simba.spark.jdbc.Driver.
  10. انقر فوق موافق.

الخطوة 3: الاتصال DataGrip إلى قواعد بيانات Azure Databricks

استخدم DataGrip للاتصال بالكتلة أو نقطة النهاية SQL التي تريد استخدامها للوصول إلى قواعد البيانات في مساحة عمل Azure Databricks.

  1. في DataGrip، انقر فوق مصادر بيانات الملف.

  2. في علامة التبويب مصادر البيانات، انقر فوق الزر (إضافة).

  3. حدد برنامج تشغيل Databricks التي قمت بإضافتها في الخطوة السابقة.

  4. في علامة التبويب عام، ل URL، أدخل قيمة حقل عنوان URL ل JDBC لمورد Azure Databricks كما يلي:

    نظام المجموعة

    1. البحث عن قيمة حقل URL JDBC على علامة التبويب JDBC/ODBC ضمن منطقة خيارات متقدمة الكتلة الخاصة بك. يجب أن يبدو عنوان URL ل JDBC مشابها لهذا العنوان:

      jdbc:spark://adb-1234567890123456.7.azuredatabricks.net:443/default;transportMode=http;ssl=1;httpPath=sql/protocolv1/o/1234567890123456/1234-567890-reef123;AuthMech=3;UID=token;PWD=<personal-access-token>
      
    2. استبدل <personal-access-token><personal-access-token> الخاص بك لمساحة عمل Azure Databricks.

      تلميح

      إذا كنت لا تريد تخزين رمز الوصول الشخصي الخاص بك على جهاز التطوير المحلي، حذف UID=token;PWD=<personal-access-token> من عنوان URL JDBC، وفي القائمة UID=token;PWD=<personal-access-token> اختر أبدا. ستتم مطالبتك للمستخدم () وكلمة المرور (رمز الوصول الشخصي) في كل مرة تحاول فيها الاتصال.

    3. للاسم، أدخل كتلة مجمعات البيانات.

    لمزيد من المعلومات، راجع مصادر البيانات وبرامج التشغيل الحوار على موقع DataGrip.

    نقطة نهاية SQL

    1. ابحث عن قيمة حقل عنوان URL ل JDBC في علامة التبويب تفاصيل الاتصال لنقطة النهاية SQL. يجب أن يبدو عنوان URL ل JDBC مشابها لهذا العنوان:

      jdbc:spark://adb-1234567890123456.7.azuredatabricks.net:443/default;transportMode=http;ssl=1;AuthMech=3;httpPath=/sql/1.0/endpoints/a123456bcde7f890;
      
    2. للمستخدم ، أدخل .

    3. لكلمة المرور، أدخل رمز الوصول الشخصيالخاص بك.

      تلميح

      إذا كنت لا تريد تخزين رمز الوصول الشخصي الخاص بك على جهاز التطوير المحلي، اترك المستخدموكلمة المرور فارغين، وفي القائمة حفظ، حدد أبدا. ستتم مطالبتك للمستخدم (الكلمة) وكلمة المرور (رمز الوصول الشخصي) في كل مرة تحاول فيها الاتصال.

    4. بالنسبة للاسم، أدخل ستريك البيانات SQL نقطة النهاية.

    لمزيد من المعلومات، راجع مصادر البيانات وبرامج التشغيل الحوار على موقع DataGrip.

  5. انقر فوق اختبار الاتصال.

    تلميح

    يجب أن تبدأ المورد الخاص بك قبل اختبار الاتصال. وإلا قد يستغرق الاختبار عدة دقائق لإكمال أثناء بدء تشغيل المورد.

  6. إذا نجح الاتصال، في علامة التبويب مخططات، حدد المربعات للمخططات التي تريد الوصول إليها، على سبيل المثال الافتراضي.

  7. انقر فوق موافق.

كرر الإرشادات في هذه الخطوة لكل مورد تريد DataGrip الوصول إليه.

الخطوة 4: استخدام DataGrip لاستعراض الجداول

استخدم DataGrip للوصول إلى الجداول في مساحة عمل Azure Databricks.

  1. في DataGrip، في إطار قاعدة البيانات، قم بتوسيع عقدة المورد، قم بتوسيع المخطط الذي تريد استعراضه، ثم قم بتوسيع الجداول.
  2. انقر نقرا مزدوجا فوق جدول. يتم عرض المجموعة الأولى من الصفوف من الجدول.

كرر الإرشادات الموجودة في هذه الخطوة للوصول إلى جداول إضافية.

للوصول إلى الجداول في المخططات الأخرى، في شريط أدوات إطار قاعدة البيانات، انقر فوق رمز خصائص مصدر البيانات. في مربع الحوار مصادر البيانات وبرامج التشغيل، في علامة التبويب مخططات، حدد المربع لكل مخطط إضافي تريد الوصول إليه، ثم انقر فوق موافق.

الخطوة 5: استخدام DataGrip لتشغيل عبارات SQL

استخدم DataGrip لتحميل جدول العينة diamonds من مجموعات البيانات Azure diamonds في default قاعدة البيانات في مساحة العمل الخاصة بك ثم الاستعلام الجدول. لمزيد من المعلومات، راجع إنشاء جدول في _. إذا لم تكن تريد تحميل جدول عينة، انتقل إلى الخطوات التالية.

  1. في DataGrip، في إطار قاعدة البيانات، مع توسيع المخطط الافتراضي، انقر فوق ملف ملف جديد SQL ملف.

  2. أدخل اسما للملف، على سبيل create_diamonds المثال.

  3. في علامة التبويب ملف، أدخل هذه العبارات SQL، الذي يحذف جدولا اسمه diamonds إذا كان موجودا، ثم ينشئ جدولا اسمه diamonds استنادا إلى محتويات ملف CSV ضمن نقطة تحميل نظام الملفات Databricks المحدد (DBFS):

    DROP TABLE IF EXISTS diamonds;
    
    CREATE TABLE diamonds USING CSV OPTIONS (path "/databricks-datasets/Rdatasets/data-001/csv/ggplot2/diamonds.csv", header "true");
    
  4. حدد DROP TABLE العبارة.

  5. على شريط أدوات علامة التبويب ملف انقر فوق رمز تنفيذ.

  6. حدد جدول إسقاط إذا كان موجودا الماس؛ إنشاء ديامون الجدول. .. من القائمة المنسدلة.

    تلميح

    لتغيير ما يحدث عند النقر فوق رمز التنفيذ، حدد تخصيص في القائمة المنسدلة.

  7. في إطار قاعدة البيانات انقر نقرا مزدوجا فوق الجدول لمشاهدة البيانات الخاصة به. إذا diamonds لم يتم عرض الجدول، انقر فوق الزر diamonds في شريط أدوات الإطار.

لحذف diamonds الجدول:

  1. في DataGrip، في شريط أدوات إطار قاعدة البيانات، انقر فوق الزر الانتقال إلى وحدة تحكم الاستعلام.

  2. حدد وحدة التحكم (افتراضي).

  3. في علامة التبويب وحدة التحكم، أدخل هذه العبارة SQL:

    DROP TABLE diamonds;
    
  4. حدد DROP TABLE العبارة.

  5. على شريط أدوات علامة التبويب وحدة التحكم، انقر فوق رمز التنفيذ. diamondsيختفي الجدول من قائمة الجداول. إذا diamonds لم يختفي الجدول انقر فوق الزر diamonds في شريط أدوات إطار قاعدة البيانات.

الخطوات التالية

الموارد الإضافية