استخدام Azure Synapse Analytics مع التحليلات على نطاق السحابة

Azure Synapse Analytics هي خدمة التحليلات المقدمة والمتكاملة التي تسرع الوقت للحصول على نتيجة تحليلات عبر مستودعات البيانات وأنظمة البيانات الضخمة. يجمع Azure Synapse Analytics معا:

  • أفضل تقنيات SQL المستخدمة في تخزين بيانات المؤسسة.
  • تقنيات Spark المستخدمة للبيانات الضخمة.
  • البنية الأساسية لبرنامج ربط العمليات التجارية لتطبيق البيانات (محاذاة المصدر) واستخراج وتحويل وتحميل (ETL) أو استخراج وتحميل وتحويل (ELT).

Azure Synapse studio هو أداة في Azure Synapse توفر تجربة موحدة للإدارة والمراقبة والترميز والأمان. يحتوي Synapse studio على تكامل عميق مع خدمات Azure الأخرى مثل Power BI وAzure Cosmos DB والتعلم الآلي من Microsoft Azure.

ملاحظة

يهدف هذا القسم إلى وصف التكوينات الموصوفة الخاصة بالتحليات على نطاق السحابة. إنها مجاملة لوثائق Azure Synapse Analytics الرسمية.

نظرة عامة

أثناء الإعداد الأولي لمنطقة البيانات المنتقل إليها، يمكنك نشر مساحة عمل Azure Synapse Analytics واحدة لاستخدامها من قبل جميع المحللين وعلماء البيانات. يمكنك إنشاء المزيد من مساحات العمل لتكاملات بيانات أو منتجات بيانات معينة.

قد تحتاج إلى مساحات عمل Azure Synapse Analytics إضافية إذا كان منتج البيانات الخاص بك بحاجة إلى توفير الوصول إلى البيانات الموحدة مع أمان على مستوى الصف وعلى مستوى العمود. يمكنك توفير مساحات العمل هذه مع تجمعات Azure Synapse. قد تتطلب فرق منتجات البيانات مساحة عمل خاصة بها لإنشاء منتجات بيانات ومساحة عمل منفصلة مخصصة فقط لفرق المنتجات التي لديها وصول تطوير محدد النطاق.

إعداد Azure Synapse Analytics

الخطوة الأولى في نشر Azure Synapse Analytics هي إعداد مساحة عمل Azure Synapse المتصلة بحساب Azure Purview.

شبكة Azure Synapse Analytics

تنشئ منطقة البيانات المنتقل إليها مساحات عمل مع شبكة ظاهرية مدارة من Azure Synapse Analytics. يحدث الاتصال مع Azure Synapse من خلال نقاط النهاية الثلاث التي يعرضها: تجمع SQL وSQL عند الطلب ونقطة نهاية التطوير.

على مستوى الشبكة، تستخدم التحليلات على نطاق السحابة نقاط النهاية الخاصة المدارة من synapse. تضمن نقاط النهاية هذه نقل جميع نسبة استخدام الشبكة بين الشبكة الظاهرية لمنطقة البيانات المنتقل إليها ومساحات عمل Azure Synapse بالكامل عبر شبكة Microsoft الأساسية.

التحكم في الوصول إلى بيانات Azure Synapse

استخدم قوائم التحكم في الوصول مع مرور Azure Active Directory (Azure AD) في Azure Synapse Analytics لإدارة الوصول إلى الملفات في مستودع البيانات.

بالنسبة للبيانات التي تحتاج إلى تقييد الأعمدة والصفوف التي تم إرجاعها، نوصي بالأمان على مستوى الصف وعلى مستوى العمود لتقييد الوصول إلى البيانات على الجداول في تجمع Azure Synapse SQL المخصص أو بلا خادم. يتم تنفيذ الأمان على مستوى الصف والأمان على مستوى العمود على مستوى قاعدة البيانات بالإضافة إلى أدوار قاعدة البيانات.

على سبيل المثال، يضمن الأمان على مستوى الصف أن يرى المستخدمون في تطبيق بيانات معين (محاذاته المصدر) أو منتج البيانات بياناتهم الخاصة فقط. حتى إذا كان الجدول يحتوي على بيانات للمؤسسة بأكملها.

يمكنك دمج الأمان على مستوى الصف مع الأمان على مستوى العمود لتقييد الوصول إلى الأعمدة ذات البيانات الحساسة. بهذه الطريقة، يطبق كل من الأمان على مستوى الصف والأمان على مستوى العمود منطق تقييد الوصول في طبقة قاعدة البيانات بدلا من طبقة التطبيق. يتم تقييم الإذن في كل مرة تتم فيها محاولة الوصول إلى البيانات من أي مستوى.

ملاحظة

يدعم تجمع SQL بلا خادم Azure Synapse الأمان على مستوى العمود ولكنه يتطلب طرق عرض مخصصة كحل بديل للأمان على مستوى الصف.

لمزيد من المعلومات، راجع التحكم في الوصول إلى بيانات Azure Synapse Analytics.

التحكم في الوصول إلى بيانات Azure Synapse في Azure Data Lake

عند نشر مساحة عمل Azure Synapse Analytics، تحتاج إلى حساب Azure Data Lake Storage من الاشتراك أو باستخدام عنوان URL لحساب التخزين يدويا. يتم تعيين حساب التخزين المحدد كحساب أساسي لمساحة عمل Azure Synapse المنشورة لتخزين بياناته. يخزن Azure Synapse البيانات في حاوية تتضمن جداول Apache Spark وسجلات تطبيق Spark في مجلد يسمى /synapse/{workspaceName}. كما يحتوي على حاوية لإدارة أي مكتبات تختار تثبيتها.

تلميح

نوصي باستخدام حاوية مخصصة على طبقة التطوير أو حساب مستودع البيانات ثلاثة . يتم استخدام هذه الحاوية كمساحة تخزين أساسية لتخزين بيانات تعريف Spark.

راجع التحكم في الوصول إلى بيانات Azure Synapse Analytics للحصول على توصيات حول كيفية إعداد الوصول إلى البيانات.

الخطوات التالية