تقنيات Azure المصممة لعملية التعلم

مكتمل

في هذه الوحدة، ستتعلم كيفية تطبيق نتائج خطوة القياس في دورة حياة الابتكار. كما يمكنك التعرف على أهمية إضفاء الطابع الديمقراطي على البيانات.

تسهيل وصول الجميع إلى البيانات

كما تعلمت في الوحدات السابقة، يمكنك جمع البيانات من عملائك باستخدام مصادر متعددة. تتضمن هذه المصادر الاستطلاعات المصغرة، وبيانات الاستخدام المستمدة من Azure Application Insights، وعلامات الميزات التي يمكن للعملاء أن يقرروا بأنفسهم تمكينها أو تعطيلها. كلما زاد عدد البيانات لديك، كانت قراراتك أفضل، ولكنك تحتاج إلى طريقة للتعامل مع هذا التدفق المتزايد للبيانات.

لقد تحدث Satya Nadella في عام 2014 عن أهمية ثقافة البيانات في أي مؤسسة. قال إنه لا ينبغي اتخاذ القرارات بناءً على المشاعر أو الآراء الشخصية، ولكن باستخدام البيانات للتحقق من صحتها. وقال أيضاً إن البيانات يجب أن تكون متاحة لكل فرد يحتاج إليها، كما ينبغي تحويلها بسهولة إلى رؤى قابلة للتنفيذ لتيسير اتخاذ القرارات المستندة إلى البيانات.

ولا يمكن للمنظمة أن تتخذ قرارات واسعة النطاق بشأن البيانات إلا إذا استندت تلك القرارات إلى منصة بيانات صلبة يمكن الوصول إليها. ويشمل هذا الجهد أربعة مجالات:

  • جمع البيانات: الخطوة الأولى لاتخاذ القرارات المستندة إلى البيانات هي دائماً الحصول على البيانات. ويمكن أن يتخذ جمع البيانات أشكالاً متعددة: الترحيل من مستودعات البيانات الموجودة، أو إنشاء البيانات من مصادر مثل Azure Application Insights أو استيعاب البيانات من مصادر أخرى.
  • مشاركة البيانات: يجب أن تكون هذه البيانات المجمعة متاحة لكل شخص يحتاج إليها، وليس فقط لخبراء البيانات. كما ينبغي أن يكون جميع الأفراد في المؤسسة قادرين على استخدام البيانات لاتخاذ قراراتهم.
  • إضفاء الطابع المركزي على البيانات: يمكن أن تساعد الأنظمة الأساسية للبيانات المركزية في تيسير مشاركة البيانات وحوكمتها.
  • التحكم في البيانات: لا يعني مشاركة البيانات أن جميع البيانات يجب أن تكون متاحة للجميع. تأكد من أن أي بيانات حساسة يتم تأمينها، وتعقبها، وحوكمتها قبل مشاركتها.

النظام الأساسي لبيانات Azure

يغطي النظام الأساسي لـ Azure دورة حياة البيانات بأكملها، وهو أمر أساسي لصنع القرار المستند إلى البيانات وتيسر وصول الجميع إلى البيانات. من قواعد البيانات خفيفة الوزن -عند الطلب- إلى مستودعات البيانات الضخمة أو أنظمة NoSQL المرنة، يتيح لك النظام الأساسي لبيانات Microsoft Azure تغطية مجالات نشاط البيانات الأربعة.

تجميع البيانات

يتضمن النظام البنائي لبيانات Azure خدمات وأدوات لترحيل البيانات واستيعابها وتخزينها وتحليلها. تعرض القائمة التالية عددا قليلا فقط من الآليات التي يمكنك استخدامها لمعالجة البيانات وإتاحتها للمشاركة لاحقا لتسهيل اتخاذ القرارات المستندة إلى البيانات:

  • تحليلات البيانات: Azure Synapse Analytics هي خدمة تحليلات للمؤسسات التي تسرع من وقت التبصّر عبر مستودعات البيانات وأنظمة البيانات الضخمة. يجمع Azure Synapse Analytics بين أفضل ما يلي:
    • تقنيات SQL المستخدمة في تخزين بيانات المؤسسة.
    • تقنيات Spark المستخدمة للبيانات الضخمة.
    • البنية الأساسية لبرنامج ربط العمليات التجارية لتكامل البيانات وETL (استخراج وتحويل وتحميل) و ELT (استخراج وتحميل وتحويل).
    • التكامل العميق مع خدمات Microsoft الأخرى مثل Power BI وAzure Cosmos DB وAzure التعلم الآلي.
  • ترحيل البيانات: قد تكون البيانات مخزنة بالفعل في مصادر موجودة، لكن يجب ترحيلها إلى نظام أساسي حديث قبل تحويلها إلى رؤى قابلة للتنفيذ. تحتوي Azure Database Migration Service على أدوات تساعد في ترحيل البيانات من الأنظمة، مثل SQL Server، وPostgreSQL، وOracle، وMongoDB.
  • معالجة البيانات: تتضمن Azure خدمات لتحليل تدفقات البيانات وتحويلها باستخدام Azure Stream Analytics، وتشغيل عمليات ETL على نطاق واسع باستخدام Azure Data Factory.

مشاركة البيانات

Microsoft Power BI هو مجموعة من الأدوات التي تدمج البيانات القادمة من مصادر متباينة في مجموعة مرئيات متكاملة وتفاعلية. يمكن للمستخدمين التعمق في البيانات فقط من خلال تشغيل عناصر تحكم بديهية. تتوفر قوة الرؤى للجميع في المؤسسة، وليس لمحترفي البيانات فقط.

يمكن لمالكي المنطقة إنشاء تقارير ولوحات معلومات تحتوي على المعلومات ذات الصلة حول جوانب معينة من التطبيق. بعد تقديم وظيفة جديدة للتحقق من صحة فرضية، تتوفر البيانات بسهولة للتحقق من صحة الفرضية أو رفضها استناداً إلى الاستخدام الحقيقي للعملاء.

يمكن أن يساعد Microsoft Power BI في مشاركة البيانات من نظر متعددة. فيما يلي بعض الأمثلة:

  • مشاركة البيانات مع زملاء العمل والشركاء: تعمل لوحات معلومات Power BI على تبسيط استخدام البيانات. تسمح المرئيات للأشخاص الذين ليسوا خبراء بيانات بالتنقل التفصيلي في البيانات دون الحاجة إلى أن يكونوا على دراية بهيكلها الأساسي.
  • إنشاء رؤى البيانات بسرعة: يمكن أن ينشئ Power BI مرئيات لمجموعات البيانات تلقائياً باستخدام وظيفة Quick Insights. يمكنك إنشاء لوحات المعلومات بسرعة والعثور على ارتباطات البيانات التي قد لا تكون واضحة في البداية.
  • تضمين التقارير في موقع ويب أو مدخل: باستخدام Power BI، لا يمكنك فقط الوصول إلى المرئيات في مدخل Power BI الأصلي، ولكن يمكنك تضمين التقارير ولوحات المعلومات في تطبيقات الويب الأخرى أيضا. بهذه الطريقة، لا يحتاج المستخدمون إلى ترك مواقع الشركات المألوفة للعثور على البيانات التي يحتاجونها لعملية صنع القرار.

إضفاء الطابع المركزي على البيانات

وتتمثل المشكلة الرئيسية في إضفاء الطابع المركزي على البيانات في النطاق على مستويات مختلفة. في خطر الإفراط في التبسيط، يمكننا تقليله إلى البيانات الضخمة 3 V:

  • وحدة التخزين: Azure Data Lake Storage Gen2 يمثل النظام الأساسي لـ Azure الأكثر فعَّالية من حيث التكلفة والقابلية للتوسع لتخزين البيانات. وبناءً على قابلية التوسع الهائلة التي توفرها Azure Storage، تم تصميم Azure Data Lake Storage لخدمة بيتابايت متعددة من المعلومات مع الحفاظ على مئات الجيجابايت من معدل النقل.
  • التنوع: غالبا ما يشير هذا المصطلح إلى حقيقة أن البيانات غير منظمة دائما. قد تكون لديك بيانات شبه مهيكلة وحتى غير مهيكلة أيضاً. تلمع خدمة Azure Synapse في هذا المجال، إذ تجمع بين أفضل تقنيات SQL المُستخدمة في تخزين بيانات المؤسسات باستخدام Spark التي غالباً ما تُستخدَم للبيانات الضخمة.
  • السرعة: غالباً ما تكون المشكلة الموجودة في بنية البيانات القديمة هي الترابط بين سعة التخزين وسرعة التحليل ومعدلات الاستيعاب. في حلول بيانات Azure، يمكن للمؤسسة قياس أبعاد مختلفة للنظام الأساسي بشكل مستقل، من خلال فصلها. ويمكن استيعاب البيانات ومعالجتها ومشاركتها باستخدام خطوط أنابيب البيانات التي تستخدم خدمات بيانات Azure المطلوبة، كما يظهر في بنية ذكاء الأعمال المؤسسية.

حوكمة البيانات

وفي عالم اليوم، تمثل البيانات أصلاً مهماً ومسؤولية كبيرة. غالباً ما تتضمن البيانات المخزنة معلومات سرية يمكن أن تؤدي إلى أضرار مالية أو شخصية إذا تم تسريبها أو مشاركتها بشكل غير لائق. يعني تخزين البيانات ومعالجتها ضمنيا أن المؤسسة تقبل تلك المسؤولية. يمكن أن تفرض اللوائح القانونية عقوبات على المؤسسات التي تسيء التعامل مع البيانات الشخصية أو السرية.

ونتيجة لذلك، فإن حوكمة البيانات أمر بالغ الأهمية لأي مؤسسة تهدف إلى تسهيل وصول الجميع إلى البيانات. تتمثل الخطوة الأولى نحو حوكمة البيانات في تصنيف البيانات التي يلزم معالجتها بطرق محددة. على سبيل المثال، تستخدم Microsoft فئات البيانات هذه داخلياً لتصنيف البيانات:

  • غير متعلقة بالأعمال: بيانات من حياتك الشخصية لا ترتبط بـ Microsoft.
  • عامة متاحة للجمهور: بيانات الأعمال المتاحة بحرية والمعتمدة للاستخدام العام.
  • عامة غير متاحة للجمهور: بيانات الأعمال غير المخصصة للجمهور العام.
  • سرية: بيانات الأعمال التي يمكن أن تسبب ضرراً لـ Microsoft عند المشاركة الزائدة.
  • سرية للغاية: بيانات الأعمال التي قد تسبب ضرراً كبيراً لـ Microsoft عند المشاركة الزائدة.

تتمثل الخطوة التالية بعد تصنيف البيانات في ضمان حماية كل فئة بيانات من الوصول غير المصرح به. يدعم Azure هذه التقنيات التي تفرض السرية:

  • تشفير البيانات الثابتة: تُشفّر جميع بيانات Azure عند تخزينها في مراكز بيانات Microsoft. توفر بعض خدمات Azure ميزات تشفير محددة، مثل: transparent data encryption في Azure Synapse وAzure SQL Database.
  • تشفير البيانات أثناء الطيران: تقوم جميع خدمات بيانات Azure بتشفير البيانات باستخدام TLS/SSL قبل إرسالها عبر الشبكة. يمكن لبعض الخدمات، مثل Azure Storage أن تسمح اختيارياً بحركة المرور غير المشفرة. ينبغي للمؤسسات تعطيل أي اتصال غير مشفر لأي نوع من البيانات الحساسة.
  • التحكم في الوصول إلى البيانات: توفر Azure آليات مصادقة وتفويض متطورة للوصول إلى النظام الأساسي لـ Azure وللوصول إلى البيانات نفسها. إن Azure role-based access control وConditional Access وPrivileged Identity Management ثلاثة أمثلة على الخدمات الأساسية التي يمكن أن تساعد في ضمان وصول الأفراد المخوّل لهم فقط إلى المعلومات الحساسة.
  • تدقيق البيانات: تتطلب العديد من معايير التوافق التنظيمية أدلة على آليات حماية البيانات، من خلال توثيق من قام بأي عملية ووصل إلى البيانات. كما هو موضح في التدقيق لقاعدة بيانات Azure SQL وتحليلات Azure Synapse، فإن تدقيق البيانات في Azure يفكر في ثلاثة جوانب من التدقيق:
    • الاحتفاظ بسجل التدقيق للأحداث المحددة، إذ يمكنك تحديد فئات إجراءات البيانات التي سيتم تدقيقها.
    • الإبلاغ عن نشاط قاعدة البيانات، بشكل اختياري باستخدام التقارير ولوحات المعلومات التي تم تكوينها مسبقاً للبدء بسرعة.
    • تحليل التقارير، للكشف عن الأحداث المشكوك بأمرها، والنشاط غير العادي، والاتجاهات

عقلية النمو

قد تقدم مرحلة التعلم أحيانًا أخبارًا سيئة. قد يتبين خطأ الفرضيات التي كنت تعتقد بأنها صحيحة. يُعد الانفتاح على الأفكار البديلة أمراً أساسياً لسير عملية الابتكار بسلاسة. ربما كانت الفرضية بأكملها خاطئة، أو ربما كانت المشكلة هي الطريقة التي تم بها تطوير النموذج الأولي فقط.

وعلى أي حال، ينبغي دائما دعم الاستنتاجات بالبيانات. وينبغي للفريق أن ينتقل إلى صياغة الفرضية التالية، وربما نوع من المراجعة أو التكرار للفرضية الأولية.

قد لا تسمح لك البيانات الحالية بالاستنتاج بشكل لا لبس فيه ما إذا كانت الفرضية صحيحة أو خاطئة. في هذه الحالة، يجب تحسين مجموعة البيانات التي تساعد في عملية اتخاذ القرار. إما تقديم نقاط بيانات تتبع الاستخدام جديدة في التطبيق أو معرفة طرق جديدة للحصول على معلومات حول تجربة العميل.

إن عقلية النمو أمر أساسي في هذه المرحلة. فكر في الفرضيات التي ثبت خطؤها كليةً أو ثبت خطؤها جزئياً كفرص للتعلم. لا ينبغي للمؤسسات أن تضيع الوقت على الابتكار الذي لا يولد نتائج الأعمال المتوقعة.

أين ننظر بعد ذلك

نناقش أيضا العديد من المفاهيم في هذه الوحدة في وثائق Cloud Adoption Framework حول إضفاء الطابع الديمقراطي على البيانات.