فهم المعالجة التحليلية للمعاملات المختلطة مع Azure Synapse Link

مكتمل

تتيح المعالجة المختلطة للمعاملات والتحليل للشركات إجراء تحليلات عبر نظام قاعدة بيانات يُنظر إليه على أنه يوفر قدرات المعاملات دون التأثير على أداء النظام. وهذا يمكّن المؤسسات من استخدام قاعدة بيانات لتلبية كل من احتياجات المعاملات والاحتياجات التحليلية لدعم التحليل شبه الآني للبيانات التشغيلية لاتخاذ القرارات بشأن المعلومات التي يجري تحليلها.

على سبيل المثال، Tailwind Traders يستخدم Db Azure Cosmos لتخزين بيانات ملف تعريف المستخدم من موقع التجارة الإلكترونية الخاص بهم. يوفر مخزن المستندات NoSQL الذي توفره Azure Cosmos DB SQL API الإلمام بإدارة البيانات الخاصة بهم باستخدام بناء جملة SQL، في حين امتلاك القدرة على قراءة وكتابة الملفات على نطاق عالمي ضخم.

في أثناء شعور Tailwind Traders بالرضا عن قدرات وأداء Azure Cosmos DB، يراودهم القلق بشأن تكلفة تنفيذ كمية كبيرة من الاستعلامات التحليلية على أقسام متعددة (الاستعلامات عبر قسم) من مستودع البيانات الخاصة بهم. يريدون الوصول بكفاءة إلى كافة البيانات دون الحاجة إلى زيادة وحدات طلب Azure Cosmos DB. لقد نظروا في خيارات لاستخراج البيانات من حاوياتهم إلى مستودع البيانات في أثناء تغيرها، من خلال آلية تغذية التغيير في Azure Cosmos DB. المشكلة في هذا الأسلوب هو تبعيات الخدمة الإضافية والتعليمات البرمجية والصيانة طويلة الأجل التي يتطلبها الحل. يمكنهم إجراء عمليات تصدير مجمعة من مسار Synapse، ولكن بعد ذلك لن يكون لديهم أحدث المعلومات في أي لحظة.

قررت تمكين Azure Synapse Link لـ Cosmos DB وتمكين المخزن التحليلي في حاويات Azure Cosmos DB الخاصة بهم. مع هذا التكوين، يتم تخزين كافة بيانات المعاملات تلقائياً في مخزن أعمدة معزولة بالكامل. يتيح هذا المتجر تحليلات واسعة النطاق مقابل البيانات التشغيلية في Azure Cosmos DB، دون التأثير على أعباء العمل في المعاملات أو تكبد تكاليف وحدة الموارد. ينشئ Azure Synapse Link لـ Cosmos DB تكاملاً محكمًا بين Azure Cosmos DB وAzure Synapse Analytics، ما يتيح لـTailwind Traders تشغيل تحليلات شبه آنية عبر بياناتهم التشغيلية مع عدم وجود ETL وعزلة الأداء الكامل عن أعباء معاملاتهم.

من خلال الجمع بين النطاق الموزع لمعالجة المعاملات في Cosmos DB مع مخزن التحليل المدمج وقوة الحوسبة لـAzure Synapse Analytics، يتيح Azure Synapse Link بنية المعالجة المختلطة للمعاملات والتحليل (HTAP) لتحسين عمليات الأعمال الخاصة بـTailwind Trader. يلغي هذا التكامل عمليات ETL، ما يمكّن محللي الأعمال ومهندسي البيانات وعلماء البيانات من الخدمة الذاتية وتشغيل المعلومات المهنية شبه الآنية والتحليلات ومسارات التعلم الآلي في الوقت الفعلي عبر البيانات التشغيلية.

قبل أن نتمكن من إنشاء حاوية Azure Cosmos DB مع مخزن تحليلي، يجب علينا أولاً تمكين Azure Synapse Link.

  1. انتقل إلى مدخل Azure (https://portal.azure.com) وحدد Azure Cosmos DB account.

    Navigate to Azure Cosmos DB

  2. حدد الميزات في القائمة اليسرى (1)، ثم حدد Azure Synapse Link (2).

    Enable Synapse Link

  3. حدد تمكين.

    Enable Synapse Link screen

إنشاء حاوية Azure Cosmos DB جديدة

لدى Tailwind Traders حاوية Azure Cosmos DB المسمى OnlineUserProfile01. نظرًا إلى أننا قمنا بتمكين ميزة Azure Synapse Link بعد إنشاء الحاوية بالفعل، فإنه لا يمكننا تمكين المخزن التحليلي على الحاوية. سنقوم بإنشاء حاوية جديدة تحتوي على نفس مفتاح القسم وتمكين المخزن التحليلي.

بعد إنشاء الحاوية، سنقوم بإنشاء مسار Synapse جديد لنسخ البيانات من الحاوية OnlineUserProfile01 إلى واحدة جديدة.

  1. حدد Data Explorer في القائمة اليسرى.

    Launch Data Explorer

  2. حدد حاوية جديدة.

    Select a container in Data Explorer

  3. بالنسبة إلى معرف قاعدة البيانات، حدد استخدام موجود، ثم حدد CustomerProfile (1). أدخل UserProfileHTAP لمعرف الحاوية (2)، ثم أدخل /userId لمفتاح القسم (3). بالنسبة إلى معدل النقل، حدد Autoscale (4)، ثم أدخل 4000 لقيمة الحد الأقصى ل RU/s (5). وأخيرا، قم بتعيين مخزن تحليلي إلى تشغيل (6)، ثم حدد موافق.

    Add a container

    لقد قمنا هنا بتعيين قيمة مفتاح القسم إلى userId، لأنه حقل نستخدمه غالباً في الاستعلامات ويحتوي على علاقة أساسية عالية نسبياً (مجموعة من القيم الفريدة) لأداء التقسيم الجيد. وضعنا معدل النقل على التحجيم التلقائي مع أقصى قيمة قدرها 4000 وحدة طلب. هذا يعني أنه سيكون للحاوية ما لا يقل عن 400 وحدة طلب مخصصة (10٪ من الحد الأقصى للرقم)، وسيتم توسيع النطاق لكي يصل إلى 4000 وحدة بحد أقصى عندما يكتشف محرك المقياس طلبًا كبيرًا بما يكفي يستدعي زيادة معدل النقل. وأخيرا، نقوم بتمكين المخزن التحليلي على الحاوية، ما يسمح لنا بالاستفادة الكاملة من بنية المعالجة التحليلية/العمليات المختلطة (HTAP) من داخل Synapse Analytics.

    دعونا نلقي نظرة سريعة على البيانات التي سنقوم بنسخها إلى الحاوية الجديدة.

  4. قم بتوسيع حاوية OnlineUserProfile01 أسفل قاعدة بيانات CustomerProfile ، ثم حدد Items (1). حدد أحد المستندات (2) واعرض محتوياته (3). يتم تخزين المستندات بتنسيق JSON.

    View container items

مع تمكين Azure Synapse Link، وبند المخزن التحليلي، فستكون حينها قادرًا على الاستعلام عن المخزن التحليلي مباشرة من Azure Synapse Analytics، أو إنشاء مسار لنسخ محتويات المخزن التحليلي