इसके माध्यम से साझा किया गया


कॉमन डेटा मॉडल तालिकाओं से कनेक्ट करें Azure Data Lake Storage

नोट

Azure Active Directory अब Microsoft Entra ID है. और अधिक जानें

कॉमन डेटा मॉडल तालिकाओं के साथ अपने खाते का उपयोग करके डेटा को Dynamics 365 Customer Insights - Data में डालें। Azure Data Lake Storage डेटा अंतर्ग्रहण पूर्ण अथवा वृद्धिशील हो सकता है।

पूर्वावश्यकताएँ

  • Azure Data Lake Storage खाते में पदानुक्रमित नामस्थान सक्षम होना चाहिए. डेटा को पदानुक्रमित फ़ोल्डर प्रारूप में संग्रहीत किया जाना चाहिए जो रूट फ़ोल्डर को परिभाषित करता है और जिसमें प्रत्येक तालिका के लिए सबफ़ोल्डर्स होते हैं। उप-फ़ोल्डर्स में पूर्ण डेटा या वृद्धिशील डेटा फ़ोल्डर्स हो सकते हैं।

  • किसी सेवा प्रिंसिपल के साथ प्रमाणीकरण करने के लिए, सुनिश्चित करें कि यह आपके टेनेंट में कॉन्फ़िगर किया गया है. Microsoft Entra अधिक जानकारी के लिए, देखें सेवा प्रिंसिपल वाले Azure Data Lake Storage खाते से कनेक्ट करें Microsoft Entra

  • जिस Azure Data Lake Storage से आप कनेक्ट करना और डेटा प्राप्त करना चाहते हैं, वह Dynamics 365 Customer Insights पर्यावरण के समान Azure क्षेत्र में होना चाहिए और सदस्यताएँ उसी टेनेंट में होनी चाहिए. एक अलग Azure क्षेत्र में एक Data Lake से एक सामान्य डेटा मॉडल फ़ोल्डर के लिए कनेक्शंस समर्थित नहीं हैं. परिवेश के Azure क्षेत्र को जानने के लिए, सेटिंग्स>सिस्टम>About in Customer Insights - Data पर जाएँ.

  • ऑनलाइन सेवाओं में संग्रहीत डेटा उस स्थान से भिन्न स्थान पर संग्रहीत किया जा सकता है जहां डेटा संसाधित या संग्रहीत किया जाता है। ऑनलाइन सेवाओं में संग्रहीत डेटा को आयात या उससे कनेक्ट करके, आप सहमत होते हैं कि डेटा स्थानांतरित किया जा सकता है। Microsoft ट्रस्ट सेंटर पर अधिक जानें.

  • स्टोरेज खाते तक पहुँचने के लिए सेवा प्रिंसिपल को निम्नलिखित भूमिकाओं में से एक में होना चाहिए. Customer Insights - Data अधिक जानकारी के लिए, देखें स्टोरेज खाते तक पहुँचने के लिए सेवा प्रिंसिपल को अनुमतियाँ प्रदान करें.

    • स्टोरेज ब्लॉब डेटा रीडर
    • स्टोरेज ब्लॉब डेटा स्वामी
    • स्टोरेज ब्लॉब डेटा योगदानकर्ता
  • Azure सदस्यता विकल्प का उपयोग करके अपने Azure संग्रहण से कनेक्ट करते समय, डेटा स्रोत कनेक्शन सेट करने वाले उपयोगकर्ता को संग्रहण खाते पर कम से कम Storage Blob Data सहयोगी अनुमतियों की आवश्यकता होती है.

  • Azure resource विकल्प का उपयोग करके अपने Azure संग्रहण से कनेक्ट करते समय, डेटा स्रोत कनेक्शन सेट करने वाले उपयोगकर्ता को संग्रहण खाते पर कम से कम Microsoft.Storage/storageAccounts/read कार्रवाई के लिए अनुमति की आवश्यकता होती है. एक Azure अंतर्निहित भूमिका जिसमें यह क्रिया शामिल है वह रीडर भूमिका है. ... केवल आवश्यक क्रिया तक पहुँच को सीमित करने के लिए, एक Azure कस्टम भूमिका बनाएँ जिसमें केवल यह क्रिया शामिल हो.

  • इष्टतम प्रदर्शन के लिए, विभाजन का आकार 1 जीबी या उससे कम होना चाहिए और फ़ोल्डर में विभाजन फ़ाइलों की संख्या 1000 से अधिक नहीं होनी चाहिए।

  • आपके डेटा लेक स्टोरेज में डेटा को आपके डेटा के भंडारण के लिए कॉमन डेटा मॉडल मानक का पालन करना चाहिए और डेटा फ़ाइलों (*.csv या *.parquet) की स्कीमा का प्रतिनिधित्व करने के लिए कॉमन डेटा मॉडल मैनिफ़ेस्ट होना चाहिए। मैनिफ़ेस्ट में तालिकाओं का विवरण जैसे तालिका स्तंभ और डेटा प्रकार, तथा डेटा फ़ाइल स्थान और फ़ाइल प्रकार प्रदान करना होगा। अधिक जानकारी के लिए, कॉमन डेटा मॉडल मैनिफ़ेस्ट देखें. यदि मैनिफ़ेस्ट मौजूद नहीं है, तो स्टोरेज ब्लॉब डेटा स्वामी या स्टोरेज ब्लॉब डेटा सहयोगी एक्सेस वाले व्यवस्थापक उपयोगकर्ता डेटा को अंतर्ग्रहण करते समय स्कीमा को परिभाषित कर सकते हैं।

    नोट

    यदि .parquet फ़ाइल में किसी भी फ़ील्ड का डेटा प्रकार Int96 है, तो डेटा तालिकाएँ पृष्ठ पर प्रदर्शित नहीं हो सकता है। हम मानक डेटा प्रकारों का उपयोग करने की अनुशंसा करते हैं, जैसे कि यूनिक्स टाइमस्टैम्प प्रारूप (जो 1 जनवरी, 1970 को मध्य रात्रि UTC से सेकंड की संख्या के रूप में समय को दर्शाता है)।

सीमाएँ

  • Customer Insights - Data 16 से अधिक परिशुद्धता वाले दशमलव प्रकार के स्तंभों का समर्थन नहीं करता है।

Azure Data Lake Storage से कनेक्ट करें

  1. डेटा>डेटा स्रोत पर जाएं.

  2. डेटा स्रोत जोड़ें चुनें.

  3. Azure Data Lake कॉमन डेटा मॉडल तालिकाएँ चुनें.

    सामान्य डेटा मॉडल तालिकाओं के साथ Azure Data Lake के लिए कनेक्शन विवरण दर्ज करने हेतु संवाद बॉक्स.

  4. एक डेटा स्रोत नाम और एक वैकल्पिक विवरण दर्ज करें. नाम को डाउनस्ट्रीम प्रक्रियाओं में संदर्भित किया जाता है और डेटा स्रोत बनाने के बाद इसे बदलना संभव नहीं है।

  5. अपने संग्रहण का उपयोग करके कनेक्ट करें के लिए निम्न विकल्पों में से कोई एक चुनें. अधिक जानकारी के लिए, देखें सेवा प्रिंसिपल वाले Azure Data Lake Storage खाते से कनेक्ट करें Microsoft Entra

    • Azure संसाधन: संसाधन ID दर्ज करें. (private-link.md)।
    • Azure सदस्यता: सदस्यताऔर उसके बाद संसाधन समूह और संग्रहण खाते का चयन करें .

    नोट

    डेटा स्रोत बनाने के लिए आपको कंटेनर में निम्न भूमिकाओं में से एक की आवश्यकता है:

    • स्टोरेज ब्लॉब डेटा रीडर स्टोरेज अकाउंट से पढ़ने और डेटा को इनगल करने के लिए Customer Insights - Data पर्याप्त है।
    • यदि आप मैनिफ़ेस्ट फ़ाइलों को सीधे संपादित Customer Insights - Data करना चाहते हैं तो संग्रहण ब्लॉब डेटा सहयोगी या स्वामी की आवश्यकता होती है।

    भंडारण खाते पर भूमिका होने से इसके सभी कंटेनरों पर समान भूमिका प्रदान की जाएगी।

  6. वैकल्पिक रूप से, यदि आप Azure निजी लिंक के माध्यम से किसी संग्रहण खाते से डेटा निगलना चाहते हैं, तो निजी लिंक सक्षम करें का चयन करें . अधिक जानकारी के लिए, निजी लिंक्स देखें.

  7. उस कंटेनर का नाम चुनें जिसमें डेटा आयात करने के लिए डेटा और स्कीमा (model.json या manifest.json फ़ाइल) है और अगला चुनें.

    नोट

    परिवेश में किसी अन्य डेटा स्रोत से संबद्ध कोई भी model.json या manifest.json फ़ाइल सूची में नहीं दिखाई देगी. हालांकि, एक ही model.json या manifest.json फ़ाइल को कई परिवेश में डेटा स्रोतों के लिए इस्तेमाल किया जा सकता है.

  8. कोई नई स्कीमा बनाने के लिए, एक नई स्कीमा फ़ाइल बनाएँ परजाएँ.

  9. किसी मौजूदा स्कीमा का उपयोग करने के लिए, उस फ़ोल्डर पर नेविगेट करें जिसमें model.json या manifest.cdm.json फ़ाइल है. आप फ़ाइल खोजने के लिए एक निर्देशिका के भीतर खोज कर सकते हैं।

  10. जेसन फ़ाइल का चयन करें और अगला चुनें। उपलब्ध तालिकाओं की एक सूची प्रदर्शित होती है।

    चयन करने के लिए तालिकाओं की सूची का संवाद बॉक्स

  11. उन तालिकाओं का चयन करें जिन्हें आप शामिल करना चाहते हैं.

    प्राथमिक कुंजी के लिए आवश्यक दिखा रहा संवाद बॉक्स

    टिप

    JSON संपादन इंटरफ़ेस में तालिका संपादित करने के लिए, तालिका का चयन करें और फिर स्कीमा फ़ाइल संपादित करें। बदलाव करें और सेव करें चुनें.

  12. चयनित तालिकाओं के लिए जिन्हें वृद्धिशील अंतर्ग्रहण की आवश्यकता होती है, वृद्धिशील ताज़ा करें के तहत आवश्यकप्रदर्शन। इनमें से प्रत्येक तालिका के लिए, Azure Data Lake डेटा स्रोतों के लिए वृद्धिशील ताज़ा कॉन्फ़िगर करें देखें.

  13. चयनित तालिकाओं के लिए जहां प्राथमिक कुंजी परिभाषित नहीं की गई है, प्राथमिक कुंजी के तहत आवश्यकप्रदर्शित होता है। इनमें से प्रत्येक तालिका के लिए:

    1. ज़रूरी चुनें . तालिका संपादित करें पैनल प्रदर्शित करता है.
    2. प्राथमिक कुंजी चुनें. प्राथमिक कुंजी तालिका के लिए एक अद्वितीय विशेषता है। एक मान्य प्राथमिक कुंजी होने के लिए, इसमें डुप्लिकेट मान, गुम हुए मान या शून्य मान शामिल नहीं होने चाहिए. स्ट्रिंग, पूर्णांक और GUID डेटा प्रकार विशेषताएँ प्राथमिक कुंजी के रूप में समर्थित हैं।
    3. वैकल्पिक रूप से, विभाजन पैटर्न बदलें।
    4. पैनल को सहेजने और बंद करने के लिए बंद करें चुनें
  14. प्रत्येक शामिल तालिका के लिए स्तंभों की संख्या का चयन करें. विशेषताएँ प्रबंधित करें पृष्ठ प्रदर्शित करता है.

    डेटा प्रोफाइलिंग का चयन करने के लिए संवाद बॉक्स.

    1. नए स्तंभ बनाएँ, संपादित करें या मौजूदा स्तंभ हटाएँ. आप नाम, डेटा स्वरूप बदल सकते हैं, या सिमेंटिक प्रकार जोड़ सकते हैं।
    2. विश्लेषण और अन्य क्षमताओं को सक्षम करने के लिए, संपूर्ण तालिका या विशिष्ट स्तंभों के लिए डेटा प्रोफाइलिंग का चयन करें. डिफ़ॉल्ट रूप से, डेटा प्रोफाइलिंग के लिए कोई तालिका सक्षम नहीं होती है.
    3. पूर्ण चयन करें.
  15. सहेजें चुनें. डेटा स्रोत पेज खुलता है जो ताज़ा करने स्थिति में नया डेटा स्रोत दिखाता है।

    टिप

    कार्यों और प्रक्रियाओं के लिए स्थितियाँ हैं। अधिकांश प्रक्रियाएं अन्य अपस्ट्रीम प्रक्रियाओं पर निर्भर करती हैं, जैसे कि डेटा स्रोत और डेटा प्रोफाइलिंग रीफ्रेश

    प्रगति विवरण फलक खोलने और कार्यों की प्रगति देखने के लिए स्थिति का चयन करें। कार्य रद्द करने के लिए, फलक के नीचे कार्य रद्द करें का चयन करें.

    प्रत्येक कार्य के अंतर्गत, आप अधिक प्रगति जानकारी के लिए विवरण देखें का चयन कर सकते हैं, जैसे कि प्रसंस्करण समय, अंतिम प्रसंस्करण तिथि, तथा कार्य या प्रक्रिया से संबंधित कोई भी लागू त्रुटियाँ और चेतावनियाँ। सिस्टम में अन्य प्रक्रियाओं को देखने के लिए पैनल के नीचे सिस्टम स्थिति देखें का चयन करें।

डेटा लोड होने में समय लग सकता है। एक सफल ताज़ा करने के बाद, तालिकाएँ पृष्ठ से अंतर्ग्रहण किए गए डेटा की समीक्षा की जा सकती है

एक नई स्कीमा फ़ाइल बनाएँ

  1. स्कीमा फ़ाइल बनाएँ का चयन करें.

  2. फ़ाइल के लिए एक नाम डालें और सहेजें चुनें.

  3. नई तालिका चुनें. नया तालिका पैनल प्रदर्शित करता है।

  4. तालिका नाम दर्ज करें और डेटा फ़ाइल स्थान चुनें.

    • एकाधिक .csv या .parquet फ़ाइलें: रूट फ़ोल्डर में ब्राउज़ करें, पैटर्न प्रकार का चयन करें और व्यंजक दर्ज करें।
    • एकल .csv या .parquet फ़ाइलें: .csv या .parquet फ़ाइल पर ब्राउज़ करें और उसे चुनें.

    हाइलाइट की गई डेटा फ़ाइलों के स्थान के साथ एक नई तालिका बनाने के लिए संवाद बॉक्स.

  5. सहेजें चुनें.

    विशेषताओं को परिभाषित या स्वतः उत्पन्न करने के लिए संवाद बॉक्स।

  6. विशेषताएँ मैन्युअल रूप से जोड़ने के लिए विशेषताएँ निर्धारित करें का चयन करें , या उन्हें स्वतः जनरेट करें का चयन करें. विशेषताओं को परिभाषित करने के लिए, एक नाम दर्ज करें, डेटा प्रारूप और वैकल्पिक सिमेंटिक प्रकार का चयन करें। ऑटो-जेनरेट की गई विशेषताओं के लिए:

    1. विशेषताएं अपने आप जनरेट होने के बाद, विशेषताओं की समीक्षा करें चुनें . विशेषताएँ प्रबंधित करें पृष्ठ प्रदर्शित करता है.

    2. सुनिश्चित करें कि प्रत्येक विशेषता के लिए डेटा प्रारूप सही है।

    3. विश्लेषण और अन्य क्षमताओं को सक्षम करने के लिए, संपूर्ण तालिका या विशिष्ट स्तंभों के लिए डेटा प्रोफाइलिंग का चयन करें. डिफ़ॉल्ट रूप से, डेटा प्रोफाइलिंग के लिए कोई तालिका सक्षम नहीं होती है.

      डेटा प्रोफाइलिंग का चयन करने के लिए संवाद बॉक्स.

    4. पूर्ण चयन करें. तालिकाओं का चयन करें पृष्ठ प्रदर्शित होता है.

  7. यदि लागू हो, तो तालिकाएँ और स्तंभ जोड़ना जारी रखें.

  8. सभी तालिकाएँ जोड़ दिए जाने के बाद, डेटा स्रोत अंतर्ग्रहण में तालिकाएँ शामिल करें का चयन करें .

    प्राथमिक कुंजी के लिए आवश्यक दिखा रहा संवाद बॉक्स

  9. चयनित तालिकाओं के लिए जिन्हें वृद्धिशील अंतर्ग्रहण की आवश्यकता होती है, वृद्धिशील ताज़ा करें के तहत आवश्यकप्रदर्शन। इनमें से प्रत्येक तालिका के लिए, Azure Data Lake डेटा स्रोतों के लिए वृद्धिशील ताज़ा कॉन्फ़िगर करें देखें.

  10. चयनित तालिकाओं के लिए जहां प्राथमिक कुंजी परिभाषित नहीं की गई है, प्राथमिक कुंजी के तहत आवश्यकप्रदर्शित होता है। इनमें से प्रत्येक तालिका के लिए:

    1. ज़रूरी चुनें . तालिका संपादित करें पैनल प्रदर्शित करता है.
    2. प्राथमिक कुंजी चुनें. प्राथमिक कुंजी तालिका के लिए एक अद्वितीय विशेषता है। एक मान्य प्राथमिक कुंजी होने के लिए, इसमें डुप्लिकेट मान, गुम हुए मान या शून्य मान शामिल नहीं होने चाहिए. स्ट्रिंग, पूर्णांक और GUID डेटा प्रकार विशेषताएँ प्राथमिक कुंजी के रूप में समर्थित हैं।
    3. वैकल्पिक रूप से, विभाजन पैटर्न बदलें।
    4. पैनल को सहेजने और बंद करने के लिए बंद करें चुनें
  11. सहेजें चुनें. डेटा स्रोत पेज खुलता है जो ताज़ा करने स्थिति में नया डेटा स्रोत दिखाता है।

    टिप

    कार्यों और प्रक्रियाओं के लिए स्थितियाँ हैं। अधिकांश प्रक्रियाएं अन्य अपस्ट्रीम प्रक्रियाओं पर निर्भर करती हैं, जैसे कि डेटा स्रोत और डेटा प्रोफाइलिंग रीफ्रेश

    प्रगति विवरण फलक खोलने और कार्यों की प्रगति देखने के लिए स्थिति का चयन करें। कार्य रद्द करने के लिए, फलक के नीचे कार्य रद्द करें का चयन करें.

    प्रत्येक कार्य के अंतर्गत, आप अधिक प्रगति जानकारी के लिए विवरण देखें का चयन कर सकते हैं, जैसे कि प्रसंस्करण समय, अंतिम प्रसंस्करण तिथि, तथा कार्य या प्रक्रिया से संबंधित कोई भी लागू त्रुटियाँ और चेतावनियाँ। सिस्टम में अन्य प्रक्रियाओं को देखने के लिए पैनल के नीचे सिस्टम स्थिति देखें का चयन करें।

डेटा लोड होने में समय लग सकता है। सफल ताज़ा करने के बाद, डेटा तालिकाएँ पृष्ठ से>अंतर्ग्रहण किए गए डेटा की समीक्षा की जा सकती है .

Azure Data Lake Storage डेटा स्रोत संपादित करें

आप विकल्प का उपयोग करके संग्रहण खाते से कनेक्ट करें को अपडेट कर सकते हैं। अधिक जानकारी के लिए, देखें सेवा प्रिंसिपल वाले Azure Data Lake Storage खाते से कनेक्ट करें Microsoft Entra । अपने संग्रहण खाते से किसी भिन्न कंटेनर से कनेक्ट करने या खाता नाम बदलने के लिए, एक नया डेटा स्रोत कनेक्शन बनाएँ.

  1. डेटा>डेटा स्रोत पर जाएं. आप जिस डेटा स्रोत का अपडेट करना चाहते हैं, उसके आगे, बदलाव करें चुनें.

  2. निम्न में से कोई भी जानकारी परिवर्तित करें:

    • विवरण

    • अपने संग्रहण का उपयोग और कनेक्शन जानकारी कनेक्ट करें । कनेक्शन अपडेट करते समय आप कंटेनर जानकारी नहीं बदल सकते.

      नोट

      निम्न भूमिकाओं में से एक संग्रह खाते या कंटेनर को असाइन किया जाना चाहिए:

      • स्टोरेज ब्लॉब डेटा रीडर
      • स्टोरेज ब्लॉब डेटा स्वामी
      • स्टोरेज ब्लॉब डेटा योगदानकर्ता
    • Azure के लिए प्रबंधित पहचान का उपयोग अपने Azure Data Lake Storage ???

    • यदि आप Azure निजी लिंक के माध्यम से संग्रहण खाते से डेटा निगलना चाहते हैं, तो निजी लिंक सक्षम करें. अधिक जानकारी के लिए, निजी लिंक्स देखें.

  3. अगला चुनें.

  4. निम्न में से कोई भी परिवर्तित करें :

    • कंटेनर से तालिकाओं के एक अलग सेट के साथ एक अलग model.json या manifest.json फ़ाइल पर नेविगेट करें।

    • निगलने के लिए अतिरिक्त तालिकाएँ जोड़ने के लिए, नई तालिका चुनें.

    • यदि कोई निर्भरताएँ नहीं हैं, तो पहले से चयनित तालिकाओं को निकालने के लिए, तालिका का चयन करें और हटाएँ.

      महत्त्वपूर्ण

      यदि मौजूदा model.json या manifest.json फ़ाइल और तालिकाओं के सेट पर निर्भरताएँ हैं, तो आपको एक त्रुटि संदेश दिखाई देगा और आप किसी भिन्न model.json या manifest.json फ़ाइल का चयन नहीं कर सकते. model.json या manifest.json फ़ाइल को बदलने से पहले उन निर्भरताओं को हटा दें या model.json या manifest.json फ़ाइल वाला एक नया डेटा स्रोत बनाएं जिसे आप निर्भरता को हटाने से बचने के लिए उपयोग करना चाहते हैं.

    • डेटा फ़ाइल स्थान या प्राथमिक कुंजी परिवर्तित करने के लिए, संपादित करें का चयन करें .

    • वृद्धिशील अंतर्ग्रहण डेटा परिवर्तित करने के लिए, Azure Data Lake डेटा स्रोतों के लिए वृद्धिशील ताज़ा कॉन्फ़िगर करें देखें.

    • केवल .json फ़ाइल में तालिका नाम से मेल खाने के लिए तालिका नाम बदलें।

      नोट

      तालिका नाम को हमेशा model.json या manifest.json फ़ाइल में तालिका नाम के समान ही रखें। Customer Insights - Data प्रत्येक सिस्टम रीफ्रेश के दौरान model.json या manifest.json के साथ सभी तालिका नामों को मान्य करता है। यदि कोई तालिका नाम परिवर्तित होता है, तो कोई त्रुटि उत्पन्न होती है क्योंकि Customer Insights - Data .json फ़ाइल में नया तालिका नाम नहीं ढूँढ सकता. यदि अंतर्ग्रहण तालिका नाम गलती से बदल दिया गया था, तो .json फ़ाइल में नाम से मेल खाने के लिए तालिका नाम संपादित करें।

  5. स्तंभों को जोड़ने या परिवर्तित करने के लिए, या डेटा प्रोफाइलिंग सक्षम करने के लिए उनका चयन करें. फिर पूर्ण का चयन करें

  6. अपने परिवर्तन लागू करने और डेटा स्रोतपृष्ठ पर लौटने के लिए सहेजें का चयन करें .

    टिप

    कार्यों और प्रक्रियाओं के लिए स्थितियाँ हैं। अधिकांश प्रक्रियाएं अन्य अपस्ट्रीम प्रक्रियाओं पर निर्भर करती हैं, जैसे कि डेटा स्रोत और डेटा प्रोफाइलिंग रीफ्रेश

    प्रगति विवरण फलक खोलने और कार्यों की प्रगति देखने के लिए स्थिति का चयन करें। कार्य रद्द करने के लिए, फलक के नीचे कार्य रद्द करें का चयन करें.

    प्रत्येक कार्य के अंतर्गत, आप अधिक प्रगति जानकारी के लिए विवरण देखें का चयन कर सकते हैं, जैसे कि प्रसंस्करण समय, अंतिम प्रसंस्करण तिथि, तथा कार्य या प्रक्रिया से संबंधित कोई भी लागू त्रुटियाँ और चेतावनियाँ। सिस्टम में अन्य प्रक्रियाओं को देखने के लिए पैनल के नीचे सिस्टम स्थिति देखें का चयन करें।