Conectarea la date în Azure Data Lake Storage

Ingerați date în Dynamics 365 Customer Insights folosind dvs Azure Data Lake Storage cont Gen2. Asimilarea datelor poate fi completă sau incrementală.

Cerințe preliminare

  • Suporta ingestie de date Azure Data Lake Storage Gen2 exclusiv conturi. Nu puteți utiliza conturi Data Lake Storage Gen1 pentru a asimila date.

  • The Azure Data Lake Storage cont trebuie sa aiba spațiu de nume ierarhic activat. Datele trebuie să fie stocate într-un format de folder ierarhic care definește folderul rădăcină și are subfoldere pentru fiecare entitate. Subfolderele pot avea date complete sau foldere de date incrementale.

  • Pentru a vă autentifica cu o entitate principală de serviciu Azure, asigurați-vă că este configurat în entitatea găzduită. Pentru mai multe informații, vezi Conectați-vă la un Azure Data Lake Storage Cont Gen2 cu un principal de serviciu Azure.

  • The Azure Data Lake Storage de la care doriți să vă conectați și să ingerați date trebuie să fie în aceeași regiune Azure ca și Dynamics 365 Customer Insights mediu inconjurator. Conexiunile la un director Common Data Model dintr-un data lake dintr-o altă regiune Azure nu sunt acceptate. Pentru a cunoaște regiunea Azure a mediului, accesați Admin > Sistem > Despre în Customer Insights.

  • Datele stocate în serviciile online pot fi stocate într-o locație diferită de cea în care sunt procesate sau stocate datele Dynamics 365 Customer Insights.Prin importul sau conectarea la date stocate în serviciile online, sunteți de acord că datele pot fi transferate și stocate cu Dynamics 365 Customer Insights . Aflați mai multe la Centrul de încredere Microsoft.

  • Principalul serviciu Customer Insights trebuie să aibă unul dintre următoarele roluri pentru a accesa contul de stocare. Pentru mai multe informații, vezi Acordați permisiuni principalului serviciu pentru a accesa contul de stocare.

    • Cititor de date Blob de stocare
    • Proprietar de date Blob de stocare
    • Contribuitor de date blob de stocare
  • Datele din Data Lake Storage trebuie să urmeze standardul Common Data Model pentru stocarea datelor dvs. și să aibă manifestul comun al modelului de date pentru a reprezenta schema fișierelor de date (*.csv sau *.parquet). Manifestul trebuie să furnizeze detaliile entităților, cum ar fi coloanele de entități și tipurile de date, precum și locația și tipul fișierului de date. Pentru mai multe informații, vezi Manifestul Common Data Model. Dacă manifestul nu este prezent, utilizatorii administratori cu acces Proprietar de date blob stocare sau Contributor la date blob stocare pot defini schema atunci când ingerează datele.

Conectarea la Azure Data Lake Storage

  1. Accesați Date > Surse de date.

  2. Selectați Adăugați sursa de date.

  3. Selectați Stocare Azure Data Lake.

    Caseta de dialog pentru a introduce detaliile de conectare pentru Azure Data Lake.

  4. Introduceți a Nume pentru sursă de date și opțional Descriere. Numele identifică în mod unic sursă de date și este referit în procesele din aval și nu poate fi schimbat.

  5. Alegeți una dintre următoarele opțiuni pentru Conectați-vă spațiul de stocare folosind. Pentru mai multe informații, vezi Conectați Customer Insights la un Azure Data Lake Storage Cont Gen2 cu un principal de serviciu Azure.

    • Resursa Azure : Introduceți ID resursă . Opțional, dacă doriți să ingerați date dintr-un cont de stocare printr-o legătură privată Azure, selectați Activați legătura privată. Pentru mai multe informații, vezi Linkuri private.
    • Abonament Azure : Selectează Abonament iar apoi cel Grup de resurse și Cont de stocare. Opțional, dacă doriți să ingerați date dintr-un cont de stocare printr-o legătură privată Azure, selectați Activați legătura privată. Pentru mai multe informații, vezi Linkuri private.

    Notă

    Aveți nevoie de unul dintre următoarele roluri fie pentru container, fie pentru contul de stocare pentru a crea sursă de date:

    • Storage Blob Data Reader este suficient pentru a citi dintr-un cont de stocare și pentru a asimila datele în Customer Insights.
    • Este necesar să editați fișierele manifest direct în Customer Insights.
  6. Alegeți numele Container care conține datele și schema (fișierul model.json sau manifest.json) din care să importați date și selectați Următorul.

    Notă

    Orice fișier model.json sau manifest.json asociat cu o altă sursă de date din mediu nu va apărea în listă. Cu toate acestea, același fișier model.json sau manifest.json poate fi utilizat pentru surse de date în medii multiple.

  7. Pentru a crea o nouă schemă, accesați Creați un nou fișier de schemă.

  8. Pentru a utiliza o schemă existentă, navigați la folderul care conține fișierul model.json sau manifest.cdm.json. Puteți căuta într-un director pentru a găsi fișierul.

  9. Selectați fișierul json și selectați Următorul. Se afișează o listă de entități disponibile.

    Caseta de dialog cu o listă de entități de selectat

  10. Selectați entitățile pe care doriți să le includeți.

    Caseta de dialog care arată Necesar pentru cheia primară

    Sfat

    Pentru a edita o entitate într-o interfață de editare JSON, selectați entitatea și apoi Editați fișierul schema. Faceți modificări și selectați Salvați.

  11. Pentru entitățile selectate care necesită asimilare incrementală, Necesar afișează sub Reîmprospătare incrementală. Pentru fiecare dintre aceste entități, a se vedea Configurați o reîmprospătare incrementală pentru sursele de date Azure Data Lake.

  12. Pentru entitățile selectate pentru care nu a fost definită o cheie primară, Necesar afișează sub Cheia principala. Pentru fiecare dintre aceste entități:

    1. Selectați Necesar. The Editați entitate afișajele panoului.
    2. Alege Cheia principala. Cheia primară este un atribut unic pentru entitate. Pentru ca un atribut să fie o cheie primară validă, nu ar trebui să includă valori duplicate, valori lipsă sau valori nule. Atributele tipului de date șir, întreg și GUID sunt acceptate ca chei primare.
    3. Opțional, modificați modelul de partiție.
    4. Selectați Închide pentru a salva și a închide panoul.
  13. Selectați numărul de Atribute pentru fiecare entitate inclusă. The Gestionați atributele afișează pagina.

    Casetă de dialog pentru a selecta profilarea datelor.

    1. Creați atribute noi, editați sau ștergeți atributele existente. Puteți schimba numele, formatul datelor sau puteți adăuga un tip semantic.
    2. Pentru a activa analiza și alte capabilități, selectați Profilarea datelor pentru întreaga entitate sau pentru anumite atribute. În mod implicit, nu este activată nicio entitate pentru profilarea datelor.
    3. Selectați Terminat.
  14. Selectați Salvare. The Surse de date se deschide pagina afișând noul sursă de date în Înviorător stare.

    Sfat

    Sunt statusuri pentru sarcini și procese. Majoritatea proceselor depind de alte procese din amonte, cum ar fi sursele de date și profilarea datelor reîmprospătează.

    Selectați starea pentru a deschide Detalii despre progres panoul și vizualizați progresul sarcinilor. Pentru a anula lucrarea, selectați Anulează jobul în partea de jos a panoului.

    Sub fiecare sarcină, puteți selecta Vezi detalii pentru mai multe informații despre progres, cum ar fi timpul de procesare, ultima dată de procesare și orice erori și avertismente aplicabile asociate sarcinii sau procesului. Selectează Vedeți starea sistemului în partea de jos a panoului pentru a vedea alte procese din sistem.

Încărcarea datelor poate dura timp. După o reîmprospătare cu succes, datele ingerate pot fi revizuite din Entități pagină.

Creați un nou fișier de schemă

  1. Selectați Fișier de schemă nou.

  2. Introduceți un nume pentru fișier și selectați Salvați.

  3. Selectați Noua entitate. The Entitate nouă afișajele panoului.

  4. Introduceți numele entității și alegeți Locația fișierelor de date.

    • Mai multe fișiere .csv sau .parquet : Navigați la folderul rădăcină, selectați tipul de model și introduceți expresia.
    • Fișiere unice .csv sau .parquet : Navigați la fișierul .csv sau .parquet și selectați-l.

    Casetă de dialog pentru a crea o nouă entitate cu locația fișierelor de date evidențiată.

  5. Selectați Salvare.

    Casetă de dialog pentru definirea sau generarea automată a atributelor.

  6. Selectați definiți atributele pentru a adăuga manual atributele sau pentru a selecta generați-le automat. Pentru a defini atributele, introduceți un nume, selectați formatul de date și tipul semantic opțional. Pentru atributele generate automat:

    1. După ce atributele sunt generate automat, selectați Atributele de revizuire. The Gestionați atributele afișează pagina.

    2. Asigurați-vă că formatul datelor este corect pentru fiecare atribut.

    3. Pentru a activa analiza și alte capabilități, selectați Profilarea datelor pentru întreaga entitate sau pentru anumite atribute. În mod implicit, nu este activată nicio entitate pentru profilarea datelor.

      Casetă de dialog pentru a selecta profilarea datelor.

    4. Selectați Terminat. The Selectați entitățile afișează pagina.

  7. Continuați să adăugați entități și atribute, dacă este cazul.

  8. După ce toate entitățile au fost adăugate, selectați Include pentru a include entitățile în asimilarea sursă de date.

    Caseta de dialog care arată Necesar pentru cheia primară

  9. Pentru entitățile selectate care necesită asimilare incrementală, Necesar afișează sub Reîmprospătare incrementală. Pentru fiecare dintre aceste entități, a se vedea Configurați o reîmprospătare incrementală pentru sursele de date Azure Data Lake.

  10. Pentru entitățile selectate pentru care nu a fost definită o cheie primară, Necesar afișează sub Cheia principala. Pentru fiecare dintre aceste entități:

    1. Selectați Necesar. The Editați entitate afișajele panoului.
    2. Alege Cheia principala. Cheia primară este un atribut unic pentru entitate. Pentru ca un atribut să fie o cheie primară validă, nu ar trebui să includă valori duplicate, valori lipsă sau valori nule. Atributele tipului de date șir, întreg și GUID sunt acceptate ca chei primare.
    3. Opțional, modificați modelul de partiție.
    4. Selectați Închide pentru a salva și a închide panoul.
  11. Selectați Salvare. The Surse de date se deschide pagina afișând noul sursă de date în Înviorător stare.

    Sfat

    Sunt statusuri pentru sarcini și procese. Majoritatea proceselor depind de alte procese din amonte, cum ar fi sursele de date și profilarea datelor reîmprospătează.

    Selectați starea pentru a deschide Detalii despre progres panoul și vizualizați progresul sarcinilor. Pentru a anula lucrarea, selectați Anulează jobul în partea de jos a panoului.

    Sub fiecare sarcină, puteți selecta Vezi detalii pentru mai multe informații despre progres, cum ar fi timpul de procesare, ultima dată de procesare și orice erori și avertismente aplicabile asociate sarcinii sau procesului. Selectează Vedeți starea sistemului în partea de jos a panoului pentru a vedea alte procese din sistem.

Încărcarea datelor poate dura timp. După o reîmprospătare cu succes, datele ingerate pot fi revizuite din Entități pagină.

Editați un Azure Data Lake Storage sursă de date

Puteți actualiza Conectați-vă la contul de stocare folosind opțiune. Pentru mai multe informații, vezi Conectați Customer Insights la un Azure Data Lake Storage Cont Gen2 cu un principal de serviciu Azure. Pentru a conecta la un container diferit de contul de stocare sau să modificați numele contului, trebuie să creați o nouă conexiune la sursa de date.

  1. Accesați Date > Surse de date.

  2. Lângă sursă de date pe care doriți să o actualizați, selectați Editați | ×.

    Casetă de dialog pentru a edita Azure Data Lake sursă de date.

  3. Modificați oricare dintre următoarele informații:

    • Descriere

    • Conectați-vă spațiul de stocare folosind și informații de conectare. Nu puteți schimba informațiile legate de Recipient la actualizarea conexiunii.

      Notă

      Unul dintre următoarele roluri trebuie să fie atribuit contului de stocare sau containerului:

      • Cititor de date Blob de stocare
      • Proprietar de date Blob de stocare
      • Contribuitor de date blob de stocare
    • Activați legătura privată dacă doriți să ingerați date dintr-un cont de stocare printr-o legătură privată Azure. Pentru mai multe informații, vezi Linkuri private.

  4. Selectați Următorul.

  5. Modificați oricare dintre următoarele:

    • Navigați la un alt fișier model.json sau manifest.json cu un set diferit de entități din container.

    • Pentru a adăuga entități suplimentare de asimilat, selectați Noua entitate.

    • Pentru a elimina orice entitate deja selectată dacă nu există dependențe, selectați entitatea și Șterge.

      Important

      Dacă există dependențe de fișierul model.json sau manifest.json existent și setul de entități, veți vedea un mesaj de eroare și nu puteți selecta un fișier model.json sau manifest.json diferit. Eliminați aceste dependențe înainte de a schimba fișierul model.json sau manifest.json sau creați un nou sursă de date cu fișierul model.json sau manifest.json pe care doriți să îl utilizați pentru a evita eliminarea dependențelor.

    • Pentru a schimba locația fișierului de date sau cheia principală, selectați Editați | ×.

    • Pentru a modifica datele de asimilare incrementală, consultați Configurați o reîmprospătare incrementală pentru sursele de date Azure Data Lake.

    • Schimbați numai numele entității pentru a se potrivi cu numele entității din fișierul .json.

      Notă

      Păstrați întotdeauna numele entității din Customer Insights același cu numele entității din fișierul model.json sau manifest.json după ingerare. Customer Insights validează toate numele de entități cu model.json sau manifest.json la fiecare reîmprospătare a sistemului. Dacă numele unei entități este schimbat fie în interiorul Customer Insights, fie în exterior, apare o eroare, deoarece Customer Insights nu poate găsi noul nume de entitate în fișierul .json. Dacă numele unei entități ingerate a fost schimbat din greșeală, editați numele entității în Customer Insights pentru a se potrivi cu numele din fișierul .json.

  6. Selectați Atribute pentru a adăuga sau modifica atribute sau pentru a activa profilarea datelor. Apoi selectați Terminat.

  7. Clic Salvați pentru a aplica modificările și a reveni la Surse de date pagină.

    Sfat

    Sunt statusuri pentru sarcini și procese. Majoritatea proceselor depind de alte procese din amonte, cum ar fi sursele de date și profilarea datelor reîmprospătează.

    Selectați starea pentru a deschide Detalii despre progres panoul și vizualizați progresul sarcinilor. Pentru a anula lucrarea, selectați Anulează jobul în partea de jos a panoului.

    Sub fiecare sarcină, puteți selecta Vezi detalii pentru mai multe informații despre progres, cum ar fi timpul de procesare, ultima dată de procesare și orice erori și avertismente aplicabile asociate sarcinii sau procesului. Selectează Vedeți starea sistemului în partea de jos a panoului pentru a vedea alte procese din sistem.

Notă

Ne puteți spune care preferințele dvs. lingvistice pentru documentație? Răspundeți la un chestionar scurt. (rețineți că acest chestionar este în limba engleză)

Chestionarul va dura aproximativ șapte minute. Nu sunt colectate date personale (angajament de respectare a confidențialității).