Повезивање са уобичајеним табелама модела података у Azure Data Lake Storage

Белешка

Azure Active Directory је сада Microsoft Entra ID. Учи више

Унесите податке у Dynamics 365 Customer Insights - Data коришћење налога Azure Data Lake Storage помоћу табела"Уобичајени модел података". Уношење података може бити пуно или постепено.

Предуслови

  • Налог Azure Data Lake Storage мора имати хијерархијски за име. Подаци морају бити ускладиштени у хијерархијски фасцикле који дефинише основну фасциклу и има потфасцикле за сваку табелу. Потфасцикле могу да имају пуне податке или постепене фасцикле са подацима.

  • Да бисте потврдили идентитет код директора Microsoft Entra услуге, уверите се да је конфигурисан у вашем закупцу. Више информација потражите у чланку Повезивање са налогом Azure Data Lake Storage са главним Microsoft Entra сервисом.

  • Подаци Azure Data Lake Storage из којих желите да повежете и уносите податке морају да буду у истој Азуре области као Dynamics 365 Customer Insights и окружење и претплате морају бити у истом закупу. Не подржавају се везе са Common Data Model фасциклом из језера података у другом Azure региону. Да бисте знали Азуре регион окружења, идите на сеттингс > Сyстем > Абоут ин Customer Insights - Data.

  • Подаци ускладиштени у услугама на мрежи могу бити ускладиштени на локацији која се разликује од места где се подаци обрађују или складиште. Увозом или повезивањем са подацима ускладиштеним у услугама на мрежи слажете се да се подаци могу пренети. Сазнајте више у Мицрософт центру за поузданост.

  • Главница Customer Insights - Data услуге мора бити у некој од следећих улога да би приступила налогу за складиштење. Више информација потражите у чланку Додељивање дозвола директору услуге за приступ налогу за складиштење.

    • Читач података складишта блоб објекта
    • Власник података складишта блоб објекта
    • Сарадник за податке складишта блоб објекта
  • Приликом повезивања са Азуре складиштем помоћу опције Азуре претплате , кориснику који подешава < ДИЦТ__извор података > дата соурце везу потребне су најмање дозволе за податке о складиштењу сарадник за налог за складиштење.

  • Приликом повезивања са Азуре складиштем помоћу опције Азуре ресурса , кориснику који подешава < ДИЦТ__извор података > дата соурце везу потребна је најмање дозвола за радњу Мицрософт.Стораге/сторагеАццоунтс/реад на налогу за складиштење. Уграђена улога Азуре која укључује ову радњу је читалац роле. Да бисте ограничили приступ само неопходној радњи, креирајте Азуре прилагођену улогу која укључује само ову радњу.

  • За оптималне перформансе, величина партиције би требало да буде 1 ГБ или мања, а број датотека партиција у фасцикли не сме да премаши 1000.

  • Подаци у складишту језера података треба да прате стандард Цоммон Дата Модел за складиштење ваших података и да манифестују Заједнички модел података који представља шему датотека са подацима (*.цсв или *.паркет). Манифест мора да обезбеди детаље табела као што су колоне табеле и типови података, као и локацију датотеке са подацима и тип датотеке. Више информација потражите у манифесту Уобичајени модел података. Ако манифест није присутан, администраторски корисници са власником података "Стораге Блоб" или "Стораге Блоб Дата сарадник" могу да дефинишу шему приликом уноса података.

    Белешка

    Ако неко од поља у .паркет датотекама има тип података Int96, подаци се можда неће приказати на страници "Табеле ". Препоручујемо да користите стандардне типове података, као што је Униx формат временске оси (који представља време као број секунди од 1.

Ограничења

  • Customer Insights - Data не подржава колоне децималног типа са прецизношћу већом од 16.

Повезивање са услугом Azure Data Lake Storage

  1. Идите на изворе > података података.

  2. Изаберите опцију Додај < ДИЦТ__извор података > дата соурце.

  3. Изаберите табеле Азуре Дата Лаке Цоммон Дата Модел.

    Дијалог за унос детаља везе за Азуре дата Лаке са табелама Цоммон Дата Модел.

  4. Унесите < ДИЦТ__извор података > дата соурце и опционални опис. Име се упућује на низводне процесе и није могуће променити га након креирања < ДИЦТ__извор података > дата соурце.

  5. Одаберите једну од следећих опција за повезивање складишта помоћу. Више информација потражите у чланку Повезивање са налогом Azure Data Lake Storage са главним Microsoft Entra сервисом.

    • Азуре ресурса : Унесите ИД ресурса . (#пии_ијфидејз).
    • Азуре претплате : Изаберите претплату , а затим налог групе ресурса и складишта.

    Белешка

    Потребна вам је једна од следећих улога контејнера да бисте креирали < ДИЦТ__извор података > дата соурце:

    • Подаци о складиштењу читалац су довољни за читање са налога за складиштење и унос података Customer Insights - Data.
    • Подаци о складиштењу сарадник или власник су потребни ако желите да уредите датотеке манифеста директно у Customer Insights - Data.

    Поседовање улоге на налогу за складиштење обезбедиће исту улогу на свим контејнерима.

  6. Опционално, ако желите да уносите податке из налога за складиштење путем Азуре приватне везе, изаберите опцију Омогући приватну везу. Више информација потражите у чланку Приватне везе.

  7. Одаберите име контејнера који садржи податке и шему (модел.јсон или манифест.јсон датотеку) из којег ћете увести податке, а затим кликните на дугме Даље .

    Белешка

    Ниједна датотека model.json или manifest.json повезана са другим извором података у окружењу неће се приказати на листи. Међутим, иста датотека model.json или manifest.json може се користити за изворе података у више окружења.

  8. Да бисте креирали нову шему, идите на ставку Креирање нове датотеке шеме.

  9. Да бисте користили постојећу шему, дођите до фасцикле која садржи модел.јсон или манифест.цдм.јсон датотеку. Можете да претражујете у каталогу да бисте пронашли датотеку.

  10. Изаберите јсон датотеку и кликните на дугме Даље. Приказаће се листа доступних табела.

    Дијалог листе табела за избор

  11. Изаберите табеле које желите да укључите.

    Дијалог који приказује потребан за примарни кључ

    Савет

    Да бисте уредили табелу у ЈСОН интерфејсу за уређивање, изаберите табелу, а затим уредите датотеку шеме. Извршите промене и изаберите Сачувај .

  12. За изабране табеле које захтевају постепено уношење, потребни екрани у оквиру постепеног освежавања. За сваку од ових табела погледајте чланак Конфигурисање постепеног освежавања за Азуре Дата Лаке изворе података.

  13. За изабране табеле у којима примарни кључ није дефинисан,Потребни прикази у оквиру примарног кључа. За сваку од ових табела:

    1. Изаберите потребну. Приказаће се табла "Уређивање табеле".
    2. Одаберите примарни кључ. Примарни кључ је атрибут јединствен за табелу. Да би атрибут био важећи примарни кључ, не би требало да садржи дуплиране вредности, недостајуће вредности или празне вредности. Атрибути типа ниска, цео број и ГУИД тип података су подржани као примарни кључеви.
    3. Опционално, промените образац партиције.
    4. Кликните на дугме " Затвори" да бисте сачували и затворили таблу.
  14. Изаберите број колона за сваку укључену табелу. Приказаће се страница"Управљање атрибутима".

    Дијалог за избор профилисања података.

    1. Креирајте нове колоне, уредите или избришите постојеће колоне. Можете да промените име, формат података или да додате семантички тип.
    2. Да бисте омогућили аналитику и друге могућности, изаберите профилисање података за целу табелу или за одређене колоне. Подразумевано, ниједна табела није омогућена за профилисање података.
    3. Изаберите Готово.
  15. Изаберите ставку Сачувај. Отвориће се страница"Извори података" која приказује нову < ДИЦТ__извор података > дата соурце у статусу "Освежавање ".

    Савет

    Постоје статуси за задатке и процесе. Већина процеса зависи од других узводних процеса, као што су извори података и освежавање профилисања података.

    Изаберите статус да бисте отворили окно са детаљима о току и приказали ток задатака. Да бисте отказали посао, кликните на дугме " Откажи посао" на дну окна.

    У оквиру сваког задатка можете изабрати погледајте детаље за више информација о току, као што су време обраде, датум последње обраде и све применљиве грешке и упозорења повезана са задатком или процесом. Изаберите статус система "Прикажи " на дну табле да бисте видели друге процесе у систему.

Учитавање података може потрајати. Након успешног освежавања, унети подаци могу да се редигује са странице " Табеле ".

Креирање нове датотеке шеме

  1. Изаберите ставку Креирај датотеку шеме.

  2. Унесите име датотеке и изаберите сачувај .

  3. Изаберите нову табелу. Приказаће се табла "Нова табела".

  4. Унесите име табеле и одаберите локацију датотека са подацима.

    • Више .цсв или .паркета : Потражите основну фасциклу, изаберите тип шаре и унесите израз.
    • Појединачне.цсв или .паркет : Потражите датотеку .цсв или .паркета и изаберите је.

    Дијалог за креирање нове табеле са истакнутом локацијом датотека са подацима.

  5. Изаберите ставку Сачувај.

    Дијалог за дефинисање или аутоматско генерисање атрибута.

  6. Потврдите избор у овом пољу за потврду дефинишите атрибуте да бисте ручно додали атрибуте или изаберите аутоматско генерисање. Да бисте дефинисали атрибуте, унесите име, изаберите формат података и опционални семантички тип. За аутоматски генерисане атрибуте:

    1. Након што се атрибути аутоматски генеришу, изаберите ставку Редигуј атрибуте. Приказаће се страница"Управљање атрибутима".

    2. Уверите се да је формат података исправан за сваки атрибут.

    3. Да бисте омогућили аналитику и друге могућности, изаберите профилисање података за целу табелу или за одређене колоне. Подразумевано, ниједна табела није омогућена за профилисање података.

      Дијалог за избор профилисања података.

    4. Изаберите Готово. Приказаће се страница" Избор табела".

  7. Наставите да додајете табеле и колоне, ако је применљиво.

  8. Када додате све табеле, изаберите опцију Укључи да бисте укључили табеле < ДИЦТ__извор података > дата соурце уношење.

    Дијалог који приказује потребан за примарни кључ

  9. За изабране табеле које захтевају постепено уношење, потребни екрани у оквиру постепеног освежавања. За сваку од ових табела погледајте чланак Конфигурисање постепеног освежавања за Азуре Дата Лаке изворе података.

  10. За изабране табеле у којима примарни кључ није дефинисан,Потребни прикази у оквиру примарног кључа. За сваку од ових табела:

    1. Изаберите потребну. Приказаће се табла "Уређивање табеле".
    2. Одаберите примарни кључ. Примарни кључ је атрибут јединствен за табелу. Да би атрибут био важећи примарни кључ, не би требало да садржи дуплиране вредности, недостајуће вредности или празне вредности. Атрибути типа ниска, цео број и ГУИД тип података су подржани као примарни кључеви.
    3. Опционално, промените образац партиције.
    4. Кликните на дугме " Затвори" да бисте сачували и затворили таблу.
  11. Изаберите ставку Сачувај. Отвориће се страница"Извори података" која приказује нову < ДИЦТ__извор података > дата соурце у статусу "Освежавање ".

    Савет

    Постоје статуси за задатке и процесе. Већина процеса зависи од других узводних процеса, као што су извори података и освежавање профилисања података.

    Изаберите статус да бисте отворили окно са детаљима о току и приказали ток задатака. Да бисте отказали посао, кликните на дугме " Откажи посао" на дну окна.

    У оквиру сваког задатка можете изабрати погледајте детаље за више информација о току, као што су време обраде, датум последње обраде и све применљиве грешке и упозорења повезана са задатком или процесом. Изаберите статус система "Прикажи " на дну табле да бисте видели друге процесе у систему.

Учитавање података може потрајати. Након успешног освежавања, унети подаци могу да се редигује са странице " Табеле > података ".

Уреди ан Azure Data Lake Storage < ДИЦТ__извор података > дата соурце

Помоћу опције можете да ажурирате налог за повезивање са складиштем. Више информација потражите у чланку Повезивање са налогом Azure Data Lake Storage са главним Microsoft Entra сервисом. Креирајте нову везу да бисте се повезали са другим контејнером из налога за складиштење или променили < ДИЦТ__извор података > дата соурце име налога.

  1. Идите на изворе > података података. Поред < ДИЦТ__извор података > дата соурце желите да ажурирате, изаберите уреди .

  2. Промените неку од следећих информација:

    • Опис

    • Повежите складиште користећи информације о вези и вези. Не можете да промените информације о контејнеру приликом ажурирања везе.

      Белешка

      Једна од следећих улога мора бити додељена налогу за складиштење или контејнеру:

      • Читач података складишта блоб објекта
      • Власник података складишта блоб објекта
      • Сарадник за податке складишта блоб објекта
    • Користите контролисане идентитете за Азуре са Azure Data Lake Storage ???

    • Омогућите приватну везу ако желите да уносите податке са налога за складиштење путем Азуре приватне везе. Више информација потражите у чланку Приватне везе.

  3. Изаберите Следеће.

  4. Промените нешто од следећег:

    • Крећите се до модел.јсон или манифест.јсон датотеке са другим скупом табела из контејнера.

    • Изаберите нову табелу да бисте додали додатне табеле у "ингест".

    • Изаберите табелу и"Избриши" да бисте уклонили већ изабране табеле ако нема зависности.

      Важно

      Ако постоје зависности од постојеће модел.јсон или манифест.јсон датотеке и скупа табела, видећете поруку о грешци и нећете моћи да изаберете другу модел.јсон или манифест.јсон датотеку. Уклоните те зависности пре промене датотеке model.json или manifest.json или креирајте нови извор података са датотеком model.json или manifest.json коју желите да користите да бисте избегли уклањање зависности.

    • Да бисте променили локацију датотеке са подацима или примарни кључ, кликните на дугме " Уреди".

    • Да бисте променили постепене податке о брисању, погледајте чланак Конфигурисање постепеног освежавања за Азуре Дата Лаке изворе података.

    • Промените само име табеле тако да се подудара са именом табеле у .јсон датотеке.

      Белешка

      Име табеле увек држите у истом имену табеле у модел.јсон или манифест.јсон након брисања. Customer Insights - Data проверава ваљаност свих имена табела са модел.јсон или манифест.јсон сваком освежавању система. Ако се име табеле промени, долази до грешке јер не Customer Insights - Data можете да пронађете ново име табеле у .јсон датотеке. Ако је име унете табеле случајно промењено, уредите име табеле тако да се подудара са именом .јсон датотеке.

  5. Изаберите колоне да бисте их додали или променили или омогућили профилисање података. Затим изаберите Готово .

  6. Кликните на дугме "Сачувај" да бисте применили промене и вратили се на страницу "Извори података ".

    Савет

    Постоје статуси за задатке и процесе. Већина процеса зависи од других узводних процеса, као што су извори података и освежавање профилисања података.

    Изаберите статус да бисте отворили окно са детаљима о току и приказали ток задатака. Да бисте отказали посао, кликните на дугме " Откажи посао" на дну окна.

    У оквиру сваког задатка можете изабрати погледајте детаље за више информација о току, као што су време обраде, датум последње обраде и све применљиве грешке и упозорења повезана са задатком или процесом. Изаберите статус система "Прикажи " на дну табле да бисте видели друге процесе у систему.