عمليات نظام الملفات على Azure Data Lake Storage Gen1 باستخدام Python
في هذه المقالة، يمكنك معرفة كيفية استخدام Python SDK لتنفيذ عمليات نظام الملفات على Azure Data Lake Storage Gen1. للحصول على إرشادات حول كيفية تنفيذ عمليات إدارة الحساب على Data Lake Storage Gen1 باستخدام Python، راجع عمليات إدارة الحساب على Data Lake Storage Gen1 باستخدام Python.
المتطلبات الأساسية
لغة برمجة بايثون. يمكنك تنزيل Python من هنا. تستخدم هذه المقالة بايثون 3.6.2.
اشتراك Azure. راجع الحصول على الإصدار التجريبي المجاني من Azure .
Azure Data Lake Storage حساب Gen1. اتبع الإرشادات في بدء Azure Data Lake Storage Gen1 باستخدام مدخل Microsoft Azure.
تثبيت الوحدات
للعمل مع Data Lake Storage Gen1 باستخدام Python ، تحتاج إلى تثبيت ثلاث وحدات.
- الوحدة النمطية
azure-mgmt-resource، التي تتضمن وحدات Azure النمطية ل Active Directory، وما إلى ذلك. - الوحدة
azure-mgmt-datalake-storeالنمطية ، والتي تتضمن عمليات إدارة حساب Gen1 Azure Data Lake Storage. لمزيد من المعلومات حول هذه الوحدة النمطية، راجع مرجع الوحدة النمطية azure-mgmt-datalake-store. - الوحدة
azure-datalake-storeالنمطية ، التي تتضمن عمليات نظام الملفات Gen1 Azure Data Lake Storage. لمزيد من المعلومات حول هذه الوحدة النمطية، راجع مرجع الوحدة النمطية لنظام الملفات azure-datalake-store.
استخدم الأوامر التالية لتثبيت الوحدات النمطية.
pip install azure-mgmt-resource
pip install azure-mgmt-datalake-store
pip install azure-datalake-store
إنشاء تطبيق Python جديد
في IDE من اختيارك ، قم بإنشاء تطبيق Python جديد ، على سبيل المثال ، mysample.py.
إضافة الأسطر التالية لاستيراد الوحدات المطلوبة
## Use this only for Azure AD service-to-service authentication from azure.common.credentials import ServicePrincipalCredentials ## Use this only for Azure AD end-user authentication from azure.common.credentials import UserPassCredentials ## Use this only for Azure AD multi-factor authentication from msrestazure.azure_active_directory import AADTokenCredentials ## Required for Azure Data Lake Storage Gen1 account management from azure.mgmt.datalake.store import DataLakeStoreAccountManagementClient from azure.mgmt.datalake.store.models import DataLakeStoreAccount ## Required for Azure Data Lake Storage Gen1 filesystem management from azure.datalake.store import core, lib, multithread ## Common Azure imports from azure.mgmt.resource.resources import ResourceManagementClient from azure.mgmt.resource.resources.models import ResourceGroup ## Use these as needed for your application import logging, getpass, pprint, uuid, timeاحفظ التغييرات في mysample.py.
المصادقة
في هذا القسم، نتحدث عن الطرق المختلفة للمصادقة باستخدام Azure AD. الخيارات المتاحة هي:
- للحصول على مصادقة المستخدم النهائي لتطبيقك، راجع مصادقة المستخدم النهائي باستخدام Data Lake Storage Gen1 باستخدام Python.
- للحصول على مصادقة من خدمة إلى خدمة لتطبيقك، راجع مصادقة الخدمة إلى الخدمة باستخدام Data Lake Storage Gen1 باستخدام Python.
إنشاء عميل نظام الملفات
يقوم المقتطف التالي أولا بإنشاء عميل حساب Data Lake Storage Gen1. يستخدم كائن العميل لإنشاء حساب Data Lake Storage Gen1. وأخيرا، يقوم المقتطف بإنشاء كائن عميل نظام ملفات.
## Declare variables
subscriptionId = 'FILL-IN-HERE'
adlsAccountName = 'FILL-IN-HERE'
## Create a filesystem client object
adlsFileSystemClient = core.AzureDLFileSystem(adlCreds, store_name=adlsAccountName)
إنشاء دليل
## Create a directory
adlsFileSystemClient.mkdir('/mysampledirectory')
تحميل ملف
## Upload a file
multithread.ADLUploader(adlsFileSystemClient, lpath='C:\\data\\mysamplefile.txt', rpath='/mysampledirectory/mysamplefile.txt', nthreads=64, overwrite=True, buffersize=4194304, blocksize=4194304)
تنزيل ملف
## Download a file
multithread.ADLDownloader(adlsFileSystemClient, lpath='C:\\data\\mysamplefile.txt.out', rpath='/mysampledirectory/mysamplefile.txt', nthreads=64, overwrite=True, buffersize=4194304, blocksize=4194304)
حذف دليل
## Delete a directory
adlsFileSystemClient.rm('/mysampledirectory', recursive=True)