تحرير مكون بيانات التعريف

توضح هذه المقالة مكونا مضمنا في Azure التعلم الآلي مصمم.

استخدم مكون تحرير بيانات التعريف لتغيير بيانات التعريف المقترنة بالأعمدة في مجموعة بيانات. ستتغير قيمة مجموعة البيانات ونوع بياناتها بعد استخدام مكون تحرير بيانات التعريف.

قد تتضمن التغييرات النموذجية في البيانات الوصفية ما يلي:

  • التعامل مع الأعمدة المنطقية أو الرقمية كقيم فئوية.

  • الإشارة إلى العمود الذي يحتوي على تسمية الفئة أو يحتوي على القيم التي تريد تصنيفها أو التنبؤ بها.

  • وضع علامة على الأعمدة كميزات.

  • تغيير قيم التاريخ / الوقت إلى قيم رقمية أو العكس.

  • إعادة تسمية الأعمدة.

استخدم تحرير بيانات التعريف في أي وقت تحتاج فيه إلى تعديل تعريف عمود، عادة لتلبية متطلبات مكون المصب. على سبيل المثال، تعمل بعض المكونات فقط مع أنواع بيانات محددة أو تتطلب علامات على الأعمدة، مثل IsFeature أو IsCategorical.

بعد تنفيذ العملية المطلوبة، يمكنك إعادة تعيين بيانات التعريف إلى حالتها الأصلية.

تكوين تحرير البيانات الوصفية

  1. في Azure التعلم الآلي مصمم، أضف مكون تحرير بيانات التعريف إلى خط الأنابيب الخاص بك وقم بتوصيل مجموعة البيانات التي تريد تحديثها. يمكنك العثور على المكون في فئة تحويل البيانات .

  2. انقر فوق تحرير العمود في اللوحة اليمنى من المكون واختر العمود أو مجموعة الأعمدة للعمل معها. يمكنك اختيار الأعمدة بشكل فردي حسب الاسم أو الفهرس، أو يمكنك اختيار مجموعة من الأعمدة حسب النوع.

  3. حدد خيار نوع البيانات إذا كنت بحاجة إلى تعيين نوع بيانات مختلف للأعمدة المحددة. قد تحتاج إلى تغيير نوع البيانات لعمليات معينة. على سبيل المثال، إذا كانت مجموعة البيانات المصدر تحتوي على أرقام يتم التعامل معها كنص، فيجب تغييرها إلى نوع بيانات رقمي قبل استخدام عمليات الرياضيات.

    • أنواع البيانات المدعومة هي سلسلة وعدد صحيحومزدوجومنطقيوDateTime.

    • إذا قمت بتحديد أعمدة متعددة، فيجب عليك تطبيق تغييرات بيانات التعريف على جميع الأعمدة المحددة. على سبيل المثال، لنفترض أنك اخترت عمودين رقميين أو ثلاثة. يمكنك تغييرها جميعا إلى نوع بيانات سلسلة وإعادة تسميتها في عملية واحدة. ومع ذلك، لا يمكنك تغيير عمود إلى نوع بيانات سلسلة وعمود آخر من تعويم إلى عدد صحيح.

    • إذا لم تحدد نوع بيانات جديدا، فلن تتغير بيانات تعريف العمود.

    • سيتغير نوع العمود وقيمه بعد إجراء عملية تحرير بيانات التعريف. يمكنك استرداد نوع البيانات الأصلي في أي وقت باستخدام تحرير بيانات التعريف لإعادة تعيين نوع بيانات العمود.

    ملاحظة

    يتبع تنسيق DateTime تنسيقdatetime المدمج في Python.
    إذا قمت بتغيير أي نوع من الأرقام إلى نوع DateTime، اترك الحقل تنسيق DateTime فارغا. لا يمكن حاليا تحديد تنسيق البيانات المستهدفة.

  4. حدد الخيار فئوي لتحديد أن القيم الموجودة في الأعمدة المحددة يجب أن تعامل كفئات.

    على سبيل المثال، قد يكون لديك عمود يحتوي على الأرقام 0 و1 و2، ولكن اعلم أن الأرقام تعني في الواقع "مدخن" و"غير مدخن" و"غير معروف". في هذه الحالة، من خلال وضع علامة على العمود على أنه فئوي، فإنك تضمن استخدام القيم فقط لتجميع البيانات وليس في العمليات الحسابية الرقمية.

  5. استخدم الخيار الحقول إذا كنت تريد تغيير الطريقة التي يستخدم بها Azure التعلم الآلي البيانات في نموذج.

    • الميزة: استخدم هذا الخيار لوضع علامة على عمود كميزة في المكونات التي تعمل فقط على أعمدة المعالم. بشكل افتراضي، يتم التعامل مع جميع الأعمدة في البداية كميزات.

    • التسمية: استخدم هذا الخيار لوضع علامة على التسمية، والتي تعرف أيضا باسم السمة التي يمكن التنبؤ بها أو المتغير المستهدف. تتطلب العديد من المكونات وجود عمود تسمية واحد بالضبط في مجموعة البيانات.

      في كثير من الحالات، يمكن أن يستنتج Azure التعلم الآلي أن العمود يحتوي على تسمية فئة. من خلال تعيين بيانات التعريف هذه، يمكنك التأكد من تحديد العمود بشكل صحيح. لا يؤدي تعيين هذا الخيار إلى تغيير قيم البيانات. إنه يغير فقط الطريقة التي تتعامل بها بعض خوارزميات التعلم الآلي مع البيانات.

    تلميح

    هل لديك بيانات لا تتناسب مع هذه الفئات؟ على سبيل المثال، قد تحتوي مجموعة البيانات على قيم مثل المعرفات الفريدة التي لا تكون مفيدة كمتغيرات. في بعض الأحيان يمكن أن تسبب هذه المعرفات مشاكل عند استخدامها في نموذج.

    لحسن الحظ، يحتفظ Azure التعلم الآلي بجميع بياناتك، بحيث لا تضطر إلى حذف هذه الأعمدة من مجموعة البيانات. عندما تحتاج إلى تنفيذ عمليات على مجموعة خاصة من الأعمدة، ما عليك سوى إزالة جميع الأعمدة الأخرى مؤقتا باستخدام مكون تحديد أعمدة في مجموعة البيانات . في وقت لاحق، يمكنك دمج الأعمدة مرة أخرى في مجموعة البيانات باستخدام مكون إضافة أعمدة .

  6. استخدم الخيارات التالية لمسح التحديدات السابقة واستعادة بيانات التعريف إلى القيم الافتراضية.

    • مسح الميزة: استخدم هذا الخيار لإزالة علامة الميزة.

      يتم التعامل مع جميع الأعمدة في البداية كميزات. بالنسبة للمكونات التي تقوم بتنفيذ عمليات رياضية، قد تحتاج إلى استخدام هذا الخيار لمنع معاملة الأعمدة الرقمية كمتغيرات.

    • مسح التصنيف: استخدم هذا الخيار لإزالة البيانات الوصفية للتصنيف من العمود المحدد.

    • مسح النتيجة: استخدم هذا الخيار لإزالة البيانات الوصفية للنقاط من العمود المحدد.

      لا يمكنك حاليا وضع علامة صريحة على عمود كنتيجة في Azure التعلم الآلي. ومع ذلك، تؤدي بعض العمليات إلى وضع علامة على عمود كنتيجة داخليا. أيضا، قد يقوم مكون R مخصص بإخراج قيم النقاط.

  7. بالنسبة إلى أسماء الأعمدة الجديدة، أدخل الاسم الجديد للعمود أو الأعمدة المحددة.

    • يمكن أن تستخدم أسماء الأعمدة الأحرف التي يدعمها ترميز UTF-8 فقط. لا يسمح بالسلاسل الفارغة أو الفارغة أو الأسماء التي تتكون بالكامل من مسافات.

    • لإعادة تسمية أعمدة متعددة، أدخل الأسماء كقائمة مفصولة بفواصل بترتيب فهارس الأعمدة.

    • يجب إعادة تسمية جميع الأعمدة المحددة. لا يمكنك حذف الأعمدة أو تخطيها.

  8. إرسال المسار.

الخطوات التالية

راجع مجموعة المكونات المتوفرة ل Azure التعلم الآلي.