Parametrisatie voor kennisoverdracht

Dit artikel bevat een voorbeeld van het uitvoeren van featurization voor het overdragen van leren met pandas UDF's.

Featurization voor overdrachtsleer in DL-modellen

Azure Databricks ondersteunt parametrisatie met deep learning-modellen. Vooraf getrainde Deep Learning-modellen kunnen worden gebruikt om functies te berekenen voor gebruik in andere downstreammodellen. Azure Databricks ondersteunt parametrisatie op schaal en verdeelt de berekening over een cluster. U kunt featurization uitvoeren met deep learning-bibliotheken die zijn opgenomen in Databricks Runtime ML, waaronder TensorFlow en PyTorch.

Azure Databricks ondersteunt ook kennisoverdracht, een techniek die nauw samenhangt met parametrisatie. Met kennisoverdracht kunt u de kennis van een bepaald probleemdomein in een gerelateerd domein hergebruiken. Parametrisatie is op zichzelf een eenvoudige en krachtige methode voor kennisoverdracht: rekenfuncties die gebruik maken van een vooraf getraind deep learning-model dragen kennis over goede functies over van het oorspronkelijke domein.

Stappen voor het berekenen van functies voor overdrachtsleer

In dit artikel wordt gedemonstreerd hoe u functies voor overdrachtsleer kunt berekenen met behulp van een vooraf getraind TensorFlow-model met behulp van de volgende werkstroom:

  1. Begin met een vooraf getraind deep learning-model, in dit geval een afbeeldingsclassificatiemodel van tensorflow.keras.applications.
  2. De laatste laag(en) van het model afkappen. Het gewijzigde model produceert een tensor van functies als uitvoer, in plaats van een voorspelling.
  3. Pas dat model toe op een nieuwe afbeeldingsgegevensset uit een ander probleemdomein, computerfuncties voor de installatiekopieën.
  4. Gebruik deze functies om een nieuw model te trainen. In het volgende notitieblok wordt deze laatste stap weggelaten. Zie Voorbeelden van modeltraining voor voorbeelden van het trainen van een eenvoudig model, zoals logistieke regressie.

Voorbeeld: Pandas UDF's gebruiken voor featurization

In het volgende notebook worden pandas UDF's gebruikt om de featurization-stap uit te voeren. pandas UDF's en hun nieuwere variant Scalar Iterator pandas UDF's, bieden flexibele API's, ondersteunen elke deep learning-bibliotheek en bieden hoge prestaties.

Featurization and transfer learning with TensorFlow

Notebook downloaden