データの探索

完了

機械学習モデルは、既存のデータでトレーニングする必要があります。 この例では、季節と気象の特徴に基づき、自転車レンタル詳細の履歴データセットを使用して、特定の日に予想される自転車レンタルの数を予測するモデルをトレーニングします。

データセットを作成する

Azure Machine Learning では、モデルのトレーニングやその他の操作用のデータは通常、"データセット" と呼ばれるオブジェクトにカプセル化されます。

  1. Web ブラウザーで、https://aka.ms/bike-rentals のコンマ区切りデータを表示します。

  2. Azure Machine Learning Studio で、[データセット] ページを表示します。 データセットは、Azure ML 内で使用する予定の特定のデータ ファイルまたはテーブルを表します。

  3. 次の設定を使用して、Web ファイル から新しいデータセットを作成します。

    • [基本情報]:
      • [Web URL]: https://aka.ms/bike-rentals
      • [名前]: bike-rentals
      • [データセットの種類]: 表形式
      • [説明]: 自転車レンタルのデータ
      • データ検証のスキップ: 選択しないでください
    • [Settings and preview](設定とプレビュー):
      • [ファイル形式]: 区切り記号付き
      • [区切り記号]: コンマ
      • [エンコード]: UTF-8
      • [列ヘッダー]: 最初のファイルにのみヘッダーを付ける
      • [行のスキップ]: なし
      • データセットに複数行のデータが含まれています: 選択しないでください
    • [スキーマ]:
      • [パス] 以外のすべての列を含める
      • 自動的に検出された型を確認する
    • [詳細の確認]:
      • 作成後にデータセットをプロファイリングしない
  4. データセットが作成されたら、それを開き、[探索] ページを表示して、データのサンプルを確認します。 このデータには、自転車レンタルに関する特徴量およびラベルの履歴が含まれています。

[引用]: このデータは Capital Bikeshare から派生し、発行データの ライセンス契約に従って使用されます。