Gyakorlat – Python-kódtárak és a rakétaindítási adatok importálása

Befejeződött

Most már van egy célja: Valószínű, hogy a kilövés adott időjárási körülmények között történik? Rendelkezik egy olyan adatkészlettel, amely időjárási adatokat tartalmaz a következőből:

  • Számos sikeres indítás
  • Egy leküldéses indítási nap
  • Az egyes indításokat megelőző és követő napok

Kezdődhet a kódolás!

Gépi tanulás kódokban

Gépi tanulási problémákat különféle eszközökkel és szolgáltatásokkal oldhat meg. Ezek az űrkutatás témájú képzési tervek a Visual Studio Code-ot, a Pythont, a scikit-learnt és az Azure-t használják.

Ebből a Microsoft-videóból megtudhatja, hogyan tölthet le és konfigurálhat egy ahhoz hasonló környezetet, amilyenre szüksége lesz.

Amikor a helyi programozási környezetet állítja be, célszerű létrehozni egy Anaconda-környezetet, amellyel gondoskodhat arról, hogy minden szükséges elemmel rendelkezik a projekthez. Használhatja az előnyben részesített módszert vagy eszközkészletet. A modulok többsége nem igényel kifejezetten Visual Studio Code-ot vagy Azure-t.

A helyi környezet beállítása

A továbblépés előtt győződjön meg arról, hogy rendelkezik az alábbiakkal:

A helyi környezet beállítása:

  1. Nyissa meg az Anaconda parancssorát.

    Screenshot that shows the Anaconda prompt.

  2. Az Anaconda parancssorban hozzon létre egy új Anaconda-környezetet a Pandas, a NumPy, a scikit-learn, a PyDotPlus és a Jupyter használatával:

    conda create -n myenv python=3.8 pandas numpy jupyter seaborn scikit-learn pydotplus
    
  3. Az Anaconda parancssorában aktiválja az új környezetet:

    conda activate myenv
    
  4. Az Anaconda parancssorában telepítse az AzureML-SDK-t:

    pip install --upgrade azureml-sdk
    

    Bizonyos esetekben a telepítés több percet is igénybe vehet. Hagyja feloldani, amíg meg nem teszi.

  5. Az Anaconda parancssorban telepítsen egy Excel-olvasót (vegye figyelembe, hogy előfordulhat, hogy az xlrd nem működik a letöltött Excel-adatfájllal):

    pip install openpyxl
    
  6. A Visual Studio Code-ban nyissa meg a létrehozott helyi mappát az összes kód és adat tárolásához. Válassza ki a jobb felső Jupyter kernel Python-verzióját és a bal alsó Python-értelmezőt, és állítsa be mindkettőt az Anaconda-környezet használatára:

    Screenshot that shows Visual Studio Code with the Anaconda environment.

Kódtárak importálása

A Visual Studio Code helyi környezetének létrehozásával mostantól importálhatja a kódtárakat. Ezekkel könnyebben importálhatók és megtisztíthatók az időjárási adatok, valamint létrehozható és tesztelhető a gépi tanulási modell.

Másolja be egy cellába az alábbi kódot, majd futtassa le a kódtárak importálásához.

# Pandas library is used for handling tabular data
import pandas as pd

# NumPy is used for handling numerical series operations (addition, multiplication, and ...)

import numpy as np
# Sklearn library contains all the machine learning packages we need to digest and extract patterns from the data
from sklearn import linear_model, model_selection, metrics
from sklearn.model_selection import train_test_split

# Machine learning libraries used to build a decision tree
from sklearn.tree import DecisionTreeClassifier
from sklearn import tree

# Sklearn's preprocessing library is used for processing and cleaning the data 
from sklearn import preprocessing

# for visualizing the tree
import pydotplus
from IPython.display import Image 

Adatok beolvasása egy változóba

Most, hogy minden kódtárat importáltunk, a pandas-kódtárral importálhatjuk a saját adatokat. A pd.read_excel paranccsal beolvashatja az adatokat, és elmentheti őket egy változóban. Ezután a .head() függvény használatával nyomtassa ki az adatok első öt sorát, hogy minden helyesen legyen beolvasva.

launch_data = pd.read_excel('RocketLaunchDataCompleted.xlsx')
launch_data.head()

Az adatfeltárás megkezdése

Végül használhatjuk a függvényhívást az .columns adatok összes oszlopának megtekintéséhez. Ennek során az adatok attribútumai láthatók. Láthat néhány gyakori attribútumot, például a kilövésre ütemezett múltbeli rakéták nevét, az ütemezett dátumokat, a tényleges indítást és egyebeket. Nézze meg ezeket az oszlopokat, és próbálja kitalálni, hogy melyik lesz a legnagyobb hatása annak meghatározásában, hogy egy rakéta fog-e elindulni.

launch_data.columns