Gyakorlat – Python-kódtárak és a rakétaindítási adatok importálása
Most már van egy célja: Valószínű, hogy a kilövés adott időjárási körülmények között történik? Rendelkezik egy olyan adatkészlettel, amely időjárási adatokat tartalmaz a következőből:
- Számos sikeres indítás
- Egy leküldéses indítási nap
- Az egyes indításokat megelőző és követő napok
Kezdődhet a kódolás!
Gépi tanulás kódokban
Gépi tanulási problémákat különféle eszközökkel és szolgáltatásokkal oldhat meg. Ezek az űrkutatás témájú képzési tervek a Visual Studio Code-ot, a Pythont, a scikit-learnt és az Azure-t használják.
Ebből a Microsoft-videóból megtudhatja, hogyan tölthet le és konfigurálhat egy ahhoz hasonló környezetet, amilyenre szüksége lesz.
Amikor a helyi programozási környezetet állítja be, célszerű létrehozni egy Anaconda-környezetet, amellyel gondoskodhat arról, hogy minden szükséges elemmel rendelkezik a projekthez. Használhatja az előnyben részesített módszert vagy eszközkészletet. A modulok többsége nem igényel kifejezetten Visual Studio Code-ot vagy Azure-t.
A helyi környezet beállítása
A továbblépés előtt győződjön meg arról, hogy rendelkezik az alábbiakkal:
- A Visual Studio Code, az Anaconda és a Python telepítve van. (Az Anaconda-környezetet az alábbi lépésekben fogjuk létrehozni).
- Az összes kód és adat tárolására létrehozott helyi mappa.
- A letöltött és a helyi mappába mentett adatok Excel-fájlja .
- Egy üres Jupyter-jegyzetfüzet a mappában. (A helyi mappában hozzon létre egy saját fájlnév.ipynb nevű próbabábufájlt).
A helyi környezet beállítása:
Nyissa meg az Anaconda parancssorát.
Az Anaconda parancssorban hozzon létre egy új Anaconda-környezetet a Pandas, a NumPy, a scikit-learn, a PyDotPlus és a Jupyter használatával:
conda create -n myenv python=3.8 pandas numpy jupyter seaborn scikit-learn pydotplus
Az Anaconda parancssorában aktiválja az új környezetet:
conda activate myenv
Az Anaconda parancssorában telepítse az AzureML-SDK-t:
pip install --upgrade azureml-sdk
Bizonyos esetekben a telepítés több percet is igénybe vehet. Hagyja feloldani, amíg meg nem teszi.
Az Anaconda parancssorban telepítsen egy Excel-olvasót (vegye figyelembe, hogy előfordulhat, hogy az xlrd nem működik a letöltött Excel-adatfájllal):
pip install openpyxl
A Visual Studio Code-ban nyissa meg a létrehozott helyi mappát az összes kód és adat tárolásához. Válassza ki a jobb felső Jupyter kernel Python-verzióját és a bal alsó Python-értelmezőt, és állítsa be mindkettőt az Anaconda-környezet használatára:
Kódtárak importálása
A Visual Studio Code helyi környezetének létrehozásával mostantól importálhatja a kódtárakat. Ezekkel könnyebben importálhatók és megtisztíthatók az időjárási adatok, valamint létrehozható és tesztelhető a gépi tanulási modell.
Másolja be egy cellába az alábbi kódot, majd futtassa le a kódtárak importálásához.
# Pandas library is used for handling tabular data
import pandas as pd
# NumPy is used for handling numerical series operations (addition, multiplication, and ...)
import numpy as np
# Sklearn library contains all the machine learning packages we need to digest and extract patterns from the data
from sklearn import linear_model, model_selection, metrics
from sklearn.model_selection import train_test_split
# Machine learning libraries used to build a decision tree
from sklearn.tree import DecisionTreeClassifier
from sklearn import tree
# Sklearn's preprocessing library is used for processing and cleaning the data
from sklearn import preprocessing
# for visualizing the tree
import pydotplus
from IPython.display import Image
Adatok beolvasása egy változóba
Most, hogy minden kódtárat importáltunk, a pandas-kódtárral importálhatjuk a saját adatokat. A pd.read_excel
paranccsal beolvashatja az adatokat, és elmentheti őket egy változóban. Ezután a .head()
függvény használatával nyomtassa ki az adatok első öt sorát, hogy minden helyesen legyen beolvasva.
launch_data = pd.read_excel('RocketLaunchDataCompleted.xlsx')
launch_data.head()
Az adatfeltárás megkezdése
Végül használhatjuk a függvényhívást az .columns
adatok összes oszlopának megtekintéséhez. Ennek során az adatok attribútumai láthatók. Láthat néhány gyakori attribútumot, például a kilövésre ütemezett múltbeli rakéták nevét, az ütemezett dátumokat, a tényleges indítást és egyebeket. Nézze meg ezeket az oszlopokat, és próbálja kitalálni, hogy melyik lesz a legnagyobb hatása annak meghatározásában, hogy egy rakéta fog-e elindulni.
launch_data.columns