Eksplorowanie danych dotyczących startów rakiet, aby uzyskać informacje

Ukończone

Modele uczenia maszynowego są trenowane przy użyciu wystarczająco dużej ilości danych, aby uniknąć pomyłek. Bez odpowiedniej ilości danych model uczenia maszynowego może być zbyt ogólny.

Jeśli na przykład wytrenujesz model uczenia maszynowego tylko przy użyciu danych o temperaturze, możesz nie odkryć, że opady są ważniejsze i nie zawsze skorelowane z niższą temperaturą na Florydzie (Stany Zjednoczone). Jeśli tak się stanie, model może wskazywać, że można bezpiecznie wystrzelić rakietę w dzień, który ma dobrą temperaturę, ale zbyt dużo opadów, co byłoby niebezpieczne.

Zbieranie danych

Pierwszym krokiem podczas tworzenia każdego rozwiązania z zakresu nauki o danych lub uczenia maszynowego jest zebranie i poznanie danych. Na potrzeby tej ścieżki szkoleniowej zebraliśmy publicznie dostępne dane pogodowe z NOAA i Weather Underground dla dat startów rakiet NASA, pobranych ze strony Wikipedii misji NASA. Następnie skompilowaliśmy te dane do pliku programu Excel.

Wybierz ten link do pliku programu Excel, aby pobrać plik. Użyjemy go do ćwiczeń w tym module.

Plik programu Excel zawiera dane pogodowe dla dni startów poszczególnych załogi i nieukręconych startów. Dodaliśmy również dane z dwóch dni wokół startów, aby sprawdzić, czy istnieją jakieś wzorce, które mogą być interesujące. Oto zrzut ekranu przedstawiający plik programu Excel.

Screenshot that shows Excel data.

Brakujące dane

Plik programu Excel zawiera rozbudowane dane na temat każdego startu. Jednak w miarę rozpoczynania eksplorowania tych danych może wystąpić znaczący problem. Tylko jeden wiersz reprezentuje start rakiety, który miał się zdarzyć, ale został wypchnięty z powodu problemów pogodowych:

Wiersz 294 — SpaceX Dragon — 27 maja 2020 r.

Lista każdego startu, który został podjęty, ale wypchnięty ze względu na pogodę nie jest tak łatwo odnajdywalna, jak lista pomyślnych startów. Daty, które zostały uznane, ale przeniesione przed ogłoszeniem oczekiwanej daty premiery, również nie są łatwe do odnalezienia.

Eksperci

45.Skrzydło kosmiczne sił powietrznych Stany Zjednoczone ma jedną misję: "Wykorzystanie pogody w celu zapewnienia bezpiecznego dostępu do powietrza i przestrzeni kosmicznej". W połączeniu z umysłami w NASA prawdopodobieństwo wybrania daty, która będzie mieć wpływ na obawy pogodowe, jest niewielka. Aby zapewnić najmniejszą liczbę zmian w harmonogramie startu, eksperci ds. pogody i lotów rozważają zmiany klimatu, wzorce pogodowe i istniejące dane.

Możesz zacząć samodzielnie badać ten problem, przechodząc do harmonogramu startów agencji NASA. Nawet bez uczenia maszynowego spójrz na przewidywane wzorce pogodowe w Cape Canaveral. Sprawdź, czy możesz określić, dlaczego określona data/godzina została wybrana w ciągu jednego tygodnia przed lub po nim.

Znajdowanie dodatkowych danych

Celem tej ścieżki szkoleniowej jest wprowadzenie Cię w ciekawy świat pogody i tego, jak wpływa ona na starty. Zachęcamy do odnajdywania dodatkowych danych w celu ulepszania modelu uczenia maszynowego. To część podróży związanej z nauką o danych.

Co myślisz, że można użyć do odkrycia startów, które zostały opóźnione z powodu pogody? W artykułach na temat bieżących wydarzeń? Archiwach?