Samouczek: importowanie notesów Jupyter z usługi GitHub do usługi Azure Cosmos DB for NoSQL (wersja zapoznawcza)
DOTYCZY: NoSQL
Ostrzeżenie
Funkcja notesów Jupyter Notebooks usługi Azure Cosmos DB zostanie wycofana 30 marca 2024 r. Nie będzie można używać wbudowanych notesów Jupyter z konta usługi Azure Cosmos DB. Zalecamy korzystanie z obsługi notesów Jupyter lub preferowanego klienta notesów programu Visual Studio Code.
W tym samouczku przedstawiono sposób importowania notesów Jupyter z repozytorium GitHub i uruchamiania ich na koncie usługi Azure Cosmos DB for NoSQL. Po zaimportowaniu notesów można uruchamiać, edytować je i utrwalać zmiany w tym samym repozytorium GitHub.
Wymagania wstępne
- Istniejące konto usługi Azure Cosmos DB for NoSQL.
- Jeśli masz istniejącą subskrypcję platformy Azure, utwórz nowe konto.
- Brak subskrypcji platformy Azure? Możesz wypróbować usługę Azure Cosmos DB bezpłatnie bez konieczności korzystania z karty kredytowej.
Tworzenie kopii repozytorium GitHub
Przejdź do repozytorium szablonów azure-samples/cosmos-db-nosql-notebooks .
Utwórz nową kopię repozytorium szablonów na własnym koncie lub organizacji usługi GitHub.
Ściąganie notesów z usługi GitHub
Zamiast tworzyć nowe notesy za każdym razem, gdy uruchamiasz obszar roboczy, możesz zaimportować istniejące notesy z usługi GitHub. W tej sekcji połączysz się z istniejącym repozytorium GitHub przy użyciu przykładowych notesów.
Przejdź do konta usługi Azure Cosmos DB i otwórz Eksploratora danych.
Wybierz pozycję Połączenie w witrynie GitHub.
W oknie dialogowym Połączenie do usługi GitHub wybierz opcję dostępu odpowiednią dla repozytorium GitHub, a następnie wybierz pozycję Autoryzuj dostęp.
Ukończ przepływ pracy autoryzacji innej firmy w usłudze GitHub, udzielając dostępu do organizacji[s] wymaganej do uzyskania dostępu do repozytorium GitHub. Aby uzyskać więcej informacji, zobacz Autoryzowanie aplikacji GitHub.
W oknie dialogowym Zarządzanie ustawieniami usługi GitHub wybierz utworzone wcześniej repozytorium GitHub.
Wróć do Eksploratora danych, znajdź nowe drzewo węzłów dla przypiętego repozytorium i otwórz plik website-metrics-python.ipynb .
W edytorze notesu znajdź następującą komórkę.
import pandas as pd pd.options.display.html.table_schema = True pd.options.display.max_rows = None df_cosmos.groupby("Item").size()
Komórka zwraca obecnie liczbę unikatowych elementów. Zastąp ostatni wiersz komórki nowym wierszem, aby wyświetlić liczbę unikatowych akcji w zestawie danych.
df_cosmos.groupby("Action").size()
Uruchom wszystkie komórki sekwencyjnie, aby wyświetlić nowy zestaw danych. Nowy zestaw danych powinien zawierać tylko trzy potencjalne wartości dla kolumny Akcja . Opcjonalnie możesz wybrać wizualizację danych dla wyników.
Wypychanie zmian notesu w usłudze GitHub
Napiwek
Obecnie tymczasowe obszary robocze zostaną cokrotne, jeśli pozostaną bezczynne przez 20 minut. Maksymalna ilość czasu użycia na dzień wynosi 60 minut. Te limity mogą ulec zmianie w przyszłości.
Aby trwale zapisać swoją pracę, zapisz notesy z powrotem w repozytorium GitHub. W tej sekcji utrwałysz zmiany z tymczasowego obszaru roboczego do usługi GitHub jako nowe zatwierdzenie.
Wybierz pozycję Zapisz , aby utworzyć zatwierdzenie zmiany w notesie.
W oknie dialogowym Zapisywanie dodaj opisowy komunikat zatwierdzenia.
Przejdź do repozytorium GitHub utworzonego przy użyciu przeglądarki. Nowe zatwierdzenie powinno być teraz widoczne w repozytorium online.