Samouczek: importowanie notesów Jupyter z usługi GitHub do usługi Azure Cosmos DB for NoSQL (wersja zapoznawcza)

DOTYCZY: NoSQL

Ostrzeżenie

Funkcja notesów Jupyter Notebooks usługi Azure Cosmos DB zostanie wycofana 30 marca 2024 r. Nie będzie można używać wbudowanych notesów Jupyter z konta usługi Azure Cosmos DB. Zalecamy korzystanie z obsługi notesów Jupyter lub preferowanego klienta notesów programu Visual Studio Code.

W tym samouczku przedstawiono sposób importowania notesów Jupyter z repozytorium GitHub i uruchamiania ich na koncie usługi Azure Cosmos DB for NoSQL. Po zaimportowaniu notesów można uruchamiać, edytować je i utrwalać zmiany w tym samym repozytorium GitHub.

Wymagania wstępne

Tworzenie kopii repozytorium GitHub

  1. Przejdź do repozytorium szablonów azure-samples/cosmos-db-nosql-notebooks .

  2. Utwórz nową kopię repozytorium szablonów na własnym koncie lub organizacji usługi GitHub.

Ściąganie notesów z usługi GitHub

Zamiast tworzyć nowe notesy za każdym razem, gdy uruchamiasz obszar roboczy, możesz zaimportować istniejące notesy z usługi GitHub. W tej sekcji połączysz się z istniejącym repozytorium GitHub przy użyciu przykładowych notesów.

  1. Przejdź do konta usługi Azure Cosmos DB i otwórz Eksploratora danych.

  2. Wybierz pozycję Połączenie w witrynie GitHub.

    Screenshot of the Data Explorer with the 'Connect to GitHub' option highlighted.

  3. W oknie dialogowym Połączenie do usługi GitHub wybierz opcję dostępu odpowiednią dla repozytorium GitHub, a następnie wybierz pozycję Autoryzuj dostęp.

    Screenshot of the 'Connect to GitHub' dialog with options for various levels of access.

  4. Ukończ przepływ pracy autoryzacji innej firmy w usłudze GitHub, udzielając dostępu do organizacji[s] wymaganej do uzyskania dostępu do repozytorium GitHub. Aby uzyskać więcej informacji, zobacz Autoryzowanie aplikacji GitHub.

  5. W oknie dialogowym Zarządzanie ustawieniami usługi GitHub wybierz utworzone wcześniej repozytorium GitHub.

    Screenshot of the 'Manage GitHub settings' dialog with a list of unpinned and pinned repositories.

  6. Wróć do Eksploratora danych, znajdź nowe drzewo węzłów dla przypiętego repozytorium i otwórz plik website-metrics-python.ipynb .

    Screenshot of the pinned repositories in the Data Explorer.

  7. W edytorze notesu znajdź następującą komórkę.

    import pandas as pd
    pd.options.display.html.table_schema = True
    pd.options.display.max_rows = None
    
    df_cosmos.groupby("Item").size()
    
  8. Komórka zwraca obecnie liczbę unikatowych elementów. Zastąp ostatni wiersz komórki nowym wierszem, aby wyświetlić liczbę unikatowych akcji w zestawie danych.

    df_cosmos.groupby("Action").size()
    
  9. Uruchom wszystkie komórki sekwencyjnie, aby wyświetlić nowy zestaw danych. Nowy zestaw danych powinien zawierać tylko trzy potencjalne wartości dla kolumny Akcja . Opcjonalnie możesz wybrać wizualizację danych dla wyników.

    Screenshot of the Pandas dataframe visualization for the data.

Wypychanie zmian notesu w usłudze GitHub

Napiwek

Obecnie tymczasowe obszary robocze zostaną cokrotne, jeśli pozostaną bezczynne przez 20 minut. Maksymalna ilość czasu użycia na dzień wynosi 60 minut. Te limity mogą ulec zmianie w przyszłości.

Aby trwale zapisać swoją pracę, zapisz notesy z powrotem w repozytorium GitHub. W tej sekcji utrwałysz zmiany z tymczasowego obszaru roboczego do usługi GitHub jako nowe zatwierdzenie.

  1. Wybierz pozycję Zapisz , aby utworzyć zatwierdzenie zmiany w notesie.

    Screenshot of the 'Save' option in the Data Explorer menu.

  2. W oknie dialogowym Zapisywanie dodaj opisowy komunikat zatwierdzenia.

    Screenshot of the 'Save' dialog with an example of a commit message.

  3. Przejdź do repozytorium GitHub utworzonego przy użyciu przeglądarki. Nowe zatwierdzenie powinno być teraz widoczne w repozytorium online.

    Screenshot of the updated notebook on the GitHub website.

Następne kroki