Share via


Öğretici: Jupyter not defterlerini GitHub'dan NoSQL için Azure Cosmos DB'ye aktarma (önizleme)

UYGULANANLAR: NoSQL

Uyarı

Azure Cosmos DB'nin Jupyter Notebooks özelliği 30 Mart 2024'te kullanımdan kaldırılacak; Azure Cosmos DB hesabından yerleşik Jupyter not defterlerini kullanamazsınız. Visual Studio Code'un Jupyter not defterleri veya tercih ettiğiniz not defterleri istemcisi için desteğini kullanmanızı öneririz.

Bu öğreticide Jupyter not defterlerini GitHub deposundan içeri aktarma ve NoSQL için Azure Cosmos DB hesabında çalıştırma adımları gösterilmektedir. Not defterlerini içeri aktardıktan sonra bunları çalıştırabilir, düzenleyebilir ve değişikliklerinizi aynı GitHub deposunda kalıcı hale getirebilirsiniz.

Ön koşullar

GitHub deposunun kopyasını oluşturma

  1. azure-samples/cosmos-db-nosql-notebooks şablon deposuna gidin.

  2. Kendi GitHub hesabınızda veya kuruluşunuzda şablon deposunun yeni bir kopyasını oluşturun.

GitHub'dan not defterlerini çekme

Her çalışma alanını başlattığınızda yeni not defterleri oluşturmak yerine mevcut not defterlerini GitHub'dan içeri aktarabilirsiniz. Bu bölümde, örnek not defterleriyle mevcut bir GitHub deposuna bağlanacaksınız.

  1. Azure Cosmos DB hesabınıza gidin ve Veri Gezgini açın.

  2. GitHub'a Bağlan'ı seçin.

    Screenshot of the Data Explorer with the 'Connect to GitHub' option highlighted.

  3. GitHub'a Bağlan iletişim kutusunda GitHub deponuza uygun erişim seçeneğini belirleyin ve ardından Erişimi yetkile'yi seçin.

    Screenshot of the 'Connect to GitHub' dialog with options for various levels of access.

  4. GitHub deponuza erişmek için gereken kuruluşa[s] erişim veren GitHub üçüncü taraf yetkilendirme iş akışını tamamlayın. Daha fazla bilgi için bkz . GitHub Uygulamalarını Yetkilendirme.

  5. GitHub ayarlarını yönet iletişim kutusunda, daha önce oluşturduğunuz GitHub deposunu seçin.

    Screenshot of the 'Manage GitHub settings' dialog with a list of unpinned and pinned repositories.

  6. Veri Gezgini geri dönüp sabitlenmiş deponuz için yeni düğüm ağacını bulun ve website-metrics-python.ipynb dosyasını açın.

    Screenshot of the pinned repositories in the Data Explorer.

  7. Not defterinin düzenleyicisinde aşağıdaki hücreyi bulun.

    import pandas as pd
    pd.options.display.html.table_schema = True
    pd.options.display.max_rows = None
    
    df_cosmos.groupby("Item").size()
    
  8. Hücre şu anda benzersiz öğe sayısını verir. Veri kümesindeki benzersiz eylemlerin sayısını çıkarmak için hücrenin son satırını yeni bir satırla değiştirin.

    df_cosmos.groupby("Action").size()
    
  9. Yeni veri kümesini görmek için tüm hücreleri sıralı olarak çalıştırın. Yeni veri kümesi, Eylem sütunu için yalnızca üç olası değer içermelidir. İsteğe bağlı olarak, sonuçlar için bir veri görselleştirmesi seçebilirsiniz.

    Screenshot of the Pandas dataframe visualization for the data.

Not defteri değişikliklerini GitHub'a gönderme

Bahşiş

Şu anda, 20 dakika boşta bırakılırsa geçici çalışma alanları kaldırılacaktır. Günlük kullanım süresi üst sınırı 60 dakikadır. Bu sınırlar gelecekte değişebilir.

Çalışmanızı kalıcı olarak kaydetmek için not defterlerinizi GitHub deposuna geri kaydedin. Bu bölümde, geçici çalışma alanından GitHub'a yaptığınız değişiklikleri yeni bir işleme olarak kalıcı hale geçireceksiniz.

  1. Not defterindeki değişikliğiniz için bir işleme oluşturmak için Kaydet'i seçin.

    Screenshot of the 'Save' option in the Data Explorer menu.

  2. Kaydet iletişim kutusunda açıklayıcı bir işleme iletisi ekleyin.

    Screenshot of the 'Save' dialog with an example of a commit message.

  3. Tarayıcınızı kullanarak oluşturduğunuz GitHub deposuna gidin. Yeni işleme artık çevrimiçi depoda görünür olmalıdır.

    Screenshot of the updated notebook on the GitHub website.

Sonraki adımlar