Konfigurowanie laboratorium do uczenia języka R w systemie Linux

Uwaga

Ten artykuł odwołuje się do funkcji dostępnych w planach laboratorium, które zastąpiły konta laboratorium.

R to język open source używany do obliczeń statystycznych i grafiki. Jest on używany w analizie statystycznej genetyki do przetwarzania języka naturalnego w celu analizowania danych finansowych. Język R zapewnia interaktywne środowisko wiersza polecenia. RStudio to interaktywne środowisko projektowe (IDE) dostępne dla języka R. Bezpłatna wersja udostępnia narzędzia do edycji kodu, zintegrowane środowisko debugowania i narzędzia programistyczne pakietów.

Ten artykuł koncentruje się wyłącznie na RStudio i R jako bloku konstrukcyjnym dla klasy, która wymaga użycia obliczeń statystycznych. Typy klas uczenia głębokiego i języka Python i notesów Jupyter Notebooks konfigurują program RStudio inaczej. W każdym artykule opisano sposób używania obrazu platformy handlowej Nauka o danych Virtual Machine for Linux (Ubuntu), który zawiera wiele narzędzi związanych z nauką o danych, w tym RStudio, wstępnie zainstalowanych.

Konfiguracja laboratorium

Aby skonfigurować to laboratorium, potrzebujesz subskrypcji platformy Azure i planu laboratorium, aby rozpocząć pracę. Jeśli nie masz subskrypcji platformy Azure, przed rozpoczęciem utwórz bezpłatne konto.

Konfiguracja zasobów zewnętrznych

Niektóre klasy wymagają, aby pliki, takie jak duże pliki danych, przechowywane zewnętrznie. Aby uzyskać opcje i instrukcje dotyczące konfigurowania, zobacz Używanie zewnętrznego magazynu plików w usłudze Azure Lab Services .

Jeśli zdecydujesz się mieć udostępniony serwer R Server dla uczniów, przed utworzeniem laboratorium należy skonfigurować serwer. Aby uzyskać więcej informacji na temat konfigurowania serwera udostępnionego, zobacz jak utworzyć laboratorium z udostępnionym zasobem w usługach Azure Lab Services. Aby uzyskać instrukcje dotyczące tworzenia programu RStudio Server, zobacz Pobieranie programu RStudio Server dla systemu Debian & Ubuntu i uzyskiwanie dostępu do oprogramowania RStudio Server Open Source.

Jeśli zdecydujesz się korzystać z jakichkolwiek zasobów zewnętrznych, musisz Połączenie do sieci wirtualnej w usłudze Azure Lab Services przy użyciu planu laboratorium.

Ważne

Zaawansowana sieć musi być włączona podczas tworzenia planu laboratorium. Nie można go dodać później.

Ustawienia planu laboratorium

Po uzyskaniu subskrypcji platformy Azure możesz utworzyć nowy plan laboratorium w usłudze Azure Lab Services. Aby uzyskać więcej informacji na temat tworzenia nowego planu laboratorium, zobacz samouczek dotyczący konfigurowania planu laboratorium. Możesz również użyć istniejącego planu laboratorium.

Włącz ustawienia planu laboratorium zgodnie z opisem w poniższej tabeli. Aby uzyskać więcej informacji na temat włączania obrazów witryny Azure Marketplace, zobacz Określanie obrazów witryny Azure Marketplace dostępnych dla twórców laboratorium.

Ustawienie planu laboratorium Instrukcje
Obrazy z witryny Marketplace Włącz obraz systemu Ubuntu Server 18.04 LTS .

Ustawienia laboratorium

Aby uzyskać instrukcje dotyczące tworzenia laboratorium, zobacz Samouczek: konfigurowanie laboratorium. Podczas tworzenia laboratorium użyj następujących ustawień.

Ustawienie laboratorium Wartość i opis
Rozmiar maszyny wirtualnej Mały procesor GPU (obliczenia)
Obraz maszyny wirtualnej Ubuntu Server 18.04 LTS
Włączanie połączenia pulpitu zdalnego To ustawienie powinno być włączone, jeśli zdecydujesz się używać protokołu RDP. To ustawienie nie jest potrzebne, jeśli wybierzesz pozycję X2Go, aby nawiązać połączenie z maszynami laboratoryjnymi.

Jeśli zamiast tego zdecydujesz się używać protokołu RDP, musisz połączyć się z maszyną wirtualną z systemem Linux przy użyciu protokołu SSH i zainstalować pakiety RDP i GUI przed opublikowaniem laboratorium. Następnie uczniowie mogą połączyć się z maszyną wirtualną z systemem Linux przy użyciu protokołu RDP później. Aby uzyskać więcej informacji, zobacz Włączanie graficznego pulpitu zdalnego dla maszyn wirtualnych z systemem Linux.

Konfigurowanie szablonu

Po utworzeniu maszyny szablonu uruchom maszynę i połącz się z nią, aby zainstalować oprogramowanie R, RStudio Desktop i opcjonalnie X2Go Server.

Najpierw zaktualizujmy apt i uaktualnijmy istniejące pakiety na maszynie.

sudo apt update 
sudo apt upgrade

Instalowanie serwera X2Go

Jeśli zdecydujesz się korzystać z rozwiązania X2Go, zainstaluj serwer. Najpierw musisz Połączenie do maszyny wirtualnej laboratorium z systemem Linux przy użyciu protokołu SSH, aby zainstalować składnik serwera. Po zakończeniu pozostałej części konfiguracji można ukończyć po nawiązaniu połączenia przy użyciu klienta X2Go.

Domyślna instalacja narzędzia X2Go nie jest zgodna z programem RStudio. Aby obejść ten problem, zaktualizuj plik opcji x2goagent.

  1. Edytuj /etc/x2go/x2goagent.options plik. Nie zapomnij edytować pliku jako sudo.

    1. Usuń komentarz z wiersza, który stwierdza: X2GO_NXAGENT_DEFAULT_OPTIONS+=" -extension GLX"
    2. Oznacz jako komentarz wiersz, który stwierdza: X2GO_NXAGENT_DEFAULT_OPTIONS+=" -extension GLX"
  2. Uruchom ponownie serwer X2Go, aby były używane nowe opcje.

    sudo systemctl restart x2goserver
    

Alternatywnie możesz utworzyć wymagane biblioteki, postępując zgodnie z instrukcjami w temacie OBEJŚcie GLX dla rozwiązania X2Go.

Instalowanie języka R

Istnieje kilka sposobów instalowania języka R na maszynie wirtualnej. Język R jest instalowany z repozytorium kompleksowej sieci archiwum języka R (CRAN). Udostępnia najbardziej aktualne wersje języka R. Po dodaniu tego repozytorium do maszyny można zainstalować język R i wiele innych powiązanych pakietów.

Musimy dodać repozytorium CRAN. Polecenia są modyfikowane z instrukcji dostępnych w temacie Pakiety Ubuntu, aby uzyskać krótkie instrukcje języka R.

#download helper packages
sudo apt install --no-install-recommends software-properties-common dirmngr
# download and add the signing key (by Michael Rutter) for these repos
sudo wget -q "https://cloud.r-project.org/bin/linux/ubuntu/marutter_pubkey.asc" -O /etc/apt/trusted.gpg.d/cran_ubuntu_key.asc
#add repository
sudo add-apt-repository "deb https://cloud.r-project.org/bin/linux/ubuntu bionic-cran40/"

Teraz możemy zainstalować język R, uruchamiając następujące polecenie:

sudo apt install r-base

Instalowanie programu RStudio

Po zainstalowaniu języka R lokalnie możemy zainstalować środowisko IDE programu RStudio. Instalujemy bezpłatną wersję programu RStudio Desktop. Aby zapoznać się ze wszystkimi dostępnymi wersjami, zobacz Pliki do pobrania programu RStudio.

  1. Zaimportuj klucz podpisywania kodu dla programu RStudio.

    sudo gpg --keyserver keyserver.ubuntu.com  --recv-keys 3F32EE77E331692F
    
  2. Pobierz plik pakietu Debian Linux (.deb) dla programu R Studio dla systemu Ubuntu. Plik ma format rstudio-{version}-amd64.deb. Na przykład:

    export rstudiover="1.4.1717"
    wget --quiet -O rstudio.deb https://download1.rstudio.org/desktop/bionic/amd64/rstudio-$rstudiover-amd64.deb
    
  3. Zainstaluj program RStudio za pomocą narzędzia gdebi. Pamiętaj, aby użyć ścieżki pliku, aby wskazać, czy plik lokalny został zainstalowany.

    sudo apt install gdebi-core 
    echo "y" | gdebi rstudio.deb –quiet
    

Pakiety CRAN

Teraz nadszedł czas na zainstalowanie dowolnych pakietów CRAN. Najpierw dodaj bieżące repozytorium R 4.0 lub nowsze "c2d4u".

sudo add-apt-repository ppa:c2d4u.team/c2d4u4.0+

install.packages(“package name”) Użyj polecenia w interakcyjnej sesji języka R, jak pokazano na szybkiej liście przydatnych pakietów języka R. Alternatywnie użyj elementu menu Narzędzia —> zainstaluj pakiety w programie RStudio.

Jeśli potrzebujesz pomocy w znalezieniu pakietu, zobacz listę pakietów według zadań lub alfabetycznej listy pakietów.

Koszt

Omówimy przykładowy szacowany koszt dla tej klasy. Załóżmy, że masz klasę 25 uczniów. Każdy uczeń ma 20 godzin zaplanowanego czasu zajęć. Kolejne 10 godzin przydziału dla pracy domowej lub przydziałów poza zaplanowanym czasem zajęć jest przydzielane każdemu uczniowi. Wybrany rozmiar maszyny wirtualnej to Mały procesor GPU (obliczenia), czyli 139 jednostek laboratoryjnych.

25 studentów × (20 zaplanowanych godzin + 10 godzin przydziału) × 139 Lab Units × 0,01 USD za godzinę = 1042,5 USD

Ważne

Oszacowanie kosztów jest przeznaczone tylko do celów przykładowych. Aby uzyskać bieżące informacje o cenach, zobacz Cennik usług Azure Lab Services.

Następne kroki

Obraz szablonu można teraz opublikować w laboratorium. Aby uzyskać więcej informacji, zobacz Publikowanie maszyny wirtualnej szablonu.

Podczas konfigurowania laboratorium zapoznaj się z następującymi artykułami: