Share via


빠른 시작: Linux(Ubuntu)용 Data Science Virtual Machine 설정

Ubuntu 20.04 DSVM(Data Science Virtual Machine) 및 PyTorch용 Azure DSVM을 사용하여 시작하고 실행합니다.

필수 조건

Ubuntu 20.04 Data Science Virtual Machine 또는 PyTorch용 Azure DSVM을 만들려면 Azure 구독이 필요합니다. Azure 평가판 체험하기.

Azure 체험 계정은 GPU 지원 VM(가상 머신) SKU를 지원하지 않습니다.

Linux용 데이터 과학 Virtual Machine 만들기

Ubuntu 20.04 DSVM 또는 PyTorch용 Azure DSVM의 인스턴스를 만들려면 다음을 수행합니다.

  1. Azure Portal로 이동합니다. 아직 로그인하지 않은 경우 Azure 계정에 로그인하라는 메시지가 표시될 수 있습니다.

  2. 데이터 과학 가상 머신을 입력하여 VM 목록을 찾습니다. 그런 다음, Data Science Virtual Machine- Ubuntu 20.04 또는 PyTorch용 Azure DSVM을 선택합니다.

  3. 만들기를 실행합니다.

  4. 가상 머신 만들기 창에서 기본 사항 탭을 채웁니다.

    • 구독: 둘 이상의 구독을 보유한 경우, 컴퓨터를 만들고 요금을 청구할 구독 하나를 선택합니다. 이 구독에 대한 리소스 만들기 권한이 있어야 합니다.

    • 리소스 그룹: 새 그룹을 만들거나 기존 그룹을 사용합니다.

    • 가상 머신 이름: VM의 이름을 입력합니다. 이 이름은 Azure Portal에서 사용됩니다.

    • 지역: 가장 적절한 데이터 센터를 선택합니다. 가장 빠른 네트워크 액세스의 경우 대부분의 데이터를 호스팅하거나 실제 위치에 가장 가까운 데이터 센터가 가장 적합합니다. 자세한 내용은 Azure 지역을 참조하세요.

    • 이미지: 기본값을 변경하지 마세요.

    • 크기: 이 옵션은 일반 워크로드에 적합한 크기로 자동 채워집니다. 자세한 내용은 Azure의 Linux VM 크기를 참조하세요.

    • 인증 유형: 더 빠른 설정을 위해 암호를 선택합니다.

      참고 항목

      JupyterHub를 사용하려는 경우 JupyterHub가 SSH(Secure Shell) 프로토콜 공개 키를 사용하도록 구성되지 않았으므로 암호를 선택해야 합니다.

    • 사용자 이름: 관리자 사용자 이름을 입력합니다. 이 사용자 이름을 사용하여 VM에 로그인합니다. Azure 사용자 이름과 일치할 필요는 없습니다. 대문자를 사용하지 마세요.

      Important

      사용자 이름에 대문자를 사용하면 JupyterHub가 작동하지 않으며 500 내부 서버 오류가 발생합니다.

    • 암호: VM에 로그인하는 데 사용할 암호를 입력합니다.

  5. 검토 + 만들기를 선택합니다.

  6. 검토 + 만들기 창에서 다음을 수행합니다.

    • 입력한 모든 정보가 올바른지 확인합니다.
    • 만들기를 실행합니다.

    프로비전 프로세스는 약 5분이 걸립니다. Azure Portal에서 VM의 상태를 볼 수 있습니다.

Ubuntu Data Science Virtual Machine에 액세스

다음 네 가지 방법 중 하나로 Ubuntu DSVM에 액세스할 수 있습니다.

  • 터미널 세션에 대한 SSH
  • 그래픽 세션에 대한 xrdp
  • 그래픽 세션에 대한 X2Go
  • Jupyter Notebook용 JupyterHub 및 JupyterLab

SSH

SSH 인증을 사용하여 VM을 구성한 경우 텍스트 셸 인터페이스에 대해 4단계의 기본 사항 섹션에서 만든 계정 자격 증명을 사용하여 로그인할 수 있습니다. 자세한 내용은 Linux VM에 연결하는 방법에 대해 자세히 알아보기를 참조하세요.

xrdp

Linux 그래픽 세션에 액세스하기 위한 표준 도구는 xrdp입니다. 배포에는 기본적으로 이 도구가 포함되지 않지만 이러한 지침에서는 설치 방법을 설명합니다.

X2Go

참고 항목

테스트 결과 X2Go 클라이언트의 성능이 X11 전달보다 더 우수했습니다. 그래픽 데스크톱 인터페이스에서는 X2Go 클라이언트를 사용하는 것이 좋습니다.

X2Go 서버를 사용해 Linux VM이 이미 프로비저닝되었으며 클라이언트 연결을 수락할 준비가 되었습니다. Linux VM 그래픽 데스크톱에 연결하려면 클라이언트에서 다음 절차를 완료합니다.

  1. 사용 중인 클라이언트 플랫폼용 X2Go 클라이언트를 X2Go에서 다운로드하여 설치합니다.

  2. VM의 공용 IP 주소를 적어둡니다. Azure Portal에서 사용자가 만든 VM을 열어 이 정보를 찾습니다.

    VM의 공용 IP 주소를 보여 주는 스크린샷.

  3. X2Go Client를 실행합니다. 새 세션 창이 자동으로 팝업되지 않으면 세션>새 세션을 선택합니다.

  4. 결과 구성 창에서 다음 구성 매개 변수를 입력합니다.

    • 세션:
      • Host: 앞에서 기록해 둔 VM의 IP 주소를 입력합니다.
      • 로그인: Linux VM에서 사용자 이름을 입력합니다.
      • SSH 포트: 기본값 22를 그대로 사용합니다.
      • 세션 유형: 값을 XFCE로 변경합니다. 현재 Linux VM은 XFCE 데스크톱만 지원합니다.
    • 미디어: 사운드 지원 및 클라이언트 인쇄를 사용하지 않으려면 해제할 수 있습니다.
    • 공유 폴더: 이 탭을 사용하여 VM에 탑재하려는 클라이언트 컴퓨터 디렉터리를 추가합니다.

    새 X2Go 세션에 대한 기본 설정을 보여 주는 스크린샷.

  5. 확인을 선택합니다.

  6. X2Go 창의 오른쪽 창에 있는 상자를 선택하여 VM의 로그인 창을 표시합니다.

  7. VM의 암호를 입력합니다.

  8. 확인을 선택합니다.

  9. 연결 프로세스를 완료하려면 방화벽을 우회할 수 있는 X2Go 권한을 부여해야 할 수 있습니다.

  10. 이제 Ubuntu DSVM의 그래픽 인터페이스가 표시됩니다.

JupyterHub 및 JupyterLab

Ubuntu DSVM은 다중 사용자 Jupyter 서버인 JupyterHub를 실행합니다. 연결하려면 다음 단계를 따릅니다.

  1. VM의 공용 IP 주소를 확인합니다. 이 값을 찾으려면 다음 스크린샷과 같이 Azure Portal에서 VM을 검색하고 선택합니다.

    VM의 공용 IP 주소를 보여 주는 스크린샷.

  2. 로컬 컴퓨터에서 웹 브라우저를 열고 https://your-vm-ip:8000로 이동합니다. your-vm-ip를 앞서 기록해 둔 IP 주소로 바꿉니다.

  3. 브라우저에서 창을 직접 열지 못할 수 있습니다. 인증서 오류가 있음을 알 수 있습니다. DSVM은 자체 서명된 인증서를 사용하여 보안을 제공합니다. 대부분의 브라우저는 이 경고 후에 선택할 수 있습니다. 대부분의 브라우저는 웹 세션 전체에서 인증서에 대한 일종의 시각적 경고를 계속 제공합니다.

    브라우저에 ERR_EMPTY_RESPONSE 오류 메시지가 표시되면 HTTPS 프로토콜을 명시적으로 사용하여 컴퓨터에 액세스해야 합니다. 이 단계에서는 HTTP나 웹 주소만으로는 작동하지 않습니다. 주소 줄에 https://가 없는 웹 주소를 입력하면 대부분의 브라우저는 기본적으로 http로 설정되며 이 오류가 표시됩니다.

  4. 이 스크린샷과 같이 VM을 만드는 데 사용한 사용자 이름 및 암호를 입력하고 로그인합니다.

    JupyterHub 로그인 창을 보여 주는 스크린샷.

    이 단계에서 500 오류가 발생하면 사용자 이름에 대문자를 사용했을 것입니다. 이 문제는 JupyterHub와 사용하는 PAM 인증자 간의 알려진 상호 작용입니다.

    "이 페이지에 연결할 수 없습니다"라는 오류가 표시되면 NSG(네트워크 보안 그룹) 권한을 조정해야 할 수 있습니다. Azure Portal에서 리소스 그룹 내의 NSG 리소스를 찾습니다. 공용 인터넷에서 JupyterHub에 액세스하려면 포트 8000이 열려 있어야 합니다. (이미지는 이 VM이 Just-In-Time 액세스용으로 구성되어 있음을 보여주며, 매우 권장됩니다. 자세한 내용은 Just-In-Time 액세스를 사용하여 관리 포트 보호를 참조하세요.)

    NSG 구성 값을 보여 주는 스크린샷.

  5. 사용 가능한 샘플 Notebook을 찾아봅니다.

Jupyter 노트북의 차세대 JupyterLab 및 JupyterHub도 제공됩니다. 액세스하려면 JupyterHub에 로그인합니다. 그런 다음, URL https://your-vm-ip:8000/user/your-username/lab으로 이동합니다. your-username을 VM을 구성할 때 선택한 사용자 이름으로 바꿉니다. 다시 말하지만, 잠재적인 인증서 오류는 처음에 사이트에 액세스하지 못하도록 차단할 수 있습니다.

JupyterLab을 기본 노트북 서버로 설정하려면 다음 줄을 /etc/jupyterhub/jupyterhub_config.py에 추가합니다.

c.Spawner.default_url = '/lab'

다음 단계

  • Linux용 Data Science Virtual Machine의 데이터 과학 연습을 참조해 여기서 프로비저닝된 Linux DSVM을 사용하여 몇 가지 일반적인 데이터 과학 작업을 수행하는 방법을 알아봅니다.
  • 이 문서에서 설명하는 도구를 사용하여 DSVM의 다양한 데이터 과학 도구를 살펴보세요. VM 내의 셸에서 dsvm-more-info를 실행하여 VM에 설치된 도구에 대한 기본 소개 및 자세한 정보에 대한 포인터를 확인할 수도 있습니다.
  • 팀 데이터 과학 프로세스를 사용하여 분석 솔루션을 체계적으로 빌드하는 방법을 알아봅니다.
  • Azure AI 서비스를 사용하는 기계 학습 및 데이터 분석 샘플은 Azure AI Gallery를 참조하세요.
  • 이 VM에 적합한 참조 설명서를 참조하세요.