你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

在 Windows 上设置实验室来讲授 R

注意

本文参考了自 2022 年 4 月更新(预览版)以来发布的功能,其中的实验室计划取代了实验室帐户。 有关详细信息,请参阅 2022 年 4 月更新(预览版)中的新增功能

R 是一种用于统计计算和图形的开源语言。 它被运用于遗传学统计分析、自然语言处理和金融数据数据分析等领域。 R 提供了一种交互式命令行体验。 RStudio 是可用于 R 语言的交互式开发环境 (IDE)。 免费版提供代码编辑工具、集成调试体验和包开发工具。

本文仅重点介绍 RStudio 和 R,两者是需要使用统计计算的课程的基础。 深度学习以及 Python 和 Jupyter Notebook 课程类型通过不同的方式设置 RStudio。 每篇文章都介绍了如何使用适用于 Linux (Ubuntu) 的 Data Science Virtual Machine 市场映像,该映像预先安装了许多与数据科学相关的工具,包括 RStudio。

实验室配置

若要设置此实验室,需要有 Azure 订阅和实验室计划才能开始。 如果没有 Azure 订阅,请在开始之前创建一个免费帐户

外部资源配置

某些课程需要将文件(例如大型数据文件)存储在外部。 有关选项和设置说明,请参阅在 Azure 实验室服务中使用外部文件存储

如果选择让学生拥有共享 R Server,则应在创建实验室之前设置服务器。 若要详细了解如何设置共享服务器,请参阅如何在 Azure 实验室服务中创建具有共享资源的实验室。 有关创建 RStudio 服务器的说明,请参阅下载适用于 Debian 和 Ubuntu 的 RStudio 服务器访问 RStudio 服务器开源代码

如果选择使用任何外部资源,则需要使用实验室计划连接 Azure 实验室服务中的虚拟网络

重要

必须在创建实验室计划期间启用高级网络。 以后无法添加它。

实验室计划设置

在获取 Azure 订阅后,就可以在 Azure 实验室服务中创建新的实验室计划。 若要详细了解如何新建实验室计划,请参阅有关如何设置实验室计划的教程。 也可以使用现有实验室计划。

实验室设置

有关如何创建实验室的说明,请参阅教程:设置实验室。 创建实验室时,请使用以下设置。

实验室设置 值和描述
虚拟机大小 小型 GPU (计算)
VM 映像 Windows 10 专业版 版本 2004

模板配置

在创建模板计算机后,启动并连接到该计算机,以安装 RRStudio Desktop

安装 R

  1. 下载适用于 Windows 的 R 的最新安装程序。 有关可用版本的完整列表,请参阅适用于 Windows 的 R 下载页面
  2. 运行安装程序。
    1. 对于“选择设置语言”提示,选择所需的语言,然后选择“确定”
    2. 在安装程序的“信息”页上,阅读许可协议。 选择“下一步”,接受协议并继续。
    3. 在“选择目标位置”页面上,接受默认安装位置,然后选择“下一步” 。
    4. 在“选择组件”页面上,选择性地取消选中“32 位文件”选项 。 有关同时运行 32 位和 62 位版本的 R 的详细信息,请参阅可以将 32 位和 64 位的 R 安装在同一台计算机上吗?常见问题解答。
    5. 在“启动选项”页面上,将启动选项设置为“否(接受默认值)” 。 如果希望 R 图形用户界面 (GUI) 使用单独的窗口 (SDI) 或纯文本帮助,请选择“是(自定义启动)”单选按钮,并将以下启动选项更改为向导页面。
    6. 在“选择开始菜单文件夹”页上,选择“下一步”。
    7. 在“选择其他任务”页面上,选择“创建桌面快捷方式”(可选) 。 选择“下一页”。
    8. 在“正在安装”页上,等待安装完成。
    9. 在“完成适用于 Windows 的 R”页面上,选择“完成” 。

也可使用 PowerShell 来安装 R。 此代码示例显示如何在没有 32 位组件的情况下安装 R 并为最新版本的 R 添加桌面图标。若要查看安装程序命令行选项的完整列表,请参阅设置命令行参数

#Avoid prompt to setup Internet Explorer if we must parse download page
Set-ItemProperty -Path "HKLM:\SOFTWARE\Microsoft\Internet Explorer\Main" -Name "DisableFirstRunCustomize" -Value 2

$outputfile = "R-win.exe"

$result = Invoke-WebRequest "https://cran.r-project.org/bin/windows/base/release.html" -OutFile $outputfile -PassThru

#Check if we need to parse the result ourselves, to find the latest version of R
if ($result.StatusCode -eq '200' -and $result.Headers["Content-Type"] -eq 'text/html')
{
    $metaTag = $result.ParsedHtml.Head.children | Where-Object {$_.nodeName -eq 'META'}
    if ($metaTag.content  -match "R-\d+\.\d+\.\d+-win.exe"){
        $outputfile = $Matches.0

        #Download latest version
        Invoke-WebRequest "https://cran.r-project.org/bin/windows/base/$outputfile" -OutFile $outputfile
    }else{
        Write-Error "Unable to find latest version of R installer.  Go to https://cran.r-project.org/bin/windows/base/release.html to download manually."
    }
}

#Install Silently
$installPath = Get-Item -Path $outputfile
Start-Process -FilePath $installPath.FullName -ArgumentList "/VERYSILENT /LOG=r-install.log /NORESTART /COMPONENTS=""main,x64,translations"" /MERGETASKS=""desktopicon"" /LANG=""en""" -NoNewWindow -Wait

安装 RStudio

现在已在本地安装 R,接下来可以安装 RStudio IDE。 我们将安装免费版本的 RStudio Desktop。 有关所有可用版本,请参阅 RStudio 下载

  1. 下载适用于 Windows 10 的 R Studio 安装程序。 安装程序文件的格式为 rstudio-{version}.exe
  2. 运行 RStudio 安装程序。
    1. 在“RStudio 设置”向导的“欢迎使用 RStudio 设置”页面上,选择“下一步” 。
    2. 在“选择安装位置”页面上,选择“下一步” 。
    3. 在“选择开始菜单文件夹”页面上,选择“安装” 。
    4. 在“正在安装”页上,等待安装完成。
    5. 在“完成 RStudio 设置”页面上,选择“完成” 。

若要使用 PowerShell 执行 RStudio 安装步骤,请运行以下命令。 在执行命令之前,请参阅 RStudio 下载以验证 RStudio 版本是否可用。

$rstudiover="1.4.1717"
$outputfile = "RStudio-$rstudiover.exe"

#Download installer executable
Invoke-WebRequest "https://download1.rstudio.org/desktop/windows/RStudio-$rstudiover.exe" -OutFile $outputfile

#Install RStudio silently
$installPath = Get-Item -Path $outputfile
Start-Process -FilePath $installPath.FullName -ArgumentList "/S" -NoNewWindow -Wait

CRAN 包

在 R 交互式会话中使用 install.packages(“package name”) 命令,如有用的 R 包快速列表一文中所示。 也可使用 RStudio 中的“工具”->“安装包”菜单项。

如果在查找包时需要帮助,请参阅按任务列出的包列表按字母顺序排列的包列表

成本

接下来介绍此课程的示例成本估算。 假设你的班上有 25 名学生。 每名学生都有 20 小时的计划课程时间。 除计划的课堂时间外,每名学生还有另外 10 小时的配额,用于完成家庭作业或分配给他们的任务。 我们选择的虚拟机大小是“小型 GPU (计算)”,即 139 个实验室单位。

25 名学生 ×(20 个计划小时 + 10 个配额小时)× 139 个实验室单位 × 0.01 美元/小时 = 1042.5 美元

重要

成本估算仅用于示例。 有关最新定价信息,请参阅 Azure 实验室服务定价

后续步骤

现在可以将模板映像发布到实验室。 有关详细信息,请参阅发布模板 VM

设置实验室时,请参阅以下文章: