Visual Studio용 R 도구 샘플 프로젝트R Tools for Visual Studio Sample Projects

이 샘플 컬렉션을 통해 R, RTVS(Visual Studio용 R 도구) 및 Microsoft R Server 사용을 시작할 수 있습니다.This collection of samples gets you started on R, R Tools for Visual Studio (RTVS), and Microsoft R Server:

  1. 샘플 zip 파일을 다운로드하고 선택한 폴더로 추출합니다.Download the samples zip file and extract to a folder of your choice.
  2. examples/Examples.sln를 열어 프로젝트의 두 폴더를 표시합니다.Open examples/Examples.sln to see two folders in the project:

    • R 개요에서는 R을 처음 사용하는 사람에게 적당한 소개를 제공합니다.A First Look at R gives a gentle introduction for newcomers to R.
    • MRS 및 Machine Learning에서는 기계 학습에 R 및 Microsoft R Server를 사용하는 방법의 예제를 제공합니다.MRS and Machine Learning gives examples of how to use R and Microsoft R Server for machine learning.

R 개요A First Look at R

이 샘플에서는 두 소스 파일에 있는 포괄적인 주석을 통해 R을 자세히 소개합니다.This sample provides an in-depth introduction to R through the extensive comments in two source files. 최상의 경험을 얻으려면 파일의 맨 위에 커서를 놓고 Ctrl+Enter를 눌러 코드를 한 줄씩 R 대화형 창으로 보냅니다.For the best experience, place the cursor at the top of the file and press Ctrl+Enter to send the code line-by-lie to the R Interactive window. 패키지를 설치하는 줄은 완료하는 데 1~2분이 걸릴 수 있습니다.(Lines that install packages might take a minute or two to complete.)

  • 1-Getting Started with R.R에서는 패키지 사용, 데이터 로드 및 분석, 그리기를 포함한 많은 R 기본 사항을 설명합니다.1-Getting Started with R.R covers many R fundamentals including using packages, loading and analyzing data, and plotting.

    1-Getting Started with R.R 샘플의 예제 출력

  • 2-Introduction to ggplot2.R에서는 눈에 띄는 플롯 및 간단한 구문용으로 알려진 ggplot2 그래픽 패키지를 소개합니다.2-Introduction to ggplot2.R introduces the ggplot2 graphic package known for its visually appealing plots and simple syntax. 이 예제에서는 Fiji의 지진 데이터를 시각화합니다.This example visualizes earthquake data from Fiji.

    2-Introduction to ggplot2.R 샘플의 예제 출력

Microsoft R Server 및 Machine LearningMicrosoft R Server and Machine Learning

이 예제 컬렉션에서는 R을 사용하여 기계 학습 모델을 만드는 방법과 MRS(Microsoft R Server)를 활용하는 방법을 보여 줍니다.This collection of examples shows how to use R to create machine learning models and to take advantage of Microsoft R Server (MRS). 제목에 MRS가 있는 스크립트를 명시된 위치에서 실행하려면 MRS를 설치합니다.Install MRS to run scripts with MRS in the title and where noted.

모든 예제와 마찬가지로 파일을 열고 맨 위에 커서를 놓은 다음 Ctrl+Enter를 사용하여 한 줄씩 단계별로 코드를 실행합니다.As with all examples, open the file, place the cursor at the top, and then step through the code line by line with Ctrl+Enter. 각 폴더의 markdown 파일에도 추가 정보가 포함되어 있습니다.The markdown files in each folder also contain additional details.

  • Benchmarks는 많은 집약적인 병렬 선형 대수 계산을 실행하여 Microsoft R Open 및 Intel MKL(Math Kernel Library) 사용을 통해 얻을 수 있는 성능 향상을 보여 줍니다.Benchmarks runs a number of intensive, parallel linear algebra computations to show the performance gains that are possible through the use of Microsoft R Open and the Intel Math Kernel Library (MKL). 시뮬레이션 데이터를 사용하여 벤치마크는 특히 한 스레드와 두 스레드의 행렬 계산을 비교합니다.With simulated data, the benchmarks specifically compare matrix calculations on one thread versus two.

    벤치마크 플롯 예제

  • Bike_Rental_Estimation_with_MRS에서는 Microsoft R Server를 사용하여 기록 데이터 집합을 기반으로 자전거 대여에 대한 수요 예측 모델을 만듭니다.Bike_Rental_Estimation_with_MRS creates a demand prediction model for bike rentals based on a historical data set, using Microsoft R Server.

  • Data_Exploration에는 다음 세 개의 스크립트가 포함됩니다.Data_Exploration contains three scripts:

    • Import Data from URL.R에서는 URL로 식별되는 데이터 파일을 R에 로드하는 방법을 보여 줍니다.Import Data from URL.R shows how to load a URL-identified data file into R.
    • Import Data from URL to xdf.R에서는 URL로 식별되는 데이터 파일을 Microsoft R Server에 xdf로 로드하는 방법을 보여 줍니다.Import Data from URL to xdf.R shows how to load a URL-identified data file into Microsoft R Server as an xdf. MRS가 필요합니다.(Requires MRS.)
    • Using ggplot2.R는 대화형 3차원 그리기를 포함하여 ggplot2 기능의 더 다양한 둘러보기를 제공하는 A First Look at R/2-Introduction to ggplot2.R 샘플의 확장입니다.Using ggplot2.R is an extension of the A First Look at R/2-Introduction to ggplot2.R sample, giving a more extensive tour of ggplot2's functionality including interactive 3D plotting.

      ggplot2.R 사용 예제 출력

  • Datasets에는 다른 샘플에서 사용되는 세 개의 .csv 파일이 포함됩니다.Datasets contains three .csv files used by other samples

  • Flight_Delays_Prediction_with_RFlight_Delays_Prediction_with_MRS는 R, 기계 학습 및 기록 정시 성능/날씨 데이터를 사용하여 항공 지연을 예측하는 방법을 보여 줍니다.Flight_Delays_Prediction_with_R and Flight_Delays_Prediction_with_MRS shows how to predict flight delays using R, machine learning, and historical on-time performance and weather data.
  • Machine learning에는 항공 지연, 주택 가격 및 자전거 임대를 예측하기 위한 세 가지 학습용 샘플이 포함되어 있습니다.Machine learning contains three samples for learning to predict flight delays, housing prices, and bike rentals. 세 샘플은 모두, 실제 문제에 대한 R과 MRS의 응용 프로그램을 보여 줍니다.Together, these samples demonstrate the application of R and MRS to real-world problems. 이러한 항목은 여러 가지 인기 있는 기계 학습 모델을 사용하고 Azure Machine Learning 작업 영역을 통해 Azure 웹 서비스로 배포하는 방법을 보여 줍니다.They also show you how to use several popular machine learning models and deploy them as an Azure Web Service using an Azure Machine Learning workspace.

  • R_MRO_MRS_Comparison은 R, Microsoft R Open 및 Microsoft R Server의 명령, 구문, 생성 및 성능에 대한 유사점과 차이점을 보여 주는 6개 부분 비교입니다.R_MRO_MRS_Comparison is a six-part comparison that shows the similarities and differences of R, Microsoft R Open and Microsoft R Server with commands, syntax, constructs, and performance.

Microsoft R Open 및 Microsoft R Server가 특별한 점은 무엇인가요?What's special about Microsoft R Open and Microsoft R Server?

Microsoft의 R 배포인 Microsoft R OpenCRAN R와 다음과 같은 중요한 두 가지가 다릅니다.Microsoft R Open, Microsoft's distribution of R, is different from CRAN R in two important ways:

  1. Intel Math Kernel Library와 함께 사용될 경우 계산 성능 향상.Better computation performance when used with the Intel Math Kernel Libraries. 라이브러리는 Microsoft R Open과 함께 사용하도록 Microsoft에서 무료 다운로드로 제공됩니다.The libraries are available as a free download from Microsoft for use with Microsoft R Open.

  2. 재현 가능한 R 도구 키트는 R 프로그램을 빌드하는 데 사용한 라이브러리가 작업을 재현할 다른 사용자에게 항상 제공되도록 합니다.Reproducible R Toolkit ensures that the libraries you used to build your R program are always available to others that want to reproduce your work.

Microsoft R Server는 추가 데이터를 더 빠르게 처리할 수 있도록 하는 R의 확장입니다.Microsoft R Server is an extension of R that allows you to handle more data and handle it faster. 이 확장은 R에 두 가지 강력한 기능을 제공합니다.It gives R two powerful capabilities:

  1. RAM 제한이 없는 더 큰 데이터 집합.Larger data sets without RAM limitations. MRS는 Hadoop 클러스터, 데이터베이스 및 데이터 웨어하우스를 포함한 다양한 소스의 메모리 부족 데이터를 처리할 수 있습니다.MRS can process out-of-memory data from a variety of sources including Hadoop clusters, databases, and data warehouses.

  2. 병렬, 다중 코어 처리.Parallel, multi-core processing. MRS는 사용 가능한 모든 계산 리소스에 걸쳐 계산을 효율적으로 분배할 수 있습니다.MRS can efficiently distribute computation across all the computational resources it has available. 개인 워크스테이션 또는 원격 클러스터에서 MRS는 더 빠르게 답변을 얻습니다.On your personal workstation or a remote cluster, MRS gets an answer faster.

다음 비교는 MKL이 있는 MRS 및 MRO의 특정 매트릭스 계산에 관련된 계산 성능이 MKL이 없는 R 및 MRO보다 크게 향상됨을 보여 줍니다.The following comparison shows that MRS and MRO with MKL have significantly better computation performance related to certain matrix calculation than R and MRO without MKL. 시뮬레이트된 데이터는 다음 계산에서 사용됩니다.Simulated data is used in this calculation:

MKL이 있는 MRS/MRO 및 MKL이 없는 R/MRO 비교

R과 MRO/MRS의 기술적인 비교를 위해 항목에서 Lixun Zhang의 자세한 설명을 확인하세요.For a technical comparison of R with MRO and MRS, check out Lixun Zhang's detailed discussion on the topic.

다음 그림은 15분 이상의 항공 지연을 예측하는 로지스틱 회귀 모델을 작성하는 데 사용되는 경과된 시간(초)을 비교합니다.The following figure then compares elapsed time in seconds used in building Logistic Regression models to predict flight delays greater than 15 minutes. 적은 수의 행을 늘릴 때 CRAN R에 사용되는 경과된 시간은 대폭 증가하지만 MRS는 2배 정도씩만 증가합니다.Elapsed time used in CRAN R increases dramatically when increasing a small number of rows, while MRS increases only by approximately two times. 이 벤치마크에 대한 자세한 내용은 Benchmarks/rxGlm_benchmark.R 예제를 참조하세요.For details of this benchmark, check out the Benchmarks/rxGlm_benchmark.R example.

rxGlm 벤치마크