Power BI Desktop을 사용하여 웹 페이지 데이터 분석(자습서)Analyzing Web page data using Power BI Desktop (tutorial)

이 자습서에서는 웹 페이지에서 데이터 테이블을 가져오고 이 데이터를 시각화하는 보고서를 만드는 방법을 배웁니다.In this tutorial, you learn how to import a table of data from a Web page and create a report to visualize this data. 이 프로세스의 일부로, 웹 페이지에서 사용할 수 있는 표를 탐색하고 데이터 변환 단계를 적용하여 표를 새 모양으로 변경합니다.As part of this process, you navigate across tables available on a web page, and apply data transformation steps to bring the table into a new shape.

이 문서의 내용In this article:

  • 작업 1: 웹 데이터 원본에 연결Task 1: Connect to a web data source
  • 작업 2: 쿼리 뷰에서 데이터 셰이핑Task 2: Shape data in the Query view
    • 1단계: 다른 열을 제거하여 관심 있는 열만 표시Step 1: Remove Other Columns to only display columns of interest
    • 2단계: 값을 바꿔 선택한 열의 값 정리Step 2: Replace Values to clean up values in a selected column
    • 3단계: 열의 값 필터링Step 3: Filter values in a column
    • 4단계: 열 이름 바꾸기Step 4: Rename a column
    • 5단계: 열의 null 값 필터링Step 5: Filter null values in a column
    • 6단계: 쿼리 이름 바꾸기Step 6: Rename a query
    • 생성되는 쿼리 단계Query Steps created
  • 작업 3: 보고서 뷰를 사용하여 시각화 만들기Task 3: Create visualizations using the Report view
    • 1단계: 보고서에 쿼리 로드Step 1: Load the query to your report
    • 2단계: 맵 시각화 만들기Step 2: Create a Map visualization

작업 1: 웹 데이터 소스에 연결Task 1: Connect to a web data source

작업 1에서는 http://en.wikipedia.org/wiki/UEFA_European_Football_Championship에 있는 UEFA 유럽 축구 선수권 대회 Wikipedia 페이지에서 토너먼트 요약 표를 가져옵니다.In task 1, you import a Tournament Summary table from the UEFA European Football Championship Wikipedia page at the following location: http://en.wikipedia.org/wiki/UEFA_European_Football_Championship

Wikipedia 페이지 데이터 소스 추가Add a Wikipedia page data source

  1. 시작 대화 상자 또는 리본 탭에서 데이터 가져오기를 선택합니다.In the Getting Started dialog or in the Home ribbon tab, select Get Data.
  2. 데이터 가져오기 대화 상자가 표시되며, 여기서 다양한 데이터 소스 중에서 선택하여 데이터를 Power BI Desktop으로 가져올 수 있습니다.This brings up the Get Data dialog, where you can pick from a wide range of data sources to import data into Power BI Desktop. 모두 또는 기타 그룹 아래에서 사용할 수 있는 을 선택합니다.We will select Web which is available under the All or Other group.
  3. 웹 콘텐츠 대화 상자의 URL 텍스트 상자에 Wikipedia URL(http://en.wikipedia.org/wiki/UEFA_European_Football_Championship)을 붙여넣습니다.In the Web Content dialog box, in the URL text box, paste the Wikipedia URL (http://en.wikipedia.org/wiki/UEFA_European_Football_Championship).
  4. 확인을 클릭합니다.Click OK.

웹 페이지에 연결하면 이 Wikipedia 페이지에서 사용할 수 있는 테이블 목록이 탐색기 대화 상자에 표시됩니다.After establishing a connection to the web page, you see a list of tables available on this Wikipedia page in the Navigator dialog. 각 표를 한 번 클릭하여 데이터를 미리 볼 수 있습니다.You can single-click on each of these tables to preview the data.

탐색기 왼쪽 창에서 토너먼트 요약 결과에 대한 결과[편집] 테이블을 선택하거나 결과[편집] 테이블을 선택하고 편집을 선택합니다.In the Navigator left-pane, select the Results[edit] table for the Tournament Summary results, or select the Results[edit] table and select Edit. 이렇게 하면 데이터가 분석에 필요한 모양이 아니기 때문에 이 표를 보고서에 로드하기 전에 모양을 변경할 수 있습니다.This will allow us to reshape this table before loading it to the Report, since the data is not in the shape that we need for our analysis.

이제 표의 미리 보기가 쿼리 뷰에 배치되며, 일련의 변환 단계를 적용하여 데이터를 정리할 수 있습니다.This will land a preview of the table in the Query view, where we can apply a set of transformation steps to clean up the data.

작업 2: 제목 표에서 데이터 모양 지정Task 2: Shape data in the subject table

이제 제목 표가 데이터 쿼리에 대해 선택되었으므로 다양한 데이터 셰이핑 및 정리 단계를 수행하는 방법을 배웁니다.Now that you have the subject table selected for your data query, you learn how to perform various data shaping and cleansing steps.

1단계: 다른 열을 제거하여 관심 있는 열만 표시Step 1: Remove Other Columns to only display columns of interest

이 단계에서는 YearFinal Winners를 제외한 모든 열을 제거합니다.In this step, you remove all columns except Year and Final Winners.

  1. 쿼리 미리 보기 표에서 YearFinal Winners 열을 선택합니다(CTRL + 클릭 사용).In the Query Preview grid, select the Year and Final Winners columns (use CTRL + Click).
  2. 쿼리 미리 보기 표에서 열 머리글을 마우스 오른쪽 단추로 클릭하고 다른 열 제거 를 클릭하여 선택되지 않은 열을 제거합니다.Right-click a column header in the Query Preview grid, and click Remove Other Columns to remove the unselected columns. 이 작업은 리본 탭의 열 관리 그룹에서도 사용할 수 있습니다.Note that this operation is also available in the Home ribbon tab, in the Manage Columns group.

2단계: 값을 바꿔 선택한 열의 값 정리Step 2: Replace Values to clean up values in a selected column

이 단계에서는 Year 열의 Details 접미사를 바꿉니다.In this step, you replace the Details suffix in the Year column. 이 접미사는 새 줄에 있으므로 표 미리 보기에 표시되지 않습니다.Note that this suffix is on a new line so it is not visible in the table preview. 그러나 연도 열에서 숫자 값이 포함된 셀 중 하나를 클릭하면 자세히 보기에 전체 값이 표시됩니다.However, if you click in one of the cells with a numeric value in the Year column, you will see the full value in the detailed view.

  1. Year 열을 선택합니다.Select the Year column.
  2. 쿼리 뷰 리본에서 탭 아래의 값 바꾸기 를 클릭하거나 Year 열을 마우스 오른쪽 단추로 클릭하고 값 바꾸기 를 클릭하여 Details를 빈 텍스트로 바꿉니다.In the Query view ribbon, click Replace Values under the Home tab or right-click the Year column, and click Replace Values to replace Details with empty text.
  3. 값 바꾸기 대화 상자에서 찾을 값 텍스트 상자에 Details를 입력하고 바꿀 내용 텍스트 상자를 비워둡니다.In the Replace Values dialog box, type Details in the Value to Find text box and leave the Replace With text box empty.
  4. 확인을 클릭합니다.Click OK.

3단계: 열의 값 필터링Step 3: Filter values in a column

이 단계에서는 Year 열을 필터링하여 "Year"를 포함하지 않는 행을 표시합니다.In this step, you filter the Year column to display rows that do not contain “Year”.

  1. Year 열에서 필터 드롭다운 화살표를 클릭합니다.Click the filter drop down arrow on the Year column.
  2. 필터 드롭다운에서 Year 옵션을 선택 취소합니다.In the Filter drop-down, clear the Year option.
  3. 확인을 클릭합니다.Click OK.

4단계: 열 이름 바꾸기Step 4: Rename a column

Year 열의 데이터를 정리했으므로 Final Winner 열을 작업하겠습니다.Now that we have cleaned up the data in the Year column, we are going to work on the Final Winner column.

승자 목록만 확인하므로 이 열의 이름을 Country로 바꿀 수 있습니다.Since we are only looking at the list of winners, we can rename this column to Country.

  1. 쿼리 미리 보기에서 Final Winner 열을 선택합니다.Select the Final Winner column in the Query preview.
  2. 쿼리 뷰 리본의 변환 탭 및 Any Column(임의 열) 그룹 아래에 이름 바꾸기가 있습니다.In the Query view ribbon, under the Transform tab and Any Column group, you will find Rename.
  3. 이렇게 하면 열 이름을 편집할 수 있습니다.This will make the column name editable. 이 열의 이름을 국가로 바꾸겠습니다.We will rename this column to Country.

5단계: 열의 null 값 필터링Step 5: Filter out null values in a column

또한 Country 열에서 null 값을 필터링해야 합니다.We also need to filter out null values in the Country column. 이 작업을 수행하기 위해 3단계에서 확인한 필터 메뉴를 사용하거나 다음을 수행할 수 있습니다.In order to do this, we could use the filter menu as we saw in Step 3, or alternatively we can:

  1. Country 열에서 null 값이 포함된 셀 중 하나를 마우스 오른쪽 단추로 클릭합니다.Right-click on one of the cells in the Country column that contain a null value.
  2. 상황에 맞는 메뉴에서 텍스트 필터 -> 같지 않음을 선택합니다.Select Text Filters -> Does not Equal in the context menu.
  3. Country 열에서 null 값이 포함된 행을 제거하는 새 필터 단계가 만들어집니다.This creates a new filter step to remove rows with null values in the Country column.

6단계: 쿼리 이름 지정Step 6: Name a query

이 단계에서는 최종 쿼리의 이름을 Euro Cup Winners로 지정합니다.In this step, you name your final query Euro Cup Winners.

  1. 쿼리 설정 창의 이름 텍스트 상자에 Euro Cup Winners를 입력합니다.In the Query Settings pane, in the Name text box, enter Euro Cup Winners.

작업 3: 보고서 뷰를 사용하여 시각화 만들기Task 3: Create visualizations using the Report view

이제 분석에 필요한 모양으로 데이터를 변환했으므로 결과 표를 보고서에 로드하고 몇 가지 시각화를 만들 수 있습니다.Now that we have converted the data into the shape that we need for our analysis, we can load the resulting table into our Report and create a few visualizations.

1단계: 보고서에 쿼리 로드Step 1: Load the query to your report

쿼리 결과를 Power BI Desktop에 로드하고 보고서를 만들기 위해 리본에서 Close & Load(닫기 및 로드)를 선택합니다.In order to load the query results to Power BI Desktop and create a report, we select Close & Load from the Home ribbon.

이렇게 하면 쿼리 평가 및 보고서에 표 출력 로드가 트리거됩니다.This will trigger evaluation of the query and load of the table output to the Report. Power BI Desktop에서 보고서 아이콘을 선택하여 보고서 뷰에서 Power BI Desktop을 봅니다.In Power BI Desktop, select the Report icon to see Power BI Desktop in Report view.

보고서 뷰 오른쪽의 필드 창에서 결과 테이블 필드를 볼 수 있습니다.You can see the resulting table fields in the Fields pane at the right of the Report view.

2단계: 맵 시각화 만들기Step 2: Create a Map visualization

시각화를 만들려면 필드 목록 에서 보고서 캔버스로 필드를 끌어서 놓으면 됩니다.In order to create a visualization, we can drag fields from the Field list and drop them in the Report canvas.

  1. Country 필드를 보고서 캔버스로 끌어서 놓습니다.Drag the Country field and drop it in the Report canvas. 보고서 캔버스에 새 시각화가 만들어집니다.This will create a new visualization in the Report canvas. 여기서는 국가 목록이 있으므로 지도 시각화가 만들어집니다.In this case, since we have a list of countries, it will create a Map visualization.

  2. 시각화 창에서 다른 아이콘을 클릭하여 시각화 형식을 쉽게 변경할 수 있습니다.We can easily change the type of visualization by clicking on a different icon in the Visualization pane.

  3. 지도에 대해 지도 시각화 형식을 사용할 것이며, 시각화의 모서리 중 하나를 원하는 크기까지 끌어 시각화의 크기를 조정할 수도 있습니다.We are going to stay with the Map visualization type to Map, We can also resize the visualization by dragging from one of the corners of the visualization up to the desired size.

  4. 지금은 맵에 있는 모든 점의 크기가 같습니다.Note that currently all the points in the map have the same size. 유로 컵 토너먼트 승리 횟수가 더 많은 국가가 맵에서 더 큰 점으로 표시되도록 이 모양을 변경하려고 합니다.We want to change this so that countries with more Euro Cup tournaments won are represented with a larger point in the map. 이 작업을 수행하려면 필드 목록Year 필드를 필드 창 아래쪽에 있는 상자로 끌면 됩니다.In order to do thiso, we can drag the Year field in the Fields list to the Values box in the lower half of the Fields pane.

살펴봤듯이 보고서에서 시각화를 매우 쉽게 사용자 지정하여 원하는 방식으로 데이터를 표시할 수 있습니다.As you can see, it is very easy to customize visualizations in your report, in order to present the data in the way that you want. Power BI Desktop은 다양한 데이터 소스에서 데이터를 가져오고 이 데이터를 풍부한 대화형 방식으로 시각화하기 위해 분석 요구 사항에 맞게 셰이핑하는 원활한 종단 간 환경을 제공합니다.Power BI Desktop provides a seamless end-to-end experience from getting data from a wide range of data sources and shaping it to meet your analysis needs to visualizing this data in rich and interactive ways. 보고서가 준비되면 Power BI로 업로드하고 보고서에 따라 대시보드를 만든 후 다른 Power BI 사용자와 공유할 수 있습니다.Once your report is ready, you can upload it to Power BI and create dashboards based on it, which you can share with other Power BI users.

이제 웹에서 데이터 가져오기 자습서를 마쳤습니다.This concludes the Importing Data from the Web tutorial. 여기서 완료된 Power BI Desktop 파일을 다운로드할 수 있습니다.You can download the completed Power BI Desktop file here.

자세한 정보를 얻을 수 있는 기타 위치Where else can I get more information?