파워 쿼리 편집기를 사용하여 데이터 정리 및 변환

완료됨

이제 Power BI Desktop 을 사용하여 데이터 원본에 연결했으므로 요구 사항에 맞게 데이터를 조정해야 합니다. 열 또는 테이블의 이름을 변경하거나, 텍스트를 숫자로 변경하거나, 행을 제거하거나, 첫 번째 행을 헤더로 설정하는 등 데이터를 변환 하는 작업도 조정이라고 합니다.

Power BI Desktop의 파워 쿼리 편집기 는 리본 메뉴에서 작업을 수행할 수 있을 뿐만 아니라 바로 가기 메뉴(마우스 오른쪽 단추 클릭 또는 팝업 메뉴라고도 함)를 확장할 수 있습니다. 항목(예: 열)을 마우스 오른쪽 단추로 클릭한 다음, 표시되는 바로 가기 메뉴에서 명령을 선택하여 리본 메뉴의 변환 탭에서 선택할 수 있는 대부분을 사용할 수 있습니다.

데이터 셰이핑

파워 쿼리 편집기 에서 데이터를 셰이핑 하는 경우 파워 쿼리 편집기 가 데이터를 로드하여 표시하도록 사용자가 단계별 지침을 제공합니다. 데이터 원본은 영향을 받지 않습니다. 데이터의 이 특정 보기는 조정되거나 셰이핑 됩니다.

지정하는 단계(예: 테이블 이름 변경, 데이터 형식 변환 또는 열 삭제)는 파워 쿼리 편집기 에 의해 기록됩니다. 그렇게 되면 각 쿼리가 데이터 원본에 연결될 때마다 사용자가 지정한 동일한 셰이핑을 거치게 됩니다. 사용자가 Power BI Desktop에서 쿼리를 사용하거나 또 다른 사용자가 Power BI 서비스 등에서 공유 쿼리를 사용할 때마다 이 프로세스가 발생합니다. 이 단계는 파워 쿼리 설정 창의 적용된 단계 아래에서 순서대로 캡처됩니다.

다음 이미지에서는 셰이핑된 쿼리에 대한 쿼리 설정 창을 보여줍니다. 다음 단락에서 각 단계를 살펴봅니다.

쿼리 설정

데이터 원본에서 가져온 은퇴 데이터로 돌아가서 요구 사항에 맞게 데이터를 다시 셰이핑하겠습니다.

참고

샘플 데이터 세트를 다운로드하지 않은 경우 이전 단위 페이지를 참조합니다.

데이터를 숫자로 변환해야 합니다. 지금은 괜찮지만 데이터 형식을 바꿔야 할 경우 열 헤더를 마우스 오른쪽 단추로 클릭한 다음 형식 변경 > 정수 를 선택하기만 하면 됩니다. 둘 이상의 열을 변경해야 하는 경우 그 중 하나를 선택한 다음 Shift 키를 누른 채로 인접한 추가 열을 선택합니다. 그런 다음, 선택한 모든 열을 변경하려면 열 헤더를 오른쪽 단추로 클릭합니다. 또한 Ctrl 키를 사용하여 인접하지 않은 열을 선택할 수도 있습니다.

적용된 단계 변경 유형

참고

파워 쿼리 편집기로 테이블을 가져올 때 파워 쿼리에서는 텍스트 열을 숫자로 변환해야 한다는 사실을 인식하고, 데이터 형식을 자동으로 변경하는 경우가 많습니다. 이 경우에 적용된 단계 의 단계는 파워 쿼리에서 수행한 작업을 식별합니다.

또한 리본 메뉴에서 변환 탭을 사용하여 이러한 열을 텍스트에서 헤더로 변경하거나 변환 할 수도 있습니다. 다음 이미지는 변환 탭을 보여 줍니다. 빨간색 상자는 현재 데이터 형식을 다른 데이터 형식으로 변환할 수 있는 데이터 형식 단추를 강조 표시합니다.

변환 리본 메뉴 및 데이터 형식 단추

쿼리 설정 창의 적용된 단계 목록은 수행된 모든 변경 내용을 반영합니다. 셰이핑 프로세스에서 단계를 제거하려면 해당 단계를 선택한 다음, 왼쪽에 있는 X 를 선택하기만 하면 됩니다.

쿼리 설정 창

데이터에 연결

다양한 주에 대한 데이터는 흥미로우며, 추가적인 분석 활동과 쿼리를 구축하는 데 유용합니다. 하지만 한 가지 문제가 있습니다. 대부분의 데이터는 주 모드에 주의 전체 이름이 아닌 2글자로 된 약어를 사용합니다. 따라서 주 이름과 약어를 연결할 몇 가지 방법이 필요합니다.

다행히 이러한 역할을 하는 다른 공용 데이터 원본이 있지만 이를 은퇴 테이블에 연결하려면 셰이핑 작업이 상당히 많이 필요합니다. 주 약어에 대한 웹 리소스는 다음과 같습니다.

http://en.wikipedia.org/wiki/List_of_U.S._state_abbreviations

파워 쿼리 편집기 에 있는 리본 메뉴의 탭에서 새 원본 > 웹 을 선택합니다. 그런 다음, 주소를 입력하고 확인 을 선택합니다. 탐색기 창에 웹 페이지에서 검색된 내용이 표시됩니다.

웹 사이트에서 발견된 미국 주 약어

필요한 데이터가 포함되어 있는 코드 및 약어... 테이블을 선택합니다. 하지만 해당 데이터를 축소하기 위해 상당히 많은 셰이핑이 필요합니다.

로드 을 선택하여 해당 데이터를 파워 쿼리 편집기 로 가져오면 셰이핑할 수 있습니다. 그런 다음, 다음 단계를 수행합니다.

  • 상위 3개 행 제거 – 해당 행은 웹 페이지 테이블의 생성 방식으로 인해 발생하지만 필요하지 않습니다. 제거하려면 리본 메뉴의 탭에서 행 제거 > 상위 행 제거 를 선택합니다. 나타나는 대화 상자에서 제거할 행 수로 3 을 입력합니다.

    상위 행 제거

  • 하위 26개 행 제거 – 해당 행은 모두 지역에 대한 것이므로 포함할 필요가 없습니다. 프로세스는 동일하지만 이번에는 행 제거> 하위 행 제거 를 선택하고, 제거할 행 수로 26 을 입력합니다.

    하위 행 제거

  • 워싱턴 DC 필터링 – 은퇴 주 테이블에는 워싱턴 DC가 포함되어 있지 않으므로 목록에서 제외하겠습니다. 연방 주 열의 옆에 있는 드롭다운 화살표를 선택한 다음, 연방 구역 확인란의 선택을 해제합니다.

    특정 값이 있는 행 제거

  • 불필요한 열 제거 – 공식 2글자 약어에 각 주를 매핑하기만 하면 되는데, 해당 정보는 첫 번째 열과 네 번째 열에 있습니다. 따라서 두 열을 유지해야 하고 나머지는 모두 제거할 수 있습니다. 삭제할 첫 번째 열을 선택한 다음, Ctrl 키를 누른 채로 제거할 다른 열을 선택합니다(이렇게 하면 여러 개의 인접하지 않은 열을 선택할 수 있음). 그런 다음, 리본 메뉴의 탭에서 열 제거 > 열 제거 를 선택합니다.

    특정 열 제거

  • 첫 번째 행을 헤더로 사용 – 상위 3개 행을 제거했으므로 필요한 헤더가 현재 상위 행이 되었습니다. 첫 번째 행을 헤더로 사용 단추를 선택합니다.

    헤더로 첫 번째 행 사용

    참고

    여기서 한 가지 짚고 넘어가겠습니다. 파워 쿼리 편집기 에서 적용된 단계의 시퀀스 는 중요하며, 데이터의 셰이핑 방식에 영향을 줄 수 있습니다. 또한 하나의 단계가 다른 후속 단계에 어떤 영향을 주는지도 고려해야 합니다. 적용된 단계 목록에서 단계를 제거하면 쿼리의 단계 시퀀스 영향으로 인해 후속 단계가 원래 의도한 대로 동작하지 않을 수 있습니다.

  • 열과 테이블 자체의 이름 변경 - 일반적으로 열의 이름을 변경하는 방법은 몇 가지가 있습니다. 원하는 방법을 선택할 수 있습니다. 이름을 주 이름주 코드 로 변경하겠습니다. 테이블의 이름을 바꾸려면 쿼리 설정 창의 이름 필드에 이름을 입력하기만 하면 됩니다. 이 테이블을 StateCodes 라고 명명하겠습니다.

    열 이름 바꾸기

데이터 결합

이제 StateCodes 테이블이 셰이핑되면, 두 테이블을 하나로 결합할 수 있습니다. 이제 보유한 테이블이 데이터에 적용한 쿼리의 결과이기 때문에 쿼리 라고도 합니다.

쿼리를 결합하는 기본적인 방법으로는 병합추가 라는 두 가지 방법이 있습니다.

다른 쿼리에 추가하려는 열이 하나 이상 있는 경우 쿼리를 병합 합니다. 기존 쿼리에 추가할 데이터 행이 더 있는 경우 쿼리를 추가 합니다.

여기에서는 쿼리를 병합하려고 합니다. 시작하려면 다른 쿼리를 병합할 대상 쿼리를 선택합니다. 그런 다음, 리본 메뉴의 탭에서 쿼리 병합 을 선택합니다. 먼저 은퇴 쿼리를 선택하려고 합니다. 여기서는 이 쿼리의 이름을 RetirementStats 으로 변경하겠습니다.

쿼리 병합 단추

병합 창이 나타나면 선택된 테이블에 병합할 테이블 및 병합에 사용할 일치 열을 선택하라는 메시지가 표시됩니다.

RetirementStats 테이블(쿼리)에서 상태 를 선택한 다음, StateCodes 쿼리를 선택합니다. (이 경우에 다른 쿼리가 하나뿐이므로 선택하기 쉽습니다. 하지만 여러 데이터 원본에 연결할 때는 선택할 쿼리가 많이 있습니다.) 올바른 일치 열(RetirementStatsState, StateCodesState Name)을 선택하면 병합 대화 상자가 다음과 같이 표시되고, 확인 단추가 활성화됩니다.

병합 대화 상자

NewColumn 은 쿼리 종료 시 생성되며, 기존 쿼리와 병합된 테이블(쿼리)의 내용에 해당합니다. 병합된 쿼리의 모든 열은 NewColumn 으로 요약되지만 테이블을 확장 하고 원하는 열을 포함할 수 있습니다. 병합된 테이블을 확장하고 포함할 열을 선택하려면 확장 아이콘(확장 아이콘)을 선택합니다. 확장 대화 상자가 나타납니다.

확장 대화 상자

이 경우에 상태 코드 열만 필요합니다. 따라서 해당 열만 선택한 다음, 확인 을 선택합니다. 원래 열 이름을 접두사로 사용 확인란의 선택을 취소할 수도 있습니다. 선택된 상태로 두면 병합된 열의 이름은 NewColumn.State Code(차례로 원래 열 이름 또는 NewColumn, 점, 쿼리에 가져올 열의 이름)입니다.

참고

원한다면 NewColumn 테이블을 전환하는 방법을 바꿀 수 있습니다. 결과가 마음에 들지 않으면 쿼리 설정 창의 적용된 단계 목록에서 확장 단계를 삭제하기만 하면 됩니다. 쿼리는 해당 단계를 적용하기 전의 상태로 돌아갑니다. 확장 프로세스가 원하는 방식이 될 때까지 원하는 만큼 자유롭게 작업을 반복적으로 수행할 수 있습니다.

이제 각각 요구 사항에 맞게 셰이핑된 두 개의 데이터 원본을 결합하는 단일 쿼리(테이블)가 생성되었습니다. 이 쿼리는 모든 주의 주거 비용 통계, 인구 통계 또는 취업 기회와 같이 흥미로운 여러 추가 데이터 연결의 기반으로 사용될 수 있습니다.

파워 쿼리 편집기 에서 변경 내용을 적용하고 Power BI Desktop에 로드하려면 리본 메뉴의 탭에서 닫기 및 적용 을 선택합니다.

데이터 설정 닫기 및 적용

이제 모델의 데이터를 사용할 준비가 되었습니다. 다음으로, 보고서에 몇 가지 시각적 개체를 만들겠습니다.

지금 Power BI Desktop에는 흥미로운 보고서를 만드는 데 필요한 데이터가 충분히 많습니다. 이 작업은 마일스톤이므로 이 Power BI Desktop 파일을 저장하겠습니다. 리본 메뉴의 탭에서 파일 > 저장 을 선택하여 보고서를 저장합니다. 여기서는 Power BI Desktop 시작 이라고 합니다.

잘하셨습니다! 이제 다음 단원에서 흥미로운 몇몇 시각적 개체를 만들겠습니다.