쿼리 시각화 및 레거시 대시보드 만들기

이 자습서에서는 샘플에서 뉴욕시 택시 데이터 세트를 사용합니다. Databricks SQL에서 SQL 편집기를 사용하여 여러 쿼리 각각에 대한 시각화를 만든 다음, 이러한 시각화를 사용하여 대시보드를 만드는 방법을 보여 줍니다. 또한 대시보드의 각 시각화에 대한 대시보드 매개 변수를 만드는 방법도 보여 줍니다.

참고 항목

이제 대시보드(이전의 Lakeview 대시보드)를 일반 공급할 수 있습니다.

Azure Government 지역에서는 대시보드를 사용할 수 없습니다. 레거시 대시보드를 사용합니다.

  • Azure Databricks는 최신 도구를 사용하여 새 대시보드를 작성하는 것이 좋습니다. 대시보드를 참조 하세요.
  • 원래 Databricks SQL 대시보드를 이제 레거시 대시보드라고 합니다. 중요한 버그 수정으로 계속 지원되고 업데이트되지만 새로운 기능은 제한됩니다. 작성 및 사용 모두에 레거시 대시보드를 계속 사용할 수 있습니다.
  • 마이그레이션 도구 또는 REST API를 사용하여 레거시 대시보드를 변환합니다. 기본 제공 마이그레이션 도구 사용에 대한 지침은 Lakeview 대시보드에 레거시 대시보드 복제를 참조하세요. REST API를 사용하여 대시보드를 만들고 관리하는 방법에 대한 자습서는 Azure Databricks API를 사용하여 대시보드를 관리하는 방법을 참조하세요.

SQL 편집기를 사용하여 Databricks SQL에 커넥트

  1. 사이드바에서 새로 만들기를 클릭하고 새 아이콘쿼리를 선택합니다.

    SQL 편집기가 열립니다.

  2. 웨어하우스를 선택합니다.

    쿼리를 처음 만들면 사용 가능한 SQL 웨어하우스 목록이 알파벳 순서로 표시됩니다. 다음에 쿼리를 만들 때 마지막으로 사용한 웨어하우스가 선택됩니다.

  3. 서버리스 스타터 웨어하우스를 클릭합니다. 이 웨어하우스는 빠르게 시작하는 데 도움이 되도록 자동으로 만들어집니다. 작업 영역에 서버리스를 사용하도록 설정하지 않은 경우 Starter Warehouse를 선택합니다. SQL 웨어하우스를 만드는 방법에 대한 자세한 내용은 SQL 웨어하우스 만들기를 참조하세요.

픽업 시간 분포 쿼리

  1. SQL 편집기에서 새 쿼리 창에 다음 쿼리를 붙여넣어 택시 승차 분포를 시간 단위로 반환합니다.

    SELECT
    date_format(tpep_pickup_datetime, "HH") AS `Pickup Hour`,
    count(*) AS `Number of Rides`
    FROM
    samples.nyctaxi.trips
    GROUP BY 1
    
  2. Ctrl/Cmd + Enter를 누르거나 실행(1000)을 클릭합니다. 몇 초 후에 결과 창의 쿼리 아래에 쿼리 결과가 표시됩니다.

    쿼리에서 최대 1000개의 행을 반환하도록 1000개 제한이 모든 쿼리에 대해 기본적으로 선택되어 있습니다. 제한 1000 설정을 사용하여 쿼리를 저장하는 경우 이 설정은 쿼리의 모든 실행(대시보드 내 포함)에 적용됩니다. 이 쿼리에 대한 모든 행을 반환하려면 실행(1000) 드롭다운을 클릭하여 1000개 제한을 선택 취소할 수 있습니다. 행 수에 대해 다른 제한을 지정하려는 경우 원하는 값으로 쿼리에 LIMIT 절을 추가할 수 있습니다.

    쿼리 결과가 결과 탭에 표시됩니다.

  3. 저장을 클릭하고 쿼리를 다음과 같이 Pickup hour저장합니다.

    첫 번째 쿼리 nyc taxi 쿼리의 결과

시간별 택시 승차 분포에 대한 시각화를 만듭니다.

  1. 결과 탭 옆의 시각화를 클릭한 + 다음 클릭합니다.

    시각화 편집기가 표시됩니다.

  2. 시각화 유형 드롭다운에서 막대가 선택되어 있는지 확인합니다.

  3. 시각화 이름을 .로 Bar chart변경합니다.

  4. Pickup Hour Y 열 드롭다운에 대해 지정되었는지 확인합니다.

  5. X 열 드롭다운에 대해 지정되어 있는지 Number of RidesSum 확인합니다.

    픽업 시간 분포

  6. 저장을 클릭합니다.

    저장된 차트가 SQL 편집기에 표시됩니다.

  1. SQL 편집기에서 새 쿼리 만들기를 클릭한 + 다음 클릭합니다.

  2. 새 쿼리 창에 다음 쿼리를 붙여넣어 일일 요금 추세를 반환합니다.

     SELECT
      T.weekday,
      CASE
        WHEN T.weekday = 1 THEN 'Sunday'
        WHEN T.weekday = 2 THEN 'Monday'
        WHEN T.weekday = 3 THEN 'Tuesday'
        WHEN T.weekday = 4 THEN 'Wednesday'
        WHEN T.weekday = 5 THEN 'Thursday'
        WHEN T.weekday = 6 THEN 'Friday'
        WHEN T.weekday = 7 THEN 'Saturday'
        ELSE 'N/A'
      END AS day_of_week,
      T.fare_amount,
      T.trip_distance
    FROM
      (
        SELECT
          dayofweek(tpep_pickup_datetime) as weekday,
          *
        FROM
          `samples`.`nyctaxi`.`trips`
      ) T
    
  3. 저장을 클릭하고 쿼리를 다음과 같이 Daily fare to distance analysis저장합니다.

  1. 결과 탭 옆의 시각화를 클릭한 + 다음 클릭합니다.

    시각화 편집기가 표시됩니다.

  2. 시각화 유형 드롭다운에서 분산을 선택합니다.

  3. 시각화 이름을 .로 Fare by distance변경합니다.

  4. 일반 탭에서 X 열값을 설정하여 trip_distance Y 열fare_amount값을 .로 설정합니다.

  5. 그룹별 드롭다운에서 값을 day_of_week.로 설정합니다.

  6. X축 탭에서 이름 값을 Trip distance (miles).로 설정합니다.

  7. Y축 탭에서 이름 값을 Fare Amount (USD).로 설정합니다.

  8. 페이지 맨 아래에 있는 저장

    저장된 차트가 SQL 편집기에 표시됩니다.

    일일 요금 추세

이러한 시각화를 사용하여 대시보드 만들기

  1. 사이드바에서 새로 만들기를 클릭하고 새 아이콘레거시 대시보드를 선택합니다.

  2. 대시보드 이름을 .로 NYC taxi trip analysis설정합니다.

  3. 저장을 클릭합니다.

  4. 웨어하우스 선택 드롭다운 목록에서 서버리스 스타터 웨어하우스를 선택합니다. 작업 영역에 서버리스를 사용하도록 설정하지 않은 경우 Starter Warehouse를 선택합니다.

  5. 추가 드롭다운 목록에서 시각화를 클릭합니다.

  6. 시각화 위젯 추가 창에서 거리 분석 쿼리에 대한 일일 요금을 선택합니다.

  7. 기존 시각화 선택 목록에서 거리별 요금을 선택합니다.

  8. 제목 텍스트 상자에 .를 입력Daily fare trends합니다.

    시각화 추가 위젯

  9. 레거시 대시보드에 추가를 클릭합니다.

    일별 요금 추세 시각화가 대시바드 디자인 화면에 표시됩니다.

  10. 추가 드롭다운 목록에서 대시보드에 두 번째 위젯을 추가한 다음 시각화를 클릭합니다.

  11. 시각화 위젯 추가 창에서 픽업 시간 쿼리를 선택합니다.

  12. 기존 시각화 선택 목록에서 가로 막대형 차트를 선택합니다.

  13. 제목 텍스트 상자에 .를 입력Pickup hour distribution합니다.

  14. 레거시 대시보드에 추가를 클릭합니다.

  15. 대시보드에서 첫 번째 시각화의 너비와 일치하도록 이 시각화의 크기를 조정합니다.

  16. 편집 완료를 클릭합니다.

초기 대시보드

각 쿼리에 픽업 우편 번호 매개 변수 추가

  1. SQL 편집기에서 일일 요금에서 거리 분석 쿼리를 엽니다.

  2. 거리 분석 쿼리에 대한 일일 요금에 다음 WHERE 절을 추가하여 우편 번호를 픽업하여 쿼리를 필터링합니다.

    WHERE
      pickup_zip IN ({{ pickupzip }})
    
  3. pickupzip 텍스트 상자에 변경 내용 적용을 입력 10018 하고 클릭하여 픽업 우편 번호 매개 변수를 사용하여 쿼리를 실행합니다.

  4. 저장을 클릭합니다.

  5. 픽업 시간 쿼리를 엽니다.

  6. 픽업 시간 쿼리에 다음 WHERE 절을 추가하여 픽업 우편 번호로 쿼리를 필터링합니다. 절 앞에 이 절을 추가합니다 GROUP BY .

       WHERE
         pickup_zip IN ({{ pickupzip }})
    
  7. pickupzip 텍스트 상자에 변경 내용 적용을 입력 10018 하고 클릭하여 픽업 우편 번호 필터를 사용하여 쿼리를 실행합니다.

  8. 저장을 클릭합니다.

대시보드 매개 변수를 사용하도록 대시보드 업데이트

  1. NYC Taxi Trip 분석 대시보드를 엽니다.

    이제 각 시각화에는 픽업 우편 번호에 대한 매개 변수가 포함됩니다.

    위젯 - 매개 변수

  2. 이 대시보드의 케밥 메뉴를 세로 줄임표 클릭한 다음 편집을 클릭합니다.

  3. 일일 요금 추세 시각화에 대한 케밥 메뉴를 세로 줄임표 클릭한 다음 위젯 설정 변경을 클릭합니다.

  4. 매개 변수 섹션에서 값 필드에서 위젯 매개 변수연필 아이콘 편집 아이콘클릭합니다.

    위젯 매개 변수 보기

  5. 원본 및 값 편집 창에서 원본새 대시보드 매개 변수변경합니다.

    위젯 매개 변수를 새 대시보드 매개 변수로 변경

  6. 확인을 클릭한 다음 저장을 클릭합니다.

    pickupzip 대시보드 매개 변수가 나타나고 일일 요금 추세 시각화에 대한 위젯 매개 변수가 더 이상 나타나지 않습니다.

    1. 픽업 시간 배포 시각화에 대한 케밥 메뉴를 세로 줄임표 클릭한 다음 위젯 설정 변경을 클릭합니다.
  7. 매개 변수 섹션에서 값 필드에서 위젯 매개 변수연필 아이콘 편집 아이콘클릭합니다.

  8. 원본 및 값 편집 창에서 원본기존 대시보드 매개 변수변경합니다.

  9. pickupzip 값으로 선택되었는지 확인합니다.

  10. 확인을 클릭한 다음 저장을 클릭합니다.

    픽업 시간 배포 시각화에 대한 위젯 매개 변수가 더 이상 나타나지 않습니다.

  11. 편집 완료를 클릭합니다.

  12. pickupzip 대시보드 매개 변수의 값을 변경한 10017 다음 변경 내용 적용을 클릭합니다.

    각 vizualizations의 데이터는 이제 10017 우편 번호에서 픽업에 대한 데이터를 표시합니다.

    위젯 매개 변수를 새 대시보드 매개 변수로 변경