일반적인 하위 식 제거 설명

아티클
08/21/2023

APS CU7.3은 SQL 쿼리 최적화 프로그램에서 일반적인 하위 식 제거를 통해 쿼리 성능을 향상시킵니다. 향상된 기능은 두 가지 방법으로 쿼리를 향상시킵니다. 첫 번째 이점은 SQL 컴파일 시간을 줄이는 데 도움이 되는 이러한 식을 식별하고 제거하는 기능입니다. 두 번째이자 더 중요한 이점은 이러한 중복 하위 식에 대한 데이터 이동 작업이 제거되어 쿼리에 대한 실행 시간이 더 빨라진다는 것입니다.

select top 100 asceding.rnk, i1.i_product_name best_performing, i2.i_product_name worst_performing
  from(select *
       from (select item_sk,rank() over (order by rank_col asc) rnk
             from (select ss_item_sk item_sk,avg(ss_net_profit) rank_col
                   from store_sales ss1
                   where ss_store_sk = 8
                   group by ss_item_sk
                   having avg(ss_net_profit) > 0.9*(select avg(ss_net_profit) rank_col
                                                    from store_sales
                                                    where ss_store_sk = 8
                                                      and ss_hdemo_sk is null
                                                    group by ss_store_sk))V1)V11
       where rnk  < 11) asceding,
      (select *
       from (select item_sk,rank() over (order by rank_col desc) rnk
             from (select ss_item_sk item_sk,avg(ss_net_profit) rank_col
                   from store_sales ss1
                   where ss_store_sk = 8
                   group by ss_item_sk
                   having avg(ss_net_profit) > 0.9*(select avg(ss_net_profit) rank_col
                                                    from store_sales
                                                    where ss_store_sk = 8
                                                      and ss_hdemo_sk is null
                                                    group by ss_store_sk))V2)V21
       where rnk  < 11) descending,
  item i1,
  item i2
  where asceding.rnk = descending.rnk
    and i1.i_item_sk=asceding.item_sk
    and i2.i_item_sk=descending.item_sk
  order by asceding.rnk
  ;

TPC-DS 벤치마크 도구에서 위의 쿼리를 고려합니다. 위의 쿼리에서 하위 쿼리는 동일하지만 함수에 대한 rank()가 있는 절의 순서는 두 가지 방법으로 정렬됩니다. CU7.3 이전의 이 하위 쿼리는 오름차순으로 한 번, 내림차순으로 한 번 평가되고 두 번 실행되어 두 개의 데이터 이동 작업이 발생합니다. APS CU7.3을 설치한 후 하위 쿼리 부분은 한 번 평가되므로 데이터 이동을 줄이고 쿼리를 더 빠르게 완료합니다.

APS CU7.3으로 업그레이드한 후에도 기능을 테스트할 수 있는 'OptimizeCommonSubExpressions'라는 기능 스위치 가 도입되었습니다. 이 기능은 기본적으로 켜져 있지만 해제할 수 있습니다.

참고 항목

기능 스위치 값을 변경하려면 서비스를 다시 시작해야 합니다.

테스트 환경에서 다음 테이블을 만들고 위에서 언급한 쿼리에 대한 설명 계획을 평가하여 샘플 쿼리를 시도할 수 있습니다.

CREATE TABLE [dbo].[store_sales] (
    [ss_sold_date_sk] int NULL, 
    [ss_sold_time_sk] int NULL, 
    [ss_item_sk] int NOT NULL, 
    [ss_customer_sk] int NULL, 
    [ss_cdemo_sk] int NULL, 
    [ss_hdemo_sk] int NULL, 
    [ss_addr_sk] int NULL, 
    [ss_store_sk] int NULL, 
    [ss_promo_sk] int NULL, 
    [ss_ticket_number] int NOT NULL, 
    [ss_quantity] int NULL, 
    [ss_wholesale_cost] decimal(7, 2) NULL, 
    [ss_list_price] decimal(7, 2) NULL, 
    [ss_sales_price] decimal(7, 2) NULL, 
    [ss_ext_discount_amt] decimal(7, 2) NULL, 
    [ss_ext_sales_price] decimal(7, 2) NULL, 
    [ss_ext_wholesale_cost] decimal(7, 2) NULL, 
    [ss_ext_list_price] decimal(7, 2) NULL, 
    [ss_ext_tax] decimal(7, 2) NULL, 
    [ss_coupon_amt] decimal(7, 2) NULL, 
    [ss_net_paid] decimal(7, 2) NULL, 
    [ss_net_paid_inc_tax] decimal(7, 2) NULL, 
    [ss_net_profit] decimal(7, 2) NULL
)
WITH (CLUSTERED COLUMNSTORE INDEX, DISTRIBUTION = HASH([ss_item_sk]),  PARTITION ([ss_sold_date_sk] RANGE RIGHT FOR VALUES (2450815, 2451180, 2451545, 2451911, 2452276, 2452641, 2453006)));

CREATE TABLE [dbo].[item] (
    [i_item_sk] int NOT NULL, 
    [i_item_id] char(16) COLLATE Latin1_General_100_CI_AS_KS_WS NOT NULL, 
    [i_rec_start_date] date NULL, 
    [i_rec_end_date] date NULL, 
    [i_item_desc] varchar(200) COLLATE Latin1_General_100_CI_AS_KS_WS NULL, 
    [i_current_price] decimal(7, 2) NULL, 
    [i_wholesale_cost] decimal(7, 2) NULL, 
    [i_brand_id] int NULL, 
    [i_brand] char(50) COLLATE Latin1_General_100_CI_AS_KS_WS NULL, 
    [i_class_id] int NULL, 
    [i_class] char(50) COLLATE Latin1_General_100_CI_AS_KS_WS NULL, 
    [i_category_id] int NULL, 
    [i_category] char(50) COLLATE Latin1_General_100_CI_AS_KS_WS NULL, 
    [i_manufact_id] int NULL, 
    [i_manufact] char(50) COLLATE Latin1_General_100_CI_AS_KS_WS NULL, 
    [i_size] char(20) COLLATE Latin1_General_100_CI_AS_KS_WS NULL, 
    [i_formulation] char(20) COLLATE Latin1_General_100_CI_AS_KS_WS NULL, 
    [i_color] char(20) COLLATE Latin1_General_100_CI_AS_KS_WS NULL, 
    [i_units] char(10) COLLATE Latin1_General_100_CI_AS_KS_WS NULL, 
    [i_container] char(10) COLLATE Latin1_General_100_CI_AS_KS_WS NULL, 
    [i_manager_id] int NULL, 
    [i_product_name] char(50) COLLATE Latin1_General_100_CI_AS_KS_WS NULL
)
WITH (CLUSTERED INDEX ( [i_item_sk] ASC ), DISTRIBUTION = REPLICATE);

쿼리의 설명 계획을 살펴보면 CU7.3 이전(또는 기능 스위치가 꺼져 있는 경우) 쿼리의 총 작업 수가 17개이고 CU7.3(또는 기능 스위치가 켜져 있는 경우) 동일한 쿼리에 총 9개의 작업이 표시됩니다. 데이터 이동 작업만 계산하면 이전 계획에 새 계획의 이동 작업 4개와 이동 작업 2개가 있음을 알 수 있습니다. 새 쿼리 최적화 프로그램은 새 계획으로 이미 만든 임시 테이블을 다시 사용하여 두 개의 데이터 이동 작업을 줄여 쿼리 런타임을 줄일 수 있었습니다.

Share via

일반적인 하위 식 제거 설명

피드백

피드백

추가 리소스