반응형
SELECT시 기존 사용자 함수를 만들어둔 것 때문에 속도가 나지 않아, 스칼라 서브쿼리로 처리했다.
그래도 속도가 잘 안나오길래 찾아보다가
구루비에서 좋은 글을(http://wiki.gurubee.net/pages/viewpage.action?pageId=27427586) 발견해서 정리해둔다.
1. FUNCTION은 최종 추출 결과만큼만 수행하자
[Function 사용 위치 변경전 ]
select *
from
(
SELECT
t1.c1, t1.c2,t2.c3,FN_C2_CODENM(t2.c4) c4
FROM FUNCTION_TABLE t1,
C1_CODE_NM t2
WHERE t1.c2 = 0
AND t1.c3 = 'A'
AND t1.c1 = t2.C1
AND t2.c4 IN (2, 4)
order by t2.c3
) z
where rownum < 5
Call Count CPU Time Elapsed Time Disk Query Current Rows
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Parse 1 0.000 0.005 0 0 0 0
Execute 1 0.000 0.000 0 0 0 0
Fetch 2 0.484 0.574 0 3021 0 4
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Total 4 0.484 0.579 0 3021 0 4
Rows Row Source Operation
------- -----------------------------------------------------------------------
4 COUNT STOPKEY (cr=3021 pr=0 pw=0 time=573754 us)
4 VIEW (cr=3021 pr=0 pw=0 time=573749 us)
4 SORT ORDER BY STOPKEY (cr=3021 pr=0 pw=0 time=573746 us)
1538 HASH JOIN (cr=714 pr=0 pw=0 time=71036 us)
3846 TABLE ACCESS FULL FUNCTION_TABLE (cr=245 pr=0 pw=0 time=7748 us)
40000 TABLE ACCESS FULL C1_CODE_NM (cr=469 pr=0 pw=0 time=40046 us)
********************************************************************************
-총 추출건수 : 4건
SELECT C2 FROM C2_CODE_NM WHERE C1 = :B1
Call Count CPU Time Elapsed Time Disk Query Current Rows
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Parse 1 0.000 0.000 0 0 0 0
Execute 1538 0.016 0.028 0 0 0 0
Fetch 1538 0.000 0.012 0 2307 0 769
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Total 3077 0.016 0.041 0 2307 0 769
********************************************************************************
-Function 수행횟수 : 1538건
[Function 사용 위치 변경후 ]
select c1,c2,c3, FN_C2_CODENM(c4) c4 <-- 최종 쿼리 추출시 Function 사용
from
(
SELECT
t1.c1, t1.c2,t2.c3,t2.c4
FROM FUNCTION_TABLE t1,
C1_CODE_NM t2
WHERE t1.c2 = 0
AND t1.c3 = 'A'
AND t1.c1 = t2.C1
AND t2.c4 IN (2, 4)
order by t2.c3
) z
where rownum < 5
Call Count CPU Time Elapsed Time Disk Query Current Rows
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Parse 1 0.016 0.005 0 0 0 0
Execute 1 0.000 0.000 0 0 0 0
Fetch 2 0.078 0.079 0 722 0 4
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Total 4 0.094 0.085 0 722 0 4
Rows Row Source Operation
------- -----------------------------------------------------------------------
4 COUNT STOPKEY (cr=714 pr=0 pw=0 time=54872 us)
4 VIEW (cr=714 pr=0 pw=0 time=54864 us)
4 SORT ORDER BY STOPKEY (cr=714 pr=0 pw=0 time=54860 us)
1538 HASH JOIN (cr=714 pr=0 pw=0 time=60290 us)
3846 TABLE ACCESS FULL FUNCTION_TABLE (cr=245 pr=0 pw=0 time=7781 us)
40000 TABLE ACCESS FULL C1_CODE_NM (cr=469 pr=0 pw=0 time=40047 us)
********************************************************************************
-총 추출건수 : 4건
SELECT C2 FROM C2_CODE_NM WHERE C1 = :B1
Call Count CPU Time Elapsed Time Disk Query Current Rows
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Parse 1 0.000 0.000 0 0 0 0
Execute 4 0.000 0.000 0 0 0 0
Fetch 4 0.000 0.000 0 8 0 4
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Total 9 0.000 0.000 0 8 0 4
********************************************************************************
-Function 수행횟수 : 4번
-4건 추출 후 Fetch 단계에서 Function 수행
-불필요하게 수행되었던 FUNCTION 수행을 효과적으로 제거하여 성능개선 효과
2. FUNCTION이 스칼라 서브쿼리에서 수행하도록 변경하자
-SQL 추출건수가 많다면 FUNCTION의 수행위치만으로는 성능개선이 힘들다.
-반복되는 입력값을 통해 동일한 결과값을 추출하는 경우
매번 Function을 사용하는 것 보다는
스칼라 서브쿼리 내에서 수행되도록 변경한다면
Multi Buffer(10g이후) 사용이 가능해지므로 Function의 수행횟수를 감소시켜 성능개선의 효과를 볼수 있다
-_query_execution_cache_max_size Multi Buffer 사이즈 조정가능.(충분한 검토후 사용해야함)
**입력 값에 대응하는 값의 종류가 다양하지 않고, 입력 값에 대한 결과가 항상 동일하다는 것이 보장 된다면,
SQL 작성시 Function 은 스칼라 서브쿼리에서 수행하도록 하여, Function 수행에 의한 부하를 감소시켜야 한다!
3. FUNCTION을 호출하는 값의 패턴을 분석하자
-Function을 스칼라 서브쿼리에서 수행하도록 변경하더라도,
중복값이 거의 존재하지 않는는 Unique한 값이 Function의 입력값인 경우
Cache 효과를 거의 볼수 없으므로 성능상 유리한 점이 없다.
-오히려 Unique한 값이 입력값으로 사용되는 Function인 경우 Cache 효과는 누리지 못하면서, 내부적으로 Multi Buffer 관리 비용만 발생한다.
-따라서 Function을 호출하는 입력값의 패턴에 대한 분석 없이 Function을 스칼라 서브쿼리에서 수행하도록 SQL을 작성하는것은 바람직 하지 않다
*NUM_DISTINCT 값이 테이블 ROW수와 비슷한 경우에는 Function의 사용보다는 Outer Join으로 변경하여 수행하는것이 성능상 유리할 수 있다.
(Outer Join을 수행할 경우, 가장 유리한 조인방법 선택이 가능하고 소프트 파싱의 부하도 줄일 수 있다)
- 패턴 분석(테이블)TABLE_NAMENUM_ROWSBLOCKS
FUNCTION_TABLE 100000 253
- 패턴분석(컬럼)COLUMN_NAMENUM_DISTINCT
C1 100000 <-- 아우터 조인이 유리할 수 있다. C2 2 C3 26 C4 3 <-- 이러한 경우에 FUNCTION을 스칼라 서브쿼리를 통해 수행하도록 하면 성능개선의 큰 효과를 볼 수 있다
*테이블 통계정보의 NUM_ROWS와 컬럼 통계정보의 NUM_DISTINCT를 보고 패턴을 파악하여 효과적인 방법을 선택하자!*
4. SELECT절에 사용된 FUNCTION을 조인으로 변경하자
-NUM_DISTINCT값이 매우 많은 경우 스칼라 서브쿼리로 변경해도 성능개선이 되지 않는다.
-이러한 경우에는 Outer Join으로 변경하여 성능을 개선시킬 수 있다
(변경전)
SELECT (SELECT fn_c1_codenm(c1) FROM DUAL), c1
FROM FUNCTION_TABLE
Call Count CPU Time Elapsed Time Disk Query Current Rows
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Parse 1 0.016 0.003 0 0 0 0
Execute 1 0.000 0.000 0 0 0 0
Fetch 1001 15.460 15.503 0 301243 0 100000
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Total 1003 15.475 15.506 0 301243 0 100000
Rows Row Source Operation
------- -----------------------------------------------------------------------
100000 FAST DUAL (cr=0 pr=0 pw=0 time=104896 us)
100000 TABLE ACCESS FULL FUNCTION_TABLE (cr=1243 pr=0 pw=0 time=79 us)
********************************************************************************
SELECT C2 FROM C1_CODE_NM WHERE C1 = :B1
Call Count CPU Time Elapsed Time Disk Query Current Rows
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Parse 1 0.000 0.000 0 0 0 0
Execute 100000 1.888 1.773 0 0 0 0
Fetch 100000 1.154 1.166 0 300000 0 100000
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Total 200001 3.042 2.939 0 300000 0 100000
********************************************************************************
(변경후)
SELECT b.c2, a.c1
FROM function_table a,
c1_code_nm b
WHERE a.c1 = b.c1(+)
Call Count CPU Time Elapsed Time Disk Query Current Rows
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Parse 1 0.000 0.001 0 0 0 0
Execute 1 0.000 0.000 0 0 0 0
Fetch 1001 0.359 0.287 0 1706 0 100000
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Total 1003 0.359 0.288 0 1706 0 100000
Rows Row Source Operation
------- -----------------------------------------------------------------------
100000 HASH JOIN OUTER (cr=1706 pr=0 pw=0 time=160334 us)
100000 TABLE ACCESS FULL FUNCTION_TABLE (cr=245 pr=0 pw=0 time=56 us)
100000 TABLE ACCESS FULL C1_CODE_NM (cr=1461 pr=0 pw=0 time=62 us)
********************************************************************************
- SQL 수행 시 Function 을 수행하면서 발생하는 10 만 번의 파싱도 동시에 제거됨으로써, 소프트 파싱으로 인한 부하도 크게 개선되었다
- Function 을 통해 10 만 번 반복적으로 Unique Scan 을 했던 C1_CODE_NM 테이블이
조인으로 수행되도록 SQL 을 작성하고 Hash Join 으로 처리함으로써, 반복적인 액세스를 제거하여 성능을 개선하였다.
5. WHERE절의 FUNCTION을 SELECT절로 옮기자
SELECT /*+ LEADING(T1 T2) USE_HASH(T1 T2) */
t1.c3, t2.c4
FROM FUNCTION_TABLE t1,
C1_CODE_NM t2
WHERE t1.c2 = 0
AND t1.c4 = 2
AND t1.c1 = t2.c1
AND t2.c3 IN ( 'A' )
AND fn_c2_codenm(T2.C4) BETWEEN 'A' AND 'B'
Call Count CPU Time Elapsed Time Disk Query Current Rows
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Parse 1 0.000 0.000 0 0 0 0
Execute 1 0.000 0.000 0 0 0 0
Fetch 18 1.607 1.762 0 20731 0 1667
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Total 20 1.607 1.762 0 20731 0 1667
Rows Row Source Operation
------- -----------------------------------------------------------------------
1667 HASH JOIN (cr=20731 pr=0 pw=0 time=1440778 us)
16667 TABLE ACCESS FULL FUNCTION_TABLE (cr=245 pr=0 pw=0 time=84 us)
5000 TABLE ACCESS FULL C1_CODE_NM (cr=20486 pr=0 pw=0 time=2174393 us)
********************************************************************************
SELECT C2 FROM C2_CODE_NM WHERE C1 = :B1
Call Count CPU Time Elapsed Time Disk Query Current Rows
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Parse 1 0.000 0.000 0 0 0 0
Execute 10000 0.250 0.170 0 0 0 0
Fetch 10000 0.078 0.100 0 20000 0 10000
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Total 20001 0.328 0.270 0 20000 0 10000
********************************************************************************
-SELECT count(*) FROM c1_code_nm t2 WHERE t2.c3 IN ('A') 의 수행결과는 5,000건이다.
-따라서 위의 조건으로 걸러낸 결과에 대해서 Function이 수행될것이라 생각했지만 실제로는 10,000번이 수행되었다
-그 이유는 Optimizer 가 내부적으로 BETWEEN 조건의 경우 다음과 같이 변경하여 처리하기 때문이다.
Execution Plan
-----------------------------------------------------------
0 SELECT STATEMENT Optimizer=ALL_ROWS (Cost=178 Card=12 Bytes=264)
1 0 HASH JOIN (Cost=178 Card=12 Bytes=264)
2 1 TABLE ACCESS (FULL) OF 'FUNCTION_TABLE' (TABLE) (Cost=62 Card=17K Bytes=195K)
3 1 TABLE ACCESS (FULL) OF 'C1_CODE_NM' (TABLE) (Cost=115 Card=13 Bytes=130)
-----------------------------------------------------------
Predicate information (identified by operation id):
-----------------------------------------------------------
1 - access("T1"."C1"="T2"."C1")
2 - filter("T1"."C4"=2 AND "T1"."C2"=0)
3 - filter("T2"."C3"='A' AND "FN_C2_CODENM"("T2"."C4")>='A' AND "FN_C2_CODENM"("T2"."C4")<='B')
-----------------------------------------------------------
-where 절의 function을 select 절로 옮기자
SELECT /*+ NO_MERGE(A) */ *
FROM (
SELECT /*+ LEADING(T1 T2) USE_HASH(T1 T2) */
t1.c3,
t1.c4,
fn_c2_codenm(t2.c4) AS ft2c4
FROM FUNCTION_TABLE t1,
C1_CODE_NM t2
WHERE t1.c2 = 0
AND t1.c4 = 2
AND t1.c1 = t2.c1
AND t2.c3 IN ( 'A' )
) A
WHERE ft2c4 BETWEEN 'A' AND 'B'
Call Count CPU Time Elapsed Time Disk Query Current Rows
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Parse 1 0.000 0.000 0 0 0 0
Execute 1 0.000 0.000 0 0 0 0
Fetch 18 1.825 1.849 0 24099 0 1667
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Total 20 1.825 1.849 0 24099 0 1667
Rows Row Source Operation
------- -----------------------------------------------------------------------
1667 VIEW (cr=24099 pr=0 pw=0 time=1689310 us)
1667 HASH JOIN (cr=20731 pr=0 pw=0 time=1453056 us)
16667 TABLE ACCESS FULL FUNCTION_TABLE (cr=245 pr=0 pw=0 time=88 us)
5000 TABLE ACCESS FULL C1_CODE_NM (cr=20486 pr=0 pw=0 time=2255478 us)
********************************************************************************
SELECT C2 FROM C2_CODE_NM WHERE C1 = :B1
Call Count CPU Time Elapsed Time Disk Query Current Rows
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Parse 1 0.000 0.000 0 0 0 0
Execute 11701 0.218 0.200 0 0 0 0
Fetch 11701 0.062 0.117 0 23402 0 11701
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Total 23403 0.281 0.317 0 23402 0 11701
********************************************************************************
Execution Plan
-----------------------------------------------------------
0 SELECT STATEMENT Optimizer=ALL_ROWS (Cost=178 Card=12 Bytes=24K)
1 0 VIEW (Cost=178 Card=12 Bytes=24K)
2 1 HASH JOIN (Cost=178 Card=12 Bytes=264)
3 2 TABLE ACCESS (FULL) OF 'FUNCTION_TABLE' (TABLE) (Cost=62 Card=17K Bytes=195K)
4 2 TABLE ACCESS (FULL) OF 'C1_CODE_NM' (TABLE) (Cost=115 Card=13 Bytes=130)
-----------------------------------------------------------
Predicate information (identified by operation id):
-----------------------------------------------------------
2 - access("T1"."C1"="T2"."C1")
3 - filter("T1"."C4"=2 AND "T1"."C2"=0)
4 - filter("T2"."C3"='A' AND "FN_C2_CODENM"("T2"."C4")>='A' AND "FN_C2_CODENM"("T2"."C4")<='B')
-----------------------------------------------------------
-인라인뷰 바깥쪽의 조건이 인라인뷰 안으로 침투되어 성능저하 발생
-Function 을 Select 절에서 수행해놓고 나중에 이 값을 이용해 뷰 바깥에서 조건을 처리할 목적으로 SQL 을 재 작성했지만,
QUERY TRANSFORMATION 에 의해 FPD 가 발생함으로써, Where 절과 Select 절의Function 까지 수행하여 수행횟수가 증가함
-select절의 function을 스칼라 서브쿼리로 사용
SELECT /*+ NO_MERGE(A) */
*
FROM ( SELECT /*+ LEADING(T1 T2) USE_HASH(T1 T2) */
t1.c3,
t2.c4,
(SELECT fn_c2_codenm(T2.C4) FROM DUAL) AS ft2c4
FROM FUNCTION_TABLE t1 ,
C1_CODE_NM t2
WHERE t1.c2 = 0
AND t1.c4 = 2
AND t1.c1 = t2.c1
AND t2.c3 IN ( 'A' )
) A
WHERE ft2c4 between 'A' AND 'B'
Call Count CPU Time Elapsed Time Disk Query Current Rows
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Parse 1 0.000 0.004 0 0 0 0
Execute 1 0.000 0.000 0 0 0 0
Fetch 18 0.062 0.047 0 733 0 1667
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Total 20 0.062 0.051 0 733 0 1667
Rows Row Source Operation
------- -----------------------------------------------------------------------
1667 VIEW (cr=733 pr=0 pw=0 time=45879 us)
1667 FILTER (cr=733 pr=0 pw=0 time=45873 us)
1667 HASH JOIN (cr=731 pr=0 pw=0 time=35262 us)
16667 TABLE ACCESS FULL FUNCTION_TABLE (cr=245 pr=0 pw=0 time=57 us)
5000 TABLE ACCESS FULL C1_CODE_NM (cr=486 pr=0 pw=0 time=10047 us)
1 FAST DUAL (cr=0 pr=0 pw=0 time=2 us)
********************************************************************************
SELECT C2 FROM C2_CODE_NM WHERE C1 = :B1
Call Count CPU Time Elapsed Time Disk Query Current Rows
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Parse 1 0.000 0.000 0 0 0 0
Execute 1 0.000 0.000 0 0 0 0
Fetch 1 0.000 0.000 0 2 0 1
------- ------ -------- ------------ ---------- ---------- ---------- ----------
Total 3 0.000 0.000 0 2 0 1
********************************************************************************
-Function 수행 후 비교하는 조건이 사라지면서 FPD(Filter Push Down) 가 발생하지 않은 것을 알 수 있다.
*** FUNCTION의 사용 *** FUNCTION의 사용은 프로그램 개발이나 유지보수 등 여러 측면에서 효율적이지만, 반대로 비효율적으로 사용된 FUNCTION은 DB 성능에 큰 악영향을 미칠 수 있다. FUNCTION의 동작방식을 정확히 이해하고, FUNCTION을 사용할 때 항상 효율적으로 수행되도록 SQL을 작성해야 한다. |
문서정보
이 문서는 구루비에서 작성하였습니다.
이 문서를 다른 블로그나 홈페이지에 게재하실 경우에는 출처를 꼭 밝혀 주시면 고맙겠습니다.~^^
구루비 지식창고의 모든 문서는 크리에이티브 커먼즈의 저작자표시-비영리-동일조건변경허락
(BY-NC-SA) 라이선스에 따라 자유롭게 사용할 수 있습니다.
http://wiki.gurubee.net/pages/viewpage.action?pageId=27427586
반응형
'DB > DB' 카테고리의 다른 글
[SQL] SELECT 쿼리 실행 순서 (0) | 2022.01.24 |
---|
댓글