#title Cross Join
[[TableOfContents]]

==== 개요 ====
Cross Join을 상호조인 또는 카테시안곱이라고도 한다. Cross Join은 조인되는 테이블끼리 곱의 연산을 한다. 그러므로 1 * 1은 1이므로 관계가 전혀 없는 테이블도 1:1의 관계만 만들어 준다면 Cross Join을 해도 부하가 없다. Cross Join은 통계를 내기 위한 데이터 복제에 자주 이용된다. 또한 곱해지는 특수성에 의해 때로는 상당히 유용할 경우가 자주 있다. 다음은 Cross Join을 응용한 것이다. 

'''구구단1'''
{{{
with temp
as
(
	select 1 id union all
	select 2 id union all
	select 3 id union all
	select 4 id union all
	select 5 id union all
	select 6 id union all
	select 7 id union all
	select 8 id union all
	select 9 id 
)
select  
	cast(a.id + 1 as varchar) + '*' + 
	cast(b.id + 1 as varchar) + '=' + 
	cast((a.id + 1)  * (b.id + 1) as varchar)
from   temp a cross join temp b
order by a.id, b.id
}}}

'''구구단2'''
{{{
with temp
as
(
	select 1 seq
	union all
	select seq + 1 from temp
	where seq + 1 <= 12
)
select
	min(case when md = 1 then val1 end) val1
,	min(case when md = 1 then val2 end) val2
,	min(case when md = 1 then result end) result1

,	min(case when md = 2 then val1 end) val1
,	min(case when md = 2 then val2 end) val2
,	min(case when md = 2 then result end) result2

,	min(case when md = 0 then val1 end) val1
,	min(case when md = 0 then val2 end) val2
,	min(case when md = 0 then result end) result3
from (
	select  
		a.seq val1
	,	b.seq val2
	,	(a.seq)  * (b.seq) result
	,	a.seq % 3 md
	,	row_number() over(partition by a.seq % 3 order by a.seq, b.seq) rowno
	from   temp a cross join temp b
) t cross join temp c
where c.seq <= 3
group by
	rowno
}}}

'''0 ~ 999 번 만들기'''
{{{
select * into #temp
from (
         select 0 id union all
         select 1 id union all
         select 2 id union all
         select 3 id union all
         select 4 id union all
         select 5 id union all
         select 6 id union all
         select 7 id union all
         select 8 id union all
         select 9 id ) t
 
select cast(cast(c.id  as varchar) + 
          cast(b.id as varchar) + 
          cast(a.id as varchar) as int) number
from #temp a cross join #temp b cross join #temp c
order by 1
}}}

==== 약간 복잡한 예제 ====
아주 기본적인 사용이다. 앞에도 이야기 하였듯이 Cross Join을 이용한 데이터 복제로 많은 일을 할 수 있다. 내가 원하는 결과집합을 만들기 위해서 동일한 집합이 더 필요하다면 Cross Join을 이용하여 데이터를 복제하여 그것을 사용하면 된다. 다음의 예가 그런 예이다. 온라인 도움말에 있는 것을 변형해 본 것이다. 

{{{
CREATE TABLE Pivot
( Year      SMALLINT,
  Quarter   TINYINT, 
  Amount      DECIMAL(2,1) )
GO
INSERT INTO Pivot VALUES (1990, 1, 1.1)
INSERT INTO Pivot VALUES (1990, 2, 1.2)
INSERT INTO Pivot VALUES (1990, 3, 1.3)
INSERT INTO Pivot VALUES (1990, 4, 1.4)
INSERT INTO Pivot VALUES (1991, 1, 2.1)
INSERT INTO Pivot VALUES (1991, 2, 2.2)
INSERT INTO Pivot VALUES (1991, 3, 2.3)
INSERT INTO Pivot VALUES (1991, 4, 2.4)
GO
 
SELECT MIN(CASE WHEN ID = 1 THEN CAST(Year AS VARCHAR) 
ELSE '분기별 총합' END) AS '년도', 
    SUM(CASE Quarter WHEN 1 THEN Amount ELSE 0 END) AS '1분기',
    SUM(CASE Quarter WHEN 2 THEN Amount ELSE 0 END) AS '2분기',
    SUM(CASE Quarter WHEN 3 THEN Amount ELSE 0 END) AS '3분기',
    SUM(CASE Quarter WHEN 4 THEN Amount ELSE 0 END) AS '4분기',
    SUM(Amount) '년도별 합계'
FROM Pivot CROSS JOIN (SELECT 1 AS ID UNION ALL SELECT 2) T
GROUP BY CASE WHEN ID = 1 THEN Year END
ORDER BY 1
}}}

attachment:cross_join01.jpg

==== Cross Join의 원리 ====
실제로 결과만 대충 보면 별것이 아닌 것 같이 보인다. 그러나 자세히 보면 얼마나 유용한 것인가를 알 수 있을 것이다. 년도별 합계, 해당 년도의 분기별 합계, 모든 년도의 분기별 합계까지 그리고 모든 합계까지 나온 것이다. 그야말로 엄청난 쿼리임이 아닐 수 없다. 이 마법의 원리는 GROUP BY에 있다. 원리를 이해하도록 하자. 위 쿼리에서 ‘분기별 총합’을 뺀다면 다음과 같이 쉽게 Cross Tab Query를 할 수 있다. Cross Tab의 원리는 SUM(CASE ~ ) 에 있다. SUM()함수가 Group에 대해 한 개의 값만 반환하는데 그 원리가 있다. 

{{{
SELECT Year AS '년도', 
    SUM(CASE Quarter WHEN 1 THEN Amount ELSE 0 END) AS '1분기',
    SUM(CASE Quarter WHEN 2 THEN Amount ELSE 0 END) AS '2분기',
    SUM(CASE Quarter WHEN 3 THEN Amount ELSE 0 END) AS '3분기',
    SUM(CASE Quarter WHEN 4 THEN Amount ELSE 0 END) AS '4분기',
    SUM(Amount) '년도별 합계'
FROM Pivot 
GROUP BY Year
}}}

attachment:cross_join02.jpg

문제는 역시 ‘분기별 총합’을 만드는데 있다. 그냥 생각해 본다면 다음과 같이 UNION ALL을 사용하여 우리가 원하는 결과를 만들 수도 있다. 

{{{
SELECT CAST(Year AS VARCHAR) AS '년도', 
    SUM(CASE Quarter WHEN 1 THEN Amount ELSE 0 END) AS '1분기',
    SUM(CASE Quarter WHEN 2 THEN Amount ELSE 0 END) AS '2분기',
    SUM(CASE Quarter WHEN 3 THEN Amount ELSE 0 END) AS '3분기',
    SUM(CASE Quarter WHEN 4 THEN Amount ELSE 0 END) AS '4분기',
    SUM(Amount) '년도별 합계'
FROM Pivot 
GROUP BY Year
UNION ALL
SELECT '분기별 총합', SUM(a), SUM(b), SUM(c), SUM(d), SUM(YearSum)
FROM (
            SELECT Year AS 'Year', 
                SUM(CASE Quarter WHEN 1 THEN Amount ELSE 0 END) AS 'a',
                SUM(CASE Quarter WHEN 2 THEN Amount ELSE 0 END) AS 'b',
                SUM(CASE Quarter WHEN 3 THEN Amount ELSE 0 END) AS 'c',
                SUM(CASE Quarter WHEN 4 THEN Amount ELSE 0 END) AS 'd',
                SUM(Amount) 'YearSum'
            FROM Pivot 
            GROUP BY Year) T
}}}

attachment:cross_join03.jpg

대부분의 개발자는 결과 나왔다고 좋아라 한다. 그러나 위와 같은 SQL문은 같은 테이블을 2번 읽어야 하는 비효율이 발생을 한 것이다. 그러므로 Cross Join으로 똑 같은 그룹을 2개를 만든다.

{{{
SELECT *    
FROM Pivot CROSS JOIN (SELECT 1 AS ID UNION ALL SELECT 2) T
}}}

attachment:cross_join04.jpg

ID가 1인 집합의 경우는 Year로 Group By를 하고, 

{{{
SELECT 
    MIN(CASE WHEN ID = 1 THEN CAST(Year AS VARCHAR) ELSE '분기별 총합' END) AS '년도', 
    SUM(CASE Quarter WHEN 1 THEN Amount ELSE 0 END) AS '1분기',
    SUM(CASE Quarter WHEN 2 THEN Amount ELSE 0 END) AS '2분기',
    SUM(CASE Quarter WHEN 3 THEN Amount ELSE 0 END) AS '3분기',
    SUM(CASE Quarter WHEN 4 THEN Amount ELSE 0 END) AS '4분기',
    SUM(Amount) '년도별 합계'
FROM Pivot CROSS JOIN (SELECT 1 AS ID UNION ALL SELECT 2) T
GROUP BY CASE WHEN ID = 1 THEN Year END
}}}

ID가 1이 아닌 집합의 경우는 NULL이 된다. 그러므로 GROUP BY로 그룹을 지어줄 대상은 ID가 1이 아닌 집합 전체가 된다. 그러므로 집합 2의 경우는 전체 집계의 결과가 나오는 것이다. 

{{{
SELECT MIN(CASE WHEN ID = 1 THEN CAST(Year AS VARCHAR) 
ELSE '분기별 총합' END) AS '년도', 
    SUM(CASE Quarter WHEN 1 THEN Amount ELSE 0 END) AS '1분기',
    SUM(CASE Quarter WHEN 2 THEN Amount ELSE 0 END) AS '2분기',
    SUM(CASE Quarter WHEN 3 THEN Amount ELSE 0 END) AS '3분기',
    SUM(CASE Quarter WHEN 4 THEN Amount ELSE 0 END) AS '4분기',
    SUM(Amount) '년도별 합계'
FROM Pivot CROSS JOIN (SELECT 1 AS ID UNION ALL SELECT 2) T
GROUP BY NULL
}}}

==== 응용 예제1 ====
실제 사이트의 예로 다음과 같은 쿼리가 있다. 

{{{
SELECT MIN(CASE WHEN T.ID = '1' THEN CAST(a.eDate AS VARCHAR) 
ELSE '품목별 총합' END) '기간',
        SUM(CASE WHEN b.CommDetail = 'CS' THEN a.sqty ELSE '0' END) '남방셔츠    ',
        SUM(CASE WHEN b.CommDetail = 'DS' THEN a.sqty ELSE '0' END) '와이셔츠    ',
        SUM(CASE WHEN b.CommDetail = 'JP' THEN a.sqty ELSE '0' END) '잠    바    ',
        SUM(CASE WHEN b.CommDetail = 'NT' THEN a.sqty ELSE '0' END) '넥 타 이    ',
        SUM(CASE WHEN b.CommDetail = 'TS' THEN a.sqty ELSE '0' END) '티 셔 츠    ',
        SUM(CASE WHEN b.CommDetail = 'SU' THEN a.sqty ELSE '0' END) '양    복    ',
        SUM(CASE WHEN b.CommDetail = 'JL' THEN a.sqty ELSE '0' END) '가죽잠바    ',
        SUM(CASE WHEN b.CommDetail = 'JA' THEN a.sqty ELSE '0' END) '자    켓    ',
        SUM(CASE WHEN b.CommDetail = 'VS' THEN a.sqty ELSE '0' END) '조    끼    ',
        SUM(CASE WHEN b.CommDetail = 'PS' THEN a.sqty ELSE '0' END) '양복바지    ',
        SUM(CASE WHEN b.CommDetail = 'PD' THEN a.sqty ELSE '0' END) '일반바지    ',
        SUM(CASE WHEN b.CommDetail = 'SW' THEN a.sqty ELSE '0' END) '스 웨 트    ',
        SUM(CASE WHEN b.CommDetail = 'OL' THEN a.sqty ELSE '0' END) '롱 코 트    ',
        SUM(CASE WHEN b.CommDetail = 'OT' THEN a.sqty ELSE '0' END) '바 바 리    ',
        SUM(CASE WHEN b.CommDetail = 'OH' THEN a.sqty ELSE '0' END) '반 코 트    ',
        SUM(CASE WHEN b.CommDetail = 'AC' THEN a.sqty ELSE '0' END) '악세사리    ',
        SUM(CASE WHEN b.CommDetail = 'ES' THEN a.sqty ELSE '0' END) '내 의 류    ',
        SUM(a.amount) '합계'
FROM
         (SELECT code, MIN(eDate) 'eDate', SUM(sqty) 'sqty', SUM(amount) 'amount' 
         FROM saledetail_m 
         WHERE edate between '2004-04-01' and '2004-04-10' 
         GROUP BY code) a INNER JOIN BaseGoods_Head b
ON a.code = b.code CROSS JOIN (SELECT 1 AS ID UNION ALL SELECT 2) T
WHERE a.edate between '2004-04-01' and '2004-04-30'
GROUP BY  CASE WHEN T.ID = 1 THEN a.eDate END
ORDER BY 1 DESC
}}}

실제 In-Line View 부분은 인라인뷰가 아니였고, 그냥 Join으로 연결되었었다. 위와 같은 결과집합을 보기 위해서 약 7초 정도의 시간의 소요되었다. 그러나 Group By를 이용하여 조인의 횟수를 줄임으로써 5초를 절약할 수 있었다. 또 다른 예로 이번에는 차원의 수를 더 높였다. 3개의 복사본을 만들어 3개의 레벨로 접근을 시도하였다. 만약 이러한 연산이 빈번히 읽어난다면 계층형 테이블 구조를 만드는 것도 하나의 방법이 될 수 있다. 

{{{
select min(case when id in(1, 3) then cast(datepart(yyyy, tsSupportDate) as varchar) 
else '총 지원 건수' end)'년도', 
           min(case when id = 1 then tsSupporter 
                           when id = 2 then '------------->'
                           when id = 3 then '------------->' end) '지원자', 
           count(case when datepart(mm, tsSupportDate) = '1' then tsSupporter end) '1월',
           count(case when datepart(mm, tsSupportDate) = '2' then tsSupporter end) '2월',
           count(case when datepart(mm, tsSupportDate) = '3' then tsSupporter end) '3월',
           count(case when datepart(mm, tsSupportDate) = '4' then tsSupporter end) '4월',
           count(case when datepart(mm, tsSupportDate) = '5' then tsSupporter end) '5월',
           count(case when datepart(mm, tsSupportDate) = '6' then tsSupporter end) '6월',
           count(case when datepart(mm, tsSupportDate) = '7' then tsSupporter end) '7월',
           count(case when datepart(mm, tsSupportDate) = '8' then tsSupporter end) '8월',
           count(case when datepart(mm, tsSupportDate) = '9' then tsSupporter end) '9월',
           count(case when datepart(mm, tsSupportDate) = '10' then tsSupporter end) '10월',
           count(case when datepart(mm, tsSupportDate) = '11' then tsSupporter end) '11월',
           count(case when datepart(mm, tsSupportDate) = '12' then tsSupporter end) '12월',
           count(*) '총 지원 건수 합계',
           sum(tsDuration) '총 지원시간 합계'
from tblTechnicalSupport cross join (select 1 as id union all select 2 union all select 3) tmp
group by  case when id = 1 then tsSupporter end,
                case when id in(1, 3) then datepart(yyyy, tsSupportDate) end
order by 1, 2 desc
}}}

attachment:cross_join05.jpg

결과를 보면 년도별, 지원자별, 월별 지원건수 집계, 년도별 월별 총지원 건수 및 지원시간 집계, 등의 상당히 많은 레벨로 집계를 한 것을 알 수 있다. 

==== 응용 예제2 ====
{{{
SELECT CASE WHEN ID = 2 THEN CAST(DATEPART(YYYY, SALEDATE) AS VARCHAR) 
ELSE '' END '년도', 
           MIN(CASE WHEN ID = 1 THEN EMPID ELSE '합계' END) '사원', 
           COUNT(CASE WHEN DATEPART(MM, SALEDATE) = '1' THEN EMPID END) '1월',
           COUNT(CASE WHEN DATEPART(MM, SALEDATE) = '2' THEN EMPID END) '2월',
           COUNT(CASE WHEN DATEPART(MM, SALEDATE) = '3' THEN EMPID END) '3월',
           COUNT(CASE WHEN DATEPART(MM, SALEDATE) = '4' THEN EMPID END) '4월',
           COUNT(CASE WHEN DATEPART(MM, SALEDATE) = '5' THEN EMPID END) '5월',
           COUNT(CASE WHEN DATEPART(MM, SALEDATE) = '6' THEN EMPID END) '6월',
           COUNT(CASE WHEN DATEPART(MM, SALEDATE) = '7' THEN EMPID END) '7월',
           COUNT(CASE WHEN DATEPART(MM, SALEDATE) = '8' THEN EMPID END) '8월',
           COUNT(CASE WHEN DATEPART(MM, SALEDATE) = '9' THEN EMPID END) '9월',
           COUNT(CASE WHEN DATEPART(MM, SALEDATE) = '10' THEN EMPID END) '10월',
           COUNT(CASE WHEN DATEPART(MM, SALEDATE) = '11' THEN EMPID END) '11월',
           COUNT(CASE WHEN DATEPART(MM, SALEDATE) = '12' THEN EMPID END) '12월',
           COUNT(*) '판매개수 합계'
FROM SALES CROSS JOIN (SELECT 1 AS ID UNION ALL SELECT 2) TMP
GROUP BY  DATEPART(YYYY, SALEDATE), ID,
          CASE WHEN ID = 2 THEN CAST(DATEPART(YYYY, SALEDATE) AS VARCHAR) 
ELSE '' END ,
          CASE WHEN ID = 1 THEN EMPID END
}}}
attachment:cross_join06.jpg

==== 응용 예제3 ====
이 문제는 sqler.pe.kr에서 발견한 문제([http://sqler.pe.kr/web_board/view_list.asp?id=1218&read=149&pagec=1&gotopage=1&block=0&part=myboard7&tip=ok 여기])입니다. 링크로 가보면 문제가 두 개인데 비슷한 방식으로 푸는 문제입니다. 재미있을꺼 같아 한 개만 풀어봤습니다. (원리만 이해한다면 트래이닝 건덕지도 아니지요.) 

{{{#!html
<pre>
원하는 결과

num         a    b    c    d    e
----------- ---- ---- ---- ---- ----
5                     ▒         
4                     ▒         
3                ▒    ▒         
2                ▒    ▒         ▒
1           ▒    ▒    ▒         ▒
0           ▒    ▒    ▒    ▒    ▒
NULL        1    3    5    0    2
</pre>
}}}
{{{
--쿼리 결과는 텍스트로 보고 고정길이 폰트(~~체)로 보면 된다. 옵션 바꾸는거 귀찮으면 메모장으로 복사해서 보면 된다. 
with temp(num)
as
(
        select 6 numm
        union all
        select num - 1 from temp
        where num - 1 >= 0
),
val(a,b,c,d,e)
as
(
	select '1' a, '3' b, '5' c, '0' d, '2' e
)
select 
	case when b.num = 0 then null else b.num - 1 end num
,	case when b.num = 0 then a when b.num - 1 <= a.a then '▒' else '' end a
,	case when b.num = 0 then b when b.num - 1 <= a.b then '▒' else '' end b	
,	case when b.num = 0 then c when b.num - 1 <= a.c then '▒' else '' end c
,	case when b.num = 0 then d when b.num - 1 <= a.d then '▒' else '' end d
,	case when b.num = 0 then e when b.num - 1 <= a.e then '▒' else '' end e
from val a
	cross join temp b
}}}