∞. 기술 면접/4. 데이터베이스

04. 기술 면접 - 데이터베이스 - 조인 (Join)

THE HEYDAZE 2021. 10. 15. 14:06
공부목적으로 다른 블로그의 글을 그대로 따라치면서 작성되었습니다. 저작권 문제 시, 비공개 처리하겠습니다

조인 (Join)

- 조인이란
  - 한 데이터베이스 내의 여러 테이블의 레코드를 조합하여 하나의 열로 표현한 것
  - 회원(Member) 테이블과 게시글(Board) 테이블이 있을 때 어떤 회원이 작성한 게시글을 가지고 오기 위해
    두 테이블을 조합하여 가져와야 할 때 사용된다

- 조인의 필요성
  - 관계형 데이터베이스의 구조적 특징으로 정규화를 수행하면 의미 있는 데이터의 집합으로 테이블이 구성되고, 각
    테이블끼리는 관계(Relationship) 를 갖게 된다
  - 이와 같은 특징으로 관계형 데이터베이스는 저장 공간이 효율성이 향상되게 된다.
  - 다른 한편으로는 서로 관계있는 데이터가 여러 테이블로 나뉘어 저장되므로, 각 테이블에 저장된 데이터를 효과적으
    로 검색하기 위해 조인이 필요하다 (성능 저하)

 

조인의 종류
1. 내부 조인 (INNER JOIN)

      - 여러 애플리케이션에서 사용되는 가장 흔한 결합 방식이며, 기본 조인 형식으로 간주 된다.
      - 내부 조인은 조인 구문에 기반한 2개의 테이블(A,B)의 컬럼 값을 결합함으로써 새로운 결과 테이블을 생성한다
      - 명시적 조인 표현(explicit)암시적 조인 표현(implicit) 2개의 다른 조인식 구문이 있다
      - 명시적 조인 표현
          - 테이블에 조인을 하라는 것을 지정하기 위해 JOIN 키워드를 사용하며, 그리고 나서 다음의 예제와 같이
            ON 키워드를 조인에 대한 구문을 지정하는 사용한다

SELECT *
FROM employee INNER JOIN department
ON employee.DepartmentID = department.DepartmentID;


      - 암시적 조인 표현
        - select 구문의 from 절에서 그것들을 분리하는 컴마를 사용해서 단순히 조인을 위한 여러 테이블을 나열

SELECT *
FROM employee, department
WHERE employee.DepartmentID = department.DepartmentID;

      - 결과

      a. 동등 조인 (EQUI JOIN)
        - 비교자 기반의 조인이며, 조인 구문에서 동등비교만을 사용한다
        - 다른 비교 연산자(<와 같은)를 사용하는 것을 동등 조인으로서의 조인의 자격을 박탈하는 것이다

      b. 자연 조인 (NATURAL JOIN)
        - 동등 조인의 한 유형으로 조인 구문이 조인된 테이블에서 동일한 컬럼명을 가진 2개의 테이블에서 모든 컬럼
          들을 비교함으로써, 암시적으로 일어나는 구문이다.
        - 결과적으로 나온 조인된 테이블은 동일한 이름을 가진 컬럼의 각 쌍에 대한 단 하나의 컬럼만 포함하고 있다
        - 안티패턴이라 사용되지 않는다

SELECT * FROM employee NATURAL JOIN department;

      - 결과

      c. 교차 조인 (CROSS JOIN)
        - 조인되는 두 테이블에서 곱집합을 반환한다
        - 즉, 두 번째 테이블롭터 각 행과 첫 번째 테이블에서 각 행이 한번씩 결합된 열을 만든다
        - m개의 행을 가진 테이블 A와 n개의 행을 가진 테이블 B 를 교차조인 하면 m*n 개의 행을 생성한다
        - 명시적 조인 표헌
        - 모든 경우의 수를 가져오는 특이한 케이스가 아닌 경우 안티패턴이라 사용되지않는다

SELECT * FROM employee CROSS JOIN department;

        - 암시적 조인 표헌

SELECT * FROM employee, department;

        - 결과

 

 2. 외부 조인 (OUTER JOIN)

  - 조인 대상 테이블에서 특정 테이블의 데이터가 모두 필요한 상황에서 외부 조인을 활용하여
    효과적으로 결과 집합을 생성할 수 있다
  - 방향(LEFT, RIGHT) 를 특정 테이블을 지정하여 특정 테이블의 데이터를 모두 포함할 지 정한다

  a. 왼쪽 외부 조인 (LEFT OUTER JOIN = LEFT JOIN)
      - 우측 테이블에 조인할 컬럼의 값이 없는 경우 사용한다
      - 즉, 좌측 테이블의 모든 데이터를 포함하는 결과 집합을 생성한다

SELECT *
FROM employee LEFT OUTER JOIN department
ON employee.DepartmentID = department.DepartmentID;

  - 결과

Innert Join 을 했다면, 부서가 있는 회사원들만 가져오게 되어 John 회사원은 조회 할 수 없다 LEFT JOIN 을 이용하여 부서가 정해지지 않은 회사원 John 도 조회가 가능해진다

  - b. 오른쪽 외부 조인(RIGHT OUTER JOIN)
    - 좌측 테이브에 조인할 컬럼의 값이 없는 경우 사용한다
    - 즉, 우측 테이블의 모든 데이터를 포함하는 결과 집합을 생성한다

SELECT *
FROM employee RIGHT OUTER JOIN department
ON employee.DepartmentID = department.DepartmentID;

  - 결과

부서에 속한 회원과, 부서에 회원이 없는 부서를 조회한다 (즉, 모든 부서를 가져오고 부서에 회원이 있으면 회원도 가져오는 것이고 없으면 NULL 로 표시한다)


  c. 완전 외부 조인 (FULL OUTER JOIN)
      - 양쪽 테이블 모두 OUTER JOIN 이 필요할 때 사용한다

SELECT *
FROM employee FULL OUTER JOIN department
ON employee.DepartmentID = department.DepartmentID;

회사원과 부서가 있는 경우 + 회사원만 있는 경우 + 부서만 있는 경우

 

3. 셀프 조인 (SELF JOIN)

  - 한 테이블에서 자기 자신에 조인을 시키는 것 이다
  - 계층형 구조에서 사용된다 (예를들어 현재 선택된 행의 상사가 누구인지 출력할 때)

SELECT * 
FROM EMP e JOIN EMP m;
ON e.manager_id = m.id

 

4. 전체 목록

[출처] https://stanleykou.tistory.com/entry/SQL-INNER-%EC%A1%B0%EC%9D%B8%EA%B3%BC-OUTER%EC%A1%B0%EC%9D%B8%EC%9D%B4-%EB%AC%B4%EC%97%87%EC%9D%B8%EA%B0%80%EC%9A%94

 

조인을 사용할 때 주의사항

- SQL 문장의 의미를 제대로 파악
    - SQL 을 어떻게 작성하느냐에 따라 성능이 크게 좌우된다. 어떤 질의를 수행할 것인지를 명확하게 정의한 후
      비효율을 제거하여 최적의 SQL을 작성해야 한다

- 명확한 조인 조건 제공
    - 조인 조건을 명확하게 제공하지 않을 경우, 의도치 않게 CROSS JOIN(Cartesian Product) 이 수행될 수 있다

 

조인을 사용할 때 고려사항

- 조인할 대상의 집합을 최소화
    - 집합을 최소화할 방법이 있으면, 조건을 먼저 적용하여 관계를 맺을 집합을 최소화한 후, 조인을 맺는 것이 효율적이다
- 효과적인 인덱스의 활용
    - 인덱스를 활용하면, 조인 연산의 비용을 극적으로 낮출 수 있다