∞. 기술 면접/4. 데이터베이스

03. 기술 면접 - 데이터베이스 - 트랜잭션 (Transaction)

THE HEYDAZE 2021. 10. 12. 14:36
공부목적으로 다른 블로그의 글을 그대로 따라치면서 작성되었습니다. 저작권 문제 시, 비공개 처리하겠습니다

트랜잭션이란?

- 데이터베이스의 상태를 변환시키는 하나의 논리적인 작업 단위를 구성하는 연산들의 집합이다
  - 예를 들어, A계좌에서 B계좌로 일정 금액을 이체한다고 가정하자.
      1. A계좌의 잔액을 확인한다
      2. A계좌의 금액에서 이체할 금액을 빼고 다시 저장한다
      3. B계좌의 잔액을 확인한다
      4. B계좌의 금액에서 이체할 금액을 더하고 다시 저장한다
  - 이러한 과정들이 모두 합쳐져 계좌이체라는 하나의 작업단위를 구성한다.

  - 하나의 트랜잭션은 commit 되거나, rollback 된다
      - commit 연산
          - 한 개의 논리적인 단위(트랜잭션)에 대한 작업이 성공적으로 끝나 데이터베이스가 다시 일관된 상태에 있을 때
            이 트랜잭션이 행한 갱신 연산이 완료된 것을 트랜잭션 관리자에게 알려주는 연산이다
          - 트랜잭션 안의 작업 내용 반영 (INSERT, UPDATE, DELETE ...)

      - rollback 연산
          - 하나의 트랜잭션 처리가 비정상적으로 종료되어 데이터베이스의 일관성을 깨뜨렸을 때, 이 트랜잭션의 일부가
            정상적으로 처리되었더라도 트랜잭션의 원자성을 구현하기 위해 이 트랜잭션이 행한 모든 연산을 취소(undo)
            하는 연산이다
          - rollback 시에는 해당 트랜잭션을 재시작하거나 폐기한다
          - 트랜잭션 안의 작업 내용 반영안함 (INSERT, UPDATE, DELETE ...)

  - 데이터베이스 응용프로그램은 트랜잭션들의 집합으로 정의 할 수 있다

트랜잭션의 성질 (ACID)

- 원자성 (Atomicity), All or nothing
    - 트랜잭션의 모든 연산들은 정상적으로 수행 완료되거나 아니면 전혀 어떠한 연산도 수행되지 않은 상태를 보장해야
      한다

- 일관성 (Consistency)
      - 트랜잭션은 완료 후에도 데이터베이스가 일관된 상태로 유지되어야 한다

- 독립성 (Isolation)
      - 하나의 트랜잭션이 실행하는 도중에 변경한 데이터는 이 트랜잭션이 완료될 때 까지 다른 트랜잭션이 참조하지 
        못한다

- 지속성 (Durability)
      - 성공적으로 수행 된 트랜잭션영원히 반영되어야 한다

 

트랜잭션의 필요성

- 현금 인출기를 작동하는 도중에 기계오류나 정전 등과 같은 예기치 않은 상황이 발생하여 카드가 나오지 않거나 기계
  가 멈추는 경우

- 각 각 다른 지점의 은행에서 동시에 인출할 때, 하나의 지점이 다른지점에서 저장한 잔액을 덮어 쓰는 경우

- 위와 같은 상황이 발생되지 않도록 방지하기 위해, 즉 트랜잭션의 성질인 ACID 를 제공받기위해 트랜잭션을 사용한다

 

트랜잭션의 상태

- 활동 (Active)
  - 트랜잭션이 실행 중에 있는 상태, 연산들이 정상적으로 실행 중인 상태

- 장애 (Failed)
  - 트랜잭션이 실행에 오류가 발생하여 중단된 상태

- 철회 (Aborted)
  - 트랜잭션이 비정상적으로 종료되어 Rollback 연산을 수행한 상태

- 부분 완료 (Partially Committed)
  - 트랜잭션이 마지막 연산까지 실행했지만, Commit 연산이 실행되기 직전의 상태

- 완료 (Committed)
  - 트랜잭션이 성공적으로 종료되어 Commit 연산응 실행한 후의 상태

 

트랜잭션 격리 수준 (Isolation Level)

- Isolation Level 이란?
    - 트랜잭션에서 일관성이 없는 데이터를 허용하도록 하는 수준

- Isolation Level 의 필요성
    - 데이터베이스는 ACID 같이 트랜잭션이 원자적이면서도 독립적인 수행을 하도록 한다
    - 그래서 Locking 이라는 개념이 등장한다
        - 트랜잭션이 DB 를 다루는 동안 다른 트랜잭션이 관여하지 못하게 막는 것
    - 하지만 무조건적인 Locking 으로 동시에 수행되는 많은 트랜잭션들을 순서대로 처리하는 방식으로 구현되면 DB
     의 성능은 떨어지게 된다
    - 반대로 응답성을 높이기 위해 Locking 범위를 줄인다면 잘못된 값이 처리 될 여지가 있다
    - 그래서 최대한 효율적인 Locking 방법이 필요하다

- Isolation Level 의 종류
    1. Read Uncommitted (레벨 0) = A트랜잭션 중 커밋되지 않은 데이터를 B트랜잭션에서 읽기가능
        - select 문장이 수행되는 동안 해당 데이터에 Shared Lock이 걸리지 않는 Level
        - 트랜잭션에 처리중인 혹은 아직 커밋되지 않은 데이터를 다른 트랜잭션이 읽는 것을 허용한다
        - 따라서, 어떤 사용자가 A라는 데이터를 B라는 데이터로 변경하는 동안 다른 사용자는 아직 완료되지 않은
          (Uncommitted 혹은 Dirty) 트랜잭션이지만 변경된 데이터인 B를 읽을 수 있다
        - 데이터베이스 일관성을 유지할 수 없다

   2. Read Committed (레벨 1) = A트랜잭션이 커밋하지 않는다면 B트랜잭션에서 A 데이터를 읽을 수 없다 (기본값)
        - select 문장이 수행되는 동안 해당 데이터에 Shared Lock 이 걸리는 Level
        - 트랜잭션이 수행되는 동안 다른 트랜잭션이 접근할 수 없어 대기하게 된다
        - Commit이 이루어진 트랜잭션만 조회할 수 있다
        - 따라서, 어떤 사용자가 A라는 데이터를 B라는 데이터로 변경하는 동안 다른 사용자는 해당 데이터에 접근 할 수 없다
        - SQL Server가 Default 로 사용하는 Isolation Level

   3. Repeatable Read (레벨 2)
        - 트랜잭션이 완료될 때까지 select 문장이 사용하는 모든 데이터에 Shared Lock 이 걸리는 Level
        - 트랜잭션이 범위 내에서 조회한 데이터의 내용이 항상 동일함을 보장한다
        - 따라서, 다른 사용자는 그 영역에 해당되는 데이터 대한 수정이 불가능하다
        - 예) member 조회, board 조회, post 조회 시 Lock 이 걸리고, commit 또는 rollback 될 때 까지 접근 불가?

   4. Serializable (레벨 3)
        - 트랜잭션이 완료 될 때까지 select 문장이 사용되는 모든 데이터에 Shared Lock 걸리는 Level
        - 완벽한 읽기 일관성 모드를 제공한다
        - 따라서, 다른 사용자는 그 영역에 해당되는 데이터에 대한 수정 및 입력이 불가능하다

  - Isolation Level 조정은 동시성이 증가되는데 반해 데이터 무결성에 문제가 발생할 수 있고,
    데이터의 무결성을 유지하는 데 반해 동시성 떨어질 수 있다
  - level 이 높아질 수록 비용이 높아진다

  동시성 데이터 무결성
ISO LEVEL ↑
ISO LEVEL ↓

 

낮은 단계의 Isolation Level 이용시 발생하는 현상

- Dirty Read
    - 커밋되지 않은 수정 중인 데이터를 다른 트랜잭션에서 읽을 수 있도록 허용할 때 발생하는 현상
      어떤 트랜잭션에서 아직 실행이 끝난지 않은 다른 트랜잭션에 의한 변경 사항을 보게 되는 되는 경우
- Non-Repeatable Read
    - 한 트랜잭션에서 같은 쿼리를 두 번 수행할 때 그 사이에 다른 트랜잭션이 값을 수정 또는 삭제함으로써 두 쿼리의        결과가 상이하게 나타나는 비 일관성 현상
- Phantom Read
    - 한 트랜잭션 안에서 일정 범위의 레코드를 두 번 이상 읽을 때, 첫 번째 쿼리에서 없던 레코드가
      두 번째 쿼리에서 나타나는 현상
      이는 트랜잭션 도중 새로운 레코드가 삽입되는 것을 허용하기 때문에 나타난다.

참고

배타적 잠금(읽기/쓰기 둘다 불가능) 과 공유 잠금(읽기 가능 / 쓰기 불가능)

 

데이터베이스 - Exclusive lock과 Shared lock의 차이

Exclusive lock과 Shared lock 운영체제에서 잠금(Lock)과 유사하게 데이터베이스에서도 잠금(Lock)이 있다. 멀티 트랜잭션 환경에서 데이터베이스의 일관성과 무결성을 유지하려면 트랜잭션의 순차적

jeong-pro.tistory.com

 

https://sabarada.tistory.com/121

 

[데이터베이스] Lock에 대해서 알아보자 - 기본편

안녕하세요. 오늘은 DataBase의 Lock에 대해서 알아보고 정리해보는 시간을 가져보도록 하겠습니다. DataBase는 데이터를 영속적으로 저장하고 있는 시스템입니다. 이런 시스템은 같은 자원(데이터)

sabarada.tistory.com

 

https://mangkyu.tistory.com/154