∞. 기술 면접/3. 운영체제

02. 운영체제 - 멀티 프로세스와 멀티 쓰레드

THE HEYDAZE 2021. 10. 5. 15:57
공부목적으로 다른 블로그의 글을 그대로 따라치면서 작성되었습니다. 저작권 문제 시, 비공개 처리하겠습니다

멀티 프로세스 대신 멀티 스레드를 사용하는 이유
프로그램을 여러 개 키는 것(멀티 프로세스) 보다 하나의 프로그램 안에서 여러 작업(멀티 스레드)을 해결하는 것이다

1. 자원의 효율성 증대
    -  멀티 프로세스로 실행되는 작업을 멀티 스레드로 실행할 경우,
       프로세스를 생성하여 자원을 할당하는  시스템 콜이 줄어들어 자원을 효율적으로 관리 할 수 있다

시스템 콜
운영체제에서 프로그램이 구동되는데 있어 파일을 읽어 오거나, 파일을 쓰거나, 혹은 화면에 메시지를 출력하는 등 (Data, Stack, Heap 등 포함) 많으 부분이 커널 모드를 사용한다. 시스템 콜은 이러한 커
널 영역의 기능을 사용자 모드가 사용 가능하게, 즉 프로세스가 하드웨어에 직접 접근해서 필요한 기능을 사용할 수 있게 해준다. 


    - 프로세스 간의 Context Switching 시 단순히 CPU 레지스터 교체뿐만 아니라 RAM 과 CPU 사이의 캐시 메모리
       에 대한 데이터까지 초기화되므로 오버헤드가 크기 때문이다
    - 스레드는 프로세스 내의 메모리를 공유하기 때문에 독립적인 프로세스와 달리 스레드 간 데이터를 주고 받는 것이
     자원 소모가 줄어들게 된다

2. 처리 비용 감소 및 응답 시간 단축
     - 또한 프로세스 간의 통신(IPC) 보다 스레드 간의 통신의 비용이 적으므로 작업들 간의 통신의 부담이 줄어든다
         - 스레드는 Stack 영역을 제외한 모든 메모리를 공유하기 때문이다
     - 프로세스 간의 전환 속도보다 스레드 간의 전환 속도가 빠르다
         - Context Switching 시 스레드는 Stack 영역만 처리하기 때문

 

※ 주의 할 점
  - 동기화 문제
  - 스레드 간의 자원 공유는 전역 변수 (데이터 세그먼트)를 이용하므로 함께 상용할 때 충돌이 발생할 수 있다

 

https://nesoy.github.io/articles/2018-11/Context-Switching

 

https://velog.io/@raejoonee/%ED%94%84%EB%A1%9C%EC%84%B8%EC%8A%A4%EC%99%80-%EC%8A%A4%EB%A0%88%EB%93%9C%EC%9D%98-%EC%B0%A8%EC%9D%B4

 

 Thread-safe (스레드 세이프)

- Thread-safe 란?
  - 직역하면 스레드의 안전이다
  _ 멀티 스레드 환경에서 여러 스레드가 동시에 하나의 객체 및 변수 (공유 자원)에 접근할 때, 의도한 대로 동작하는 것
    을 말한다
  - 이러한 상황을 "Thread-safe 하다" 라고 표현한다

- Thread-safe 하게 구현하기
  - Thread-safe 하기 위해서는 공유 자원에 접근하는 임계영역(critical section) 을 동기화 기법으로 제어 해줘야 한다
  - 이를 `상호배제`라고 한다
  - 동기화 기법으로는 Mutex(뮤텍스) 나 Semaphore(세마포어) 등이 있다

- Reentrant
  - Reentrant 는 재진입성이라는 의미로, 어떤 함수가 Reentrant 하다는 것은 여러 스레드가 동시에 접근해도 언제나
    같은 실행 결과를 보장한다는 의미이다 - 동기화된 함수
  - 이를 만족하기 위해서 해당 서브루틴에서는 공유자원을 사용하지 않으면 된다
     - 예를들어 정적(전역=static) 변수를 사용하거나 반환하면 안 되고 호출 시 제공된 매개변수만으로 동작해야한다
  - 따라서, Reentrant(리엔트랜트) 하다면 Thread-safe 하지만 그 역은 성립하지 않는다.

 

동기화 객체의 종류

- 스레드 동기화 방법
  1. 실행 순서의 동기화
      - 스레드의 실행순서를 정의하고, 이 순서에 반드시 따르도록 하는 것

자바에서는 위와 같이 스레드 우선순위를 적용한다 (순서대로는 아니지만 우선순위가 높이 적용되어 실행된다)

  2. 메모리 접근에 대한 동기화
      - 메모리 접근에 있엇 동시 접근을 막는 것
      - 실행의 순서가 중요한 상황이 아니고, 한 순간에 하나의 스레드만 접근하면 되는 상황을 의미 (mutex)

- 동기화 기법의 종류
  1. 유저 모드 동기화
      - 커널의 힘을 빌리지 않는 (커널 코드가 실행되지 않는) 동기화 기법
      - 성능상 이점, 기능상의 제한
      - Ex) 크리티컬 섹션 기반의 동기화, 인터락 함수 기반의 동기화

  2. 커널 모드 동기화
      - 커널에서 제공하는 동기화 기능을 활용하는 방법
      - 커널 모드로의 변경이 필요하고 이는 성능 저하로 이어짐, 다양한 기능 활용 가능
      - Ex) 뮤텍스 기반의 동기화, 세마포어 기반의 동기화, 이름있는 뮤텍스 기반의 프로세스 동기화, 이벤트 기반의 동기화

 

Mutex (뮤텍스) 와 Semaphore (세마포어)의 차이

- 뮤텍스 (Mutex)
  - 공유된 자원의 데이터를 여러 스레드가 접근하는 것을 막는 것
  - 상호배제라고도 하며, Critical Section 을 가진 스레드의 Running time 이 서로 겹치지 않도록 각각 단독으로 실행
    하게 하는 기술이다
  - 다중 프로세스들의 공유 리소스에 대한 접근을 조율하기 위해 synchronized 또는 lock 을 사용한다
     - 즉, 뮤텍스 객체를 두 개(이상)의 스레드가 동시에 사용할 수 없다

- 세마포어 (Semaphore)
  - 공유된 자원의 데이터를 여러 프로세스가 접근하는 것을 막는 것
  - 리소스 상태를 나타내는 간단한 카운터로 생각할 수 있다
      - 운영체제 또는 커널의 한 지정된 저장장치 내의 값이다
      - 일반적으로 비교적 긴 시간을 확보하는 리소스에 대해 이용한다
      - 유닉스 시스템 프로그래밍에서 세마포어는 운영체제의 리소스를 경쟁적으로 사용하는 다중 프로세스에서 행동을
        조정하거나 또는 동기화 시키는 기술이다
  - 공유 리소스에 접근 할 수 있는 프로세스의 최대 허용치만큼 동시에 사용자가 접근하여 사용할 수 있다
  - 각 프로세스는 세마포어 값은 확인하고 변경할 수 있다
      a. 사용 중이지 않는 자원의 경우 그 프로세스가 즉시 자원을 사용할 수 있다
      b. 이미 다른 프로세스에 의해 사용 중이라는 사실을 알게 되면 재시도하기 전에 일정 시간을 기다려야 한다
      - 세마포어를 사용하는 프로세스는 그 값을 확인하고, 자원을 사용하는 동안에는 그 값을 변경함으로써 다른 
        세마포어 사용자들이 기다리도록 해야한다
  - 세마포어는 이진수 (0 또는 1) 를 사용 = mutex 하거나, 또는 추가적인 값을 가질 수 도 있다

- 차이점
  1. 가장 큰 차이점은 관리하는 동기화 대상의 개수
     - Mutex 는 동기화 대상이 오직 하나 뿐일 때, Semaphore 는 동기화 대상이 하나 이상일 때 사용한다
  2. Semaphore 는 Mutex 가 될 수 있지만, Mutex 는 Semaphore 가 될 수 없다
     - Mutex 는 상태가 0,1  두 개 뿐인 Binary Semaphore 
  3. Semaphore 는 소유할 수 없는 반면, Mutex 는 소유가 가능하며 소유주가 이에 대한 책임을 가진다
    - Mutex 의 경우 상태가 두개 뿐인 lock 이므로 lock 을 가질 수 있다
  4. Mutex 의 경우 Mutex 를 소유하고 있는 스레드가 이 Mutex 를 해제할 수 있다. 하지만, Semaphore 의 경우
     이러한 Semaphore 를 소유하지 않는 스레드가 Semaphore 를 해제 할 수 있다
  5. Semaphore 는 시스템 범위에 걸쳐있고 파일시스템상의 파일 형태로 존재하는 반면 Mutex 는 프로세스 범위를
     가지며 프로세스가 종료 될 대 자동으로 Clean  up 된다