02. 운영체제 - 멀티 프로세스와 멀티 쓰레드
공부목적으로 다른 블로그의 글을 그대로 따라치면서 작성되었습니다. 저작권 문제 시, 비공개 처리하겠습니다
멀티 프로세스 대신 멀티 스레드를 사용하는 이유
프로그램을 여러 개 키는 것(멀티 프로세스) 보다 하나의 프로그램 안에서 여러 작업(멀티 스레드)을 해결하는 것이다
1. 자원의 효율성 증대
- 멀티 프로세스로 실행되는 작업을 멀티 스레드로 실행할 경우,
프로세스를 생성하여 자원을 할당하는 시스템 콜이 줄어들어 자원을 효율적으로 관리 할 수 있다
시스템 콜
운영체제에서 프로그램이 구동되는데 있어 파일을 읽어 오거나, 파일을 쓰거나, 혹은 화면에 메시지를 출력하는 등 (Data, Stack, Heap 등 포함) 많으 부분이 커널 모드를 사용한다. 시스템 콜은 이러한 커널 영역의 기능을 사용자 모드가 사용 가능하게, 즉 프로세스가 하드웨어에 직접 접근해서 필요한 기능을 사용할 수 있게 해준다.
- 프로세스 간의 Context Switching 시 단순히 CPU 레지스터 교체뿐만 아니라 RAM 과 CPU 사이의 캐시 메모리
에 대한 데이터까지 초기화되므로 오버헤드가 크기 때문이다
- 스레드는 프로세스 내의 메모리를 공유하기 때문에 독립적인 프로세스와 달리 스레드 간 데이터를 주고 받는 것이
자원 소모가 줄어들게 된다
2. 처리 비용 감소 및 응답 시간 단축
- 또한 프로세스 간의 통신(IPC) 보다 스레드 간의 통신의 비용이 적으므로 작업들 간의 통신의 부담이 줄어든다
- 스레드는 Stack 영역을 제외한 모든 메모리를 공유하기 때문이다
- 프로세스 간의 전환 속도보다 스레드 간의 전환 속도가 빠르다
- Context Switching 시 스레드는 Stack 영역만 처리하기 때문
※ 주의 할 점
- 동기화 문제
- 스레드 간의 자원 공유는 전역 변수 (데이터 세그먼트)를 이용하므로 함께 상용할 때 충돌이 발생할 수 있다
Thread-safe (스레드 세이프)
- Thread-safe 란?
- 직역하면 스레드의 안전이다
_ 멀티 스레드 환경에서 여러 스레드가 동시에 하나의 객체 및 변수 (공유 자원)에 접근할 때, 의도한 대로 동작하는 것
을 말한다
- 이러한 상황을 "Thread-safe 하다" 라고 표현한다
- Thread-safe 하게 구현하기
- Thread-safe 하기 위해서는 공유 자원에 접근하는 임계영역(critical section) 을 동기화 기법으로 제어 해줘야 한다
- 이를 `상호배제`라고 한다
- 동기화 기법으로는 Mutex(뮤텍스) 나 Semaphore(세마포어) 등이 있다
- Reentrant
- Reentrant 는 재진입성이라는 의미로, 어떤 함수가 Reentrant 하다는 것은 여러 스레드가 동시에 접근해도 언제나
같은 실행 결과를 보장한다는 의미이다 - 동기화된 함수
- 이를 만족하기 위해서 해당 서브루틴에서는 공유자원을 사용하지 않으면 된다
- 예를들어 정적(전역=static) 변수를 사용하거나 반환하면 안 되고 호출 시 제공된 매개변수만으로 동작해야한다
- 따라서, Reentrant(리엔트랜트) 하다면 Thread-safe 하지만 그 역은 성립하지 않는다.
동기화 객체의 종류
- 스레드 동기화 방법
1. 실행 순서의 동기화
- 스레드의 실행순서를 정의하고, 이 순서에 반드시 따르도록 하는 것
2. 메모리 접근에 대한 동기화
- 메모리 접근에 있엇 동시 접근을 막는 것
- 실행의 순서가 중요한 상황이 아니고, 한 순간에 하나의 스레드만 접근하면 되는 상황을 의미 (mutex)
- 동기화 기법의 종류
1. 유저 모드 동기화
- 커널의 힘을 빌리지 않는 (커널 코드가 실행되지 않는) 동기화 기법
- 성능상 이점, 기능상의 제한
- Ex) 크리티컬 섹션 기반의 동기화, 인터락 함수 기반의 동기화
2. 커널 모드 동기화
- 커널에서 제공하는 동기화 기능을 활용하는 방법
- 커널 모드로의 변경이 필요하고 이는 성능 저하로 이어짐, 다양한 기능 활용 가능
- Ex) 뮤텍스 기반의 동기화, 세마포어 기반의 동기화, 이름있는 뮤텍스 기반의 프로세스 동기화, 이벤트 기반의 동기화
Mutex (뮤텍스) 와 Semaphore (세마포어)의 차이
- 뮤텍스 (Mutex)
- 공유된 자원의 데이터를 여러 스레드가 접근하는 것을 막는 것
- 상호배제라고도 하며, Critical Section 을 가진 스레드의 Running time 이 서로 겹치지 않도록 각각 단독으로 실행
하게 하는 기술이다
- 다중 프로세스들의 공유 리소스에 대한 접근을 조율하기 위해 synchronized 또는 lock 을 사용한다
- 즉, 뮤텍스 객체를 두 개(이상)의 스레드가 동시에 사용할 수 없다
- 세마포어 (Semaphore)
- 공유된 자원의 데이터를 여러 프로세스가 접근하는 것을 막는 것
- 리소스 상태를 나타내는 간단한 카운터로 생각할 수 있다
- 운영체제 또는 커널의 한 지정된 저장장치 내의 값이다
- 일반적으로 비교적 긴 시간을 확보하는 리소스에 대해 이용한다
- 유닉스 시스템 프로그래밍에서 세마포어는 운영체제의 리소스를 경쟁적으로 사용하는 다중 프로세스에서 행동을
조정하거나 또는 동기화 시키는 기술이다
- 공유 리소스에 접근 할 수 있는 프로세스의 최대 허용치만큼 동시에 사용자가 접근하여 사용할 수 있다
- 각 프로세스는 세마포어 값은 확인하고 변경할 수 있다
a. 사용 중이지 않는 자원의 경우 그 프로세스가 즉시 자원을 사용할 수 있다
b. 이미 다른 프로세스에 의해 사용 중이라는 사실을 알게 되면 재시도하기 전에 일정 시간을 기다려야 한다
- 세마포어를 사용하는 프로세스는 그 값을 확인하고, 자원을 사용하는 동안에는 그 값을 변경함으로써 다른
세마포어 사용자들이 기다리도록 해야한다
- 세마포어는 이진수 (0 또는 1) 를 사용 = mutex 하거나, 또는 추가적인 값을 가질 수 도 있다
- 차이점
1. 가장 큰 차이점은 관리하는 동기화 대상의 개수
- Mutex 는 동기화 대상이 오직 하나 뿐일 때, Semaphore 는 동기화 대상이 하나 이상일 때 사용한다
2. Semaphore 는 Mutex 가 될 수 있지만, Mutex 는 Semaphore 가 될 수 없다
- Mutex 는 상태가 0,1 두 개 뿐인 Binary Semaphore
3. Semaphore 는 소유할 수 없는 반면, Mutex 는 소유가 가능하며 소유주가 이에 대한 책임을 가진다
- Mutex 의 경우 상태가 두개 뿐인 lock 이므로 lock 을 가질 수 있다
4. Mutex 의 경우 Mutex 를 소유하고 있는 스레드가 이 Mutex 를 해제할 수 있다. 하지만, Semaphore 의 경우
이러한 Semaphore 를 소유하지 않는 스레드가 Semaphore 를 해제 할 수 있다
5. Semaphore 는 시스템 범위에 걸쳐있고 파일시스템상의 파일 형태로 존재하는 반면 Mutex 는 프로세스 범위를
가지며 프로세스가 종료 될 대 자동으로 Clean up 된다
'∞. 기술 면접 > 3. 운영체제' 카테고리의 다른 글
06. 기술면접 - 운영체제 - 메모리 관리 전략 (0) | 2021.10.06 |
---|---|
05. 기술면접 - 운영체제 - 프로세스 동기화 (0) | 2021.10.06 |
04. 기술면접 - 운영체제 - 동기와 비동기 (0) | 2021.10.06 |
03. 기술면접 - 운영체제 - 스케줄러 (Schedula) (0) | 2021.10.06 |
01. 운영체제 - 프로세스와 스레드의 차이 (Process vs Thread) (0) | 2021.10.05 |
댓글
이 글 공유하기
다른 글
-
05. 기술면접 - 운영체제 - 프로세스 동기화
05. 기술면접 - 운영체제 - 프로세스 동기화
2021.10.06 -
04. 기술면접 - 운영체제 - 동기와 비동기
04. 기술면접 - 운영체제 - 동기와 비동기
2021.10.06 -
03. 기술면접 - 운영체제 - 스케줄러 (Schedula)
03. 기술면접 - 운영체제 - 스케줄러 (Schedula)
2021.10.06 -
01. 운영체제 - 프로세스와 스레드의 차이 (Process vs Thread)
01. 운영체제 - 프로세스와 스레드의 차이 (Process vs Thread)
2021.10.05