스레드란?
프로세스는 실행중인 프로그램이란 뜻이다. 프로그램이 실제로 실행되어, 메모리나 CPU와 같은 자원을 할당 받으면 이를 프로세스라고 부른다. 스레드는 프로세스 내에서 실제로 작업을 수행하는 한 단위이다. 모든 프로세스는 하나 이상의 스레드가 존재하고, 두개 이상의 스레드를 갖는 프로세스를 멀티 스레드 프로세스(Multi Thread Process)라고 한다.
프로세스는 독자적인 메모리를 할당받기 때문에 프로세스끼리 일반적으로 서로의 메모리 영역을 침범하지 못한다.(공유할 수 없다) 하지만 프로세스 내부의 스레드는 같은 자원을 공유하여 사용이 가능하다. 같은 자원을 공유할 수 있기 때문에 동시에 여러가지 일을 같은 자원을 두고 수행할 수 있고, 이는 곧 병렬성의 향상으로 이어진다.
여러 스레드를 사용하여 병렬 프로그래밍을 하게 되면, 웹 서버에서는 빠른 응답이 가능하다는 장점이 있지만, 결코 장점만 있는 것은 아니다. 여러 스레드가 하나의 자원을 공유하고 있기 때문에 스레드 간 경쟁 상태가 발생할 수 있고, 이는 동시성 문제로 이어진다.
예를 들어, 아래와 같이 카운트를 갖는 Count클래스를 살펴보자.
public class Count{
private int count = 0;
public void increase() {
count++;
}
public int getCount() {
return count;
}
}
간단해보이는 이 코드는 thread-safe하지 않다.
만약 스레드A와 스레드B가 동시에 increase()메서드를 호출하여 count를 증가시켰을 때, A의 increase()로 count는 1이 되고, B의 increase()로 count는 2가 되는 것이 정상적인 동작일 것이다. 하지만 A와 B가 동시에 increase()메서드를 호출하게 된다면 count는 2가 아닌 1이 되는 문제가 발생한다.
이는 count를 증가시키는 로직이 사실은 아래와 같이 1)count변수 값 조회 2)count변수에 1을 더하고 저장 두가지의 동작으로 이루어지기 때문이다.
스레드A와 스레드B에서 동시에 count변수에 접근하게 되면, 같은 count변수를 조회하게 되고, increase()메서드를 실행한다고 했을 때 같은 count변수(0)에 1을 더하게 되므로 결과는 2가 아닌 1이 되는 것이다.
🤔동시성 문제를 어떻게 해결해야 할까?
1. 암시적 Lock 사용
가장 간단하면서 쉬운 방법이다. Lock을 걸게 되면 스레드의 공유자원에 대한 독점을 허용하기 때문에 다른 스레드가 자원에 접근하지 못하고 대기하게 된다. 이는 여러 스레드가 공유자원에 동시에 접근하지 못하므로 동시성 문제를 막을 수 있지만, 하나의 스레드만 자원을 사용하므로 병렬성은 낮아지게 된다. 자바에서는 암시적 Lock은 아래와 같이 메서드에 synchronized키워드를 사용하여 구현할 수 있다. (변수도 가능하지만, 객체만 가능하다)
public class Count {
private int count = 0;
public synchronized void increase() { //synchronized 추가
count++;
}
public synchronized int getCount() { //synchronized 추가
return count;
}
}
2. 명시적 Lock 사용
명시적 Lock은 synchronized키워드를 사용하는 암시적 Lock과는 달리 Lock 인터페이스를 이용한다. Lock객체의 lock()메서드를 호출하여 잠그고, unlock()메서드를 호출하여 잠금을 해제한다.
public class Count {
private int count = 0;
private Lock lock = new ReentrantLock();
public void increase() {
lock.lock(); //잠금
try {
count++;
} finally {
lock.unlock(); //잠금 해제
}
}
public int getCount() {
lock.lock(); //잠금
try{
return count;
}finally{
lock.unlock(); //잠금 해제
}
}
}
3. volatile을 사용
volatile 키워드를 사용하면 변수가 항상 메인 메모리에서 읽고 쓰이도록 보장된다. 이렇게 함으로써, 변수에 대한 변경 사항이 다른 스레드에 즉시 반영되므로, 스레드 간의 동시성 문제를 해결할 수 있다.
public class Count {
private volatile int count; //volatile 추가
public void increase() {
count++;
}
public int getCount() {
return count;
}
}
volatile 키워드를 변수에 붙여주면, 해당 변수는 캐시에 저장되지 않고 메인 메모리에 항상 저장이 되는데, 바로 이 점을 이용해서 캐시 사용으로 인한 데이터 불일치를 막을 수 있다.
4. Concurrent 패키지 사용
자바에서 제공하는 Concurrent패키지는 동시성 문제를 해결하기 위한 다양한 클래스와 인터페이스를 제공한다. 대표적인 ConcurrentHashMap클래스를 사용해서 위 Count클래스에서 동시성 문제를 해결해보자.
public class Count {
private ConcurrentHashMap<String, Integer> map = new ConcurrentHashMap<>();
public void increase() {
Integer currentValue = map.get("count");
if (currentValue == null) {//"count"라는 키가 Map에 존재하지 않으면
map.put("count", 1);
} else { //존재하면
map.put("count", currentValue + 1);
}
}
public int getCount() {
return map.get("count");
}
}
위와 같이 ConcurrentHashMap을 사용하면 내부적으로 스레드 간의 안전한 데이터 공유를 보장하기 때문에 동시성 문제가 발생하지 않는다.
5. 불변 객체 사용
불변 객체는 상태가 변경될 수 없는 객체이기 때문에 Thread-safe하다. 아래 코드에서 보이는 것처럼 final 키워드로 클래스와 변수를 선언하여 변경할 수 없도록 만들었기 때문에 count 변수는 반드시 생성자를 통해서 초기화한다. increase()에서는 Count 객체를 생성하면서, count를 증가시킨다.
public final class Count {
private final int count;
public Count(int count) {
this.count = count;
}
public Count increase(){
return new Count(count + 1); //새로운 Count 객체 생성
}
public int getCount(){
return count;
}
}
이렇게 불변 객체를 사용하면 동시성 문제를 해결할 수 있지만, 객체를 생성하는 비용이 굉장히 크기 때문에 성능상 문제가 발생할 수 있다. 따라서 불변 객체를 사용하는 경우 객체를 재사용하는 방법이 필요할 것이다.
Reference : https://deveric.tistory.com/104
'Languages > Java' 카테고리의 다른 글
[Java] Stream API 개념 정리 (0) | 2023.04.14 |
---|---|
[Java] equals(), hashCode()를 재정의 해야 하는 이유 (0) | 2023.04.12 |
[Java] 자바 Collection 개념 정리 & 예제 (0) | 2023.04.10 |
[Java] 상속과 인터페이스 개념 정리 (0) | 2023.04.10 |
[Java] 불변 객체(Immutable Object)란 무엇인가? (0) | 2023.04.09 |
댓글