1.1. 컴퓨터 구조를 알아야 하는 이유

  • 문제 해결 능력이 향상된다.
  • 입출력에 매몰되는 것을 넘어, 성능ㆍ용량ㆍ비용을 고려하는 개발자가 될 수 있다.

 

1.2. 컴퓨터 구조의 큰 그림

출처: https://velog.io/@seok9403/컴퓨터-구조

 

컴퓨터 구조를 이해하기 위해 필요한 지식은 크게 2가지이다.

  • 컴퓨터가 이해하는 정보
  • 컴퓨터의 4가지 핵심 부품

 

1.2.1. 컴퓨터가 이해하는 정보

컴퓨터는 0과 1로 표현된 정보만 이해한다.

0과 1로 표현되는 정보에는 크게 두 가지가 있다.

데이터명령어.

 

데이터: 컴퓨터가 이해하는 숫자, 문자, 이미지, 동영상과 같은 정적인 정보

명령어: 데이터를 움직이고, 컴퓨터를 작동시키는 정보

 

1.2.2. 컴퓨터의 4가지 핵심 부품

외관과 용도를 막론하고 컴퓨터의 핵심 부품은 CPU(중앙처리장치), 메모리(주기억장치), 보조기억장치, 입출력장치이다.

 

주기억장치에는 RAM(Random Access Memory)와 ROM(Read-Only Memory) 두 가지가 있으나, 일반적으로 RAM을 의미한다. 이후 작성될 글에서도 주기억장치는 RAM으로 간주하겠다.

 

1.2.2.1. 메모리

메모리는 현재 실행되는 프로그램의 명령어와 데이터를 저장하는 부품이다.

 

프로그램이 실행되기 위해서는 반드시 메모리에 저장되어 있어야 한다.

메모리에 저장된 값의 위치는 주소로 알 수 있다.

 

1.2.2.2. CPU

컴퓨터의 두뇌이다.

 

메모리에 저장된 명령어를 읽어 들이고, 읽어 들인 명령어를 실행하고, 실행한다.

CPU 내부는 ALU(산술연산장치), 레지스터, 제어장치로 구성되어 있다.

 

ALU: 계산기. 컴퓨터 내부 대부분의 계산을 담당.

레지스터: 임시 저장 장치. CPU에는 여러 개의 레지스터가 존재하고, 각기 다른 이름과 역할이 이싿.

제어장치: 전기 신호를 내보내고, 명령어를 해석하는 장치

 

1.2.2.3 보조기억장치

메모리와 다르게, 전원이 꺼져도 저장된 내용을 잃지 않는 저장 장치.

관점에 따라 입출력 장치라고 볼 수 있으나, 일반적으로 입출력장치와 합해 주변장치로 통칭한다.

 

1.2.2.4 입출력장치

마이크, 스피커, 프린터, 마우스 등 컴퓨터 외부에 연결되어 컴퓨터 내부와 정보를 교환하는 장치.

 

1.2.2.5 기타

메인보드(==마더보드)

핵심 부품을 비롯한 여러 컴퓨터 부품을 설치하고 연결하는 판

 

버스

연결된 부품끼리 데이터를 주고 받을 수 있는 통로.

 

컴퓨터의 핵심 4가지 부품은 시스템 버스를 통해 데이터를 주고 받는다.

시스템 버스는 주소 버스, 데이터 버스, 제어 버스로 구성된다.

 


참고

혼자 공부하는 컴퓨터구조 + 운영체제, 강민철, 1판

유저가 하드웨어에 닿기까지 (출처: TechTarget)

1. 운영체제와 컴퓨터

1.1 운영체제의 역할과 구조

운영체제의 역할

  • CPU 스케줄링과 프로세스 관리
  • 메모리 관리
  • 디스크 파일 관리
  • I/O 디바이스 관리

 

운영체제의 구조

운영체제의 구조 (출처: 쉽게 배우는 운영체제)

시스템콜

유저 프로그램(응용 프로그램)이 운영체제의 서비스를 받기 위해 커널 함수를 호출할 때 사용.

시스템콜을 받으면 유저 모드에서 커널 모드로 변환. 커널에 접근하여 명령 수행.

커널

운영체제의 핵심 부분.

시스템콜 인터페이스를 제공하며 보안, 메모리, 프로세스, 파일 시스템, I/O 디바이스, I/O 요청 관리 등 운영체제의 중추적인 역할

modebit

0 또는 1의 값을 가지는 플래그 변수.

시스템콜이 작동될 때 modebit을 참고해서 유저 모드와 커널 모드를 구분.

커널 모드: 0

유저 모드: 1

드라이버

하드웨어를 제어하기 위한 소프트웨어

 

 

1.2 컴퓨터의 요소

컴퓨터 시스템 구조 (출처: 멋쟁이 토마토)

 

CPU

산술논리연산장치(ALU, Arithmetic Logic Unit), 제어장치(CU, Contorl Unit), 레지스터로 구성.

인터럽트에 의해 메모리에 존재하는 명령어를 해석해서 실행하는 단순 반복 장치.

산술논리연산장치

아래 기능을 수행하는 디지털 회로.

  • 덧셈, 뺄셈 같은 두 숫자의 산술 연산
  • 배타적 논리합, 논리곱 같은 논리 연산

제어 장치

  • 입출력 장치 간 통신을 제어
  • 명령어를 읽고, 해석
  • 데이터 처리를 위한 순서를 결정

레지스터

CPU와 직접 연결된, CPU 내부의 매우 빠른 임시기억장치.

메모리에 비해 속도는 아득히 빠르고, 공간은 몹시 협소하다.

 

인터럽트

어떤 신호가 들어왔을 때 CPU를 잠시 정지시키는 것.

하드웨어 인터럽트: I/O 디바이스의 연결 등으로 발생

소프트웨어 인터럽트: 트랩이라고도 한다. 수를 0으로 나누는 연산 등의 프로세스 오류로 발생한다. (이때 프로세스가 시스템콜을 호출)

 

DMA 컨트롤러

I/O 디바이스가 메모리에 직접 접근할 수 있도록 하는 하드웨어 장치. 보조 일꾼.

하나의 작업을 CPU와 DMA 컨트롤러가 동시에 하는 것을 방지.

메모리

전자회로에서 데이터나 상태, 명령어 등을 기록하는 장치.

보통 RAM(Random Access Memory)을 일컬어 메모리라고 한다.

타이머

특정 프로그램에 시간 제한을 다는 역할.

시간이 종료되면 CPU에 인터럽트.

디바이스 컨트롤러

I/O 디바이스에 붙어있는 작은 CPU.

로컬 버퍼는 각 디바이스의 데이터를 임시 저장하는 작은 메모리

 

 

2. 메모리

2.1 메모리 계층

메모리 계층 구조 (출처: 나무위키)

 

  • 레지스터: CPU 안에 있는 작은 메모리
  • 캐시: L1, L2 캐시를 지칭. L3 캐시도 있음.
  • 주기억장치: RAM을 지칭.
  • 보조기억장치: HDD, SSD를 지칭. 얘만 비휘발성.

캐시

데이터를 미리 복사해 놓는 임시 저장소.

저장 장치 간에 속도 차이에 따른 병목 현상을 줄이기 위함.

예) 메모리와 CPU 사이에 존재하는 레지스터. 이런 것을 캐싱 계층이라고 함.

 

캐싱 계층을 두지 않고 캐시를 직접 설정하려면, 어떤 것을 캐시로 할지 근거가 필요하다.

근거는 지역성에 기반한다.

 

지역성

시간 지역성 temporal locality

최근 사용한 데이터에 다시 접근하려는 특성

e.g.) counter 변수

공간 지역성 spatial locality

최근 접근한 데이터 혹은 그와 가까운 공간에 접근하는 특성.

e.g.) 특정 배열을 순차적으로 모두 탐색.

 

캐시히트 & 캐시미스

캐시에서 원하는 데이터를 찾았다면 캐시히트,

해당 데이터가 캐시에 없다면 주 메모리로 가서 데이터를 찾아오는 것을 캐시미스.

 

캐시히트는 CPU 내부 버스를 기반으로 가까운 캐시에서 데이터를 가져오므로 빠르다.

캐시미스는 CPU 바깥의 시스템 버스를 통한다. 느리다.

 

캐시매핑

캐시가 히트되기 위해 매핑하는 방법.

레지스터와 주 메모리 간에 데이터를 주고 받을 때를 기반.

  • 직접 매핑: 메모리 1 ~ 100 / 캐시 1 ~ 10이라면, 1 : 1~10, 2 : 11~20 이런식으로 매핑. 처리가 빠르고 충돌 잦다.
  • 연관 매핑: 순서 상관 없이 관련 있는 캐시와 메모리를 매핑. 충돌 적고 모든 블록을 탐색해야 해서 느리다.
  • 집합 연관 매핑: 위 2개를 합침. 순서는 일치시키지만 블록화하여 덩어리로 매핑. 덩어리 내에서는 연관 매핑.

 

웹 브라우저의 캐시

쿠키

만료기한이 있는 키-값 저장소. 4KB.

same site 옵션을 strict로 설정하지 않을 경우 다른 도메인에서 요청했을 때 자동 전송.

보통 서버에서 만료기한을 정함.

로컬 스토리지

만료기한이 없는 키-값 저장소. 5MB.

웹브라우저를 닫아도 유지.

HTML 5 이상.

세션 스토리지

만료기한이 없는 키-값 저장소. 5MB.

탭 단위로 세션 스토리지를 생성. 탭을 닫을 때 해당 데이터 삭제.

HTML 5 이상.

 

2.2 메모리 관리

2.2.1 가상 메모리 virtual memory

가상 메모리 동작 방식 (출처: 면접을 위한 CS 전공지식 노트)

 

실제로 이용 가능한 메모리 자원을 추상화하여, 사용자에게 매우 큰 메모리로 보이게 만드는 것.

  • 가상 주소 logical address: 사용자에게 주어진 주소
  • 실제 주소 physical address: 실제 메모리 상에 있는 주소

가상 주소는 메모리 관리 장치(MMU)에 의해 실제 주소로 자동 변환된다.

가상 메모리는 가상 주소와 실제 주소가 매핑된 '페이지 테이블'로 관리된다.

이때 속도 향상을 위해 주소 변환을 위한 캐시인 TLB를 사용한다.

 

2.2.2 스와핑 swapping

페이지 폴트가 발생했을 때, 당장 사용하지 않는 영역을 하드디스크로 옮기고,

하드 디스크의 일부를 마치 메모리처럼 불러와 쓰는 것을 스와핑이라고 함.

페이지 폴트

가상 메모리에는 존재하지만 실제 메모리인 RAM에는 현재 없는 데이터를 접근하는 경우.

 

2.2.3 스레싱 thrashing

스레싱 (출처: yansigit.github.io)

정의

메모리의 페이지 폴트율이 높은 것을 의미한다.

이는 컴퓨터의 심각한 성능 저하를 초래한다.

원인

스레싱은 메모리에 너무 많은 프로세스가 동시에 올라가게 되면 스와핑이 많이 일어나게 되면서 발생한다.

페이즈 폴트는 CPU 이용률 저하로 이어진다.

CPU 이용률이 낮아지면 운영체제는 가용성을 높이기 위해 더 많은 프로세스를 메모리에 올린다. -> 악순환 -> 스레싱

해결방법

물리적인 방법
  • HDD를 SSD로 교체한다.
  • 메모리를 늘린다.
논리적인 방법
작업 세트 working set

프로세스의 지역성을 통해 결정된 페이지의 집합을 만들어서 미리 메모리에 로드.

PFF (Page Fault Frequency)

상・하한선으로 페이지 폴트 빈도를 조절.

상한선에 도달하면 프레임을 늘리고, 하한선에 도달하면 프레임을 줄인다.

 

2.2.4 메모리 할당

메모리에 프로그램을 할당할 때 시작 메모리 위치, 메모리의 할당 크기를 기반으로 할당한다.

이것을 결정하는 방법론.

 

연속 할당

고정 분할 방식 fixed partition allocation

메모리를 미리 나누어 관리하는 방식.

융퉁성이 없고, 내부 단편화가 발생한다.

가변 분할 방식 variable partition allocation

매 시점 프로그램의 크기에 맞게 동적으로 메모리를 나눠 사용한다.

외부 단편화가 발생한다.

최초 적합(first fit), 최적 적합(best fit), 최악 적합(worst fit)이 있다.

 

불연속 할당

페이징 Paging

동일한 크기의 페이지 단위(보통 4KB)로 나누어 메모리의 서로 다른 위치에 프로세스를 할당.

빈 공간의 크기가 균일하지 않은 문제가 없어지지만 주소 변환이 복잡.

세그멘테이션 segmentation

페이지 단위가 아닌 의미 단위인 세그먼트로 나누는 방식.

프로세스를 이루는 메모리를 코드 / 데이터 / 코드 내 함수 단위 등으로 나눈다.

공유와 보안 측면에서 장점. 빈 공간의 크기가 균일하지 않은 단점.

페이지드 세그멘테이션 paged segmentation

프로그램을 의미 단위인 세그먼트로 나누고, 다시 그것을 임의가 아닌 동일 크기의 페이지 단위로 나누는 것.

 

 

2.2.5 페이지 교체 알고리즘

오프라인 알고리즘

먼 미래에 참조되는 페이지와 현재 할당하는 페이지를 바꾼다.

미래는 알 수 없다. 꿈 같은 것이다.

FIFO

가장 먼저 적재된 페이지를 가장 먼저 교체하는 것.

LRU (Least Recently Used)

참조한 지 가장 오랜 시간이 지난 페이지를 교체하는 것.

NUR (Not Used Recently)

일명 Clock 알고리즘.

0과 1을 가진 비트를 둔다. 1은 최근 참조 / 0은 참조되지 않음.

시계 방향으로 돌면서 0을 찾고, 그 순간 해당 프로세스로 교체하고 1로 방문 처리를 한다.

LFU (Least Frequently Used)

가장 참조 횟수가 적은 페이지를 교체.

 

 

3. 프로세스와 스레드

프로세스와 스레드 (출처: velog.io/@aeong98)

프로세스

컴퓨터에서 실행되고 있는 프로그램.

CPU 스케줄링의 대상이 되는 작업(task)이라는 용어와 거의 같은 의미로 쓰임.

프로그램 -> 메모리 -> 프로그램의 인스턴스화 -> 프로세스 -> CPU 스케줄러에 따라 CPU가 프로세스를 실행.

스레드

프로세스 내 작업의 흐름.

 

 

3.1 프로세스와 컴파일 과정

프로그램의 컴파일 과정 (출처: 면접을 위한 CS 전공지식 노트)

 

전처리

소스 코드의 주석 제거.

#include 등 헤더 파일 병합하여 매크로를 치환.

컴파일러

오류 처리, 코드 최적화 -> 어셈블리어로 변환

어셈블러

어셈블리어는 어셈블러를 통해 목적 코드(object code)로 변환.

*.o의 확장자. (운영체제 by 운영체제)

링커

프로그램 내에 있는 라이브러리 함수 또는 다른 파일들과 목적 코드를 결합하여 실행 파일 생성.

*.exe, *.out 등의 확장자.

라이브러리

정적 라이브러리

프로그램 빌드 시 라이브러리가 제공하는 모든 코드를 실행 파일에 넣음.

외부 의존도 낮음. 코드 중복 등 메모리 효율 낮음.

동적 라이브러리

프로그램 실행 시 필요할 때만 DLL이는 함수 정보를 참조하여 라이브러리를 사용.

외부 의존도 높음. 메모리 효율 높음.

 

 

3.2 프로세스의 상태

프로세스의 상태 (출처: yanghs6.github.io)

 

생성 상태

프로세스가 생성된 상태.

이때 PCB가 할당.

대기 상태

메모리 공간이 충분하면 메모리를 할당 받고, 아니면 할당받지 못한 상태로 대기(대기 중단 상태).

CPU 스케줄러로부터 CPU 소유권이 넘어오기를 기다리는 상태.

실행 상태

CPU 소유권과 메모리를 할당 받고, 인스트럭션을 수행 중인 상태.

CPU burst가 일어났다고도 표현.

중단 상태

어떤 이벤트(인터럽트)가 발생하여 프로세스가 차단된 상태.

중단된 상태에서 프로세스를 실행하려고 했지만 메모리가 부족하면 일시 중단 상태.

 

 

3.3 메모리 상의 프로세스 구조

메모리 상의 프로세스 구조 (출처: devkuma)

스택

스택은 동적 할당(런타임 단계에서 메모리를 할당받는 것)이 된다.

지역 변수, 매개변수, 돌아오는 주소 등 실행되는 함수에 의해 가변적인 메모리 영역이다.

 

재귀 함수를 호출하는 경우 새로운 스택 프레임이 매번 사용되기 때문에,

함수 내의 변수 집합이 해당 함수의 다른 인스턴스 변수를 방해하지 않는다.

 

동적으로 할당되는 변수를 담는다.

malloc(), free() 함수를 통해 관리할 수 있다.

e.g.) 동적으로 관리되는 자료구조

 

데이터와 코드 영역

정적 할당(컴파일 단게에서 메모리를 할당)되는 영역이다.

데이터 영역은 BSS segement, Data segment, code/text segment로 나뉜다.

 

BSS segment는 전역 변수 또는 초기화 되지 않은 변수가 할당된다.

Data segment는 전역 변수 또는 초기화 된 변수가 할당된다.

Code segment는 프로그램의 코드가 할당된다.

 

 

3.4 프로세스 제어 블록 PCB

정의

PCB(Process Control Block)는 하나의 프로세스에 대한 메타데이터 저장소를 말한다.

중요한 정보이기에 일반 사용자가 접근할 수 없도록 커널 스택의 가장 앞부분에서 관리된다.

프로그램 실행 -> 프로세스 생성 -> 프로세스 구조에 따라 주소값이 메모리가 할당 -> 해당 프로세스의 메타데이터는 PCB에 저장.

 

구조

  • 프로세스 ID
  • 프로세스 스케줄링 상태
  • 프로세스 권한
  • 프로그램 카운터
  • CPU 레지스터
  • CPU 스케줄링 정보
  • 계정 정보
  • I/O 상태 정보

 

컨텍스트 스위칭 context switching

컨텍스트 스위칭의 과정 (출처: https://www.crocus.co.kr/1364)

 

문맥 교환이라고도 한다.

PCB를 기반으로 프로세스의 상태를 저장하고 로드하는 과정.

 

CPU는 코어 하나당 단 한 개의 프로세스를 구동할 수 있다.

많은 프로세스가 동시에 구동되는 것처럼 보이는 이유는, 몹시 빠른 속도로 프로세스 간의 컨텍스트 스위칭이 이루어지고 있기 때문이다.

 

컨텍스트 스위칭이 일어날 때 캐시 미스가 발생하면 고스란히 비용이 된다.

작업하고 있지 않는 유휴 시간(idle time)도 비용이다.

 

스레드에서의 컨텍스트 스위칭

후술하겠지만 스레드는 스택 영역을 제외한 나머지 메모리를 공유한다.

따라서 프로세스 단위에서보다, 스레드 단위의 컨텍스트 스위칭이 비용도 적고, 시간도 적게 소요된다.

 

 

3.5 멀티프로세싱

정의

여러 개의 프로세스를 통해 동시에 일을 병렬 수행하는 것. (컨텍스트 스위칭을 통해)

하나의 프로세스에 문제가 발생해도 다른 프로세스를 이용할 수 있어 신뢰성이 높다.

 

IPC (Inter Process Communication)

프로세스끼리 데이터를 주고 받고, 공유 데이터를 관리하는 메커니즘.

클라이언트가 데이터를 요청하고, 서버가 응답하는 것 또한 IPC의 예이다.

 

(스택을 제외한) 메모리가 완전히 공유되는 스레드보다는 속도가 떨어진다.

종류로는 공유 메모리, 파일, 소켓, 익명 파이프, 명명 파이프, 메시지 큐가 있다.

 

공유 메모리 shared memory

여러 프로세스에게 동일한 메모리 블록에 대한 접근 권한을 부여.

매개체를 통하지 않고, 메모리 자체를 공유하기 때문에 오버헤드가 발생하지 않아 IPC 방식 중에서 가장 빠르다.

동기화가 필수적이다. 충돌 방지해야 하니까.

 

파일

디스크에 저장된 데이터 또는 파일 서버에서 제공한 데이터

 

소켓

네트워크 인터페이스를 통해, 동일한 컴퓨터의 다른 프로세스 / 네트워크의 다른 컴퓨터로 전송하는 데이터.

TCP, UDP.

 

익명 파이프 unnamed pipe

익명 파이프 (출처: 면접을 위한 CS 전공지식 노트)

 

프로세스 간에 FIFO 방식으로 읽히는 임시 공간인 파이프를 기반으로 데이터를 주고 받음.

단방향의 읽기 전용, 쓰기 전용 파이프로 작동.

 

명명된 파이프 named pipe

명명된 파이프 (출처: 면접을 위한 CS 전공지식 노트)

 

파이프 서버와 하나 이상의 파이프 클라이언트 간의 통신을 위한 단방향 / 양방향 파이프.

 

이것은 파이프가 아니다 Ceci n'est pas une pipe

르네 마그리트의 작품 (출처: 예스24)

르네 마그리트의 유명한 작품이다.

 

메시지 큐

메시지를 큐로 관리하는 것.

커널에서 전역적으로 관리하므로 다른 IPC 방식에 비해 사용이 직관적이다.

 

공유 메모리의 복잡한 동기화 구현의 대안이 되기도 한다.

 

 

3.6 스레드와 멀티스레딩

프로세스와 멀티스레드 (출처: 면접을 위한 CS 전공지식 노트)

 

스레드

프로세스의 실행 가능한 가장 작은 단위.

프로세스는 여러 개의 스레드를 가질 수 있다.

 

프로세스와 달리 스레드 간에 코드, 데이터, 힙 영역을 공유한다.

 

멀티스레딩

프로세스 내 작업을 여러 개의 스레드로 처리하는 기법.

스레드끼리 자원을 공유하기 때문에 효율성이 높다.

 

한 스레드에 문제가 생기면 다른 스레드에 영향을 끼칠 수도 있다.

독립적으로 실행될 수도 있다.

 

 

3.7 공유 자원과 임계 영역

공유 자원 shared resource

시스템 안에서 각 프로세스, 스레드가 함께 접근할 수 있는 자원이나 변수.

모니터, 프린터, 메모리, 파일, 데이터 등.

 

공유 자원을 두 개 이상의 프로세스가 동시에 읽거나 쓰는 상황을 경쟁 상태(race condition)이라고 함.

 

임계 영역 critical section

경쟁 상태일 때 결과가 달라지는 코드 영역.

없는 게 좋다.

 

해결하기 위한 방법은 뮤텍스, 세마포어, 모니터가 있다.

이들은 다음의 조건을 만족한다.

  • 상호 배제: 한 프로세스가 임계 영역에 들어갔을 때 다른 프로세스는 들어갈 수 없다.
  • 한정 대기: 특정 프로세스가 영원히 임계 영역에 들어가지 못 해서는 안 된다.
  • 융통성: 어떠한 프로세스도 임게 영역을 사용하지 않는다면, 영역 외부의 프로세스가 들어갈 수 있다.

마치 공용 화장실처럼 A가 들어가면 잠그고(Lock), B의 접근을 막는 것과 유사하다.

B는 기다리다가 A가 나오면 이용한다.

 

뮤텍스 mutex

뮤텍스 (출처: 면접을 위한 CS 전공지식 노트)

 

프로세스나 스레드가 공유 자원을 사용할 때 lock()으로 잠금한다.

사용이 종료되면 unlock()으로 잠금을 해제한다.

 

세마포어 semaphore

세마포어 (출처: 면접을 위한 CS 전공지식 노트)

 

정수 값과 두 가지 함수 wait()과 signal()로 공유 자원에 대한 접근을 처리한다.

함수의 실행 타이밍은 뮤텍스와 유사하다.

  • wait: 프로세스나 스레드가 공유 자원에 접근 -> wait() -> 나머지는 기다려
  • signal: 공유 자원 해제 -> signal() -> 다음 프로세스로 순서를 넘겨줌

 

바이너리 세마포어 binary semaphore

0과 1만 가질 수 있는 세마포어.

뮤텍스와 유사하지만 뮤텍스는 잠금 메커니즘을, 바이너리 세마포어는 신호 메커니즘을 기반으로 동작한다는 차이가 있다.

 

카운팅 세마포어 counting semaphore

여러 개의 값을 가질 수 있는 세마포어.

여러 자원에 대한 접근을 제어.

 

모니터 monitor

모니터 (출처: 면접을 위한 CS 전공지식 노트)

둘 이상의 프로세스나 스레드가 안전하게 접근할 수 있도록, 공유 자원을 숨기고 해당 접근에 대해 인터페이스만 제공.

모니터큐를 통해 공유 자원에 대한 작업을 순차 처리.

 

 

 

3.8 교착 상태 deadlock

빵빵 (출처: velog.io/@dltmdrl1244)

 

정의

두 개 이상의 프로세스가 서로가 가진 자원을 기다리며 중단된 상태.

 

원인

  • 상호 배제: 한 프로세스가 자원을 독점. 나머지는 접근 불가.
  • 점유 대기: 특정 프로세스가 점유한 자원을 다른 프로세스가 요청 중인 상태.
  • 비선점
  • 환형 대기: A는 B의 자원을 요구, B는 A의 자원을 요구, ...

 

해결 방법

  1. 자원을 할당할 때 교착상태의 조건이 성립되지 않도록 설계.
  2. 교착 상태 가능성이 없을 때만 자원 할당. 요청 자원의 최대치를 가정하고 할당 여부를 파악 (== 은행원 알고리즘)
  3. 교착 상태가 발생하면 사이클을 찾고, 관련 프로세스를 하나씩 kill
  4. 교착 상태는 매우 드물게 발생. 매우 해결하기 어려움. -> 강제 종료.

 

 

4. CPU 스케줄링 알고리즘

CPU 스케줄링 알고리즘 (출처: 면접을 위한 CS 전공지식 노트)

정의

CPU 스케줄러는 CPU 스케줄링 알고리즘에 따라,

프로세스에서 해야 하는 일을 스레드 단위로 CPU에 할당한다.

 

이 알고리즘은 다음의 목표를 갖는다.

  • CPU 이용률은 높게
  • 주어진 시간에 많은 일을 할 수 있게
  • 준비 큐ready queue에 잇는 프로세스는 적게
  • 응답 시간은 짧게

 

4.1 비선점형

프로세스가 CPU 소유권을 스스로 포기.

강제로 프로세스를 중지하지 않음.

컨텍스트 스위칭으로 인한 오버헤드가 적다.

 

FCFS (First Come, First Served)

먼저 온 것, 먼저 처리.

준비 큐에서 오래 기다리는 현상(convoy effect)가 발생하는 단점.

 

SJF (Shortest Job First)

실행 시간이 가장 짧은 프로세스 먼저 실행.

긴 시간을 갖는 프로세스의 경우 기아starvation 문제가 있다.

 

실행 시간을 미리 알 수 없으므로 과거 실행 시간을 토대로 추측한다.

평균 대기 시간이 가장 짧다.

 

우선순위 or HRN (Highest Response-ratio Next)

기아 문제를 해결하기 위해 오래된 작업일수록 우선 순위를 높이는 방식.

실행 시간이 짧거나, 대기 시간이 길수록 우선 순위가 높아진다.

 

계산식: (대기 시간 + 서비스 시간)  / 서비스 시간

 

 

4.2 선점형

현대 운영체제가 쓰는 방식.

알고리즘에 의해 특정 프로세스에 인터럽트를 발생시켜 강제 중단하고, 다른 프로세스 CPU 할당.

 

라운드 로빈 RR, Round Robin

가장 많이 사용되는 선점형 알고리즘.

특정 시간 단위(time slice, time quantum)를 설정하여,

각 프로세스가 단위 시간 내에 끝나지 않으면 다시 준비 큐의 뒤로 가는 알고리즘.

 

N개의 프로세스가 q의 시간 단위로 동작한다고 했을 때, 반드시 (N - 1) * q 시간 내에 자기 차례가 온다.

q가 커지면 FCFS처럼 동작한다.

q가 작으면 컨텍스트 스위칭이 잦아져 오버헤드가 커진다.

 

로드밸런서에서 트래픽 분산 알고리즘으로도 사용된다.

 

SRF (Shortest Remaing time First)

SJF의 선점형 버전.

 

다단계 큐

다단계 큐 (출처: 면접을 위한 CS 전공지식 노트)

 

우선순위에 따른 여러 개의 준비 큐를 사용한다.

각 큐마다 다른 알고리즘(RR, FCFS, ...)을 적용한다.

 

우선순위가 높은 큐에 있는 프로세스는, 하위 큐의 프로세스에 대하여 절대적인 우선순위를 갖는다.

 

큐 간에는 프로세스 이동이 불가하다.

스케줄링 부담이 적지만 유연성이 떨어진다.

 

다단계 피드백 큐

다단계 피드백 큐 (출처: OS? Oh Yes!)

 

각 단계의 큐마다 서로 다른 CPU 시간 할당량을 갖는다.

우선순위가 높은 큐일수록 할당량이 적다.

 

최초 할당 시간 내에 프로세스를 완료하지 못 하면,
하위 우선순위 큐로 내려간다.

 

상위 큐는 FCFS, 하위 큐는 RR로 동작한다.

 

 

 


참고

면접을 위한 CS 전공지식 노트, 주홍철

'CS > 운영체제' 카테고리의 다른 글

[운영체제] 혼공컴운 50분 강의 요약  (0) 2024.05.01
[운영체제] 용어 사전  (0) 2024.03.05
[운영체제] 32비트, 64비트, x86, x64  (0) 2024.02.05

출처: 컴공생의 다이어리

 

 

목차

  1. 컴퓨터 구조를 알아야 하는 이유
  2. 컴퓨터 구조의 큰 그림
  3. 운영체제란?
  4. 운영체제의 큰 그림
  5. 운영체제를 알아야 하는 이유

컴퓨터 구조를 알아야 하는 이유

왜?

  1. 문제 해결 능력
    1. 컴퓨터를 미지의 대상이 아니라, 분석의 대상으로 바라볼 수 있다.
  2. 성능, 용량, 비용 개선
    1. 실제로 부품 가격이 다르다.
    2. 프로그래밍 언어의 기초 문법으로는 해결할 수 없다.

 

컴퓨터 구조의 큰 그림

컴퓨터 구조 (출처: 유튜브 캡쳐)

 

컴퓨터가 이해하는 두 가지 정보

출처: 유튜브 캡쳐

데이터

  • 숫자, 문자, 이미지, 동영상과 같은 정적인 정보
  • 컴퓨터와 주고 받는 / 컴퓨터 내부에 저장된 정보를 데이터라고 통칭
  • 명령어를 구성하는 재료

명령어

  • `컴퓨터는 결국 명령어를 처리하는 기계`
  • 컴퓨터를 실질적으로 동작시키는 정보

컴퓨터가 이해하는 것

  • 컴퓨터는 이진수로 된 `명령어`만을 이해할 수 있다.
    • 이것을 `머신 코드`라고 부른다.
  • (고수준) 자연어 -> 소스 코드 -> 어셈블리어 -> 머신 코드 (저수준)
    • 소스 코드를 머신 코드로 번역하는 도구는 `컴파일러`이다.
    • 어셈블리어를 머신 코드로 번역하는 도구는 `어셈블러`이다.

 

컴퓨터의 네 가지 핵심 부품

출처: 유튜브 캡쳐

 

 

메모리

출처: 유튜브 캡쳐

 

  • 주기억장치
    • RAM과 ROM이 있다. 일반적으로 RAM을 말한다.
  • 메모리는 실행 중인 프로그램의 `명령어`와 `데이터`를 저장한다.
  • 실행 중인 모든 프로그램은 메모리에 저장되어 있어야 한다.
  • 메모리에 저장된 값의 위치는 주소로 알 수 있다.

 

 

CPU

CPU의 동작 과정 (출처: 유튜브 캡쳐)

 

 

  • 메모리에 저장된 값을 읽어 들이고, 해석하고, 실행하는 장치이다.
  •  
  • 다음의 3가지 부품으로 구성된다.
    • ALU: 계산하는 장치.
    • 레지스터: 임시 저장 장치. CPU 내부의 작은 저장 장치.
    • 제어 장치: 제어 신호를 내보내고, 명령어를 해석하는 장치.
      • 제어 신호: 컴퓨터 부품을 관리하고 작동시키는 전기 신호 (e.g. 메모리 읽기 신호, 메모리 쓰기 신호)

 

 

보조 기억 장치

출처: 유튜브 캡쳐

 

  • 전원이 꺼져도 보관될 프로그램을 저장하는 장치.
  • 주 기억 장치(메모리, RAM)의 문제를 보완한다.
    • 단점 1. 비싸다
    • 단점 2. 전원이 꺼지면 저장된 내용을 잃는다. (휘발성)
  • 보조 기억 장치는 상대적으로 저렴하고, 전원이 꺼져도 내용을 잃지 않는다.
  • 종류로는 HDD, SSD, CD-ROM, SD 카드 등이 있다.

 

 

입출력 장치

출처: 유튜브 캡쳐

 

 

  • 컴퓨터 외부에 연결되어 컴퓨터 내부와 정보를 교환할 수 있는 부품.
  • 종류로는 모니터, 키보드, 마우스, 스피커 등이 있다.

 

 

4가지 부품을 연결하는 장치

출처: 유튜브 캡쳐

 

메인보드 & (시스템) 버스

  • 메인보드에 연결된 부품은 버스를 통해 정보를 주고 받음.
  • 버스는 컴퓨터의 부품끼리 정보를 주고 받는 일종의 통로.
  • 다양한 종류의 버스가 있음.
  • 컴퓨터의 핵심 부품을 연결하는 버스는 시스템 버스.

 

운영체제란?

운영체제 == 정부 of 컴퓨터 (출처: 유튜브 캡쳐)

(시스템) 자원 Resource

  • 프로그램이 실행되기 위해 마땅히 필요한 요소.
  • 컴퓨터의 네 가지 핵심 부품을 포함.

 

운영체제 Operating System

출처: 유튜브 캡쳐

  • 자원을 관리하는 특별한 프로그램.
  • 실행 중인 프로그램(==프로세스)을 관리하는 특별한 프로그램.
  • 운영체제도 '프로그램'이기 때문에 `메모리에 적재`된다.
  • 그러나 특별하기 때문에 사용자 영역이 아닌 `커널 영역에 적재`된다.

 

운영체제의 큰 그림

1. 자원(메모리) 관리

출처: 유튜브 캡쳐

 

  • 새로운 프로세스를 메모리의 적절한 위치에 할당한다.
  • 종료된 프로세스를 메모리에서 제거한다.

 

출처: 유튜브 캡쳐

 

  • 메모리의 물리적인 크기보다 큰 프로세스를 메모리에 적재하여 실행시킨다.
  • 페이징, 스와핑 등의 방법을 사용한다.

 

2. CPU 스케줄링

출처: 유튜브 캡쳐
Window의 작업관리자. 수많은 프로세스가 동시에 실행 중인 것처럼 보인다. (출처: 유튜브 캡쳐)

  • CPU는 프로세스를 실행시키는 유일한 주체이다.
  • CPU는 한 번에 하나의 프로세스만을 실행시킬 수 있다.
  • 따라서 개념적으로 동시에 실행한다는 것은, 실질적으로 매우 빠른 속도로 여러 개의 프로세스를 번갈아서 실행하는 것과 같다.
  • 운영체제는 프로세스가 CPU를 엄격한 규칙에 따라 배정 받을 수 있도록 관리한다.

 

3. 시스템 호출 System call을 통한 자원 보호

 

출처: 유튜브 캡쳐
프로그램은 자원에 직접적으로 접근할 수 없다. 운영체제를 거쳐야 한다. (출처: 유튜브 캡쳐)

  • 운영체제는 경쟁적으로 자원을 점유하고자 하는 프로세스들을 잘 타일러서 규칙대로 관리한다.
    • 이것을 멋진 말로 프로세스 동기화 Process Synchronization 라고 한다.

 

운영체제를 알아야 하는 이유

  • 개발자는 프로그램을 만드는 일을 한다.
    • 프로그램을 이해하기 위해서는 운영체제에 대한 이해가 필수적이다.
  • 오류 메시지에 대해서 깊은 이해를 할 수 있다.
    • 컴퓨터를 미지의 대상이 아닌, 분석의 대상으로 바라 볼 수 있다.

 

 


출처

https://youtu.be/LBqJwmFMQHI?si=NIomPDohCvOSL6dc

 

 

 

 

 

 

<애플리케이션의 구조>

클라이언트-서버 구조

클라이언트-서버 구조

애플리케이션 계층은 클라이언트 - 서버의 구조를 갖는다.

클라이언트는 요청하고, 서버는 응답한다.

 

서버:

  • 24시간 켜져 있음.
  • 영구적인 IP 주소
  • 확장을 위한 데이터 센터가 있음

클라이언트:

  • 서버와 통신
  • 항상 켜져있지 않고, 간헐적으로 통신
  • 동적인 IP 주소
  • 클라이언트와 클라이언트가 직접적으로 통신하지 않는다. (이것은 P2P)

P2P 구조

P2P 구조

서버가 항상 켜져있을 필요는 없다.

임의의 엔드 시스템(peer)끼리 직접 통신한다.

중앙 서버가 없기 때문에 확장이 더 쉽다. 중앙 서버의 장애가 전체 시스템에 영향을 끼치지 않는다.

반대로 중앙 집중 관리를 하지 않기에, 보안 문제가 발생하기 쉽다.

 

<애플리케이션 계층의 통신 방식>

통신 방식

프로세스 간의 통신은 Socket을 통해 이루어진다.


프로세스: 하나의 호스트 내에서 실행 중인 프로그램

 

하나의 호스트 내에서, 프로세스 간에 통신하는 것을 Inter Process Communication, IPC라고 한다.

다른 호스트 간에, 통신을 하는 것은 message를 주고 받음으로써 이루어진다.

이때 OS가 제공하는 인터페이스인 Socket을 통해 통신한다.

 

하나의 기기는 여러 개의 소켓을 가질 수 있다.

하나의 소켓은 여러 개의 프로세스를 가질 수 있다.

 

기기 간의 통신은 반드시 소켓에서 일어난다. 이 연결은 유일하다.

따라서 대략적인 통신 과정은 다음과 같다.

[출발 프로세스a ---> 출발 소켓A] ===> [목적지 소켓B ---> 목적지 프로세스b]

 

출발 소켓이 목적지 소켓을 찾기 위해서는 Socket 인터페이스 주소 == IP 주소가 필요하다.

목적지 소켓 내에서 목적지 프로세스를 찾기 위해서는 포트 번호가 필요하다.

 

어떤 기기든, 웹 서버 프로세스의 포트 번호는 80번이다.

 

애플리케이션 계층의 요구사항

애플리케이션 별 요구사항

 

애플리케이션은 데이터 무결성, 빠른 응답 속도, 많은 처리량, 보안성을 요구한다.

그러나 이 모든 것을 맞춰줄 수는 없다.

 

예컨대 e-mail 앱은 데이터 무결성이 중요하다. 그러나 반드시 응답 속도가 빠를 필요는 없다.

반면 실시간 영상은 데이터가 몇 프레임 정도 손상되어도 크게 지장 없다. 하지만 응답 속도는 가능한 한 빨라야 한다.

 

TCP / UDP

기능 TCP UDP
연결 형태 연결형 서비스. 송신자와 수신자 간에 연결 설정 후 통신 비연결형 서비스. 연결 설정 없이 데이터 그램을 직접 전송
reliable 높음. 중복 제거, 오류 검출 및 재전송 메커니즘 제공 낮음. 중복 제거 없음, 오류 검출 및 재전송 없음
in-order 데이터의 순서가 보장됨. 송신된 순서대로 데이터가 도착. 데이터의 순서가 보장되지 않음.
flow-control 있음. 네트워크 혼잡 시 데이터 전송 속도 조절 없음. 어떠한 흐름 제어도 적용되지 않음
congestion-control 있음. 네트워크의 혼잡 상태를 감지하고 데이터 전송량을 조절 없음. 네트워크 혼잡에 대응하지 않음
속도 UDP보다 느림. 연결 설정, 오류 검사 및 제어 메커니즘 때문 TCP보다 빠름. 최소한의 오버헤드만을 가짐
사용 사례 신뢰성 있는 데이터 전송이 필요한 경우 (웹 페이지 로딩, 이메일, 파일 전송 등) 실시간 통신이 필요한 경우 (스트리밍, 온라인 게임, VoIP 등)
헤더 크기 20바이트 기본. 옵션에 따라 더 길어질 수 있음 8바이트. 고정된 크기로 매우 경량
오류 검사 헤더와 데이터 모두에 대한 체크섬을 통한 오류 검사 및 수정 가능 헤더와 데이터에 대한 체크섬을 통해 오류 검사만 제공. 오류 수정은 제공하지 않음

 

TCP / UDP는 Transport 계층 프로토콜이 제공하는 서비스이다.

현재는 애플리케이션 계층에 대해 배우고 있지만, 후술한 HTTP에 대해서 설명하기 위해 간단하게 짚고 넘어가자.

 

TCP는 reliable, in-order, flow-control, congestion-control의 특징을 갖고 있다. 기능이 많은 대신 무겁고 느리다.

UDP는 그런 거 없다. 대신 가볍고 빠르다.

애플리케이션 별 사용하는 프로토콜

 

상술했듯이 애플리케이션마다 요구 사항이 다르다.

따라서 사용하는 전송 계층의 프로토콜도 다르다.

 

Web

사용자가 보는 웹 페이지는 object로 구성되어 있다.

object는 HTML 파일, JPEG 이미지, Audio 파일 등이 될 수 있다.

 

개발자가 보는 웹 페이지는 base HTML-file로 되어있다.

HTML은 referenced objects(객체의 주소)를 포함하고 있다.

따라서 주소(URL)를 통해 객체를 연결하고, 연결된 객체를 가져와서 보여주는 것이다.

 

HTTP

HTTP의 구조

HTTP의 통신 과정

Hyper Text Transfet Protocol.

이 프로토콜은 클라이언트의 request와 서버의 response로 이루어진다.

 

HTTP는 TCP를 기반으로 동작한다.

데이터의 reliability를 보장할 수 있지만, UDP에 비해 비싼 비용을 내야한다.

 

TCP로 통신을 하기 위해서는, 최초 request 메시지 이전에 TCP Connection이 이루어져야 한다.

이때 request & response 이후 Connection의 연결 지속 여부에 따라, Persistent와 Non-Persistent로 나뉜다.

 

HTTP는 Stateless한 특징을 갖는다.

request & response 이후에, 클라이언트와 서버는 서로에 대한 어떤 정보도 기억하지 않는다.

 

 HTTP 통신 소요 시간

HTTP 통신에 소요되는 시간

 

RTT는 Round Trip Time의 약자로, request & response가 한번 이루어지는 시간을 뜻한다.

1. TCP 통신을 위해서는 최초 TCP Connection 과정이 필요하다. (1 RTT)

2. request & response가 이루어진다. (1 RTT)

2-1. 데이터를 전송하는 시간이 소요된다. (transmission time)

 

Non-persistent의 경우, 데이터 전송 시마다 2 RTT + transmission time이 소요된다.

Persistent의 경우, 데이터 전송 시마다 1 RTT + transmission time이 소요된다.

 

HTTP 메시지의 구조

1. request / 2. response

HTTP request / response 메시지의 구조는 위와 같다.

위는 데이터를 제외한 헤더에 대한 내용이다.

 

response message에서 status line을 주목할 만하다.

응답의 상태를 나타낸다.

 

쿠키

서버가 만든 쿠키~ 클라이언트 위해 구웠지~

 

1. 웹 브라우저가 아마존에 접속하려고 함

2. http request를 생성하기 전에, 클라이언트의 로컬 디스크에서 아마존에 대한 쿠키가 있는지 살펴봄

3. 없으면 평범한 request를 생성해서 요청. 있으면 해당 정보를 포함해서 요청.

4. 아마존은 데이터베이스에서 클라이언트의 쿠키 정보를 확인함. 없으면 새로 생성해서 set-cookie: 일련번호 형태로 전송. 있으면 해당 상태에 적절한 응답.

5. 클라이언트는 이것을 로컬에 저장

6. 2~4의 과정을 반복

 

쿠키는 HTTP의 stateless 특징이 갖는 약점을 보완한다.

 

캐시 (proxy server)

프록시 서버의 구조

프록시 서버는 클라이언트와 원천 서버 사이에 위치하는 또다른 서버이다.

클라이언트의 요청을 대신하여 원천 서버의 리소스에 접근한다.

 

1. 캐싱

  • 프록시 서버는 자주 요청되는 웹 페이지나 파일을 로컬에 저장(캐싱)한다.
  • 이후 같은 요청이 들어올 경우, 프록시 서버는 인터넷에 다시 접속하지 않고 캐시된 데이터를 제공함으로써 응답 속도를 향상.

2. 보안

  • 프록시 서버는 내부 네트워크와 인터넷 사이의 중간자 역할을 하며, 외부의 불법적인 접근으로부터 내부 네트워크를 보호.
  • 또한, 내부 네트워크의 IP 주소를 숨기고 프록시 서버의 IP 주소로 대체하여 보안성을 높임.

3. 접근 제어

  • 프록시 서버를 통해 특정 웹 사이트나 서비스에 대한 접근을 제어.
  • 예를 들어, 관리자는 특정 사이트에 대한 접근을 차단하거나, 사용자 권한에 따라 인터넷 사용을 제한할 수 있음.

4. 익명성

  • 사용자가 프록시 서버를 통해 인터넷에 접속하면, 사용자의 실제 IP 주소가 숨겨지고 프록시 서버의 IP 주소가 사용됨.
  • 이를 통해 사용자의 익명성을 보장할 수 있습니다.

5. 로드 밸런싱

  • 여러 대의 프록시 서버를 사용하여 네트워크 트래픽을 분산시킬 수 있음.
  • 이는 서버에 대한 부하를 줄이고, 서비스의 가용성과 성능을 향상.

장점

빠르다. 행복한 클라이언트.

할 일이 줄어든다. 행복한 서버.

외부 네트워크로 나가는 트래픽이 줄어든다. 행복한 로컬 네트워크.

받는 돈이 줄어든다. 슬픈 KT.

받는 돈이 줄어든다. 슬픈 AT&T.

 

단점

캐싱의 근본은 자주 참조되는 데이터의 복사본을 프록시 서버에 두는 것.

원본이 바뀌었을 때는 일관성 문제가 발생.

 

캐싱의 예 (링크의 이용률이 오버 되는 상황)

로컬 웹 캐시(프록시 서버)를 설치하면 해결

 

LAN의 가용량에는 여유가 있고, 링크의 가용량이 부족한 상황

1. 케이블을 확장 설치

2. 캐싱 서버를 설치 (일반적으로 더 저렴한 해결책, 효과도 좋다.)

Conditional GET

Conditional GET의 예시

 

요청을 보낼 때 Conditional GET을 사용하면, 캐싱의 데이터 일관성 문제를 해결할 수 있다.

if-modified-since: <date> 이후로 수정이 되었는지 묻는 파라미터를 추가하여,

수정이 되지 않았다면 Not Modified를, 수정이 되었다면 새로운 데이터를 전달함으로써, 프록시 서버의 데이터를 갱신한다.

 

DNS

DNS란?

Domain Name System.

인터넷에서 도메인 이름을 IP 주소로 변환하는 시스템.

본격적인 HTTP 통신 이전에 준비 작업이다.

사용자가 웹 브라우저에 도메인 이름을 입력하면, DNS는 그것을 IP 주소로 변환하여 웹 서버에 접근할 수 있게 한다.

 

DNS의 계층화

DNS의 구조

 

DNS 테이블을 끝도 없이 채워나가다 보면 2가지 문제점을 만난다.

1. 중앙 집중으로 single point of failure 발생

2. 무거워져서 느려짐.

 

따라서 그림과 같이 분산화와 계층화를 한다.

다음과 같은 구성 요소로 이루어져 있다.

 

1. Root Name Server

  • 인터넷의 DNS 시스템에서 최상위에 위치
  • 전 세계에 걸쳐 13개의 루트 네임 서버가 존재
  • 이 서버들은 전체 DNS 조회 과정의 시작점 역할
  • 최상위 도메인(TLD)에 대한 요청을 받으면, 해당 TLD를 관리하는 네임 서버의 주소를 제공.

2. TLD (Top-Level Domain) Server

  • TLD 서버는 도메인 이름의 최상위 부분(예: .com, .net, .org 등)을 관리.
  • 각 TLD는 자신의 네임 서버를 가지며, 이 네임 서버는 해당 TLD에 등록된 모든 도메인의 정보를 관리.
  • 특정 도메인 이름에 대한 조회를 받으면, 그 도메인 이름을 관리하는 권한 있는(Authoritative) 네임 서버의 주소를 제공.

3. Authoritative Name Server

  • 권한 있는 네임 서버는 특정 도메인에 대한 최종적인 권한을 갖는다.
  • 해당 도메인의 모든 서브 도메인을 포함한 상세한 DNS 정보(예: IP 주소, 메일 서버)를 제공.

 

DNS 조회 과정

1. iterated query / 2. recursive query

  1. 사용자가 웹 브라우저에 도메인 이름을 입력.
  2. 사용자의 컴퓨터는 로컬 DNS 서버에 도메인 이름에 대한 IP 주소를 요청.
  3. 로컬 DNS 서버가 해당 정보를 캐시에 가지고 있지 않은 경우, 루트 네임 서버에 조회를 요청.
  4. 루트 네임 서버는 해당 도메인의 TLD 서버 주소를 제공.
  5. TLD 서버는 도메인의 권한 있는 네임 서버 주소를 제공.
  6. 권한 있는 네임 서버는 최종적으로 도메인 이름에 대한 IP 주소를 제공.
  7. IP 주소 정보는 로컬 DNS 서버를 거쳐 사용자의 컴퓨터에 전달되고, 이를 통해 사용자의 컴퓨터는 웹 서버에 접속한다.

도메인 레코드

도메인 레코드

A타입과 NS타입이 중요하다.

DNS 데이터를 관리하기 위해서 보통 A, NS 타입의 데이터를 관리한다.

타입 name value
A타입 호스트 이름 IP 주소
NS타입 도메인 호스트 이름(해당 도메인을 관리하는 authoritative server)

 

DNS의 프로토콜

DNS는 UDP를 사용한다.

1. 데이터의 크기가 매우 작다. 따라서 에러 발생 가능성도 작고, 손실의 리스크가 적다.

2. DNS는 본격적인 HTTP 통신 이전에 준비 과정이다. 따라서 간단할수록 좋다.

 

Socket 프로그래밍

소켓이란?

소켓의 구조

상술하였듯이, 소켓은 OS에서 제공하는 인터페이스이다.

애플리케이션 계층의 프로세스와, 통신 계층을 연결한다.

프로세스 간의 통신은 소켓을 통해서 이루어진다. (내부는 IPC 소켓, 외부는 네트워크 소켓)

 

하나의 기기는 여러 개의 소켓을 갖는다. (IP 주소로 찾는다.)

하나의 소켓은 여러 개의 프로세스를 갖는다. (포트 번호로 찾는다.

소켓은 특정 IP 주소 & 포트 번호의 조합에 바인딩 되어 있다.

 

소켓의 분류

타입에 따라 다른 소켓의 구조 (1. TCP: SOCK_STREAM / 2. UDP: SOCK_DGRAM)

 

소켓은 전송 계층의 프로토콜에 따라 2개의 분류로 나뉜다.

TCP는 SOCK_STREAM, UDP는 SOCK_DGRAM이다.

각 특징은 프로토콜의 그것을 따른다.

 

TCP: Socket 함수의 구조

TCP 소켓을 통해 통신이 이루어지는 과정

socket()

int socket(int domain, int type, int protocol);

소켓을 생성하는 함수.

type 파라미터를 통해 SOCK_STERAM / SOCK_DGRAM을 정한다.

socket file descriptor(일종의 id) or -1를 리턴한다.

bind()

IP 주소와 포트 번호를 바인딩하는 함수.

int bind(int sockfd, struct sockaddr* myaddr, int addrlen);

myaddr: 서버의 IP 주소와 포트 번호

listen()

해당 소켓으로 request를 받을 수 있도록, 연결에 대한 준비 상태로 만드는 함수

int listen(int sockfd, int backlog);

backlog: request 데이터를 담을 buffer의 사이즈를 결정한다.

accept()

해당 소켓으로 연결 준비를 마치는 함수. 이때부터 연결까지 blocking.

int accept (int sockfd, struct sockaddr* cliaddr, int* addrlen);

cliaddr: 클라이언트의 IP 주소와 포트 번호

 

새로운 소켓 id를 return한다.

이것을 이후 write(), read() 통신에서 사용한다.

connect()

연결을 시작하는 함수.

클라이언트 측에서 요청한다.

close()

연결을 종료하는 함수.

클라이언트와 서버 양측에서 종료해야 연결이 끊긴다.

 

UDP: 소켓 함수의 구조

UDP: 소켓 함수의 구조

상대적으로 단순한 구조를 갖고 있다.

따로 Connection 과정이 없는 것이 특징이다.

 

 

 

 

 

 

참조

컴퓨터네트워크 - 이석복, 한양대학교, 2018-1: http://www.kocw.net/home/search/kemView.do?kemId=1312397

자료: https://gaia.cs.umass.edu/kurose_ross/ppt.php

프로그램(Program)

  • 정의:
    • 프로그램은 저장 매체에 저장되어 있는, 실행 가능한 명령어(instruction)의 집합.
    • 이러한 명령어들은 컴퓨터가 수행해야 할 작업을 정의.
    • 프로그램은 일반적으로 하드 드라이브, SSD, USB 드라이브 등의 비휘발성 메모리에 저장.
  • 특징:
    • 프로그램은 정적인 성격.
    • 즉, 실행되고 있지 않을 때는 단순히 코드의 모음으로 존재.
    • 프로그램은 사용자나 다른 프로그램에 의해 실행될 때까지 변경되지 않고 그 상태를 유지.

프로세스(Process)

  • 정의:
    • 프로세스는 실행 중인 프로그램.
    • 컴퓨터에서 프로그램이 실행되면, 운영체제는 해당 프로그램의 코드와 데이터를 메모리에 로드하고, 이를 프로세스라는 실행 단위로 관리.
    • 프로세스는 운영체제에 의해 할당된 자원(메모리, CPU 시간, 입출력 장치 등)과 함께 실행.
  • 특징:
    • 프로세스는 동적인 성격.
    • 프로세스는 실행 상태, 대기 상태, 종료 상태 등 다양한 상태를 가지며, 시스템 자원을 소비하며 작업을 수행.
    • 각 프로세스는 고유한 프로세스 식별자(PID)를 가지고, 독립된 메모리 영역(주소 공간)에서 실행.

프로그램 VS 프로세스

  • 저장 위치와 형태: 프로그램은 디스크와 같은 저장 매체에 정적으로 저장되어 있지만, 프로세스는 메모리에 동적으로 존재.
  • 실행 상태: 프로그램은 실행되기 전의 코드와 데이터의 집합이지만, 프로세스는 실제로 실행 중인 프로그램을 의미.
  • 자원 사용: 프로세스는 실행되면서 CPU 시간, 메모리 공간, 입출력 장치 등의 시스템 자원을 사용. 반면, 프로그램은 자원을 사용하지 않고 저장 매체에 정적으로 존재.
  • 운영체제의 역할: 운영체제는 프로세스의 생성, 스케줄링, 관리를 담당. 프로그램은 사용자가 실행을 요청할 때 프로세스로 변환.

<TCP/IP 4계층 / OSI 7계층>

TCP/IP 4 계층과 OSI 7 계층의 비교
호스트 간의 통신 과정; OSI 7계층 기준이며, 상위 3개 항목을 묶어보면 TCP/IP 4계층과 같다.

 

해당 강의는 네트워크의 통신 과정을 TCP/IP 4계층을 기준으로 설명한다.

따라서 이 시리즈 역시 TCP/IP 4계층을 중심으로 정리할 예정이다.

 

 

 

<네트워크의 구조>

네트워크 구조

네트워크 구조는 크게 다음의 3가지로 나뉜다.

- 네트워크 엣지 (network edge)

- 네트워크 코어 (network core)

- 접근 네트워크와 물리 매체 (access networks and physical media)

 

네트워크 엣지

네트워크 엣지

 

Connection-oriented service.

엔드 시스템 간의 데이터 교환이 목적.

handshaking(connection): 데이터 교환 전에 준비하는 단계

 

TCP

- transmission control protocol [RFC 793] (전송 제어 프로토콜)

- reliable, in-order byte-stream data transfer: 메시지가 손실되지 않을 것이 보장, 보낸 순서대로 통신

- flow control: receiver의 수용량을 초과하지 않도록 조절

- congestion control: 네트워크 통신 상태를 고려하여 조절

- 인터넷의 프로토콜

- 애플리케이션에서 사용하는 경우: HTTP (WWW), FTP (file transfer), Telnet (remote login), SMTP (email)

 

Connectionless service

엔드 시스템 간의 데이터 교환이 목적 (위와 동일)

 

UDP

- User Datagram Protocol [RFC 768]

- unreliable data transfer

- no flow control

- no congestion control

- 애플리케이션에서 사용하는 경우: streaming media, teleconferencing, lnternet telephony

 

네트워크 엣지의 종류

엔드 시스템(호스트)

  • 애플리케이션 프로그램을 실행한다.
  • 예: 웹, 이메일

클라이언트/서버 모델

  • 클라이언트 호스트가 24시간 켜져있는 서버 측으로 서비스를 요청하고, 응답받는다.
  • 예: 웹 브라우저/서버, 이메일 클라이언트/서버

피어 투 피어 모델

  • 전용 서버 사용을 최소화하고, 사용자 간 직접적인 연결을 중심으로 데이터를 공유한다.
  • 예: Skype, BitTorrent, KaZaA

 

네트워크 코어

네트워크 코어

네트워크의 중심부.

높은 처리 능력으로 여러 네트워크 엣지를 연결하는, 라우터 광대역 전송 링크로 구성되어 있다.

데이터 패킷의 전송과 라우팅이 주로 이루어진다.

데이터를 전송하는 방식은 circuit switching, packet-switching으로 나뉜다.

 

Circuit Switching

Circuit Switching

엔드 시스템 간의 통신이, 하나의 전용 회선을 할당 받아 수행된다.

출발지 시스템에서 목적지 시스템으로 가는 경로가 유일하다.

다른 네트워크와 회선을 공유하지 않는다.

연결이 되고 나면 다음과 같은 특징을 얻는다.

- 빠른 속도를 보장

- 손실 가능성도 적음

- packet의 헤더와 같은 정보가 필요 없음

- 순차적으로 전송

 

그러나 회선을 예약하는데 매우 복잡하여 시간이 오래 걸린다.

점유 중인 회선에서 통신을 하고 있지 않다면, 회선이 낭비된다.

 

Packet Switching

Packet Switching

송신할 데이터를 packet이라는 단위로 쪼개서 전송한다.

인터넷에서 사용하는 데이터 전송 방식.

 

Circuit Switcing과 다르게, 여러 개의 시스템이 하나의 회선을 공유할 수 있으므로, 다중화(Multiflexing)를 통해 회선의 효율을 높인다.

다중화에는 FDM, TDM, STDM과 같은 방식이 있다.

 

Packet 전송이 딜레이 되는 4가지 이유

1. nodal processing

  • 비트 에러를 검사
  • 출력 링크를 결정
  • 해결 방법: 라우터의 성능 개선

2. queueing

  • 출력 링크에서 순서가 올 때까지 대기
  • 라우터의 혼잡도에 따라 대기 시간이 결정
  • 큐의 크기보다 더 많은 데이터가 들어오면, 패킷이 유실된다. (인터넷 환경에서 패킷 유실의 90% 이상이 여기에서 발생)
  • 해결 방법: 어렵다. 사용자가 몰리는 정도에 따라 다르다.

3. Transmission delay

  • 패킷은 데이터(비트)의 집합이므로, 하나의 패킷이 라우터를 완전히 빠져나가는 데에 시간이 걸린다.
  • 첫 번째 비트부터 마지막 비트까지 링크로 올라가, 전송이 시작되는 시간을 의미한다.
  • R = link bandwidth (bps)
  • L = packet length (bits)
  • 총 소요 시간: L/R
  • 해결 방법: 케이블의 대역폭을 확장한다.

4. Propagation delay

  • 마지막 비트까지 링크에 올라가서, 다음 라우터에 도달하는 데에 소요되는 시간
  • 데이터는 빛의 속도로 움직인다.
  • d = 링크의 물리적 길이
  • s = 데이터가 전파되는 속도
  • 총 소요 시간: d/s
  • 해결 방법: 어렵다. 빛의 속도를 더 줄일 수는 없다. 링크의 물리적 길이는 쉽게 개선하기 어렵다.

 

접근 네트워크와 물리 매체

접근 네트워크는 엔드 시스템을 네트워크 코어에 연결하는 역할을 한다.

이러한 네트워크는 사용자의 위치(예: 가정, 기업, 이동 중)에 따라 다양한 형태로 구성된다.

가정: DSL이나 케이블 모뎀을 통한 광대역 접속

기업: 고속 이더넷 접속

이동 중: 무선 접속 네트워크(예: 4G, 5G)

 

물리 매체는 네트워크 상에서 데이터를 전송하는 데 사용되는 물리적인 수단을 말한다.

구리선, 광섬유 케이블, 무선 링크 등이 포함된다.

 

 

 

참고

컴퓨터네트워크 - 이석복, 한양대학교, 2015-2: http://www.kocw.net/home/cview.do?mty=p&kemId=1169634

https://community.fs.com/article/tcpip-vs-osi-whats-the-difference-between-the-two-models.html

호스트

네트워크에 연결된 컴퓨터나 장치.

컴퓨터, 스마트폰, 태블릿, 서버 등 네트워크를 통해 데이터를 송수신하는 모든 장치를 포괄.

네트워크 상에서 고유한 IP 주소를 가지고 있으며, 다른 컴퓨터나 장치와 통신 가능.

(== 네트워크 호스트는 네트워크 주소가 할당된 네트워크 노드이다.)

(== 네트워크 호스트는 정보 리스소, 서비스, 애플리케이션을 네트워크 상의 사용자나 기타 노드에 제공할 수 있다.)

 

모든 서버는 호스트이지만, 모든 호스트가 호스트인 것은 아니다.

네트워크에 연결이 된 모든 장치는 호스트의 자격이 있는 반면, 다른 장치(클라이언트)로부터 연결을 수락하는 호스트만 서버가 될 수 있다.

 

호스팅

서버 컴퓨터의 전체 또는 일정 공간을 이용할 수 있도록 임대해 주는 서비스.

사용자가 직접 서버를 구입하고 운영할 필요 없이 호스팅 업체가 미리 준비해 놓은 서버를 빌려 사용하는 형식.

 

웹호스팅은 웹사이트의 파일과 데이터를 저장하는 서비스.

이를 통해 인터넷에 연결된 누구나 웹사이트에 접근 가능.

웹호스팅 제공 업체는 서버의 유지 관리, 보안, 백업 등을 관리.

 

서버 호스팅은 전체 서버를 임대하여, 사용자의 웹사이트, 애플리케이션, 데이터베이스 등을 호스팅.

고객이 서버의 전체 자원을 독점적으로 사용 가능.

 

클라우드 호스팅은 여러 연결된 서버의 네트워크를 사용하여 웹사이트나 애플리케이션을 호스팅.

필요에 따라 자원을 쉽게 확장하거나 축소할 수 있음.

 

공유 호스팅은 여러 웹사이트가 하나의 서버 자원을 공유하는 가장 기본적인 호스팅 형태.

비용이 저렴하지만, 다른 웹사이트의 트래픽이 많을 경우, 자신의 웹사이트 성능에 영향.

 

가상 사설 서버(VPS) 호스팅은 하나의 물리적 서버를 여러 가상 서버로 분할하여, 각각 독립된 서버 환경을 제공.

공유 호스팅과 전용 서버 호스팅의 중간 형태로, 사용자에게 더 많은 컨트롤과 자원을 제공.

 

로컬

특정 컨텍스트나 범위 내에서 접근이나 사용이 이루어지는 장치나 자원.

'로컬 컴퓨터'는 현재 사용자가 직접 작업하고 있는 컴퓨터.

'로컬 네트워크'는 사용자의 장치가 연결된 직접적인 네트워크.

로컬 장치 ∈ 호스트

 

프로그램

실행 가능한 소프트웨어의 모든 형태.

 

애플리케이션

최종 사용자에게 특정 작업을 수행하는 데 도움을 주는 소프트웨어.

일반적으로 사용자 인터페이스를 포함.

 

클라이언트 / 서버

네트워크 상의 두 가지 주요 컴퓨터 유형.

이들의 관계는 요청(request)과 응답(response)의 패턴을 따름.

 

클라이언트는 서비스나 데이터에 대한 요청을 하는 장치나 프로그램.

예를 들어, 웹 브라우저는 웹 페이지를 요청하는 클라이언트의 일종.

 

서버는 이러한 요청을 받아 처리하고, 필요한 데이터나 서비스를 클라이언트에게 제공하는 장치나 프로그램.

예를 들어, 웹 서버는 웹 페이지를 호스팅하고, 클라이언트의 요청에 응답하여 해당 페이지를 제공.

 

 

 

참고

https://ko.wikipedia.org/wiki/%ED%98%B8%EC%8A%A4%ED%8A%B8_(%EB%84%A4%ED%8A%B8%EC%9B%8C%ED%81%AC)

+ Recent posts