본문 바로가기

컴퓨터 시스템 이야기

Chapter 1 컴퓨터 시스템으로의 여행(1.5 캐시가 중요하다~1.7.4 파일)

1.5 캐시가 중요하다

  • 프로그램을 실행하는 예제로부터 얻게 되는 교훈은 시스템이 정보를 한 곳에서 다른 곳으로 이동시키는 일에 많은 시간을 보낸다는 것이다. 프로그램의 기계어 인스트럭션들과 코드인 데이터 스트링들은 본래 하드 디스크에 저장되어 있었다. 프로그램이 로딩될 때 메인 메모리로 복사되고 데이터 스트링들은 디스플레이 장치로 복사된다. 프로그래머의 관점에서 보면, 이러한 과정들은 프로그램의 '실제 작업'을 느리게 하는 오버헤드다. 그래서 시스템 설계자들의 목적은 가능한 복사 과정들을 빠르게 동작하도록 하는 것이다. 마찬가지로 일반적인 레지스터 파일은 수백 바이트의 정보를 저장하는 반면, 메인 메모리의 경우는 십억 개의 바이트를 저장, 그러나 프로세서는 레지스터 파일의 데이터를 읽는 데 메모리의 경우보다 거의 100배 빨리 읽을 수 있다. 프로세서-메로리 간 격차가 지속적으로 증가함에 따라, 메인 메모리를 더 빠르게 동작하도록 만드는 것보다 프로세서를 더 빨리 동작하도록 만드는 것이 더 쉽고 비용이 적게 듬.
  • 더 큰 장치들은 보다 작은 저장장치들보다 느린 속도를 갖는다. 더 빠른 장치들은 더 느린 장치들보다 더 많은 비용이 든다. (ex. 시스템의 디스크 드라이브는 메인 메모리보다 1,000배 크기가 크지만, 프로세서가 디스크에서 1 워드의 데이터를 읽어 들이는데 걸리는 시간은 메모리에서보다 천만 배 더 오래 걸린다.) 
  • 이러한 프로세서-메모리 간 격차에 대응하기 위해 시스템 설계자는 보다 작고 빠른 캐시 메모리라고 부르는 저장장치를 고안하여 프로세서가 단기간에 필요로 할 가능성이 높은 정보를 임시로 저장할 목적으로 사용. 데이터 저장 용량과 속도에 따라 L1, L2 등으로 나뉘는데(작을수록 용량은 적고 빠르다) SRAM이라는 하드웨어 기술을 사용하여 구현 , 좀 더 강력한 시스템은 3단계 캐시로 L3까지 갖는다. 캐시의 이면에 깔린 아이디어는 프로그램이 지엽적인 영역의 코드와 데이터를 액세스 하는 경향인 지역성을 활용하여 시스템이 매우 크고 빠른 메모리 효과를 얻을 수 있다는 것이다. 캐시 메모리를 이해하여 프로그램 성능을 10배 이상 개선할 수 있다.

캐시 메모리


1.6 저장장치들은 계층구조를 이룬다

모든 컴퓨터 시스템의 저장장치들은 메모리 계층구조로 구서 되어 있다. 메모리 계층구조의 주요 아이디어는 한 레벨의 저장장치가 다음 하위 레벨 저장장치의 캐시 역할을 한다는 것이다. L1과 L2의 캐시는 각각 L2와 L3의 캐시이다. L3는 메인 메모리의 캐시. 일부 분산 파일 시스템을 가지는 네트워크 시스템에서 로컬 디스크는 다른 시스템의 디스크에 저장된 데이터의 캐시 역할을 수행. 로컬 디스크들은 원격 네트워크 서버에서 파일들을 가져와 보관함.

메모리 계층구조


1.7 운영체제는 하드웨어를 관리한다.

hello 프로그램을 실행할 때, 프로그램이 키보드나 디스플레이, 디스크나 메인 메모리를 직접 액세스 하지 않음. 오히려 운여 체제가 제공하는 서비스를 활용함. 응용프로그램이 하드웨어를 제어하려면 언제나 운영체제를 통해서 해야 함.

운영체제는 두 가지 주요 목적을 가지고 있다.

  • 제멋대로 동작하는 응용프로그램들이 하드웨어를 잘못 사용하는 것을 막기 위해
  • 응용프로그램들이 단순하고 균일한 메커니즘을 사용하여 복잡하고 매우 다른 저수준 하드 웨어 장치들을 조작할 수 있도록 하기 위해

운영 체제는 추상화를 통해 위의 목표를 달성함, 파일은 입출력 장치의 추상화, 가상 메모리는 메인 메모리와 디스크 입출력 장치의 추상화, 그리고 프로세스는 프로세서, 메인 메모리, 입출력 장치 모두의 추상화 결과이다.

운영체제에 의한 추상화

1.7.1 프로세스

프로그램이 실행될 때 프로그램이 프로세서, 메인 메모리, 입출력 장치를 모두 독차지하고 있는 것처럼 보인다. 프로세서는 프로그램 내의 인스트럭션들을 다른 방해 없이 순차적으로 실행하는 것처럼 보인다. 이것은 전산학의 중요한 개념인 프로세스라고 하는 개념에 의해서 만들어진다.

프로세스는 실행 중인 프로그램에 대한 운영체제의 추상화이다. 다수의 프로세스들은 동일한 시스템에서 동시에 실행될 수 있으며, 각 프로세스는 하드웨어를 배타적으로 사용하는 것처럼 느낀다. 동시에 라는 말은 한 프로세스의 인스트럭션들이 다른 프로세스의 인스트럭션들과 섞인다는 것을 의미함. 대부분의 시스템은 프로세스를 실행할 CPU의 숫자보다 더 많은 프로세스들이 존재함. 

운영체제는 문맥 전환(context switching)이라는 방법을 사용해서 교차 실행을 수행함. 운영체제는 프로세스가 실행하는 데 필요한 모든 상태 정보의 변화를 추적한다. 이 콘텍스트라고 부르는 상태 정보는 PC, 레지스터 파일, 메인 메모리의 현재 값을 포함하고 있다. 현재 프로세스에서 다른 새로운 프로세스로 제어를 옮기려고 할 때 현재 프로세스의 콘텍스트를 저장하고 새 프로세스의 콘텍스트를 복원시키는 문맥 전환을 실행하여 새 프로세스로 넘겨준다. 예시는 다음과 같다

  • 쉘프 로세스와 hello프로세스가 있을 때, 처음에는 쉘 프로세스가 혼자 동작하고 있다.
  • 명령줄에 명령이 입력되면 쉘은 시스템 콜이라는 특수 함수를 호출하여 운영체제로 제어권을 넘겨준다.
  • 운영체제는 쉘의 콘텍스트를 저장하고 새로운 hello 프로세스와 컨텍스트를 생성한 뒤 제어권을 새 hello 프로세스로 넘겨준다.
  • hello가 종료되면 운영체제는 쉘 프로세스의 컨텍스트를 복구시키고 제어권을 넘겨주면서 다음 명령 줄 입력을 기다린다.

프로세스 사이의 전환은 운영체제 커널에 의해 관리된다. 커널은 운영체제 코드의 일부분으로 메모리에 상주한다. 응용프로그램이 운영체제에 의한 어떤 작업을 요청하면, 시스템 콜을 실행해서 커널에 제어를 넘겨준다. 그 뒤 커널은 작업을 수행하고 응용프로그램을 리턴한다. 커널은 별도의 프로세스가 아니라는 점에 유의해야 한다. 대신 커널은 모든 프로세스를 관리하기 위해 시스템이 이용하는 코드와 자료구조의 집합이다

프로세스 문맥전환

 

1.7.2 쓰레드

시스테에서 프로세스는 쓰레드라고 하는 다수의 실행 유닛으로 구성되어 있다. 각각의 쓰레드는 해당 프로세스의 콘텍스트에서 실행되며 동일한 코드와 전역 데이터를 공유한다. 쓰레드는 다수의 프로세스들에서 보다 데이터의 공유가 쉽다는 점과 더 효율적이어서 중요성이 크다. 다중 쓰레딩도 다중 프로세서를 활용할 수 있다면 프로그램의 실행 속도를 빠르게 하는 한 가지 방법이다.

1.7.3 가상 메모리

가상 메모리는 각 프로세스들이 메인 메모리 전체를 독점적으로 사용하고 있는 것 같은 환상을 제공하는 추상화이다. 주소 공간의 최상위 영역은 모든 프로세스들이 공통으로 사용하는 운영체제의 코드와 데이터를 위한 공간이다. 주소 공간의 하위 영역은 사용자 프로세스의 코드와 데이터를 저장한다. 위쪽으로 갈수록 주소가 증가하는 것을 볼 수 있다. 각 프로세스들에게 보이는 가상 주소 공간은 몇 개의 정의된 영역으로 구성되어 있다.

  • 프로그램 코드와 데이터: 코드는 모든 프로세스들이 같은 고정 주소에서 시작, 다음에 C전역 변수에 대응되는 데이터 위치들이 따라옴. 코드와 데이터 영역은 실행 가능 목적 파일인 hello로부터 직접 초기화된다.
  • 힙(heap): 코드와 데이터 영역 다음으로 런타임 힙이 따라온다. 크기가 고정되어 있는 코드, 데이터 영역과 달리, 힙은 프로세스가 실행되면서 C 표준 함수인 malloc이나 free를 호출하면서 런타임에 동적으로 크기가 늘어났다 줄었다 한다.
  • 공유 라이브러리: 주소 공간의 중간 부근에 C 표준 라이브러리나 수학 라이브러리와 같은 공유 라이브러리의 코드와 데이터를 저장하는 영역이 있다.
  • 스택 (stack) : 사용자 가상 메모리 공간의 맨 위에 컴파일러가 함수 호출을 구현하기 위해 사용하는 사용자 스택이 위치한다. 힙과 마찬가지로 사용자 스택은 프로그램이 실행되는 동안에 동적으로 늘어났다 줄어들었다 한다. 함수를 호출할 때마다 스택이 커지며, 함수에서 리턴될 때는 줄어든다.
  • 커널 가상 메모리: 주소 공간의  맨 윗부분은 커널을 위해 예약되어 있다. 응용프로그램들은 이 영역에 접근하는 것이 금지되어 있으며, 커널 코드 내에 정의된 함수를 직접 호출하는 것도 금지됨. 대신, 이런 작업을 수행하기 위해서는 커널을 호출해야 함.

프로세스 가상주소공간

1.7.4 파일

파일은 연속된 바이트들이다. 디스크, 키보드, 디스플레이 , 네트워크까지 포함하는 모든 입출력 장치는 파일로 모델링한다. 시스템의 모든 입출력은 유닉스 I/O라는 시스템 콜들을 이용하여 파일을 읽고 쓰는 형태로 이루어진다. 응용프로그램에 시스템에 들어 있는 다양한 입출력 장치들의 통일된 관점을 제공한다. 예시로 디스크 파일의 내용을 조작하려는 응용 프로그래머는 사용하고 있는 디스크의 기술에 대해 몰라도 가능하다.