서브메뉴

본문

DevOps와 SE를 위한 리눅스 커널 이야기 (단단한 서버 구축을 위한 12가지 키워드)
DevOps와 SE를 위한 리눅스 커널 이야기 (단단한 서버 구축을 위한 12가지 키워드)
저자 : 강진우
출판사 : 인사이트
출판년 : 2017
ISBN : 9788966264049

책소개

커널은 오랜 세월 기능이 추가되고 개선되어 오면서 완벽하게 이해하기 힘들 정도로 방대해졌다. 하지만 변하지 않는 기본 기능들이 있다. 이런 근간이 되는 기능에 대한 이해를 바탕으로 시스템의 문제를 파악하고 해결하는 것이 시스템 엔지니어링의 기본이라 할 수 있다. 『리눅스 커널 이야기』는 리눅스 서버를 관리할 때 만날 수 있는 문제점들과 이를 해결하는 방법을 제시하고 있다. 저자는 현업에서 경험한 다양한 상황과 문제를 바탕으로 하드웨어 정보를 알아내는 데 유용한 명령어, 정보를 해석하는 방법, 애플리케이션 테스트와 튜닝까지 실무에서 궁금할 법한 내용을 설명한다.
[교보문고에서 제공한 정보입니다.]

출판사 서평

[이 책에서 다루는 내용들]
시스템 구성 정보 확인하기
top 명령으로 프로세스 정보 확인하기
Load Average로 시스템 부하 확인하기
swap과 메모리 증설의 연관 관계
NUMA 아키텍처와 메모리 관리
TCP Keepalive로 종단 간 연결 유지하기
TIME_WAIT 소켓이 서비스에 미치는 영향

[추천의 글]
실무에서 궁금해하는 내용을 쉽게 정리한 책
실무에서 항상 궁금했지만 찾기 어려운 정보를 쉽게 정리해 주는 책입니다. 교과서에 나오는 내용이 아닌 실무를 하면서 찾아낸 방법이기 때문에 더욱 마음에 와닿는 것 같습니다. 또한, 문제 해결 방법을 같이 살펴보기 때문에 이를 통해서 독자 스스로 자신의 역량을 강화하는 데 큰 도움이 될 것으로 생각합니다. 리눅스 시스템을 운영하는 시스템 엔지니어나 데브옵스(DevOps)라면 이 정도 깊이까지 이해하는 것을 목표로 했을 때 큰 도움이 될 것입니다.
- 고우찬(카카오 인프라 & 데이터플랫폼팀 팀장)

대규모 서비스를 시스템 엔지니어의 시각에서 보여주는 책
실제로 서비스의 문제를 잘 해결하기 위해서는 두 SE의 시각이 필요합니다. 보통 서비스를 개발하고 운영하는 소프트웨어 엔지니어의 시각과, 시스템적인 부분의 운영을 다루는 시스템 엔지니어의 시각입니다. 문제가 발생하면 코드의 이슈에 집중하는 소프트웨어 엔지니어와 달리 시스템 엔지니어는 시스템의 설정부터 네트워크 환경 등, 코드가 아닌 해당 시스템에 대한 시각으로 문제에 접근합니다. 실제 서비스를 운영하게 되면 두 가지 중 어느 하나의 시각이 덜 중요한 케이스는 없습니다. 대규모 서비스에서 시스템 엔지니어는 어떻게 사고하는지, 어떤 정보를 봐야 하는지 알고 싶으신 분들은 꼭 읽어보시길 바랍니다.
- 강대명(유데미 데이터 엔지니어, 오픈소스 컨트리뷰터)
[교보문고에서 제공한 정보입니다.]

목차정보

1장 시스템 구성 정보 확인하기

1.1 커널 정보 확인하기

1.2 CPU 정보 확인하기

1.3 메모리 정보 확인하기

1.4 디스크 정보 확인하기

1.5 네트워크 정보 확인하기

1.6 요약



2장 top을 통해 살펴보는 프로세스 정보들

2.1 시스템의 상태 살피기

2.2 VIRT, RES, SHR ..?

2.3 VIRT와 RES 그리고 Memory Commit의 개념

2.4 프로세스의 상태 보기

2.5 프로세스의 우선순위

2.6 요약



3장 Load Average와 시스템 부하

3.1 Load Average의 정의

3.2 Load Average 계산 과정

3.3 CPU Bound vs I/O Bound

3.4 vmstat으로 부하의 정체 확인하기

3.5 Load Average가 시스템에 끼치는 영향

3.6 Case Study - OS 버전과 Load Average

3.7 요약



4장 free 명령이 숨기고 있는 것들

4.1 메모리 사용량 확인하기

4.2 buffers와 cached 영역

4.3 /proc/meminfo 읽기

4.4 slab 메모리 영역

4.5 Case Study - Slab 메모리 누수

4.6 요약



5장 swap, 메모리 증설의 포인트

5.1 swap 영역

5.2 버디 시스템

5.3 메모리 재할당 과정

5.4 vm.swappiness와 vm.vfs_cache_pressure

5.5 메모리 증설의 포인트

5.6 Case Study - gdb를 이용해서 메모리 누수 잡기

5.7 요약



6장 NUMA, 메모리 관리의 새로운 세계

6.1 NUMA 아키텍처

6.2 리눅스에서의 NUMA 확인

6.3 메모리 할당 정책별 특징

6.4 numad를 이용한 메모리 할당 관리

6.5 vm.zone_reclaim_mode 커널 파라미터

6.6 NUMA 아키텍처의 메모리 할당 정책과 워크로드

6.7 요약



7장 TIME_WAIT 소켓이 서비스에 미치는 영향

7.1 TCP 통신 과정

7.2 TIME_WAIT 소켓의 문제점

7.3 클라이언트에서의 TIME_WAIT

7.4 net.ipv4.tcp_tw_reuse

7.5 ConnectionPool 방식 사용하기

7.6 서버 입장에서의 TIME_WAIT 소켓

7.7 net.ipv4.tcp_tw_recycle

7.8 keepalive 사용하기

7.9 TIME_WAIT 상태의 존재 이유

7.10 Case Study - nginx upstream에서 발생하는 TIME_WAIT

7.11 요약



8장 TCP Keepalive를 이용한 세션 유지

8.1 TCP Keepalive란

8.2 TCP Keepalive의 파라미터들

8.3 TCP Keepalive와 좀비 커넥션

8.4 TCP Keepalive와 HTTP Keepalive

8.5 Case Study - MQ 서버와 로드 밸런서

8.6 요약



9장 TCP 재전송과 타임아웃

9.1 TCP 재전송과 RTO

9.2 재전송을 결정하는 커널 파라미터

9.3 재전송 추적하기

9.4 RTO_MIN 값 변경하기

9.5 애플리케이션 타임아웃

9.6 요약



10장 dirty page가 I/O에 끼치는 영향

10.1 dirty page란

10.2 dirty page 관련 커널 파라미터

10.3 백그라운드 동기화

10.4 dirty page 설정과 I/O 패턴

10.5 요약



11장 I/O 작업이 지나가는 관문, I/O 스케줄러

11.1 I/O 스케줄러의 필요성

11.2 I/O 스케줄러 설정

11.3 cfq I/O 스케줄러

11.4 deadline I/O 스케줄러

11.5 noop I/O 스케줄러

11.6 cfq와 deadline의 성능 테스트

11.7 I/O 워크로드 살펴보기

11.8 요약



12장 애플리케이션 성능 측정과 튜닝

12.1 애플리케이션 만들기

12.2 성능 테스트 시작

12.3 CPU 성능 최적화하기

12.4. 네트워크 소켓 최적화하기

12.5 nginx를 통해 reverse proxy 설정하기

12.6. 요약



Appendix A 커널 디버깅을 위한 커널 컴파일

A.1 커널 소스 컴파일하기

A.2 printk() 함수 추가하기

A.3 printk() 함수로 Load Average 계산 과정 살펴보기

A.4 요약



Appendix B strace를 통한 애플리케이션 분석

B.1 strace의 기본 사용법

B.2 hostname 명령 분석하기

B.3 요약



Appendix C tcpdump와 와이어샤크를 통한 TCP 패킷 분석

C.1 tcpdump의 사용법

C.2 와이어샤크 사용법

C.3 요약
[알라딘에서 제공한 정보입니다.]