[리뷰] 개발자를 위한 실전 선형대수학

Practical Linear Algebra for Data Science

Jinhwan Kim
4 min readOct 28, 2023

“데이터 사이언스”를 하다보면 잘 만들어진 라이브러리들을 응용하는 것 만큼이나, 라이브러리를 지탱하는 수학적 원리에 대해 관심을 갖게 된다.

데이터 직군에게 수학을 설명하는 것은 수학을 전문으로 하는 사람들만큼 너무 깊게 다루기도 어렵지만, 동시에 수학을 프로그래밍으로도 구현해낼 수 있어야할 만큼은 설명해야하기 때문에 상당히 까다롭다.

(그나마 응용통계학을 포함하여 사례들이 어느 정도 있는 통계와 다르게) 그러다보니 기존의 선형대수와 미적분학을 다루는 도서들은 적당한 밸런스를 맞추지 못했다고 생각한다.

이 관점에서 개발자를 위한 실전 선형대수학은 꽤 밸런스를 잡으려고 노력한 흔적이 보인다.

입문자도 알 수 있게 맥락과 사례를 포함하여 원리를 설명하면서 동시에, 너무 수학적으로 나아가는 것이 아닌 (저자의 표현대로 “얕은 증명”) 정도로 서술되며, 무엇보다 Python으로 다뤘던 이론적 내용들을 다시 실습할 수 있게 구성했다.

만약 수학을 건너뛰었지만, 어쩌다 보니 데이터 사이언스를 하고 있는 사람이라면, 이 책은 그 Pain point를 해결해 줄 수 있는 꽤 좋은 방법이 될 것이라 생각한다.

이 책의 저자

수학 좋아하고, 또 잘 할 것 같은 믿음의 관상.

얼마전까지는 대학의 부교수였였고, 최근 수학과 통계, 머신러닝, 딥러닝, 신호 처리를 다루는 강의와 교재를 만드는 것에 집중하기로 했다고 한다.

이 책이 도움될 수 있는 사람

이 책이 도움이 될 수 있는 사람은 다음과 같다.

  • Python을 주로 쓰는 사람.
  • 머신러닝 / 딥러닝류의 데이터 과학을 하는 사람 (통계를 주로하는 데이터 분석가는 X)
  • 응용만큼이나 수학적 기초와 원리를 중요하게 생각하는 사람
  • 자신의 페이스대로 독학할 수 있기를 원하는 사람

이 책의 특징

  • 단원의 (응용) 목적과 수학적 원리, “쉬운” 설명, 그리고 프로그래밍으로의 구현, 마지막으로는 연습문제 라는 구성을 가지고 있다. (실습 코드는 깃허브, 설명은 유튜브에서 영문으로 제공)
  • 아마 많지 않겠지만, Python에 익숙하지 않은 사람들을 위해 부록에서 필요한 정도의 Python을 다뤄준다.
  • 장점이면서 단점이 될 수도 있는데, 각 장을 1개의 개념주제별로 쪼개어두어 학습 과정중에서의 오버로드를 방지할 수 있다. (동시에 단원이 엄청많다)
  • 벡터에서부터 PCA까지 다루고 있는데 이는 완전 깊은 내용이라고 보기엔 어렵다. (굳이 표현하자면 초입문 ~ 중간 단계로 표현하고 싶다)
  • 책의 1쇄 발행일은 23년 9월 25일로, 나온지 얼마 되지 않은 책이지만, Python의 버전은 3.10을 대응 할 수 있도록 다루고 있다. 기술 + 번역서의 특성상 어쩔 수 없으며, 최근 Python 버전은 3.12.0 이지만 선형대수학 학습을 위한 목적으로는 크리티컬한 이슈를 만들 정도의 차이는 아니라고 생각한다.
  • 개인적으로는 번역 된 제목이 아쉽다. “개발자를 위한” 보단 “데이터 과학을 위한” 이라는 원어의 의미를 그대로 쓰는 것이 더 좋지 않았을까 생각한다. (보통 생각하는 웹 개발자는) 선형대수를 다룰 일이 거의 없기 때문에…

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

--

--

No responses yet