[리뷰] Machine Learning at Work

머신러닝을 아는 것과 하는 것은 다르고, 이 책은 하는 방법을 다룬다.

Jinhwan Kim
5 min readApr 16, 2022

이번 글은 Machine Learning at Work : 머신러닝 실무 프로젝트 라는 책의 리뷰입니다.

한빛미디어나는 리뷰어다 활동을 위해서 책을 제공받아 작성했습니다.

이 책을 리뷰하는 저는

  • 대학원때 머신러닝과 딥러닝을 잠깐 공부했지만 많이 활용하지는 않았고, 통계적인 접근으로 새로운 “통계치” 를 활용해서 인사이트를 찾는 연구를 했던 사람입니다.
  • 업무에는 Decision Tree 같은 간단한 수준의 머신러닝“로컬 수준”에서 분석에 활용했던 사람입니다.

요약

예전에 비하면, 기술 서적이 정말 다양한 분야를 다루고, 동시에 비전공자를 위한 이해할 수 있는 IT 지식 과 같이 다양한 독자들을 타겟으로 하고 있습니다. “데이터” 관련 서적도 마찬가지 인데요. 제게 항상 있던 개인적인 아쉬움은 “이렇게 하면 된다” 의 책을 넘어서서 “이렇게 하면 이런 문제가 생긴다”를 담는 실전 책에 대한 것이었습니다.

그에 대해 이 책은 리뷰로 제공 받았지만 상당히 만족했던 책인데요, 머신러닝 실무 프로젝트 보다는 영어 제목 Machine Learning at Work가 조금 더 와닿는 내용으로, 머신러닝에 대한 이론은 어느정도 아는 사람들이 Machine Learning Product를 만들어가야 할때 알아야할 팁들을 담은 책입니다.

300페이지 정도의 분량임에도 불구하고 상당히 넓은 분야를 다루고 있습니다. (당연히 모든 분야를 꽉꽉 다루진 않습니다)

개인적으로는 PM들이 인스파이어드를 보는 것처럼 Data PM들이 이 책을 보면 좋겠다 라고 생각했어요.

마지막으로 22년 3월에 1쇄를 찍은 개정판으로 적어도 2–3년 동안은 충분히 유효할 내용들이라고 생각합니다.

권장 독자

  • 1. 요즘 머신러닝이 좋다더라 우리 비즈니스에도 적용해볼 수 있지 않을까? 라는 의견을 내고 싶은 리더십
  • 2. 머신러닝이 뭔지 알겠고 이제 실제로 굴러가는 프로덕트에 머신러닝을 끼얹고 만들고 싶은 DS / MLE
  • 단, Data Engineer는 이 책을 읽으면 당연히 좋겠지만, 더 우선적으로 필요한 책이 있을 것이라고 생각합니다.

이 책의 장점

  • 머신러닝을 Silver Bullet의 관점으로 보는 것이 아닌, 비즈니스 문제를 풀어내는 “방법론 중 하나” 로써 실무에 적용할때 어떤 것들을 고려해야 하는 지 잘 설명해주고 있습니다.
많은 “실무” 데이터 교육에서 다루는 부분은 사실 6–8이라는 기술적인 부분이라고 생각하며 현실은 “실패 리스크를 책임지는 책임자” 를 설득하는 것 조차도 있어야 합니다. (저도 경험해봄)
  • 모든 부분을 자세하게 다루고 있지는 않지만, 대신 이 내용은 이런 책들을 보면 좋다 와 같은 레퍼런스 도서나 자료들을 첨부해주었습니다. (단점으로는. 일본 저자가 서술한 책이라 번역이 되지 않은 일본 서적도 꽤 있는 편)
  • (아마도 번역하신 김모세님의 노력으로) 참고 자료 / 이미지들도 거의 재창조 수준의 번역이 되어있습니다.
  • 많은 건 아니지만, 당연히 사용 코드는 github에 공개되어있습니다.
  • 머신러닝을 실무에 적용하면서 나오는 문제와 해결법 이라는 컨셉에 맞게 다양한 경험들이 책에 녹아있습니다.
무조건 성공하는 A/B 테스트 ㅋㅋ

개인적으로 아쉬운 점

  • 책의 Part 2는 머신러닝 실무 프로젝트 라는 이름으로 몇가지 데이터 분석 프로젝트들을 소개 하는 부분입니다. (책의 1/3 정도) 그렇지만 세부 내용은 이전의 빨간 그림 부분. 즉 데이터 분석 자체에 한정되어 있다고 생각했습니다.
  • (Part 2) 추가로 강화학습이나 업리프트 모델링, 애드테크 (AdTech)에 대한 부분을 설명하고 있어서 “실무 프로젝트”의 관점에서는 빈약하다는 생각이 들었습니다. 물론 실제로 진행했던 프로젝트를 제가 기대했던 기술세미나 정도의 단계로 책에 다루는 것은 어려울 수도 있다고 생각합니다.
실제 프로젝트 진행시 겪는 어려움을 를 다루는 부분이 빈약하다고 생각할 뿐, 전체 로드맵을 설명하는 부분에는 충분합니다.

내용

  • 1장: 데이터 분석 프로젝트 현실
  • 2–3장: 머신러닝 개론
  • 4장: 데이터 엔지니어링 약간
  • 5장: 데이터 수집
  • 6장: MLOps 개론
  • 7장: 인과관계, 가설검증, A/B테스트
  • 8장: 머신러닝 결과 해석
  • 9–12: 데이터 분석 예시

진짜 넓은 부분의 로드맵을 다루고 있음

--

--

No responses yet