데이터 과학자 원칙 집필 후기

고수들 사이에서 버스 탄 후기

Jinhwan Kim
9 min readMay 21, 2023

아마 이 글을 읽는 사람의 목적은 크게는 2가지일 것이라고 생각했다.

  1. “책 쓰기”에 대해 어떤 계기로, 어떤 과정들을 거쳐서 집필하였는지 등이 궁금한 사람

2. “책의 내용”에 대해 궁금한 사람

그리고 이 2가지에 대해서 “숫자를 포함하지 않는” 선에서 기억나는 것들을 공유해보고자 한다.

어쩌다 쓰게 되었는지

4월 3일날 저자 제안이 왔다.

출판사에서는 요즘IT와 협업을 하는 과정에서 내가 쓴 글을 (…?) 흥미 롭게 읽었고, <데이터 과학자 원칙>에 저자로 참여하면 좋겠다고 좋게 봐주시어 제안을 주셨다.

꼬리를 살랑살랑 흔든 글은 아래 3개.

내 커리어에 Product Analyst는 없지만 Product Analytics 관련된 내용이라는 것이 아이러니.

집필 타임라인이 정말 촉박했기 때문에 상상하던 것처럼 빵모자와 펜촉을 든 에디터와의 오프라인 미팅 그런건 없었고, 바로 다음날 4일에 계약을 진행했고 4월 9일부터 글을 쓰기 시작했다.

계약서는 처음 제안 메일과 다른 점이나, 법/도의적으로 물음표 드는 것이 없어서 빠르게 진행할 수 있었다.

무엇보다 내가 “말 그대로” 뭘 하든 적극 지지 + 응원해주는 회사가 있었기에 가능했던 것이 아닐까 생각한다.

원고를 준비하는 과정: 주제 정하기

이 블로그에는 내가 쓰고 싶은 말을 맘대로 써도 상관이 없지만, 책은 공동저자들이 있기 때문에 너무 엇나가지 않도록 써야지 라는 생각을 했다.

그러다보니 다른 사람들은 어떻게 썼을까? 를 고민 했지만 제목만 공유되었고 내용은 알 수 없었기에 데이터 과학자 원칙과 시리즈인 “개발자 원칙”을 참조했는데 개발이론, 문제 해결과 문화, 커리어 등 다양한 주제를 다루고 있었기에 조금 더 자유로운 글을 쓰는 것이 가능했던 것 같다.

물론 위 “좋게 봐주신” 글들처럼 데이터 분석에서의 방법론과 이론을 다룰까도 고민했지만, 아래 3가지 이유로 기각했다.

  1. 나는 데이터 분석을 안하고 있음.
  2. 분석 방법론은 나보다 더 잘 아는 사람이 많음.
  3. 아직 잘 소개되지 않은 최신 방법론을 마감기한 (4월30일) 까지 공부해서 쓸 자신이 없었음.

그렇다고 데이터에 대한 내 생각을 쓰자니 뒷감당이 되지 않을 것 같아서 내가 다른 저자들의 주제와 겹치지 않는 선에서 내가 잘 할 수 있는 것이 뭘까? 를 많이 고민했다.

R 이야기를 한다면 신나서 할 수 있겠지만, 데이터 과학자 원칙이라는 주제와는 거리가 있는 것 같아서 다른 방향에서 접근할 수 밖에 없었다.

그리고 결국 내가 정말 많이 고민했고, 듣고 싶었던 데이터 분석가 입문자와 주니어들이 “성장” 을 위해 어떤 것들을 하면 좋겠다라는 내용을 썼다.

성장이라는 단어가 정말 무서운 단어고, 사람마다 처해있는 환경마다 다르기 때문에 더더욱 내 생각이 정답으로 비춰지기보단 나는 이렇게 했는데 어쩌다보니 운이 좋아서 이렇게 된 것 같다. 정도로 전달 된다면 좋을 것 같다.

원고 작성: 글쓰기

골든래빗에서의 집필은 구글닥스를 통해 이뤄진다. 저자 소개, 본문 첫페이지 내용, SNS, 서론 그리고 본론 등으로 구성된 템플릿이 있고, 이를 채워서 에디터님께 공유하면 된다.

주제 정하기는 다양한 주제가 허용된 만큼, 그만큼 제한이 없어서 고민이 많았기에 “데이터 분석가의 성장” 정도를 시작으로 마인드맵을 그리고 정리해가며 글을 작성했다.

한편 단순히 데이터적인 측면을 넘어서 이 책과 독자의 목적이 뭘까를 고민할 수 있다는 점이 주제를 만들어 내는 것에 큰 도움을 주었다. (써머에게 오늘도 감사 ㅎㅎ)

알다시피 다른 저자분들에 비해 나는 데이터 분석에서의 커리어가 많이 빈약하기 때문에 내용에서 “약팔이”를 할 수는 없었고, 글의 구성을 어떻게 해볼 수 있지 않을까. 를 고민하며 6가지의 데이터 분석 키워드로 “데이터 분석가의 성장”에 대한 글을 쓰겠다는 생각을 했다.

  • Causal Inference
  • Multi Armed Bandit
  • Clustering
  • Occam’s razor
  • Outlier
  • 마지막으로 So What (지도교수님께 정말 많이 들었던, 그만큼 정말 중요했던 단어)

이렇게 6개로 글을 풀어냈는데 시간도 없고, 글이 어수선했어서 편집 과정에서 꽤 많이 잘려나갔다. 다행히 요즘IT에서 이 “초고” 버전의 글을 볼 수 있을 것 같다.

별도로 글에서 여름비님의 데이터 흑마법이라는 단어를 인용했고, 꼭 읽어볼 추천자료로 블로그를 포함한 도서들을 꽤 넣었는데 데이터 쪽 도서가 아니어서 그런가 뭉텅이로 빠진 것은 아쉽긴 하다.

아무튼 2주만에 20쪽 정도의 글을 쓰기 위해 하루 10시간 정도를 박았고, 그 과정에서 단순하게, 다양하게, 명확하게 그리고 목적을 가지고 라는 내 데이터와 성장에 대한 생각을 정리할 수 있던 것이 가장 큰 수확이었다.

그리고 원고를 작성하고 제출한 것이 4월 24일. 출판사에서 편집을 마친 것이 4월 26일. 총 3주 (실제로는 2주) 정도 걸렸다.

원고 제출 이후

이후는 표지 확인 및 교정 (오타 검수 등) 을 거치고, 인쇄 판매로 이어진다. 독립출판, 셀프 출판이 아니기 때문에 여기서는 내가 해야할 것이 많지 않다.

1–2주간의 예약판매 이후, 6월 1일쯤 출간이 되고 나면 저자들 오찬이 있다고 하는데 공동 집필 도서라서 그런 것 같다. 근데 다른 저자들과는 글쓰는 과정에서 접점이 없었는데 가서 뭐하지… 싶긴 하다. (접점이 없던 이유가 있음… 여기에 쓰긴 좀 그런)

출간 이후

이건 아직 모름… 귀찮아서 나중에 글에 추가 하지도 않을 듯.

단 개인적으로는 이 책으로 금전적 이익을 만들 생각은 없어서 다른 책들처럼 강연을 하거나 북토크를 하거나 하진 않을 것 같다. (책에서 나오는 인세에 사비 보태서 100만원 맞춘 다음 서울대 어린이 병원에 기부할 예정)

그래서

위를 읽고 온 사람들이라면 아마 이런 질문이 생길 것 같다.

책 쓰려면 어떻게 해야하는지, 책 써보니 어떤지?

그리고 이제 진짜 작가로써 (ㅋㅋ) 이에 대한 내 답은

  1. 책을 쓰고 싶으면 글을 많이 써라. 그리고 글을 쓰는 것을 응원하는 사람들을 만나라.

특히 나는 글을 진짜 못 쓰는데도 불구하고 이렇게 책을 쓸 수 있던 계기가 (내가 체리피킹한) 글또PAP라고 생각하는데 혼자 글을 쓰라고 했으면 절대 꾸준히 못썼을 거다. 그치만 의무감과 책임감 그리고 약간의 돈이 수백개의 글을 만들어 낸 씨앗이 되었다고 생각한다. (성장에 대한 열망 이런 건 글 2번 쓰고 나면 사라진다 ㅋㅋ)

두번째로 글쓰기를 응원하는 사람. 이것도 정말 중요하다. 글쓰기는 얻을 수 있는 것이 많지만, 여전히 어렵고 부끄럽다. 그만큼 많은 리소스를 필요로 하기 때문에 글쓰기는 어느 정도의 스스로와 주변 사람의 희생이 있어야 한다. 이 글쓰기 외적인 어려움은 창작의 고통으로 풀 수 없는 문제기 때문에, 좋은 사람을 만나는 것이 중요하다.

2. 책 써보니 돈은 잘 모르겠지만 명예는 생기는 것 같고, 책을 써 내는 과정에서 스스로가 글의 첫 독자이며 퇴고를 하는 사람인만큼 얻는 것이 또 있다.

이 데이터 과학자 원칙의 내 부분은 “이렇게 하세요” 라는 원칙의 톤보단, “이렇게 했다”라는 회고에 가깝다. 근데 그 회고가 대학원 졸업 후 광야에서의 고통을 받으며 데이터 업무를 한 시간들을 합친 회고인거지.

책에는 편집되거나, 다 쓰지 못한 것도 있지만 가능하면 나는

“과거의 나”를 포함해서 데이터를 하겠다는 “내 후임”이 알았으면 좋겠다.

싶은 것들을 적었고 이는 지금의 나에게도 방향성을 만들어줬다.

도서의 내용

나도 다른 저자 분들의 글을 보면 내 글쓰기 방향이 흔들릴 것 같아서 출간 될 때까지 안보기로 스스로와 약속했기 때문에 잘 모른다.

그러니 아래 링크로 사거나, 도서관에 신청해서 직접 읽자. (책에서 들어오는 건 전부 기부할거라 나는 부담 없음)

  • 교보문고 (링크 왜 저럼)
  • 알라딘
  • YES24

다만 확실한 건, 모두가 알고 있듯 데이터 과학자 / 데이터 분석가는 정말정말 애매한 직군이기 때문에 저자들도 하는 일과 했던 일, 그리고 생각이 다른 만큼 데이터에 대한 다양한 관점을 볼 수 있다. 특히 개인적으로는 학부생들이 데이터의 현실을 보면 더 좋지 않을까 생각.

번외

  • 에디터님이 개떡을 찰떡으로 만들어 주시면서 정말 많은 고생을 하셨다. 그만큼 이 책이 누군가의, 더 큰 의미를 만들어 내는 과정에 쓰이면 좋겠다.
  • 수상할 정도로 요즘IT에 대한 애정도와 충성도가 올라가는 요즘IT 1년차 작가
  • C사 언급 진짜 싫어하는데 마케팅 문구로 쓰여서 정말 좀 그렇다…. 그치만 마케팅의 입장에서는 1달반짜리 피플펀드를 쓸 수도 없고, (상대적 듣보) 차라투를 쓰기도 애매해서 그나마 저길 쓴게 아닐까. 이해는 가지만 어쩌겠어 졸업도 안하고 카카오를 지원한 내 잘못이지.
  • 곧, 책 또 쓴다. 주제는 R과 Shiny. 오예에에에에에!!!!

--

--

Responses (4)