Data 경력은 어떻게 쌓을 수 있을까

Jinhwan Kim
11 min readNov 19, 2020

4차 산업 4차 산업 노래는 있었지만 특히나 covid 로 인해 더 가속화 된 요즘 시대에서 우연히 이쪽에 발을 들이게된 나로써는 땡큐베리감사하게도
데이터 관련 직종이 점점 더 핫해지고 있다.

데이터쪽은 맨날 경력만 뽑던데, 어떻게 해야 경력을 쌓을 수 있을까요?

이에 사실 내가 뭘 안다고 대답을 하겠냐만 나름 고민해 본 curated list를 공유한다. 단 관련지식은 충분히 있다는 전제가 있어야 한다. 지식이 없는데 경력이 무슨 의미가 있겠는가, 운좋게 취업을 한다해도 아마 곧 쫓겨날 것이다.

대학원.

대학원

내가 대학원 출신이라서가 아니라, 진짜로 0순위 솔루션이다.
유일한 길은 아니지만 이것보다 확실한 길은 없다. (아마 창업정도…?)
그리고 랩바랩이지만 당연히 핫한 연구실은 자대생들도 들어가기 힘들다.
이를 위한 최고의 방법은

  • 핫한 대학원에 입학하는 방법을 검색해보던가
  • 신임교수의 랩에 들어가서 노가다를 하는 방법이 있다.

만약 자신이 로또만큼은 아니지만 그래도 운이 좋은 편이다라고 생각하면 ai 대학원의 구성원 (교수는 바빠서 당신의 메일을 안볼것이다. 해당 랩의 구성원에게 정중하게 메일을 보내는 것이 더 좋을 수도 있다.)

자기가 하고 싶은 분야의 데이터 분석

물론 거창하면 좋다. 그렇지만 반드시 거창해야만 하는 건 아니다.
나는 lol 이라는 게임을 엄청 자주했다. 이기는 것을 당연히 좋아했다. 아쉽게도 실력은 그리 좋지 않았기 때문에, 다소 비겁한 방법으로 승리를 위해 노력했다.

그래서 어떤 꿀챔을 찾아야 이길 수 있을까를 엄청 고민했고
그를 위해 올초 (1월) riot api를 통해 게임 데이터를 직접 따서 R로 분석하고 간단한 report를 만들었다.

아마 라이엇게임즈 본사 아니 3N 소속의 게임 데이터 분석 팀들이 보면 까무러질 것이다. 이런 쓰레기를 분석이라고 했냐고 들고 있는 서류뭉치를 던질 것이다. 확실하다 그게 아니면 3N에 떨어진 이유가 설명이 되지 않는다.

아무튼 나는 이 분석을 통해서

  • 재밌고 이기는 챔 (꿀챔)
  • 재미는 없는데 이기는 챔 (후에 이는 국밥픽이라는 단어로 불렸다)
  • 재미는 있는데 지는 챔 (즐겜용 챔)
  • 재미도 없고 지는 챔 (똥챔)

를 파악하는 것이 주 목적이었고 꽤 성공적이었다.

나중에 github을 보면 알겠지만 탑루시안이라는 꿀픽도 찾았다. 그것도 1월에.. 2020년 승리 스킨 챔피언이 (MVP 정도로 생각해도 좋다) 루시안 인것을 감안하면…

아무튼 이런 self 프로젝트의 특징은 다음과 같다.

  1. 재미있다. 내가 하고 싶은 것이니까
  2. 분석에 대한 연습을 할 수 있다.
  3. 도메인 지식도 어느 정도는 충족되어있다. 내가 좋아하니까
  4. 데이터 수집은 대부분 어렵다. 그렇지만 이는 오히려 더 좋은 경험이 될 것이다.

저는 게임 안하는데요 라고 하는 사람은 주식 데이터 분석 같은 걸 해봐도 좋다. 잘하면 돈이 된다.

데이터 만들기

흔히 “온라인 인형 눈붙이기” 라고도 불리는 이 데이터 만들기.

어쩌면 예? 왜 푼돈을 위해 이런 쓰잘데 없는 짓을…? 이라고 생각 할 수 도있다. 만약 이렇게 생각했다면 이 푼돈은 나에게 주면 된다. 미리 땡큐베리감사

데이터 만들기를 해보라고 하는 이유는 다음과 같다.

  1. 모든 데이터 분석은 결국 데이터에 따라 퀄리티가 너무나도 다르다.
    즉 더 많고, 더 좋은 데이터를 가지고 대충 모델링 한 것이
    허술한 데이터에 엄청 좋은 모델을 때려 박는 것보다 더 좋을 수도 있다는 것이다.
    어떤 방법으로 모델링을 할까에 앞서서 이 데이터는 어떠한 데이터일까 를 아는것이 더 우선되어야 하는데 (도메인 경험). 이를 위해서 데이터를 직접 만드는 것 보다 더 좋은 방법이 있을까? 나는 모르겠다.

2. 면접때 들어가서 풀 썰이 하나 생긴다.
가령 **님은 데이터 분석 해보신것 있으세요? 라고 물어보면
눈을 빤짝빤짝 하면서 (필수),
제가 아이돌 직캠 자동으로 분류해주는 인공지능 어플리케이션을 만들기 위해서 TWICE 사진을 10000장 정도 라벨링을 했는데 이런 이슈가 있었고 저런 이슈가 있어서 이렇게 하고 저렇게 했습니다.
라고 하면서 썰을 푼다면 JYP가 아니라 빅히트 라고 해도 면접에서도 좋은 평가를 받을 수 있지 않을까? 아님 말고

3. 데이터를 다뤄야 할때의 복잡한 이슈 (가령 프라이버시라던가)에 대해서도 경험 할 수 있다.

사실 이에 관련된 자료들은 엄청 많다. 직접 찾아봐라, 없다고? 당신이 만들면 대박이라는 뜻이다.

AI 경진대회 (해커톤, 오픈소스 포함)

당연한 것이다. 결국 이 사람이 실제 데이터를 잘 다룰 수 있는지 만 확인이 된다면 학력이 그렇게까진 중요하지 않을 것이다. 오히려 페이가 싸다고 좋아할 수 도 있다. (뇌피셜)

그러나 개인적으로 이런 경진대회 전문 헌터들 (극한으로는 결과물에서 파라미터 하나만 바꿔가면서 퍼포먼스 올리는 것에 모든 걸 거는 경우도 있다고 한다)을 이기는 것은 어렵기도 하고

무엇보다 그냥 남 일을 대신 해주는 경우가 많기 때문에 (심지어 엄청 싼 값에) 그렇게 까지 개인적으로 선호하진 않는다.

물론 해보면 좋다. 많이 해보면 더 좋고. 잘하면 완전 좋다. 는 것은 동의한다.

그냥 자기가 경험을 쌓고자 하는 분야와 연관 되어있다면 하고 아니면 그닥…

최신 트렌드 혹은 논문 읽기, 구현하기

만약 이게 자유자재로 된다면, 대학원을 가지 않아도 좋다.

내가 만약 이런 사람이다 라는 확신이 든다면.

1인 AI 기업 창업을 적극 권장한다.

회사에서 주는 월급보다 큰 돈을 혼자서 다 가질 수 있을 것이다.

Licences

이 쪽은 좀 사파 분야이다. 즉 목적이 너무나도 명확하다.

공기업 혹은 공무원, 정부과제 등을 따올때 유리하다는 장점이 있지만, 그 외에는 있으면 좋지만 없어도 그렇게 차이는 없을 것 같다.

물론 ADsP / SQLD 말고, ADP 나 SQLP 는 기업에서 점점 우대해 주는 추세가 있긴 하다 (ADP는 5년간 총 합격자수가 88명으로 판사보다 적다고 한다)

특정 기술 관련 글쓰기

가령 hadoop에 대한 기초 Tutorial, 활용 예시 및 후기 등을 잘 작성해둔다면 적는 과정에서 스스로에게 공부도 될 수 있고. 이후에 hadoop 관련한 포지션 에 지원할때 상당히 유리 할 것이다.
특히 minor한 기술 일 수록 high risk, high return이 될 것이다.

친목질

아무리 블라인드라서 많이 줄었다고 하지만, 정보의 노출 정도는 전혀 블라인드가 아니다.

아싸가 얻을 수 있는 취업 정보와 인싸킹의 정보는 당연히 다르다는 뜻이다. 지원후 는 당연히 공정해야 하지만 지원을 하고 안하고 조차에서부터 차이가 나버리면 얼마나 허탈 하겠는가. 학연 지연 혈연이라는 말이 괜히 있는 말이 아니다.

아마 대부분이 나보다는 더 인싸 일 것이기 때문에 이미 소속 되어 있을 수도 있겠지만, 그래도 몇가지 리스트를 놓고 간다 ( R 기준이고, Python 기준은 알아서 찾아봐라 나는 전혀 궁금하지 않다 )

이런 친목질은 어쩌면 당연하지만 give & take 다.

나는 일방적으로 정보를 받기만 할건데요 라고 하는 사람은 생각보다 좋은 “내부 정보”를 받지 못할 가능성이 없지 않다.

커뮤니티에 질문만 하지말고 다른 사람들이 궁금해 할 만할 그런 이슈들을 공유하고 발표하고 소통하는 경험을 쌓길 바란다.

모자란 사회성 혹은 커뮤니케이션 스킬을 이렇게 무료로 성장 시킬 수 있는 방법은 너무나도 귀하다는 것을 공감 할 수 있으면 좋겠다.

그러면 내가 경험 했던 것처럼 아마 개인적으로 신선하고 흥미로운 제안들이 올 것이다.

면접 준비

자 이제 위에 있는 것들 중에서 2–3개 정도를 제대로 달성했다면 어디가서 경력있는 신입이라고 말해도 괜찮을 것 같다.

그렇지만 면접장가서 저런말 했다가는 면접관에게 씹고 뜯고 맛보고 즐기고를 당할 수 있으니, 약한 척을 해야한다.

약한게 아니다 약한 척이다. 즉, 오는 질문에는 답변을 할 수 있어야 한다.

면접관으로 몇번 면접에 참여하고 알게 된 것인데 면접이라는 것은 상당히 비대칭적인 정보를 기반으로 행해진다.

나 같은 경우 면접 들어가기 전, 이력서 프로젝트 소개와 더불어 github에 가서 가능하면 코드까지 다 보고 들어가려고 노력하기 때문에 이 사람이 어떤 장점이 있고 어떤 단점이 있고를 (완벽하게는 아니지만, 그래도) 대충은 알 수 있다.

그래서 이를 바탕으로 개인 프로젝트에 대한 질문 + 연관된 기술 질문을 하고 이에 대해서 내가 답을 잘 모르더라도 물어 볼 수 있는 것이다. 나는 대답할 이유가 없으니까.

그러나 대부분의 경우 구직자는 면접에서 어떤 질문이 올 지 모른다.
그렇기 때문에 이 기울어진 운동장에서 최대한 덜 불리하기 위해 기술적인 질문을 준비 할 수 밖에 없는 것이다.

사실 앞에서 소개했던 것들은
제한된 면접시간동안 면접관이 더 잘 알 수 있는 기술적인 질문이 아닌
내가 더 잘 알 수 밖에 없는
내가 경험 했던 것들을
물어볼 수 있도록 유도해서 정보의 비대칭을 해소하려는 밑작업이다.

아무리 지식과 경험이 많다고 해도 결국은 면접을 잘봐야 Data 경력의 목적인 취업을 달성 할 수 있지 않을까?

아 물론 취미로 data 분석 하고 싶다면 해당 없다.

--

--

No responses yet