금요일, 11월 23, 2018

[B급 프로그래머] 데이터 과학자로 취직하려면 남들처럼 하지 마라.

오늘은 To get hired as a data scientist, don’t follow the herd라는 흥미로운 글을 소개해드리겠다. 데이터 과학자로 취직하기 위한 방법은 무엇일까?

대부분의 사람들은 다음과 같은 과정을 (무한) 반복한다.

  1. 먼저 기초 지식(파이썬+sklearn+Pandas+SQL이나 다른 뭔가)를 배운다
  2. 그리고 나서, 판에 박은 MOOC를 수강한다
  3. 몇몇 직무 기술서를 보고 나서, 자격 조건에 미달한다는 사실을 걱정한다
  4. 다른 MOOC를 듣거나 실제로 지원해본다
  5. 소득이 없다(잘 해봐야 몇몇 면접에서 폭탄을 맞을테다)
  6. 좌절해서 석사 과정에 대해 생각하면서 더 많이 지원한다.
  7. 결정의 시간이 왔다: 다른 뭔가를 기대하면서 2번부터 7번까지 반복해야 하나?

하지만 다른 사람들도 다 하기 때문에 명백히 밟아야 할 코스라면 피해야 마땅할 것이다. 그렇다면 어떤 전략을 구사해야 할까? 다음 다섯 가지 전략이 유효하다.

  1. 논문을 따라해보자: 특히 딥러닝을 할 경우에 유용한 방법이다. 다른 사람들이 이렇게 하지 않는 이유는 손쉽게 데이터를 가져다가 판에 박은 알고리즘에 적용하는 과정에 비해 어렵기 때문이다. 관심 있는 (기왕이면 최신) 논문을 읽고 이해하고 따라해서 블로그에 올려보자.
  2. 안전 구역에서 편안하게 지내지 말자: 프로젝트를 새로 시작한다면, 새로운 프레임워크/라이브러리/도구를 배우는 편이 좋다.
  3. 따분한 일을 배우자: 어느 누구도 따분한 일은 좋아하지 않기 때문에 사람들은 따분한 일을 하지 않늕다. 도커 사용법, Flask를 사용한 앱 개발 방법, AWS나 구글 클라우드에 모델 배포하는 방법 등은 회사가 지원자에게 간절히 원하는 기술이지만, 대다수 지원자들은 이를 저평가한다.
  4. 짜증나는 일을 하자. 지역 데이터 과학자 밋업에 논문을 제출하거나 최소한 참석이라도 해보자. 링크드인에 들어가서 모르는 사람에게 메시지를 보내보자. 스터디 그룹을 시작하자.
  5. 미친 듯이 보이는 일을 하자. 사람들은 미리 가공된 몇몇 주식 데이터셋을 사용해 프로젝트를 만들 것이다. 그러지 말고 웹 스크래핑 라이브러리 사용 방법을 배우거나 직접 데이터셋을 구축하기 위해 몇몇 저평가된 API를 활용하자. 데이터는 저절로 얻어지지 않으며, 회사는 종종 엔지니어들이 직접 수집한 데이터에 의존할 필요가 있다. 여러분의 목표를 정리하자면... 작업을 마치기 위해 필요하다면 빌어먹을 데이터셋을 직접 구축할만큼 데이터 과학에 미친 광인이 되어야 한다.

추가: 단순 예제만 반복하다가 끝나는 경우를 많이 목격했다. 학원이나 MOOC나 독서가 중요하긴 하지만 정말 자신이 풀고 싶은 문제를 하나 정해서 데이터 수집부터 분석과 시각화에 이르는 일련의 과정을 밟아볼 필요가 있다. 혹시 이 블로그 애독자 여러분들 중에서 데이터 과학자가 되기 위해 열심히 뭔가를 해봤지만 여전히 방향을 잡지 못하는 분들이 계시면 댓글이나 이메일로 도움을 요청하시라. 작지만 조금이라도 도움을 줄 수 있는 방법이 있으면 도와드릴테니까...

EOB

댓글 2개:

  1. 안녕하세요.
    데이터 과학자에 흥미가 생겼지만,
    이제 뭐 부터 해야 될까? 하고 있는 입문자 입니다.
    해보다가 궁금한게 생기면.. 도움 좀 부탁드려요 ㅎㅎ

    답글삭제