데이터 사이언티스트가 되기 위해 필요한 역량은.
- 권재명 애플 시니어 데이터 사이언티스트
기본이 되는 영어 외에 여섯 가지를 꼽을 수 있다. 첫째는 탄탄한 통계학 실력이다. 통계학부 저학년 수준의 일반통계, 고학년 수준의 이론통계 및 선형모형(회귀·분산분석 포함) 등은 필수적이고, 범주형 데이터 분석을 위한 일반화 선형분석도 알아두면 좋다.
둘째는 데이터 분석을 위한 컴퓨팅 역량이다. 통계분석을 위해 R은 잘 다룰수록 ‘숨 쉬듯이’ 좋고, 데이터 준비와 처리를 위해 파이썬(Python)도 잘 다루면 좋다. 또 시스템을 다 알 필요까진 없지만, SW엔지니어링 역량은 많을수록 빠르게 데이터를 얻을 수 있다.
셋째는 현실적인 문제를 통계로 풀어내는 능력이다. 이 분야에 대한 많은 독서가 도움이 될 것이다. 스티븐 레빗(Steven Levitt) 교수가 공저한 ‘괴짜경제학(Freakonomics)’, 대니얼 카너먼(Daniel Kahneman) 교수가 쓴 ‘생각에 관한 생각(Thinking Fast and Slow)’ 등을 추천한다.
넷째는 SW를 배우려는 열정과 학습능력이다. 데이터 분석에 요구되는 도구와 환경은 계속 변하고 있어, 개인적으로도 R, 펄(Perl), SQL, 자바(Java), 파이썬, 스칼라(Scala) 등을 그때그때 익히고 활용해왔다.
다섯째는 커뮤니케이션 역량이다. 분석한 내용을 조리 있게 설명하고 글로 풀어쓸 수 있어야 한다.
여섯째는 열린 마음, 열린 자세, 겸손이다. 대개의 경우 데이터 사이언티스트는 다른 이들이 이미 짜놓은 판에 도우미로 참여하게 되며, 협업을 통해야 의미 있는 역할이다. 비밀스럽게 작업하는 이들을 가끔 보는데, 구글링하면 다 나오는 세상에 별 도움 되지 않는 자세다.
업무지식(Domain Knowledge)의 경우도 크게 중요치는 않고, 열정을 갖고 겸손히 임하면 빠른 시간 내 흡수할 수 있는 것들이 많다. 사실 준비하기도 힘든 것이, 어느 곳에서 무슨 일을 할지 어찌 알겠나. 폭넓은 독서로 주요 분야의 큰 흐름을 따라잡는 것을 대신 권하고 싶다.
출처
http://m.itdaily.kr/news/articleView.html?idxno=64170