데이터 사이언티스트
데이터 수집·분석해 기업 전략 마련
몸값 뛰어 평균 연봉 1억2300만원
다양하게 활용
인력 관리하고 고객 맞춤 서비스
“데이터가 마케팅·품질보다 중요”
한국은 인력난
수학·머신러닝 융합 전문가 부족
데이터 ‘별동부대’ 만들어 키워야
2000년대 들어 정보기술(IT)이 발전하면서 데이터가 기업의 이익으로 연결되면서 데이터 과학에 대한 관심이 싹텄다. 데이터를 활용한 사업 전략으로 성공한 대표적인 기업이 넷플릭스와 아마존이다. 데이터 분석업체인 리비전컨설팅의 전용준 대표는 “넷플릭스와 아마존이 고객의 구매 패턴을 분석한 뒤 맞춤형 추천 서비스로 성공하자 글로벌 기업들이 데이터 사이언티스트에 주목하기 시작했다”고 말했다.
삼성·SK 등 글로벌 인재 영입 전쟁
전문가들은 기업에서 데이터 사이언티스트의 역할이 점차 커질 것으로 봤다. 전 대표는 “시장조사업체 IDC에 따르면 2011년 1.8제타바이트(ZB, 1ZB는 기가 바이트의 1조배)던 전세계 디지털 정보량은 2020년엔 50배 이상 증가할 것으로 예상한다”며 “방대한 양의 정보가 쏟아지고 있어 기업에 맞게 패턴을 분석하고 이를 응용해 전략을 짤 수 있는 데이터 사이언티스트가 필요할 수 밖에 없다”고 말했다. 김옥기 상무는 “요즘처럼 세계적인 저성장 시대엔 유통 과정을 바꾸고 가격 경쟁을 하는 것보다 데이터를 활용해 새로운 전략을 짜는게 승산이 클 수 있다”고 평가했다.
데이터 사이언티스트들은 IT업체 뿐 아니라 제조·의료 등 다양한 산업에서 활약하고 있다. 대표적인 예가 미국 다우케미칼이다. 7년 주기로 호황과 불황이 반복되는 화학산업 특성상 인력관리에 어려움을 겪다가 데이터에서 방법을 찾았다. 임직원 4만 명의 데이터를 분석해 승진은 물론 퇴직 시점까지 예측해 미래 사업부별 인력분포를 추산했다. 이를 바탕으로 인력 감축, 경기 등 다양한 외부 환경 변화에 따라 인력운영 방안을 짤 수 있게 됐다. GE헬스케어는 병원 데이터를 분석·예측해 환자처방, 앰블런스 이송, 응급실 배정 등의 시간을 효율적으로 관리하는 시스템을 개발했다. 미국 존스홉킨스병원이 2016년 이 시스템을 적용해 수술실 이송이나 응급실 병상 배정 시간이 줄면서 기존보다 환자 수용력이 60% 이상 개선됐다.
최근 삼성·SK 등 국내 대기업들도 세계적인 데이터 사이언티스트에 러브콜이 이어지고 있다. SK그룹 핵심 계열사인 SK텔레콤은 올 초 애플의 ‘시리’ 개발자인 김윤 박사를 영입한데 이어 4월엔 미국 최대 모바일 광고 플랫폼인 탭조이에서 데이터 사이언스 사업을 총괄해온 진요한씨를 스카우트 했다. 정도희 SK텔레콤 애널리틱스 그룹장은 “빠르게 변화하는 기술 환경에 따라 기존 사업 방식을 디지털로 전환하는데 데이터가 핵심으로 떠오르고 있다”며 “그만큼 데이터 전문가들의 역할이 중요해진 셈”이라고 말했다. 예를 들어 콜 센터에도 데이터 과학이 결합돼 서비스가 바뀌고 있다. 기존 고객 데이터를 분석해 요금제 문의가 많은 요일 등을 예측하기 시작했다. 고객이 전화를 하기도 전에 이미 음성 메뉴얼로 고객 맞춤형 응대 서비스를 갖추는 방식이다. 여기에 머신러닝이 결합되면 고객 관리는 물론 통신·네트워크 품질까지 한번에 관리할 수 있다.
현대카드도 300여 명의 데이터 사이언티스트를 두고 디지털회사로 변신을 꾀하고 있다. 특히 사용금액에 따라 백화점 할인권 제공 등 고객군별로 동일한 마케팅을 진행하는 방식에서 벗어나 단 한 명의 회원을 위한 맞춤형 마케팅을 준비 중이다. 해당 고객이 여행을 준비 중이면 기존 데이터를 분석·여행 방식을 예측해 공항 발레파킹, 톨게이트 할인 등을 해준다는 얘기다.
하지만 전반적인 한국의 데이터 활용 수준은 미국에 비해 10년 이상 뒤처진다는 게 전문가들의 공통된 의견이다. 세계적인 IT자문업체 가트너에 따르면 데이터의 활용 영역을 5단계로 구분하면 상당수 한국 기업은 3단계에서 4단계로 넘어가는 과정에 있다. 김옥기 상무는 “개별 부서나 사업 부문별로는 효율적으로 잘 운영되지만 아직 데이터가 전체적으로 통합되지 않아 전사적 안목으로 고객을 분석하기 쉽지 않다”고 지적했다. 미국 기업은 이미 2000년 초기에 끝낸 전산 데이터 통합을 한국 기업은 이제서야 하고 있는 셈이다. 데이터 관련 국내 기업의 매출액은 약 14조원(2017년)으로 미국 전체 매출액(약 193조원)의 13% 수준이다. 한국과 가까운 일본만 해도 약 37조원을 벌어들인다. 데이터 관련 수요가 커지면서 관련 기업 수가 10만 개가 넘어섰기 때문이다.
데이터 활용 미국보다 10년 뒤쳐져
국내 기업들의 가장 큰 고충은 인력 부족이다. 2017년 한국데이터진흥원 조사에 따르면 데이터 사이언티스트 인력 공급은 시장 수요에 비해 20% 이상 부족했다. 데이터 관련 업무 중 가장 인력난이 심하다. 수학과 머신러닝, 코딩 관련 지식을 모두 갖추고 이를 융합해 의미있는 결과를 도출하는 것이 쉽지 않기 때문이다. 정도희 그룹장은 “상시로 인재를 뽑고 있지만 인력이 부족해 어려움을 겪고 있다”고 말했다. 결국 상당수 기업들은 기존 인력에게 프로그래밍 언어나 코딩 프로그램을 교육시키고 있지만 당장 사업을 맡기긴 쉽지 않다. 익명을 요구한 대기업 인사관련 담당자는 “실리콘밸리 전문가는 최근 몸값이 급등한데다 성장성 가능성이 높은 글로벌 기업을 선호하기 때문에 수십명씩 고용하기 어려운 것이 현실”이라고 말했다.
김옥기 상무는 데이터 사이언티스트를 대체할 ‘데이터 별동부대’를 만들 필요가 있다고 조언했다. 고객관리나 마케팅 분석을 전문적으로 해온 비즈니스 분석가를 비롯해 데이터 엔지니어링, 데이터 교육가 등을 뽑아서 데이터 과학팀을 운영하는 것이다. 김옥기 상무는 “이들이 손을 잡고 함께 데이터 전략을 짜다보면 7~8년 후엔 데이터 사이언티스트로 성장할 수 있다”고 말했다.
외부 인력을 활용하는 것도 방법이다. 천성현 포스코경영연구원 연구위원은 “상당수 글로벌 기업 역시 부족한 인력난을 대체하기 위해 스타트업과 제휴를 맺고 있다”고 말했다.
최근 일본에선 급증하는 데이터 사이언티스트 수요를 메우기 위해 교육에 투자하고 있다. 대학교마다 데이터 사이언티스트를 키우는 학부를 개설하고 있다. 요코하마 사립대학은 올해 4월 수도권에선 처음으로 데이터 사이언스 학부를 만든 뒤 통계학과 인공지능(AI) 기초, 데이터 가공지식 등을 가르친다. 전용준 대표는 “한국도 학교에서 데이터와 통계, 머시러닝을 각각 배울게 아니라 융합해서 가르치는 교육 과정을 늘려야 한다”고 말했다.
데이터 사이언티스트(Data Scientist)
염지현 기자 yjh@joongang.co.kr