• Big Finance

글로벌 헤지펀드들의 '데이터 골드러시'

최종 수정일: 2018년 10월 25일


iPhone이 출시된지 10년이 지났다.


스마트폰 보급이 우리들의 일상에 얼마나 큰 변화를 가져왔는지 굳이 설명이 필요할까.


오늘 공유하고 싶은 내용은 이러한 우리들의 일상 변화가 자본시장 최전선에 있는 글로벌 헤지펀드와 자산운용사들에게 어떤 영향을 주고 있는지에 관한 이야기다.



투자자는 누구나 '알파'를 원한다

----

펀드매니저는 성과 측정 대상이 되는 '벤치마크'를 이기기 위해 노력한다. 쉽게 이야기하면 주식 펀드매니저의 경우 코스피가 5% 상승할 때 자신의 수익률은 5%+∂ 가 되기를 바란다. 이러한 초과 수익을 '알파'라고 하는데, 역사적으로 장기간 '알파'를 꾸준히 창출하는 것은 매우 어려운 일이었고, 이를 달성하기 위해 새로운 투자전략이 개발되고 또 보편화 되기를 반복해 왔다.


1950년대에는 최초의 롱숏(Long Short) 헤지펀드가 등장했고, 1980년대에는 남들보다 빨리 컴퓨터를 도입해 빠른 연산 시스템을 갖추는 것이 무기였다. 2000년대 초반에는 보다 복잡한 알고리즘을 적용한 초단타 매매가 등장했다.

(Source: Quandl)

하지만 2000년대에 들어서면서 많은 투자 전략들이 보편화 되었고, 헤지펀드들의 수익률도 장기 부진의 늪에 빠졌다. '알파' 창출이 어려워진 헤지펀드들은 새로운 '알파 소스(sources of alpha)'를 찾고 있었는데, 공교롭게 같은 기간 스마트폰 보급과 신기술이 등장하면서 데이터는 폭발적으로 증가하기 시작했다. 헤지펀드들은 이러한 변화에 주목하였고, 일명 '데이터 광산'에서 '알파'를 찾을 수 있다는 전제 아래 양질의 데이터를 선점하기 위한 투자에 나섰다.



'데이터 광산'에서 '금' 찾기, 즉 '데이터 골드러시'로 업계에서는 표현하고 있는데,

자본시장에서 '데이터 광산'이란 빅데이터를, 여기서 찾아낸 '금'은 '대체 데이터(Alternative Data)'로 정의하고 있다.




Data Gold Rush

----


시대의 변화에 따라 투자전략은 다양해지고 진화해 왔지만, 투자 전략을 수립하는데 활용 되는 데이터의 종류에는 큰 변화가 없었다. 이 점이 오늘 이야기의 핵심이다.


대체 데이터 산업을 지인들과 이야기할 때 필자는 외식업에 비유를 많이 하는데,

펀드매니저가 쉐프라면, 레시피는 '투자전략'이고, 식재료는 '데이터'다.


파스타라는 레시피를 개발했다고 치자. 히트를 치면 전국에 파스타집이 유행처럼 생겨나게 되는데, 시장이 성숙되고 경쟁이 심해지면 결국 차별화를 해야 한다. 방법은 다양하지만 새로운 '식재료'를 발굴하여 신메뉴를 개발하는 것도 좋은 차별화 요소가 될 수 있다. 2000년대 초엔 까르보나라가 진리였지만 봉골레가 나오고 이제는 성게 파스타, 어란 파스타, 트러플 파스타 등이 등장하는 것과 비슷하다.


다시 투자업으로 돌아와 설명하자면, 주가 정보, 재무 정보, 경제 정보 등의 통계 데이터는 모두가 당연히 쓰는 필수 식재료인 것이고, '데이터 광산'에서 채굴된 '대체 데이터'는 아직 모두에게 알려지지 않은 미래의 '식재료'인 셈이다.


(물론 주가, 재무, 경제 정보 등은 '토마토 소스'와 같아서 대체 데이터가 등장해도 여전히 가장 중요한 식재료 중 하나다)


데이터의 생산 증가세는 아직 시작 단계에 있고, 앞으로 더 빠른 속도로 성장할 전망이다.


(Source: FNGO - Big Finance)

1초마다 생산되는 1인당 데이터량이 1.7MB에 이르고, 미래에 500억개의 하드웨어가 서로 연결된다면 얼마나 많은 데이터가 새롭게 생겨나고 또 이를 어떻게 활용할 수 있을까?


예로 한국에서 운행되는 자동차가 약 2,300만대인데, V2X(자동차와 자동차, 자동차와 인프라간 통신 등) 시대가 본격화 되면 얼마나 많은 데이터가 새롭게 생겨날지 상상해보자. 자동차 이동경로를 데이터베이스화 하여 백화점의 매출 성장률을 추정할 수 있을 것이고, 레미콘 교통량을 통해 시멘트 출하량도 추정할 수 있을 것이다. 또한 화물차 교통량과 각 기업들의 생산 시설 주소지 데이터를 결합하면 각 기업들의 공장 가동률 추정도 가능할지 모른다.


(여기서 법률, 컴플라이언스가 중요하게 작용하지만 대체 데이터 분야에서 해당 내용이 방대해 기회가 되면 따로 글을 쓸 생각이다)


정리하는 의미에서 대체 데이터(Alternative Data)를 정의 내리자면 다음과 같다.

  • 금융 시장에서 희소성이 높고, 전문 투자자에게 가치가 높은 정보로 기존 데이터 공표 기관에서 제공하지 못하는 데이터

  • Wikipedia: "Alternative data (in finance) refers to data used to obtain insight into the investment process.These data sets are often used by hedge fund managers and other institutional investment professionals within an investment company. Alternative data sets are information about a particular company that is published by sources outside of the company, which can provide unique and timely insights into investment opportunities."


2020년 대체 데이터 시장 규모는 7.7조원으로 연평균 21% 성장할 것으로 전망되고 있다.

Financial Times 설문조사에 따르면 헤지펀드와 자산운용사들의 대체 데이터 전문 인력은 지난 5년간 450% 증가하였으며, Greenwich Associates의 설문조사에서는 '대체 데이터가 초과 성과를 내는데 기여 하고 있는가?'라는 질문에 응답자 90% 이상이 '그렇다'라고 답변하였다.


글로벌 자산운용 업계는 현재 데이터에 '올인(all-in)'하고 있다.




대체 데이터의 종류

----

영국의 대체 데이터 컨설팅 업체인 Eagle Alpha는 대체 데이터를 크게 24개의 카테고리로 분류하고 있다.

(Source: Eagle Alpha)

위 카테고리를 보면 알 수 있듯이, 대체 데이터의 원천 데이터(Raw Data)는 특정 통계 기관이 발표하는 것이 아니고, 산업 리서치 회사가 수집한 데이터도 아니다. 대체 데이터는 대부분 비정형 데이터(unstructured data)에서 시작된다.


인공위성 사진(Satellite Imagery)을 예로 들어 보자. 대표적인 회사로 Orbital Insights와 Planet Labs가 있는데, 이들은 인공위성을 임대하기도 하고 소형 인공위성을 직접 제작하기도 한다. 이 회사들은 인공위성을 이용한 저궤도 사진 촬영을 통해 물류, 원유 정제 및 저장 시설, 농산물 작황 등을 실시간으로 분석한다. 예로 Orbital Insights는 미국 백화점 또는 대형마트들의 주차장을 일단위로 촬영하여 주차된 자동차 대수를 세는데, JC Penny의 일별 주차 대수 데이터와 주가를 비교한 차트를 보면 아래와 같다.


(Source: International Banker - 'Hedge Funds See Huge Potential in Alt. Data')

Planet Labs의 인공위성 사진 촬영 범위
(Source: Planet Labs)

또 다른 예로 온라인 검색 트랜드와 결제 데이터를 결합한 Consumer Transaction 데이터를 살펴보자. 이 회사는 중국 온 · 오프라인 결제 데이터를 제공하는 회사로 티몰과 타오바오 등 온라인 커머스 결제 데이터와 신용카드 결제 정보를 브랜드, 매장, 제품 단위로 제공 한다.


아래는 중국 온라인 검색 데이터와 온 · 오프라인 결제 금액을 결합하여 아이폰의 중국 판매량을 추정한 데이터이다. 신규 모델 런칭 시점부터 일단위로 누적 판매량을 계산해 과거 신제품 출시 당시와 비교하여 중국 내 신제품 성공 여부를 빠르게 파악할 수 있게 제공한다.

(Source: China On-line data provider)

대체 데이터는 위에 언급된 24개의 카테고리 외에도 그 종류가 방대하고, 영역을 구분하기란 불가능에 가깝다. 최근에는 기업 전용기 항공 노선을 일단위로 수집하여 CEO와 임원들의 이동 경로를 파악해 M&A와 같은 빅딜 시그널을 제공하는 회사까지 등장할 정도다. 이 회사는 최근 아마존의 홀푸드 인수를 데이터 활용 사례로 소개하고 있다.


(Source: Jettrack)

헤지펀드와 자산운용사들이 데이터에 '올인' 하다 보니 대체 데이터를 전문으로 제공하는 기업 또한 빠르게 증가하고 있다. 대체 데이터의 기하급수적 증가는 이 시장을 먼저 연구하고 경험한 헤지펀드들에게 경쟁 우위를 제공하게 되는데, 데이터를 실제 운용에 적용하는 것은 생각 보다 많은 비용과 시간이 소요되기 때문이다. 과거에는 100가지 데이터(Data Set) 중 양질의 데이터를 찾아야 했다면, 이제는 1,000개, 더 지나면 10,000개의 데이터 안에서 정보를 찾아야 할 것이다. 대체 데이터 내에서도 90% 이상은 '소음(Noise)'이라 표현하는데, 소음이 많을 수록 그 안에서 '정보'를 찾는 것은 당연히 더 어려워지는 것이다. 실제 헤지펀드가 대체 데이터를 어떻게 활용하고 운용 프로세스에 적용하고 있는지는 별도의 글을 통해 이야기 해 볼 계획이다.




마무리하면서..

----


지인들과 대체 데이터 시장 이야기를 나누다 보면 흔히 대체 데이터는 '퀀트'들의 영역이고 전통 주식 펀드매니저들은 이러한 시장 변화에 걱정이 먼저 앞선다는 이야기를 많이 한다.


하지만 지난 2년간 대체 데이터 시장에서 발로 뛰며 느낀 것은, 대체 데이터는 '퀀트'만을 위한 것이 아니라는 점이다. 가장 먼저 대체 데이터 시장을 연구하고 적용해 온 것은 BlackRock SAE, Two Sigma, WorldQuant와 같은 Quantitative Investment Firm이 맞지만 지난 2 ~ 3년간 Wellington, Fidelity, Schroders와 같은 전통 뮤추얼 펀드들도 해당 시장에 적극적인 투자를 나서며 오히려 비중으로는 퀀트보다 전통 뮤추얼 펀드가 훨씬 많아진 느낌이다.


지난 4월 런던에서 열린 대체 데이터 컨퍼런스 패널 토크에서 뮤추얼 펀드 매니저와 퀀트 매니저가 대체 데이터를 이용해야 하는 이유에 대해 이야기를 나눴는데, 서로 관점이 너무 달라 이를 공유하면서 글을 마무리 하겠다.


Moderator: "앞으로 포트폴리오 운용에서 대체 데이터 활용이 필수인 이유가 무엇이라 생각합니까?"


Quant PM: "Data beats opinion"

(퀀트 펀드 매니저: "데이터가 의견보다 정확하다")


Fundamental PM: "Alternative data help us generate good questions to the market"

(액티브 주식 매니저: "대체 데이터는 우리가 시장에 좋은 질문을 던질 수 있게 도와준다")




#대체데이터 #빅데이터 #금융데이터 #Alternativedata #BigFinance

조회수 526회댓글 0개

최근 게시물

전체 보기