트위터로 부동산 가격을 예측해보자! (1)

제가 대학원 과정에서 공부하길 원하는 주제는 '사람들의 감정 분석에 기반한 자산 가치변동 예측'입니다. 예를 들어 페이스북과 트위터에 사람들이 LG G6 핸드폰에 대한 호감이 가득한 글을 쓰고, 유튜브의 G6를 리뷰한 동영상들이 '최고의 핸드폰이다'라고 극찬을 한다면 G6가 잘 팔릴 것이라는 예측을 할 수 있습니다. 


그렇다면 G6의 판매량 증가 덕분에 LG전자의 주가가 상승할 것이라는 전망을 내놓을 수 있죠. 이처럼 social network는 일선 소비자들의 반응을 가장 빨리 포착할 수 있는 곳이기에 이 social network를 잘 읽을 수만 있다면 주식시장에서 돈을 더 쉽게 벌 수 있을 것입니다.


사람들이 특정 주제에 대해 생산한 글이나 사진, 비디오를 이용해서 그 주제에 대한 사람들의 호감도가 얼마인지 분석하는 것을 sentiment analysis라고 합니다. 주식, 가상화폐, 부동산 투자 등에서 sentiment analysis를 이용하겠다는 건 지금 2017년 말에 그다지 새로운 생각은 아닙니다. 


이미 2011년초에 영국에 위치한 ' 더웬트 캐피탈'이 트위터 분석을 통해서 펀드 투자에서 성과를 낸 적이 있거든요. 이 자산운용사는 수백만건의 트윗 중 주식시장과 관련된 10%의 트윗을 분석하여 대중들의 투자심리를 알아냈습니다. 그 결과, S&P500지수가 2.2% 하락한 2011년 7월 일반 헤지펀드 운용수익률이 0.76%에 그쳤지만 더웬트는 1.86%를 기록할 수 있었죠. 이 '더웬트 캐피탈' 이야기는 아래 머니투데이 뉴스기사에서 인용하였습니다. 





'sentiment analysis를 통한 주식투자'에서 영감을 받아서 제가 한 분석은 '사람들의 특정 국가에 대한 호감도가 그 나라 부동산 가격에 영향을 주는지'였습니다.이 조사는 예전 서울대 면접 글에서도 소개했었던 연구입니다.  

   ▶ 2017/12/13 - [대학원] - 5. 융합과학기술대학원 면접 후기 및 tip



이처럼 '호감도'와 '부동산 가격'에 영향을 가지게 된 이유는 유명 여행지에 거주하는 친구들이 Airbnb 때문에 월세가 비싸졌다며 불평하는 걸 들었기 때문입니다. 사람들은 호감도가 높은 국가와 지역으로 여행을 많이 가고, 여행 숙소로 최근 각광받는 형태가 Airbnb이기에 ‘부동산 가격’과 ‘지역에 대한 호감도’ 사이에 양의 관계가 있을 것이라고 예측했습니다. 


이 연구를 개략적으로 소개하면 다음과 같습니다. 


1. 가설 

  사람들의 호감도가 높은 나라의 부동산 가격도 대체적으로 높을 것이다.

2. 사용 프로그래밍 언어 

   R (3.4.2)

3. 조사대상 

   IMF에 부동산 가격이 나온 63개 국가 (브라질, 미국, 한국 등)

4. 자료 출처 

   Twitter – 트윗에 드러난 각 국가별 호감도

   IMF – 지난 2016년간 변화한 부동산 실질가격(real price)의 변화율 

5. 조사방법

   1. 트위터 홈페이지에서 각 나라에 대한 트위트 100개씩을 crawling 해서

   2. 긍정적 단어(positive word)와 부정적 단어(negative word)의 갯수를 센 뒤, 긍정적 단어마다 +1, 부정적 단어마다 -1의 값을 부여하여 계산합니다. 

   (긍정적 단어, 부정적 단어가 정리된 텍스트 파일(.txt) 리스트가 있습니다.)

   3. 각 나라에 관련된 트윗의 점수를 구한 뒤, 이 트윗들의 평균 점수를 구하여 각 나라에 대한 호감도 점수를 구합니다.


다음 포스팅에서는 어떻게 이 연구를 수행했는지, 제가 도움을 받은 책과 구체적인 코딩을 보여드리겠습니다.

728x90
더보기

댓글,

하얀눈곰

프랑스에 살고 있습니다. 낯선 나라에 와서 살다보니 생각들이 많습니다. 이 지나가는 생각들을 붙잡아 두기 위해 블로그를 시작했습니다.