【경제칼럼】인공지능은 신문기사를 읽고 인플레이션을 전망할 수 있을까?
상태바
【경제칼럼】인공지능은 신문기사를 읽고 인플레이션을 전망할 수 있을까?
  • 김태환(한국은행 담당부서디지털혁신실 디지털신기술반 과장)
  • 승인 2022.10.27 11:49
  • 댓글 0
이 기사를 공유합니다

인공지능[ 사진= 한국은행제공]
인공지능[ 사진= 한국은행제공]

2013년 노벨 경제학상을 수상한 로버트 쉴러(Robert J. Shiller) 교수는 경제 지표만 들여다 보고 경제 사건을 이해하려 하는 것은 마치 '교회 팸플릿의 인쇄 비용만 보고 종교적인 깨달음을 얻으려는 것'과도 같다고 하였다.

 경제 주체의 행동에 영향을 미치는 '내러티브'에 대한 고려 없이 숫자에만 집중할 경우 경제 변화의 근원적인 동인(動因)을 간과할 위험을 지적한 것이다.

 그러나 풍부한 경제 지표에 비해 '내러티브'에 대한 데이터는 불완전(spotty at best)하기 때문에 경제학자들은 종종 이러한 '지표의 독재'(tyranny of metrics)라는 함정에 빠지곤 한다고 쉴러 교수는 지적하였다.

'내러티브'를 담고 있지만 경제 지표에 비해 활용이 어려운 데이터중 대표적인 것이 텍스트 데이터다. 

특히, 뉴스기사나 소셜미디어는 다양한 경로를 통해 경제 분석에 유용한 정보를 제공한다.

 이를테면 물가와 관련하여 지정학적 리스크, 이상기후 등과 같은 이벤트는 공식적인 물가지수 발표에 앞서 뉴스 속보나 인터넷 커뮤니티에 먼저 반영되고 향후 인플레이션 수준에 대한 정보를 제공한다. 

또한 거시경제 여건, 기업의 가격 설정 형태 등에 대한 언론 보도는 인플레이션 기대를 변화시킴으로써 경제활동 참가자들의 의사결정에 영향을 미칠 수 있다.

텍스트 분석기술의 발전에 따라 주요국 중앙은행과 연구기관도 경제분석에 텍스트 데이터를 활용하기 위해 노력하고 있다. 

중앙은행 회의록에 반영된 통화정책 기조를 분석하거나 뉴스기사에 나타난 경제의 불확실성과 경제주체 심리를 평가하고 이를 바탕으로 경기상황을 전망하는 연구가 대표적이다. 

이들은 주로 단어별로 긍・부정의 심리를 구분한 어휘사전(lexicon)에 기반하여 문장이나 기사를 분석하였다.

한편, 최근 들어 인공지능 기술의 발전과 함께 주목 받는 분석 기법으로 인공지능 언어모형(AI language model)이 있다. 

구글이 개발한 BERT, OpenAI[3]의 GPT 등으로 대표되는 인공지능 언어모형은 딥러닝 알고리즘을 이용하여 단어 기반 텍스트 분석에서 고려하지 못하는 문맥(context)에 따른 의미 변화를 효과적으로 포착한다.

 이들 모형은 대규모 텍스트 데이터에 대한 사전훈련(pre-training)을 통해 언어에 대한 전반적인 이해를 높인 다음, 최소한의 데이터만 추가적으로 학습하여 미세조정(fine-tuning)하는 방식을 이용한다.

 이러한 특징 때문에 인공지능 언어모형은 텍스트 분석 모형의 개발 시간과 비용은 절감하면서도 문서 분류, 검색, 번역 등의 과제에서 놀라운 성능을 보이고 있다.

최근 발표된 BOK이슈노트는 텍스트 데이터 분석에 인공지능 언어모형을 이용하였다. 앞서 설명한 장점에도 불구하고 인공지능 언어모형은 모형 구조와 분석방법이 복잡하여 경제분석에 활용하기 어렵다는 평가가 있다. 

이를 고려하여 동 연구는 인공지능 언어모형을 경제분석에 활용하는 가이드를 제시하고자 노력하였다. 또한, 인공지능 언어모형을 이용하여 뉴스기사에 반영된 인플레이션 어조를 측정함으로써 최근 불확실성이 높아진 인플레이션 전망에 활용할 수 있는지 점검하였다.

우선 인터넷 포털 사이트에서 물가 관련 키워드로 검색하여 2002년 2월부터 2022년 6월까지 총 188만 뉴스기사의 6,406만개 문장을 수집하였다. 

그리고, 인공지능 언어모형을 인플레이션 어조분류 모형으로 학습(미세조정)시키기 위해 5,000개 뉴스기사 문장을 임의로 추출하여 각 문장의 현재 및 미래에 대한 인플레이션 어조를 상승, 중립, 하락으로 분류하였다.

뉴스기사는 문장 구조가 복잡하고 경우에 따라 중의적으로 해석할 수 있는 특징이 있어 명확한 분류가 쉽지 않다. 

예를 들면, '다만 근원물가 상승세가 주춤하고 연말로 갈수록 유가 상승효과도 작아져 물가가 1%대 중반으로 떨어질 가능성을 열어뒀다.'라는 문장은 관점에 따라 '하락' 또는 '중립'으로 해석할 수 있다.

 이러한 어려움에도 불구하고 단 5,000개 뉴스기사 문장으로 어조분류 모형을 훈련한 결과, 현재 및 미래에 대한 인플레이션 어조를 80% 내외의 높은 정확도로 구분해 내는 것을 확인할 수 있었다.

어조분류 모형 개발에 비해 인플레이션 어조지수를 시산하는 과정은 간단하다. 우선 앞서 구축한 인플레이션 어조분류 모형으로 6,406만개 뉴스기사 문장의 인플레이션 어조를 상승, 중립, 하락으로 분류하였다. 

그리고, 상승, 중립, 하락 어조의 상대적 비중으로 뉴스 기사별 어조지수를 계산하였다. 

마지막으로 기간별 인플레이션 어조지수는 일별, 월별, 분기별로 구분하여 각각 해당 기간의 기사별 어조지수를 평균하는 방식으로 산출하였다. 

이러한 방식으로 2002년 이후 기간에 대해 시산한 인플레이션 어조지수는 소비자물가상승률와 비슷한 흐름을 보이면서 대체로 인플레이션을 선행하는 모습을 보였다.

인플레이션 어조지수와 소비자물가상승률[사진= 한국은행 제공].png
인플레이션 어조지수와 소비자물가상승률[사진= 한국은행 제공].png

앞서 시산한 인플레이션 어조지수는 소비자물가 변동에 대해서 고유한 정보를 가지며[5] 인플레이션 전망에도 유용한 것으로 분석되었다.

먼저 어조지수와 소비자물가상승률의 변곡점 분석(turning point analysis)을 수행하였다. 

변곡점은 각 분기의 값이 전·후 6분기(총 13분기) 이내 가장 큰 경우를 고점(peak), 가장 작은 경우를 저점(trough)으로 정의하였다. 

분석 결과, 인플레이션 어조지수의 변곡점은 소비자물가상승률 변곡점을 대체로 1~2분기 시차를 두고 선행하는 것으로 나타나 소비자물가상승률의 추세를 판단하는 데 활용 가능함을 보여주었다. 

총 8건의 어조지수 변곡점 중 7건이 소비자물가상승률 변곡점을 2분기 이내 선행 또는 동행하는 것으로 나타났는데, 특히 감염병 유행으로 경제 불확실성이 확대된 2020년 2분기 이후 어조지수와 물가상승률이 전례 없이 빠르게 증가한 것으로 나타났다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사