
최근 소설가 한강의 저서 ‘채식주의자’가 영어로 번역돼 영국에서 출간된 외국 문학작품에 주는 맨부커 인터내셔널 부문에 선정되면서 큰 화제가 됐다. 한강 작가와 영국인 번역가 데버러 스미스가 스포트라이트를 받았다.
언론들은 “번역의 승리”라며, 한국 소설의 해외 문학상 수상에 대한 기대감을 높였다. 정작 데버러 스미스는 해외 문학상 수상에 기이한 관심을 갖는 한국인들과 언론에 일침을 가했지만, 한국 문학의 우수성이 ‘영어’로는 표현이 어려워 번번이 수상에서 멀어졌다고 여기는 생각들도 이해가 간다. 우리가 영어의 섬세한 표현을 잘 인지하지 못하듯이, 반대의 경우도 마찬가지가 아닌가.
어쩌면 먼 미래에는 ‘언어 표현의 장벽’을 딥러닝이 해결해주지 않을까 싶다. 최근 들어 ‘자동 통번역’ 시스템이 인공지능의 한 분야로 각광 받으며 차세대 신기술로 부상하고 있기 때문.
이 말은 즉, 아직은 ‘갈 길이 멀다’는 뜻일 거다. 다행히도 현재 자동통번역 서비스는 품질이 미흡하긴 하지만, 점점 정확성이 높아지면서 활용이 증가되고 있다. 딥러닝은 컴퓨터가 여러 데이터를 이용해 마치 사람처럼 스스로 학습할 수 있게 하기 위해 인공 신경망(ANN: artificial neural network)을 기반으로 한 기계 학습 기술로, 이를 적용하면 사람이 모든 판단 기준을 정해주지 않아도 컴퓨터가 스스로 인지·추론·판단할 수 있게 된다.
<>유망한 미래기술로 각광받는 자동통번역
미국의 정보 기술 연구 및 자문 회사인 가트너는 ‘음성 자동통역(Speech-to-Speech)’을 향후 5~10년 내 ‘가장 유망한 미래기술’로 전망 했다. 일본 총무성도 글로벌화 추세에 따라 자동통번역 기술 확보가 ‘국가 경쟁력’과 직결된다고 보고, ‘글로벌 커뮤니케이션 정책’을 수립해 2020년까지 100억 엔 투자 계획을 발표했다.
그도 그럴것이, 자동 통번역 관련 세계시장은 꽤나 큰 규모가 예측되는 시장이다. 현재는 형성초기 단계로 볼 수 있는데 2019년까지 69억 달러(약 8조원) 규모로 성장할 것으로 윈터그린리서치는 전망했다.
자동통번역 기술은 크게 음성인식(ASR), 자동번역(MT: Machine Translation), 음성합성의 3단계를 거쳐 만들어진다. BCC 리서치(2013년)에 따르면, 로봇 등 연관된 시장 포함한 음성인식 관련 세계시장은 연 16.2% 성장, 2017년 1,130억 달러 규모로 성장이 예상했다. 그랜드 뷰 리서치는 자동번역 규모를 2022년 9억 8,330만 달러 규모로 성장할 것으로 내다보기도 했다.
<>글로벌 기업 자동통번역 서비스 현황은
실제로 구글, 시스트란, 마이크로소프트(MS) 같은 글로벌기업들은 딥러닝, 머신러닝 등과 같은 인공지능(AI) 기술을 활용해 자동통번역 정확성을 높이는 동시에 언어인지 기능을 강화하고 있다.
시스트란은 135개에 이르는 언어를 지원하며, 특히 심층 신경망 (DNN: Deep Neural Network) 기반의 ‘언어인지 모듈(감정인식, 문서요약, NER 등)’을 출시했다. 구글은 증강현실 애플리케이션 ‘퀘스트 비주얼’을 인수해 이미지 번역을 시작하였으며 통계 기반의 구글번역기를 무료로 서비스하고 있다. 그래서 자동통번역을 포함한 인공지능 시장을 적극 공략하고 있는 실정이다. 한편, MS는 스카이프 트랜스레이터를 통해 실시간 채팅 시 통번역 서비스를 제공하여 큰 인기를 얻고 있다.
<>국내 자동 통번역의 현재와 개선점은
국내에서는 구글 통번역, 네이버번역기, 지니톡, S번역기 등이 이용되고 있는 상황이다. 하지만 정보통신기술 진흥센터는 “국내 기술력은 부분적으로 우수하지만 세계적인 서비스로 발전하기에는 부족”하다고 지적했다. 대부분의 통번역서비스가 국내에 한정되어 있고 기존의 통번역 애플리케이션의 보급으로 국내 기업들의 애플리케이션 확산에 어려움을 겪고 있기 때문이다.
또한, 글로벌 기업들은 영어를 기반의 통번역 서비스에 강하기 때문에 해당 언어에 대한 정확성이 높지만, 아시아 언어는 언어의 이해 및 예문 확보에 어려움을 겪고 있어, 우리나라는 아시아권 언어를 중심으로 기반을 구축하여 해외 업체들에 대비할 필요가 있다. 때문에, 한국정부와 중국, 베트남 등 아시아 전략국가 정부 간의 언어자원(음성, 텍스트) 공유 협력 등을 통해 음성인식, 번역률을 높이는 노력이 필요하다.
영어기반의 통번역 서비스는 가능한 음성 및 텍스트 DB가 많아 70~80% 정확성을 기록하고 있는 반면, 한국어를 비롯 베트남, 태국어 등 아시아권 언어는 언어 특성상 개발이 어렵고 데이터 확보가 쉽지 않아 품질 향상에 어려움을 겪고 있는 상황이라고.
정부의 장기적이고 안정적인 지원은 최우선 과제다. 한국어에 대해 구글, MS 등 외국기업에 비해 국내기업들이 음성인식, 기계번역률의 획기적으로 개선할 수 있도록 집중 연구 및 산업체 이전 필요하다.
또한 인공지능은 학문적인 성격이 강하기 때문에, 대학에서부터 기초학문에 집중하고 기업체의 적극적인 R&D 투자와 연구소들의 고비용·장기성 과제 수행이 필요할 것으로 보인다. 무엇보다 폐쇄적인 국내 문화와 반대로 인공지능은 오픈화 되어가는 추세에 맞춰 국내 업체들 간의 기술 교류 및 협력관계 필요할 것으로 보인다.