로그인메뉴

인터뷰
  1. 프린트하기 메일보내기 기사목록 
  2. 글자 작게 하기글자 크게 하기

‘인간 번역’과 ‘인공지능 번역’의 결합, 번역 플랫폼 ‘플리토’ 이정수 대표

글 | 시정민 조선pub 기자
필자의 다른 기사

해외여행을 가기 전 번역 앱 한두 개를 설치하는 건 이제 필수가 됐다. 문장 전체를 통째로 해석하는 인공지능 신경망 기술을 적용하면서 번역의 정확도가 높아진 덕분이다.

해당 기술은 머신 러닝(기계학습)으로 컴퓨터가 단어가 아닌 문장 전체의 문맥과 어순을 고려해 번역하는 기술이다. 단어 단위 번역보다 의미를 더 정확하게 번역한다는 평가를 받고 있다. 구글의 ‘구글 번역’과 네이버의 ‘파파고’, 한글과 컴퓨터의 ‘지니 톡’도 해당 기술을 기반으로 번역 서비스를 제공하고 있다. 이에 인간 번역을 더한 번역 플랫폼 ‘플리토’는 한발 더 나아간다.

예를 들어 ‘카톡 할게’를 영어로 번역할 경우 한컴은 ‘I will do KakaoTalk’, 구글은 ‘I will do it’, 파파고는 ‘I will take care of it’으로 해석한 반면 플리토는 ‘I will send Kakao talk’으로 해석했다. 일반 기계 번역에서 오역하기 쉬운 부분을 플리토는 인간 번역을 거쳐 최대한 의미를 살린 결과를 제공한다. 

플리토의 이정수 대표는 “단순한 자동 번역 서비스는 컴퓨터 알고리즘으로 해결할 수도 있지만 언어의 밑바탕엔 한 나라의 문화와 복잡한 감성이 녹아들어 있다. 단어 하나에도 어떤 상황에 따라 쓰이는지에 따라 해석이 달라지기도 한다. 컴퓨터 알고리즘으로 사람들의 은근한 뉘앙스의 차이 혹은 상대방의 의도를 파악한 번역을 제공하는 건 컴퓨터 기술만으로는 한계가 있다고 생각한다”면서 “언어학자들 사이에서도 향후 기계번역이 완벽해질 수 있을지를 놓고 의견이 엇갈린다”고 설명했다.

본문이미지
▲'플리토' 이정수 대표


이 대표는 쿠웨이트에서 태어나 해외 주재원인 아버지를 따라 16년 동안 사우디아라비아와 영국, 미국 등지를 돌며 자랐다. 그는 “긴 외국 생활의 영향인지 외국어에 대한 관심이 높았고, 다양한 국적의 사람들과 어울리며 언어 문제로 오해가 생기는 경우가 잦았다. 언젠가 언어 문제를 해결하고 싶었던 꿈이 있었다”고 말했다.

이 대표는 고려대학교 경영학과에 재학 중 플리토의 모태가 된 번역 서비스 ‘플라잉 캐인’을 창업했다. 이후 SK텔레콤에 입사했고, 사내벤처 프로그램을 통해 집단지성 번역 서비스에 대한 계획을 키워나가다  2012년 플리토를 창업했다.

집단지성 서비스로 언어 데이터 확보

플리토는 네이버의 지식인 서비스처럼 플리토 사이트(www.flitto.com)와 플리토 앱에 접속해 텍스트, 이미지, 음성 등 다양한 매체의 번역을 요청할 수 있다. 요청된 번역은 18개(영어, 아랍어, 중국어 간체, 중국어 번체, 프랑스어, 독일어, 인도네시아어, 이탈리아어, 일본어, 한국어, 포르투갈어, 러시아어, 스페인어, 태국어, 베트남어, 타갈로그어, 힌디어, 터키어) 언어의 전문가들이 번역된 결과물을 실시간으로 답변한다.

“플리토는 기계가 아닌 사람을 통해 그 사람이 하고 싶은 말을 정확하게 풀이해 보여주는 게 핵심입니다. 더 정확한 번역을 위해 하나의 요청을 사용자가 자기 뜻에 맞는 번역을 선택할 수 있도록 300명의 번역가에게 전달합니다.”

번역을 요청한 사람은 가장 마음에 드는 번역문을 선택해 문장의 길이, 난이도에 맞는 요금을 지불하는 방식이다. 플리토 번역가들은 번역 실력마다 랭킹이 매겨지고 그에 따라 받을 수 있는 번역 수수료도 달라진다. 대게 한 줄당 50원의 소액 포인트가 번역자에게 지급되고, 포인트는 기프티콘 및 현금으로 교환하거나 아프리카 아이들에게 생수 등의 기부도 할 수 있다.

플리토는 현재 세계 200여 개국, 650만 일반 사용자 외에도 3000여 명의 전문 번역가가 맞춤형 번역을 제공하고 있다. 번역가 검증은 플리토 내에서 철저하게 이뤄지고 있다.

“수많은 전문 번역가와 프리랜서가 있지만 자신을 홍보할 방법이나 공간을 구하지 못하는 경우가 많아요. 플리토는 지속적으로 번역 요청이 들어오고 수시로 확인이 가능한 만큼 번역가들이 플리토를 통해 부가적인 수입과 더불어 자기 브랜드를 만들고, 이용자들은 언제 어디서나 번역을 요청할 수 있는 소통 공간으로도 활용되면 좋겠다고 생각했어요.”

이 대표는 플리토 오픈 후 언어 데이터를 구축하기 위해 가수 싸이, 빅뱅, 슈퍼주니어 등 케이팝 스타들의 소셜 미디어를 활용했다. 스타들의 소셜 미디어 트윗을 전 세계 언어로 번역해 오픈한지 불과 5개월 만에 270만 명에 달하는 회원을 끌어모았다. 지금은 한류스타 외에 비즈니스와 여행 등 수많은 관심사를 놓고 매일 7만 건 이상의 번역 요청을 처리하고 있다.

스마트폰으로 사진 찍으면 즉시 번역되는 ‘실시간 이미지  번역’

플리토는 집단지성 번역 서비스 외 가격, 언어, 전문 분야를 선택해 조건에 맞는 번역가를 찾을 수 있는 ‘일대일 전문 번역 서비스,’, ‘실시간 이미지 번역 서비스’ 등을 제공한다. 

특히 지난해 말 출시한 ‘실시간 이미지 번역 서비스는’ 외국인들의 국내 관광을 적극 지원하고 있다. 이 서비스는 국내 주요 관광시설 및 박물관, 국립공원 표지판, 식당 메뉴판 등의 이미지를 18개 언어로 무료로 번역해주는 서비스로 사진 촬영 한 번만으로 원하는 언어로 볼 수 있다.

본문이미지
▲실시간 이미지 번역 서비스는 지난 4월, 광화문 국제아트페스티벌에서 국내외 작가 86명의 작품 150여 점을 번역본으로 감상할 수 있도록 해 전시장을 찾는 외국인 관람객의 원활한 작품 감상을 돕는 한편 국내외 작가들이 언어 장벽 없이 자신의 작품을 소개하고 널리 알릴 수 있도록 했다.
 

이 서비스는 고유의 집단지성 번역 플랫폼을 통해 미리 처리된 최적의 번역 값이 데이터로 저장되어 사용자가 필요로 할 때마다 무료로 즉시 보여준다. 다른 번역 서비스에서는 손글씨나 이미지 배경이 복잡한 경우, 사진을 찍는 각도에 따라 글씨를 인식하지 못하는 경우가 많다. 플리토는 이와 같은 단점을 집단지성과 인간 번역으로 개선했다.
 
 
본문이미지
▲영어,일어,중국어로 번역된 카페 '오가다' 메뉴판

번역본은 3천여 명의 전문 번역가 중 예술 분야 전문 번역가가 직접 번역한 글로 원어민 검수를 거친 검증된 번역 결과다. 또한 이 서비스로 지난 4월 서울시 ‘서울 관광 스타트업 협력 프로젝트’에서 대상을 수상하기도 했다. 플리토는 앞으로 평창올림픽 경기장과 주변 시설에 실시간 이미지 번역 서비스를 확대해 갈 계획이다.

정확한 번역은 언어 데이터가 기반이 돼야
구글과 협력 통해 2차 매출 발생

대화에서 비언어 표현이 차지하는 비중은 크고, 맥락을 이해하기란 기술보다 예술에 가깝다. 인공지능이 사람의 언어를 알아듣고 번역하기가 여전히 어려운 이유다. 이에 이 대표는 번역 기술 향상을 위해 꼭 필요한 것이 언어 데이터라고 말했다. “사람은 빠르게 발전하는 인공지능의 번역 능력을 활용하고, 인공지능은 사람들이 쏟아내는 말과 글을 배우며 학습에 속도를 내는 과정에 필요한 것이 언어 데이터이고, 정확한 데이터가 있어야 인공지능의 번역 실력이 좋아진다”고 말했다.

그동안 이 대표는 코퍼스, 한글 말뭉치를 만드는 작업에 집중했다. 한글 말뭉치는 일종의 한글 어휘와 어휘 특성의 저장소로 개발 용어로 코퍼스라고 한다. 일반적으로 문서를 디지털화한 뒤 해당 문서에 사용된 모든 어휘를 문장, 어절, 형태소별로 추려내고 각각에 특성을 부여하는 식이다.
 
이 작업이 선행되어야 자동 번역 서비스를 할 때 다양한 언어 형태를 컴퓨터가 이해해 해석할 수 있다. 기존에는 대게 형태소 분석을 통해 추려냈기 때문에 번역된 문장이 다소 어색한 경우가 많았다. 이는 정해진 코퍼스에 맞춰 뜻을 해석해 결괏값을 만들기 때문이다.

어색한 부분을 개선하기 위해 플리토는 형태소뿐 아니라 문장도 함께 분석했다.
“코퍼스를 분석해 해당 코퍼스와 일치하는 결과와 함께 그와 50~60% 유사한 문장도 함께 보여주고 있어요. 현재 플리토는 글로벌 언어 데이터를 약 1억 건 정도 확보하고 있어요. 일상적 대화부터 전문 분야까지 원활히 번역을 할 수 있도록 언어 데이터를 꾸준히 확보해가는 것이 관건입니다.”

실제 플리토 매출의 대부분은 기업에 판매하는 번역 데이터에서 발생한다. 2014년 자동 통역 앱 ‘지니 톡’을 개발하던 한국전자통신연구원(ETRI)에 언어 데이터를 판매한 것을 시작으로 NTT도코모, 시스트란, 네이버 등 국내외 주요 기업에 언어 데이터를 판매했다.

현재 자동번역 서비스를 제공하는 구글, 마이크로 소프트(MS), 정부기관이 주요 고객이다. 이외에 개인·웹사이트·e북 업체가 요청하는 대량 번역, 스토어 입점 제휴업체로부터 거둬들이는 수수료가 매출의 일부를 차지한다.

“구글에 번역 데이터를 판매하는 회사는 많지만 플리토는 클라우드 소싱 방식으로 사용자가 생산한 데이터를 판매하기 때문에 유리한 부분이 많습니다.”

이 대표는 “구글 번역, 네이버 파파고 등 AI 기반 기계 번역이 발전해도 통역사나 번역가 등의 역할은 분명히 있을 것이다. 번역은 미래에도 인간의 손길을 필요로 할 것”이라며 “자동번역과 인간 번역은 공생의 관계라고 생각한다. 실제 자동번역기 회사도 인간 번역의 데이터를 사서 수집하고 있고, 인간 번역사도 자동번역기를 이용해 초벌 번역을 하는 경우가 많다”고 말했다.

“언어란 그 나라의 역사와 문화를 갖고 있어요. 우리나라에서 아직까지 고구려어 복원을 못 하고 있는데 고구려 때 간직해야 할 문화의 일부가 사라졌다는 건 슬픈 일이라고 생각해요. 언어 데이터를 만드는 것만큼 잘 보존하고 발달시켜 언어의 가교 역할을 해가고 싶습니다. 언어의 장벽을 무너뜨리는 서비스야말로 사람과 사람 사이의 관계를 원활하게 만들어 줄 것이라 생각합니다.”
 
[글=시정민 기자]
등록일 : 2017-05-23 13:33   |  수정일 : 2017-05-24 09:33
  1. 프린트하기 
  2. 기사목록
Copyright ⓒ 조선뉴스프레스 - 무단전재 및 재배포 금지
독자 리뷰는 로그인 하신 후 남기실 수 있습니다.
맨위로

하단메뉴

개인정보 취급방침독자센터취재제보광고문의조선뉴스프레스인스타그램페이스북트위터카카오톡