상단영역

포춘코리아 매거진 최신호를 무료로 읽어보세요.

본문영역

“영화속 실시간 통번역기, 3년 내 현실로”

[실리콘밸리의 한국인] 정영훈 XL8 대표

  • 기사입력 2023.02.03 18:54
  • 기자명 문상덕 기자

언어의 바벨탑을 무너뜨리려는 한국인이 있다. 사람 도움 없이, AI가 실시간으로 통번역하는 서비스를 낸다고 말한다. 구글 출신의 창업가, 정영훈 XL8 대표다.

정영훈 엑스엘에이트(XL8) 대표.
정영훈 엑스엘에이트(XL8) 대표.

기업 3000여 곳이 운집한 미국 라스베이거스의 CES 2023 행사장. 유창한 영어 회화가 들려올수록 주머니 속 스마트폰을 꼭 쥐었다. 모바일 앱을 켜둔 채 예정된 비즈니스 미팅 장소로 갔다. 앱의 이름은 ‘트래블캣(TravelCAT)’. 기계번역 스타트업 엑스엘에이트(XL8)에서 개발 중인 번역기였다. 체험판을 제공받아 사용했다. 화면 하단의 마이크 버튼을 누르고 말하면, 수 초 내로 원하는 언어로 번역돼 문자와 음성으로 제공된다. 노이즈가 적은 공간에서만큼은 소통에 문제가 없었다.

XL8는 정영훈 대표가 2019년 창업한 기계번역 스타트업이다. 정 대표는 구글에서 검색팀, 이벤트 서치팀을 거쳐 TLM(Tech Lead Manager)로 일했다. 그만큼 구글의 초거대 AI 엔진의 저력을 잘 알고 있을 터. 그런데도 도전장을 낸 건 미디어 번역에서 가능성을 봤기 때문이다. 미디어 콘텐츠 번역 분야에선 수만 명의 번역가가 실시간으로 질 좋은 데이터 셋을 만들고 있었다. 웹에서 무직위로 긁어오는 구글 데이터와 달랐다. 데이터의 양은 100분의 1 미만이지만, 붙어볼 만했다.

정 대표는 “기계번역한 결과를 다시 사람이 감수한다”며 “이렇게 감수한 결과물을 피드백에 활용하면 번역 엔진의 성능을 더 향상시킬 수 있는 것”이라고 설명했다. XL8는 올해 시리즈A 라운드에 들어갈 예정이다. 이미 글로벌 1위 LSP(번역 서비스 제공업체) 아이유노를 파트너로 뒀다. 지금까진 콘텐츠를 번역에 자막을 달았다면, 올해 안으론 스포츠경기나 콘서트 같은 라이브 이벤트의 언어를 번역해 실시간으로 자막을 생성하는 작업에 뛰어든다.

트래블캣의 미래도 흥미롭다. 그는 수년 내 영화에서 볼 법한 실시간 번역기를 현실에서 볼 수 있을 것으로 예상했다. 그만큼 기계번역의 기술 발전이 숨가쁘다는 이야기. 지난해 12월 한국을 찾은 정 대표에게 기계번역의 현주소를 물었다.

Q 양보다 질이 중요해지는 분기점이 어떻게 될까요?

A 하나의 언어 쌍을 학습하려면 1000만 개 정도의 문장이 필요하다고 봐요. 그 정도 있으면 이 언어는 만들어볼 만하다고 하죠.

Q 구글에서도 데이터 질의 중요성을 알 텐데요.

A 데이터를 확보할 방법이 마땅치 않죠. 저희는 아이유노 같은 LSP와 파트너십도 있고요. 비즈니스 모델 자체가 LSP에 작업 효율을 올릴 수 있는 도구를 제공하고, 저희는 기계번역의 질을 높일 수 있는 기회를 얻는 거예요. 큰 회사들이 하기 어려운 일이죠. 물론 웹 번역은 구글이 더 잘 합니다. 저희는 구어체 중심인 미디어 번역에 특화한 것이고요.

Q 데이터의 질 외에 번역 엔진의 성능도 중요하겠죠.

A 미디어 번역에 특화한 기법을 적용했어요. 보통 기계번역에서는 문장 하나를 받아와서 이 문장을 어떻게 번역할지 고민하는데요. 앞뒤 문맥까지 반영해서 문장을 이해하면 번역 정확도가 높아지겠죠. 이걸 문맥 인식(Context Awareness, CA) 기법이라고 합니다. 문서에 적용할 때보다 구어체 번역 때 효과가 좋더라고요. 정서와 뉘앙스가 있고, 또 다음 사람이 대화 방향을 확 틀 수도 있으니까요.


정 대표는 CA 기법을 적용한 예로 대명사 번역을 들었다. 영어 원문 ‘I like this flower. Put it in the bag’을 프랑스어로 번역하려면, 두 번째 문장에서 꽃을 지칭하는 대명사 ‘it’을 주의해야 한다. 영어와 달리, 프랑스어에서 꽃은 여성형 명사이기 때문이다. 앞 문장과의 문맥을 고려했다면 남성형 대명사 ‘le’ 대신 여성형 대명사 ‘la’가 돼야 한다. XL8의 번역 엔진은 ‘J'aime cette fleur. Mets-la dans le sac’으로 제대로 번역한다. 반면 구글의 번역 엔진은 ‘Mettez-le dans le sac’로 번역했다.


Q 또 어떤 기술도 들어갔나요?

A ‘멀티 모달(Multi modal) 번역’을 적용했어요. 언어를 번역할 때 언어 외 다른 형태의 정보도 본다는 이야기인데요. 어떤 이미지에 관한 설명을 번역할 때, 이미지도 같이 넣었더니 정확도가 높아지더라는 거죠. 그런데 대부분의 미디어 콘텐츠에서는 사람 두 명이 나와서 대화할 때가 많아요. 이미지 정보는 크게 도움이 안 되는 거죠. 그보단 언어마다 필요한 정보가 있어요. 한국어로 치면 나이죠. 이렇게 구어체에 특화된 기술을 개발한 게 주효했어요.

Q 아이유노에서 신생 업체였던 XL8을 선택했던 이유가 무엇이었을까요?

A 합의에 이르는 과정이 어렵지 않았어요. 특히 2021년 아이유노에서 미국 SDI를 인수했을 때 SDI가 기계번역 솔루션을 쓰고 있었거든요. 언어 쌍 20가지를 놓고 테스트를 했는데, 저희가 모든 언어 쌍에 대해서 우수하게 나왔어요. 그래서 결과가 나온 다음 날 저희를 선택했죠.

Q 지금은 여러 LSP에서 협업 제안이 들어온다고 들었습니다.

A 전략적인 측면이 있죠. LSP들도 미래를 고민할 수밖에 없거든요. 사람이 손으로 하는 비즈니스이고, 외부의 AI 엔진을 갖다 쓰는 건 한계가 있을 겁니다. 그렇다고 자체 개발은 쉽지 않죠. 그렇다면 저희 회사에 지분 투자를 해서 같이 커 나가는 방안을 고민할 만합니다. 저희도 중립적으로 여러 LSP에서 지원을 받으면 사업적으로 접근하기도 쉬워질 것이고요.

Q 영화 ‘설국열차’에 실시간 번역기가 나오는데요. 트래블캣을 쓰면서 떠올렸습니다.

A 결국은 현실이 될 겁니다. 구어체이기 때문에 저희 엔진이 잘 맞을 텐데요. 만약 문장 10개 중에 9개 이상이 안정적으로 번역된다고 하면 상용화가 이뤄지겠죠. 그 시점이 저희가 봤을 때는 가까이 온 것 같아요. 1~2년 안에 일상 대화는 문제없이 쓸 수 있을 정도로 되지 않을까.

Q 일상 대화의 수준이라면 몇 퍼센트의 정확도인가요?

A 95% 정도. 물론 비즈니스에서는 더 정확해야 하겠죠. 그런데 정확도도 중요하지만 실시간성, 얼마나 빨리 번역이 되느냐도 중요해요. 지금은 말이 끝나야 번역이 되거든요. 영화 ‘승리호’에선 말하는 동시에 되잖아요. 정확도와 실시간성은 트레이드 오프 관계라, 균형을 잘 맞춰야 합니다.

Q 현재 수준은 몇 초인가요?

A 7초 버전이 있고 40초 버전이 있는데, 40초 버전이 더 정확하죠. 앞으로 4~5초 정도로 사용할 만한 게 나오지 않을까.

Q SF 작품에서 영감을 받기도 하나요?

A ‘프로젝트 헤일메리’(2021)라고 영화 ‘마션’의 원작자가 쓴 소설이 있어요. 외계인의 언어를 번역하려고 노력하는 장면이 나옵니다. 외계인은 몇 개의 음으로 화음을 이뤄서 말하거든요. 화음을 인식하고, 어떻게 처리할지 연구하는데, 작가가 엔지니어 출신이라 고증이 좋았어요. 작품을 읽으면서 사람은 항상 언어 문제로 고통받는구나, 기술로 해결할 수 있겠다는 생각이 들었어요.

Q 비즈니스가 한국적이지 않다는 점이 매력적입니다.

A 번역은 한 국가에 종속될 수 없는 기술이죠. 인류가 몇 천 년 동안 고민해왔고, 이제 쓸 만한 도구가 나오기 시작했으니까요.

Q “아카데미는 로컬”이라고 했던 봉준호 감독의 말, 어떻게 생각하세요? ‘한국 스타트업이 실리콘밸리에 진출해야 한다’는 말이 산업화시대 구호와 같다고 여겨질 때가 있습니다.

A 저는 사실 ‘국뽕’ 좋아하긴 하거든요. 관련한 소설도 즐겨 봤고요. 그런데 어디까지나 재미인 거지, 사상을 지배해선 안 된다고 생각해요. 사실이 아니잖아요. 정신과 의사 빅토르 프랭클의 수기를 보면, 나치 강제수용소에서 맹목적인 낙관주의자가 가장 먼저 무너졌어요. 채용에서도 그렇습니다. 한국인이니까 잘할 수 있고, 한국인이니까 뽑아야 하는 건 없어요. 당연히 제일 잘할 수 있는 사람들의 조합으로 가는 것이 맞고요. 결과물을 놓고 보니 한국인이 잘했네, 라고 할 순 있겠죠.

Q 그래도 BAKG 대표까지 맡으셨습니다.

A BAKG 활동을 오래 했어요. 2015년도에 오면서 바로 운영진으로 시작을 했고요. 소그룹 운영진으로 6년 정도 활동을 하다가 대표를 맡았어요. 추천을 받았는데, 회사가 초기라서 고민이 많았는데, 많은 분을 만날 수 있는 자리라서 좋았어요. 또 임기 동안 코딩스쿨을 통해서 기적적인 성과를 낸 분이 많았어요. 엔지니어가 아니었던 분이 엔지니어 잡을 얻기도 했을 정도예요.


이후 정 대표를 지난 1월9일 ‘82 스타트업 서밋’ 행사에서 다시 만났다. 연단에 선 그는 수백 명의 엔지니어와 유학생들 앞에서 XL8의 비즈니스 모델을 소개했다. 지식의 전파를 자유롭게 만든다는 번역의 본질처럼, 그 역시 분주하게 자신의 경험과 통찰을 동료와 후배들에게 전파하고 있었다.

/ 포춘코리아 문상덕 기자 mosadu@fortunekorea.co.kr 사진 강태훈

이 기사를 공유합니다

개의 댓글

0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400

내 댓글 모음

하단영역

매체정보

  • 서울특별시 서대문구 경기대로 15 (엘림넷 빌딩) 1층
  • 대표전화 : 02-6261-6149
  • 팩스 : 02-6261-6150
  • 청소년보호책임자 : 박노경
  • 법인명 : (주)에이치엠지퍼블리싱
  • 제호 : 포춘코리아(FORTUNE KOREA)
  • 등록번호 : 서울중 라00672
  • 등록일 : 2009-01-06
  • 발행일 : 2017-11-13
  • 발행인 : 김형섭
  • 편집국장 : 유부혁
  • 대표 : 김형섭
  • 사업자등록번호 : 201-86-19372
  • 통신판매업신고번호 : 2021-서울종로-1734
  • 포춘코리아(FORTUNE KOREA) 모든 콘텐츠(영상,기사, 사진)는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.
  • Copyright © 2024 포춘코리아(FORTUNE KOREA). All rights reserved. mail to nkpark@fortunekorea.co.kr
ND소프트