두 중국 하이테크 라이벌 모델이 중국어 이해 평가 벤치마크에서 최고 점수를 획득했다.
일부 언어 이해에서는 기계가 인간보다 더 잘할 수 있지만, 연구자들은 AI가 언어를 진정으로 이해하려면 아직 갈 길이 멀다고 말한다.
자연어 처리(NLP)를 측정하는 벤치마크 테스트에 따르면 중국 하이테크 기업인 텐센트(Tencent Holdings)와 알리바바(Alibaba Group Holding)의 인공 지능(AI) 모델은 사람보다 중국어를 더 잘 이해하는 것으로 나타났다.
두 라이벌 모델은 중국어 이해 평가(CLUE) 벤치마크에서 기록적인 높은 점수를 얻었다.
이 평가는 기계가 인간이 하는 것처럼 중국어 텍스트를 얼마나 잘 이해하고 응답할 수 있는지 평가하도록 설계된 것이다.
3년 전 수십 명의 연구원이 벤치마크를 설정한 이후 AI 모델이 테스트에서 사람보다 더 나은 점수를 받은 것은 이번이 처음이다.
테스트 웹 사이트의 28일 순위에 따르면 텐센트의 ‘훈유안("Hunyuan) AI 모델’이 86.918점으로 1위를 차지했으며, 알리바바 앨리스마인드(AliceMind)가 86.685점으로 그 뒤를 이었다.
둘 다 86.678점을 받은 인간보다 점수가 높았다.
중국 스마트폰 제조사 오포(Oppo)와 음식 배달 대기업 메이투안(Meituan)의 AI 모델이 각각 4위와 5위에 올랐다.
전자상거래 거대 기업인 알리바바 클라우드(Alibaba Cloud)는 "순위는 많이 바뀌지만 최고 득점자는 지금까지 인간을 능가한 적이 없다"고 말했다.
최신 결과는 "AI 모델에 대한 중국어 이해가 새로운 수준에 도달했다"는 의미라고 덧붙였다.
/ 포춘코리아 김상도 기자 santos@fortunekorea.co.kr