UPDATED. 2020-07-03 11:24 (금)
[포춘US]코로나바이러스에 AI를 활용하다
[포춘US]코로나바이러스에 AI를 활용하다
  • AARON PRESSMAN 기자
  • 승인 2020.05.28 13:23
  • 댓글 0
이 기사를 공유합니다

Bringing A.I. to the Coronavirus Fight

인공지능이 감염병 확산 예측에 일조하며, 보건 관료들에 위협을 줄일 수 있는 새 도구를 제공하고 있다. BY AARON PRESSMAN

토론토의 스타트업 블루닷 BlueDot이 운영하는 인공지능 경고시스템은 2019년 마지막 날, 우한시의 미스터리한 폐렴 변종에 대한 중국발 뉴스를 예고했다. 매일 65개 언어로 올라오는 10만 건의 기사와 온라인 게시물을 샅샅이 검색하는 이 시스템은 블루닷 직원들에게 경고를 보냈다. 이들은 2003년 발발한 치명적인 사스와 유사하다는 점을 즉각 알아차렸다.

블루닷 시스템은 수십억 항공 여행객들의 일정 데이터를 기반으로, 의문의 병이 확산하면 전 세계 도시 중 어느 곳이 가장 위험할지 곧바로 파악할 수 있었다. 회사는 후에 코로나바이러스라고 불리게 될 질병에 대해, 재빨리 보건 당국과 다른 고객사들에 경고를 보냈다. 이 전염병으로 인해 3월 초까지 거의 10만 명이 감염되고, 3,000명 이상이 사망했다.

토론토 의대 교수이자 블루닷 CEO인 캄란 칸 Kamran Khan 박사는 “전염병 발발은 새해 전날 밤이든 아니든 그 시기를 가리지 않는다. 이런 질병과 위협에 대처하기 위해서는 그들보다 훨씬 더 빨리 움직여야 한다"고 강조한다.

칸이 약 7년 전 블루닷을 설립했을 때와는 전혀 다른 모습이다. 당시에는 바이러스의 잠재적 확산 지도를 작성하고, 당국에 경고를 보내는데 몇 주가 걸릴 수 있었다. 그리고 마뜩잖아 하는 정부들은 때때로 그 후에도 몇 주 또는 몇 달간이나 그 자료를 방치하곤 했다.

그러나 AI와 빅 데이터의 시대는 코로나바이러스 같은 전염병 발생 경로를 추적하고, 예측하는 데 있어 혁명적인 발전을 이뤘다. 블루닷과 다른 경쟁업체들은 언어들을 해석하고 서로 다른 의미—가령 탄저병(Anthrax)이라는 이름의 헤비 메탈 밴드와 전염병인 탄저병의 차이—를 구별할 수 있는 알고리즘을 앞세워, 잠재적인 전염병을 발견하기 위해 가능한 모든 데이터를 빨아들이고 있다.

그들의 경고가 더 빠르고 상세할수록, 보건 당국은 더 효과적으로 감염된 환자들을 선별하고 자원을 배분할 수 있다. 한발 빠른 출발은 수천 명의 생명을 구할 수 있다.

AI에 근거한 경고는 코로나바이러스에 대해, 세계보건기구(WHO)와 중국 관리들이 이전에 발생했던 사스 같은 전염병보다 더 빨리 대응하도록 도왔다. 그럼에도 초기 경고는 그 정도밖에 할 수 없다. 중국 정부는 너무 느리게 움직였다는 비난을 받는 한편, 미국은 진단 키트 부족에 발목을 잡혔다.

인공지능 스타트업들이 만든 시스템은 검색 키워드 데이터부터 위키피디아 페이지를 클릭하는 사람들의 위치까지 모든 정보를 활용한다. 이를 통해 더욱 상호 연결되고, 모바일화 된 세계에서 생성되는 정보를 공급한다.

이 자료의 상당수는 구글을 포함한 세계 최대의 인터넷 회사들로부터 공급 받은 것이다. 구글은 일부 대유행병 탐지 스타트업에 검색어 및 위치 데이터를 제공한다. 한편 페이스북은 사용자들의 이동에 대한 집계 자료와 함께, 페이스북 그룹과 인스타그램에서 코로나바이러스를 언급한 게시물도 공유했다. 트위터와 중국 텐센트 등의 익명화된 데이터도 알고리즘에 힘을 보태고 있다. 이 알고리즘은 일반적으로 모니터링 회사들의 자체 컴퓨터가 아니라 아마존과 마이크로소프트, 구글이 관리하는 서버에서 실행된다. 이 기업들이 AI용으로 특별히 설계된 칩을 사용하기 때문이다.

분명한 점은, AI와 기계학습 시스템에 엄청난 양의 정보를 공급하는 것이 성공을 보장하지는 않는다는 사실이다. 예를 들어, 구글은 2013년 발병 주기를 지나치게 과대평가한 후 계절적 독감 발생의 심각성을 예측하는 프로젝트를 중단했다. 한가지 문제는 사람들의 건강관리 정보 검색을 돕기 위한 구글의 자체 노력이 시스템을 속여, 더 많은 사람들이 병에 걸리고 있다고 잘못 예상했다는 점이다.

전염병 탐지 시스템을 개발하는 회사들의 과제는 실제 질병과 무관한 과잉반응에 현혹되지 않고, 유용한 관련 정보에만 집중하는 것이다. 모든 시스템이 여전히 각각의 경우를 더 심층적으로 파악하기 위해 인간에 의존하며, 인간들이 (자신들의 기술이 의존하는) 정보 출처를 자주 조정하는 이유도 바로 여기에 있다.

존 브라운스타인 John Brownstein은 “사람들의 온라인 활동에 따라 데이터가 끊임없이 변화하고 있으며, 그런 이유로 항상 알고리즘을 재조정해야 한다는 점을 인식해야 한다”고 설명한다. 그는 보스턴 아동병원의 최고혁신책임자이자, 블루닷 하루 전에 코로나바이러스를 경고한 또 다른 AI 경보 시스템인 헬스맵 HealthMap의 공동창립자다.

헬스맵의 AI가 발동한 코로나바이러스 경고는 우한 지역 의사들의 정보에 의해 뒷받침됐다. 이들은 프로메드 ProMed라는 온라인 포럼에서 우려를 공유하고 있었다. 브라운스타인은 “이런 게시물들은 탄광 속의 초기 카나리아 새 같은 역할을 한다. 즉, 상황이 더 심각해질 것이라고 경고하는 데이터를 제공할 수 있다”고 설명한다.

’신선한’ 데이터를 사용하는 것도 중요하다. 코로나바이러스 확산 방식에 대한 초기 시뮬레이션은 과거 항공 여행 일정에 의존했다. 그러나 마크 갤리번 Mark Gallivan은 “발병이 알려지고 정부가 중국 내 특정 지역에서 이동을 금지하기 시작하자, 여행 패턴이 바뀌었다”고 말한다. 그는 전염병 탐지를 위해 AI를 활용하는 또 다른 스타트업 메타바이오타 Metabiota의 데이터 과학 책임자다.

그 결과, 이 샌프란시스코 회사는 수백만 대의 휴대폰에서 얻은 실시간 위치 데이터로 과거 승객 정보 데이터베이스를 업데이트했다. 갤리번은 "1월 14일 유입 위험이 가장 높게 나타났던 첫 4개국은 실제로도 의심환자들을 받아들인 첫 케이스가 됐다”고 설명한다.

또 다른 접근법은 모든 온라인 채팅과 뉴스 보도는 멀리하고, 대신 실제 의료 데이터를 사용하는 방식이다. 샌프란시스코의 신생기업 킨사 Kinsa는 사람들이 언제 의사를 만날지 결정하는 데 도움을 주기 위해, 앱과 연동되는 스마트 온도계를 판매한다. 약 100만 가구와 1,000개 이상의 학교가 킨사 장비를 사용하는 가운데, 이 온도계는 미국에서 계절 독감의 확산을 파악할 수 있는 실마리를 제공한다. 8년 된 이 회사는 미국 질병통제예방센터(CDC)의 독감 예측 정확도를 수년간 앞질렀다고 주장한다. 아울러 지역에서의 독감 발생을 최대 3개월 전에 예측할 수 있는 시스템 개발을 희망하고 있다.

킨사의 CEO 인더 싱 Inder Singh은 “차이는 데이터의 품질에 있다”고 설명한다.

물론 킨사 방식은 사람들이 회사 기기를 사용하는 곳에서만 효과가 있다. 미국에서 그것은 대부분 도시들을 의미하지만, 시골지역에서는 그렇게 많지 않다. 그리고 이 회사는 아직 다른 나라까지 진출하지 못했다. 20달러짜리 스마트 온도계조차 대부분 사람들에게는 너무 비쌀 수 있기 때문이다.

그러나 메타바이오타의 갤리번은 “궁극적으로 AI 시스템에 직접 보고하는 의료기기가 늘어날 수록, 가장 빠르고 정확한 조기 경보 시스템을 만들 수 있다. 전염병을 조기 발견하기 위해서는 훨씬 더 스마트한 공중 보건 및 의료 시스템을 구축하는 것이 중요하다"라고 강조한다.

▲데이터가 뒷받침하는 AI의 전염병 예측

-스마트하고 연결된 의료기기: 수백만 환자들이 데이터를 앱으로 전송하는 체온계와 다른 기기들의 도움을 통해 치료를 받고 있다. 예컨대 집계한 종합 정보는 발열환자 집단에 대한 조기 경고를 제공할 수 있다.

-키워드 및 위치 검색: 사람들이 특정한 시간이나 장소에서 대답하기를 원하는 질문은 질병 발생의 신호일 수 있다. 그러나 검색 질의문(search queries)은 실제 전염병만큼이나 과잉반응을 반영할 수 있기 때문에, 데이터를 신중하게 걸러내야 한다.

-지역 뉴스기사: 현장 기자들은 종종 특이한 의학적인 문제나 바이러스 발생에 대한 이야기를 쓴다. 기사는 자연어 처리를 이용해 번역 및 분석을 할 수 있다.

-항공 여행 패턴: 전 세계 항공사들은 연간 약 40억 개의 여행 일정을 생성한다. 이 중요한 데이터는 전염병이 어떻게 발병 도시에서 가장 인기 있는 행선지를 거쳐 다른 도시들로 확산하는지 예측하는 데 사용할 수 있다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.