UPDATED. 2019-10-23 18:25 (수)
[포춘US]인구조사에 활용되는 최첨단 정보보호 기술
[포춘US]인구조사에 활용되는 최첨단 정보보호 기술
  • Robert Hackett 기자
  • 승인 2019.07.01 13:47
  • 댓글 0
이 기사를 공유합니다

정부는 곧 실시할 인구조사에 왜 최첨단 개인정보 보호 기술을 채택하는 걸까. By Robert Hackett

미국 인구조사국은 10년마다 민주주의 유지의 근간이 되는 전국적 설문조사를 실시한다. 질문지는 이름, 주소, 나이, 인종, 민족 및 기타 세부사항이 포함된 풍부한 데이터를 생산한다. 따라서 문제를 일으킬 수도 있다: 유능한 탐정이라면, 세부적인 인적 사항으로 특정 개인을 파악하기 위해 이 공공기록을 활용할 수 있기 때문이다.

결과를 요약해 배포하면서도 동시에 사생활을 보호해야 하는 인구조사국 입장에서는 진퇴양난의 딜레마다. 조사국의 컴퓨터 과학자 심슨 가핀켈 Simson Garfinkel은 지난 5월 인구조사 자문위원회에서 “통계를 발표할 때마다, 정보를 유출하는 셈”이라고 밝혔다. 설문조사 결과가 비밀로 지켜진다는 점을 믿지 못하면, 사람들은 조사에 응하지 않을 것이다. 2020년 인구조사 설문은 시민권에 대해 묻는 등 민감한 새 질문들을 추가할 계획이기 때문에, 개인정보 보호 문제는 더 시급해졌다.

그러나 문제가 있다: 그 동안 일반적으로 사용한 방법으로는 개인정보를 보호하기에 충분하지 않다는 점이다. 연구원들은 2016년부터 통계학적 도구와 공공 데이터를 활용, 2010년 인구조사의 기밀 데이터베이스 46%를 정확히 재구성했다. 위아래로 각각 나이 한 살씩 차이를 고려하면, 인구 71%의 기록을 다시 정렬한 것이다. 그 결과 인구조사국이 발표한 데이터와 상업적으로 활용할 수 있는 다른 데이터를 합쳐도, 연구원들이 확실하게 재식별할 수 있는 규모는 인구의 17%에 그쳤다. 즉, 다른 개인적 특성을 통해 이름을 확인한 것이다.

인구조사국의 수석 과학자로 2016년 조사를 총괄한 존 어보드 John Abowd는 “기존의 사생활 정보 대책은 더 이상 효과가 없다. 건초 더미 속에 완전히 숨는다는 것이 이제 불가능하다”고 설명한다. 이 문제를 해결하기 위해, 어보드는 2020년 인구조사에 최첨단 ‘차별화 개인정보’ 기술을 도입했다. 가짜 정보나 임의의 변수를 의도적으로 시스템에 추가, 사용자 정보를 익명화하는 것이다. 구글 같은 기술 대기업들의 접근을 막기 위한 목적이다. 그 결과 데이터베이스를 파악하려는 기업들이 인구조사 데이터를 활용, 개개인의 세부 정보를 얻는 것이 불가능해졌다.

정확성과 개인정보 보호 간의 ‘제로섬 거래(tradeoff)’인 셈이다. 일부 사회과학 연구자들은 새 접근 방식이 업무를 방해할 우려가 있다고 불평한다. 하지만 대규모 데이터 유출의 후폭풍은 인구조사의 미래에 훨씬 더 악영향을 미칠 것이다. 


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.