본문 바로가기
디지털시대의 문화현장

❺ 위대한 당신의 10초

by 뽀키2 2023. 5. 21.

글쓴이

디지털 시대, 네티즌들의 작은 행동들이 쌓여서 감동적인 일을 해낼 수 있도록 발전하는 것은 무척 놀라운 일이다. 또 그것들이 무심한 가운데, 사회적 기여, 인류에 대한 기여로 이어져 눈앞에 펼쳐진다면 여간 가슴 벅찬 일이 아닐 것이다. 그동안 우리는 이미 크고 작은 경험들을 했고, 많은 사람들은 오늘도 그 위대한 일을 애써 이어가고 있다.

나치 독일의 암호기 에니그마를 해독하는 과정을 그린 영화『이미테이션 게임』의 주인공인 영국의 수학자 앨런 튜링(1912~1954)은 1950년 자신의 논문에서 “어떤 존재든 인간과 비슷한 지적 행위를 보이면 지능이 있다고 인정하자”고 제안하면서, 사람인지 컴퓨터인지 구분하는 간단한 테스트를 ‘튜링 테스트’라고 불렀다. 말하자면 기계가 사람과 대화를 나눈 뒤, 대화를 나눈 이가 기계를 사람이라고 판단하면 기계도 지능이 있다고 인정하는 기술이다. 어쩌면 오늘날 ‘인공지능(AI)’은 그의 상상력에서 출발했다고 할 수 있다.

그 후, 2000년이 되면서 우리는 구불구불하고 왜곡된 문자를 매번 치라고 짜증나게 만드는 ‘캡차’(CAPTCHA, 웹사이트 등록인증 서비스)를 만나게 된다. 이것은 2000년 미국 카네기 멜론대 연구팀이 온라인상 부정선거를 막기 위해 개발한 프로그램이다. 인간과 로봇을 구별하는 최초 테스트 ‘튜링 테스트’의 인터넷버전인 이 프로그램은 보안이 취약한 컴퓨터를 찾아 스팸메일 발송, 계정 해킹 등의 일을 하며 부정선거를 유발하는 봇(bot)의 활동을 막는 데 집중하면서 ‘캡차’ 인증을 거쳐야 순순히 다음 단계로 진행되게 만든다.

카네기 멜론대 연구팀은 2007년, 과테말라 출신의 1979년생 루이스 폰 안(Luis Von Ahn)교수의 주도로 ‘캡차’보다 보안이 강화된 ‘리캡차’ 기술을 개발한다. 그들은 매일 2억명의 사람들이 ‘캡차’를 사용하며 50만 시간이 버려지는 것에 문제점을 느꼈다. ‘이 시간을 인류를 위해 쓸 수는 없을까? 오래된 책이나 인류에게 너무도 소중한 유산들을 모두 디지털 문서로 남겨놓으면 어떨까? ‘전 세계 2억 명이 함께 하면 가능하지 않을까?’

이렇듯 ‘리캡차’는 버려지는 시간을 유용하게 쓰기 위한 시도에서 탄생된 혁신적 프로그램인 것이다. 화면에 두 개의 단어를 보여주고, 사용자에게 답을 묻게 되면, 한 단어는 컴퓨터가 이미 답을 알고 있는 단어, 또 다른 하나는 오래된 종이책에 수록돼 디지털화가 필요한 단어이다. 사용자가 두 단어를 모두 입력하면,

이미 알고 있는 하나의 답으로 사람임을 판단하고, 나머지 한 단어도 정답으로 간주한다. 사실 사람들은 10초 동안 컴퓨터가 읽지 못한 글자들을 입력하고 있었던 것이다. 고문서를 인식할 때 보통 30%의 미해독 활자가 발생한다. 이런 미해독 활자를 ‘캡차’의 단어로 제시해서 열 번의 답안이 일치하면 그 답안을 고문서분석 데이터에 저장하는 것이다. 이렇게 무작위로 단어를 입력하게 한 뒤, 높은 비율로 입력된 단어를 간추려 고문서 디지털화에 응용하는 방식인 것이다.

 

 

'프로젝트 구텐베르크’로고, 영화<이미테이션게임>포스터, 영국지폐 속의 앨런 튜링 초상, 루이스 폰 안 교수, ‘듀오링고’캐릭터 사진
▲(왼편에서부터) &lsquo;프로젝트 구텐베르크&rsquo;로고, 영화<이미테이션게임>포스터, 영국지폐 속의 앨런 튜링 초상, 루이스 폰 안 교수, &lsquo;듀오링고&rsquo;캐릭터


아무 의미 없던 하루 10만 건 정도의 ‘캡차’가 ‘리캡차’ 과정을 통해 사람과 로봇을 가려낼 뿐만 아니라, 실제로 전 세계 사람들이 매일 1억 개 정도의 단어를 확인해서 연간 고서 250만 권을 디지털화 하는 유용한 기술로 탈바꿈시켰다. 대표적으로는 ‘인류에게 귀중한 자료를 모두 디지털화하자’는 취지로 인류에게 중요한 자료를 모아서 전자정보로 저장하고 배포하는 ‘프로젝트 구텐베르크’로 플라톤의 저술『향연』에서부터 최근 발표된 과학논문까지 어디서든 쉽게 누구나 열람할 수 있도록 했다. 이용료는 물론 모두 공짜이니 우리가 버린 그 10초는 얼마든지 자랑스러워해도 좋다. 이 ‘리캡차’는 2009년에 구글이 인수하여 ‘노캡차 리캡차’로 보다 강화되고 있다. 알고 있듯이 표지판이나 건물에 쓰인 글자 중 인식하기 어려운 문자를 문제로 제시해, 구글 지도 서비스 개선에 활용하고 있는 것이다. 게다가 구글은 2014년 12월, 모바일용으로 최적화된 새로운 캡차 기술을 선보이는데, 컴퓨터가 정교하게 이미지를 구분하는 능력이 부족하다는 점을 노리고, 이미지 검색에서 사진을 불러오는 방식으로 문제를 제시한다. 경험하셨겠지만 ‘나는 로봇이 아닙니다’라는 뜬금없는 체크박스로 사람과 로봇을 구별하는 방식을 쓰고 있는 것이다.

멈추지 않고 디지털의 사회공헌활동을 이어가는 루이스 폰 안 교수는 새로운 언어를 배우면서 인터넷상의 수많은 웹페이지를 무료로 빠르게 번역 할 수 있게 할 놀랄만한 ‘듀오링고’라는 그의 대망의 프로젝트를 발표하게 된다. 그는 ‘웹 전체를 번역할 사람들이 필요하다. 전문 번역가에게 돈을 주고 웹 전체를 번역 할 수 있겠지만 비용이 무지막지하게 든다. 그래서 모든 웹페이지를 무료로 세상의 주요 언어로 번역해 줄 1억명 정도의 사람이 필요하다’는 생각에 이른다. 그래서 ‘듀오링고’라는 웹사이트를 개발했고, 사람들은 웹을 번역하면서 무료로 외국어를 배우게 된다는 데 착안한 거다. 물론 전문 번역가의 수준에 도달하기 위해 여러 초보자들의 번역을 합치고, 이용자들은 배우면서 번역이라는 가치를 창조하게 되고, 마침내 가난한 사람들을 차별하지 않는 공평한 사업모델을 제공한다는 것이다.

인류의 거창한 업적들은 한 사람이 아니라 모두가 협력해서 한 일이라는 소신을 갖고, 혁신적인 아이디어와 디지털 기술로 루이스 폰 안 교수가 꿈꾸는 인류를 위한 위대한 협업은 쉼없이 이루어지고 있다. 디지털이 위대한가, 인간이 위대한가. 모를 일이다.

댓글