여전히 사람이 수행하는 것이 정확
엉뚱한 결과 제시에 따른 책임 여부 논란 가중
인간은 여전히 온라인에서 정답을 찾는 데 인공지능보다 뛰어나다. 이 점에서는 다행이라는 의견이 지배적이다. 구글의 화려한 소동 이후 두 달이 지났다. 새로운 인공지능(AI)의 대략적인 기능은 여러 검색 결과를 기반으로 쿼리에 대한 읽기 쉬운 답변을 제공해 "검색의 번거로움을 덜어주는 것"이어야 했다.
대신, 인공지능은 사람들에게 돌을 먹고 피자에 치즈를 붙이라는 레시피를 제시했다. 아프리카의 어느 나라가 알파벳 "K"로 시작하는지 구글에 물어볼 수 있고 그 결과를 구글은 어느 것도 없다고 답을 제시하지 않는다.
그런데 사실, AI 검색은 재앙이기 때문에 여전히 잘못된 답변을 제시한다. ‘K’로 시작하는 아프리카 국가는 없는데 AI는 있다고 가상의 국가를 제시한다.
AI 분야의 주요 업체들은 지난 봄을 바쁘게 보냈고 사람들은 덕분에 AI 검색의 획기적인 전환점이 다가온 것처럼 생각했다. 그 중 하나는 구글 AI 업데이트였고 다른 하나는 이미 가치 있는 인터넷 검색 엔진인 구글의 대안으로 제시된 AI 기반 검색 스타트-업인 퍼플렉시티(Perplexity)의 등장이다.
퍼플렉시티(Perplexity)는 페이지(Pages)라는 새로운 기능을 출시해 마치 똑똑한 친구가 숙제를 해주는 것처럼 특정 주제에 대한 정보로 가득 찬 사용자 정의 웹 페이지를 만들 수 있다. 그러다가 퍼플렉시티가 표절 혐의로 적발됐다. AI 검색이 잘 작동하려면 약간의 속임수를 써야 하는 지도 모를 일이다.
검색에서는 여전히 구글이 대세
AI 검색의 실수에 대한 악의적 댓글이 넘쳐나고 비판자들이 한꺼번에 동원되었다. 온라인 퍼블리셔와 크리에이터 그룹이 국회의사당을 찾아가 의원들에게 구글의 AI 개요 기능과 독립 크리에이터의 콘텐츠를 가져오는 기타 AI 기술을 조사하도록 로비했다.
이는 미국음반산업협회(RIAA)와 주요 음반사 그룹이 텍스트에서 음악을 생성하는 두 개의 AI 회사를 저작권 침해로 고소한 지 불과 며칠 만에 나온 것이다.
그리고 뉴욕타임스를 포함한 여러 신문들이 검색 도구를 구동하는 동일한 AI 모델을 훈련시키기 위해 콘텐츠를 스크랩한 오픈AII와 마이크로소프트를 저작권 침해로 고소했다는 사실을 상기시킨다.
생성형 AI 기술은 웹을 검색하는 방식을 변화시킬 것으로 예상된다. 적어도 2022년 말 챗GPT가 폭발적으로 등장한 이후 세상에 넘쳐나는 것이 AI 기반 모듈이다. 이제 모든 기술 대기업은 마이크로소프트에 코파일럿(Copilot), 구글에 제미니(Gemini), 애플에 애플 인텔리전스(Apple Intelligence) 등 자체 AI 기술 브랜드를 추진하고 있다. 이런 도구는 온라인에서 물건을 찾는 데 도움이 되는 것 이상을 할 수 있지만 여전히 구글을 검색의 왕좌에 앉히고 있다.
그만큼 AI가 검색 엔진과 정확도에서 따라가야 할 기술이 잇다는 것을 보여준다. 심지어 챗GPT의 제조사인 오픈AI도 구글과 직접 경쟁하기 위해 검색 엔진을 구축하고 있다. 그러나 많은 기업들의 공개적인 노력에도 불구하고 AI 검색으로 인해 온라인에서 답을 찾는 것이 당분간 쉽지 않을 것이라고 전문가들은 말한다.
몇 가지 결함으로 인해 AI 검색이 아직 황금 시대를 준비하지 못했을 뿐만 아니라 이런 결함이 AI 검색의 작동 방식에 너무 깊이 통합되어 구글을 대체할 만큼 충분히 좋아질 수 있을지 불분명하다는 것이다. AI는 좋은 추가 기능이며, 정말 유용하게 써먹을 때가 있다. 하지만 여전히 전통적인 구글 검색이 필요하고 여전히 가장 정확하고 안전하다. AI 검색의 결함은 최근 구글의 AI 시연과 퍼플렉시티(Perplexity) 커플러에서 드러났다.
피자와 접착제 그리고 AI
빠른 답변을 원하지만 필요한 모든 정보를 취합할 시간이 없는 경우가 있다. 검색은 AI 개요를 통해 작업을 수행한다. 사람들은 검색 Labs의 실험을 통해 이미 AI Overviews를 수십억 번 사용했다. 주제에 대한 빠른 개요와 더 많은 것을 배울 수 있는 링크를 모두 얻을 수 있다는 것을 좋아한다.
AI 개요를 통해 사람들은 구글 검색을 더 많이 사용하고 결과에 더 만족할 것으로 기대했다.
AI Overviews가 모든 사람에게 배포되기 시작하면 다른 국가에서도 출시될 예정이었다. 즉, 수억 명의 사용자가 AI Overviews에 액세스해 올해 말까지 10억 명 이상이 AI Overviews를 이용할 수 있을 것으로 예상했다. AI 개요를 통해 사람들은 더 복잡한 질문에 대한 도움을 받기 위해 더 다양한 웹사이트를 방문하도록 유도할 계획이었다. 또한 AI Overviews에 포함된 링크는 페이지가 해당 검색어에 대한 기존 웹 목록으로 표시된 경우보다 더 많은 클릭을 얻을 것으로 기대했다.
이 경험을 확장하면서 퍼블리셔와 크리에이터에게 가치 있는 트래픽을 보내는 데 집중해 결과적으로 광고 수익을 더 모으려 했다. 늘 그렇듯이 광고는 페이지 전체의 전용 슬롯에 계속 표시되고, 유기적 결과와 스폰서 결과를 구분하기 위한 명확한 라벨링이 제공되어야 한다.
그런데 이런 계획은 완전히 물거품이 되었다. 수제 피자를 만들기로 작정하고 저녁 시간을 쪼개어 파이를 조립해 오븐에 넣고 먹을 것을 기대한 사람이 컴퓨터에서 구글 AI에게 도움을 요청했다.
그러나 기름진 음식을 한 입 먹을 준비를 하면 치즈가 바로 떨어지는 문제에 봉착하게 된다. 좌절감을 느낀 이 사람은 해결책을 찾기 위해 구글에 도움을 요청한다.
AI가 내놓은 답은 접착제를 좀 넣으라는 것이었다. 엘머(Elmer's) 접착제 약 1/8컵을 소스와 섞으면 무독성 접착제가 효과가 있다고 제시했다.
하지만 이 글을 쓰는 시점에서 구글의 새로운 AI 개요 기능은 완전히 멈췄고 출시는 완전히 연기했다.
이 기능은 모든 쿼리에 대해 트리거되지는 않지만 웹을 스캔하고 AI 생성 응답을 제시한다. 피자 접착제 쿼리에 대해 받은 답변은 10년이 지난 레딧(Reddit) 스레드에서 "fucksmith"라는 사용자의 댓글을 기반으로 한 것으로 보여 분명히 농담이란 것을 알 수 있다. 농담을 AI는 진담으로 받아들였고 사람은 그것이 농담이란 것을 안다.
구글이 출시한 새로운 AI 기능에서 많은 실수가 나타났는데 제임스 매디슨 전 미국 대통령이 위스콘신 대학을 21번이나 졸업했고, 개는 NBA, NFL, NHL에서 뛰었고, 배트맨은 경찰이라고 주장했다.
많은 문제들은 초기 기술의 성장통에 불과하다고 믿는다. 하지만 한 가지 확실한 것은 누군가가 정말 피자에 접착제를 바르는 일이 있을 것이란 사실이다.
거짓 정보와 속임수 소동의 의미
구글 피자 접착제 사건은 생성형 AI의 환각 문제가 얼마나 완고한지를 보여준다. 구글이 AI Overview를 출시한 지 불과 며칠 후, 일부 사용자는 Google에 피자에서 치즈가 떨어지지 않도록 하는 방법을 물어보면 구글에서 접착제를 추가할 것을 제안한다는 사실을 알게 되었다.
이 특정 답변은 어떤 이유로 구글의 AI가 권위있는 출처라고 생각한 오래된 레딧(Reddit) 스레드에서 나온 것으로 보였는데, 사람은 레딧 이용자가 접착제를 먹는 것에 대해 농담하고 있다는 것을 빠르게 이해할 수 있다.
그런데 몇 주가 지나서 구글의 AI 개요 기능이 여전히 피자 접착제를 권장하고 있다는 것을 알았고 이는 대대적으로 보도되었다. 구글은 바이럴 실패 이후 5월에 AI 개요 기능을 출시했기 때문에 현재 AI 개요에 전혀 액세스하기 어렵다.
문제는 생성형 AI 도구를 구동하는 대규모 언어 모델이 특정 상황에서 환각을 일으키거나 정보를 구성할 수 있다는 것만이 아니다. AI는 적어도 현재까지는 좋은 정보와 나쁜 정보를 구별할 수 없다. 사람들은 AI를 이용하면서 확실한 진실만 접할 것이라고 간주한다.
하지만 현실은 그렇지 못하고 AI를 사용하지 않은 사람은 그 정보가 거짓이라는 것을 알 수 있다. 하지만 이런 착각을 줄이는 데 많은 진전이 있었고 AI를 사용할 수 있을 만큼 충분히 좋아지는 지점에 언젠가는 도달할 것이 확실하다.
최근의 퍼플렉시티(Perplexity) 소동은 AI 검색의 또 다른 문제점을 보여준다. AI 검색은 해서는 안되는 콘텐츠에 액세스하고 다시 게시한다. 제프 베조스(Jeff Bezos)와 엔비디아(Nvidia) 등이 투자자로 참여한 퍼플렉시티(Perplexity)는 검색어에 대한 심층적인 답변을 제공하고 출처를 공개함으로써 명성을 얻었다.
질문을 제공하면 웹에서 인용한 내용이 포함된 대화형 답변이 함께 표시되며, 더 많은 질문을 통해 구체화된 답을 얻을 수 있다.
그러나 퍼플렉시티(Perplexity)가 페이지(Pages) 기능을 출시했을 때 AI가 저널리즘을 뜯어고칠 수 있는 놀라운 능력이 있다는 것이 분명해졌다.
심지어 생성된 페이지를 웹사이트의 뉴스 섹션처럼 보이게 만들어 당혹감이 커졌다. 이 회사가 발행한 한 페이지에는 에릭 슈미트(Eric Schmidt)의 드론 프로젝트에 대한 포브스(Forbes)의 독점적인 유료 탐사 보도 요약이 포함되어 있었다.
포브스(Forbes)는 퍼플렉시티(Perplexity)가 콘텐츠를 훔쳤다고 비난했고, 와이어드(Wired)는 퍼플렉시티(Perplexity)가 이런 스크랩을 수행하는 크롤러 유형을 차단한 웹사이트에서 콘텐츠를 스크랩하고 있다고 나중에 보도했다. AI 기반 검색 엔진은 URL 또는 메타데이터의 세부 정보를 기반으로 쿼리에 대한 잘못된 답변을 구성할 수도 있다. 그런데 퍼플렉시티(Perplexity)의 CEO는 작동하는 방식에 대한 근본적인 오해가 있다고 생각한다고 말했다.
아직은 부족한 AI, 인간이 우월
AI 기반 검색이 소싱에서 악취를 풍기는 이유는 기술적이면서도 단순하다. 기술적인 설명에는 RAG(Retrieval-Augmented Generation)라는 객관적인 추출 방식이 포함되는데, 이는 교수의 개인 레퍼런스가 충분하지 않을 때 특정 주제에 대한 더 많은 정보를 찾기 위해 연구 조교를 모집하는 것과 약간 비슷하게 작동한다.
RAG는 현재 세대의 대규모 언어 모델이 환각의 빈도를 포함해 콘텐츠를 생성하는 방법과 관련된 몇 가지 문제를 해결한다. 하지만, 좋은 소스와 나쁜 소스를 구별할 수 없다는 새로운 문제를 야기한다.
현재 상태에서 AI는 올바른 판단력이 부족한 것이 현실이다.
모두가 구글 검색을 할 때 파란색 링크의 긴 목록에는 신문 기사와 같은 고품질 링크와 오래된 레딧(Reddit) 스레드 또는 저품질 또는 확인되지 않은 항목이 포함된다는 것을 알고 있다. 엔지니어들이 자신의 인터넷 검색 기술을 완성하는 수년간의 경험 덕분에 순식간에 좋은 것과 나쁜 것을 구별할 수 있게 되었다.
그리고 AI가 가지고 있지 않은 몇 가지 상식이 있는데, 예를 들어 돌과 접착제를 먹어도 괜찮은 지 아닌지 알고 있다는 사실이다.
그런데 AI 기반 검색은 아직 그런 능력이 없다. 지난 25년 동안 수많은 기술 변화 속에서 구글은 구글 검색의 기능을 지속적으로 재구상하고 확장해 왔다.
구글은 웹에 있는 최상의 정보를 찾을 수 있도록 핵심 정보 품질 시스템을 꼼꼼하게 연마했다. 또한 사람, 장소, 사물에 대한 수십억 개의 사실로 구성된 지식 기반을 구축해 눈 깜짝할 사이에 신뢰할 수 있는 정보를 얻을 수 있다.
그런데 이제 생성형 AI를 통해 검색은 상상했던 것보다 더 많은 일을 할 수 있다. 따라서 연구부터 계획, 브레인스토밍에 이르기까지 마음속에 있는 것이나 해야 할 일이 무엇이든 물어볼 수 있고 구글이 대신 그 발품을 팔아준다.
다음에 AI 개요를 볼 때 선입견을 갖고 실행해야 한다는 의미는 아니다. 그러나 답을 얻는 쉬운 방법으로 생각하는 대신 시작점으로 생각해야 한다.
위키피디아가 반은 맞고 반은 틀린 정보를 담고 있는 것과 같다. 그 답변이 어떻게 구글 검색 상단에 올라갔는지 알기 어렵기 때문에 출처를 확인하는 것이 중요하다. 결국, 구글을 직접 검색하는 사람들이 AI보다 더 똑똑하다고 말할 수 있다.
Comments