인공지능 챗봇 검색이 아직은 먼 이유, 그리고 일론 머스크는 또 일론 머스크했습니다.
인공지능 챗봇 검색, 아직 갈 길이 먼 이유
지난주에 검색계의 쌍두마차(그런 게 있다면요)인 구글과 마이크로소프트의 빙이 인공지능 챗봇 기반의 검색 기술을 공개했습니다. 둘은 공통점이 꽤 있습니다. 자연스럽게 검색하고 싶은 주제를 물어보면 검색어를 알아서 결정해서 검색한 후, 다양한 웹사이트를 긁은 결과를 모아 자연스러운 문장 형태로 모아서 보여줍니다. 챗봇이 어디서 자료를 긁어왔는지 주석으로 보여주기 때문에 직접 들어가서 추가로 확인해보는 것도 가능합니다. 아, 그리고 둘 다 공식 시연에서 대놓고 틀린 대답을 했다는 점도 공통점이겠네요.
먼저 이 사실이 알려진 것은 구글의 검색 챗봇인 "바드"였습니다. 바드를 공개하는 내용을 담은 구글의 보도자료에 첨부된 비디오 시연에서 바드는 제임스 웹 천체망원경이 태양계 밖의 행성을 처음으로 촬영한 천체망원경이라고 답했습니다. 하지만 이건 사실이 아니었던 것으로 밝혀졌습니다. 이 사실이 알려진 후, 구글의 주식이 대폭 하락하면서 무려 1,000억 달러가량의 시가총액이 날아가기도 했습니다.
빙도 비슷한 운명을 피해 갈 수는 없었습니다. 마이크로소프트가 빙 챗 기능을 선보인 언론 대상 행사에서 시연하는 과정에서 여러 가지 정보를 틀렸다는 것입니다. 먼저, 선이 없어야 할 무선 청소기의 선이 짧은 게 단점이라고 하기도 했고, 멕시코 시티의 바를 소개하는 과정에서 추천한 바들의 특징을 잘못 전달하기도 했습니다. 하지만 가장 큰 오류는 바로 챗GPT를 기반으로 한 엣지의 새로운 인공지능 기능을 시연하던 도중 기업의 회계 실적 보고서를 요약하는 과정에서 관련 데이터가 전부 틀렸다는 점이었습니다. 시연에서 빙 챗은 의류 기업인 갭의 회계 실적을 요약하는 일을 맡았는데, 매출과 전년 대비 증가율은 쉽게 맞췄으나 이후 실제로는 38.7%였던 총이윤을 37.4%라고 잘못 얘기하는 실수를 저질렀고, 이후에는 문서에 있지도 않은 운영 마진율과 희석 주당 이익을 지어내기까지 했습니다. (다른 출처에서 나오는 수치조차 달랐습니다) 다음에는 갭의 실적을 룰루레몬과 비교하기도 했는데, 이 과정에서도 룰루레몬의 다양한 수치를 틀리게 답했습니다. 해당 이벤트에 참석했던 더 버지의 편집장인 닐레이 파텔은 더 버지의 팟캐스트인 버지캐스트에서 "시연이 라이브로 진행된 것이 아닌, (시간상의 이유로) 미리 녹화된 걸 보여준 것이었기 때문에 마이크로소프트 측에서 (팩트 체크를 하고) 틀린 부분은 알아서 편집했을 줄 알았다."라며 자체적으로 팩트 체크를 안 한 게 실수였음을 시인하기도 했습니다.
이 두 가지 이야기를 들으면서 저는 인공지능 챗봇 검색은 완전 자율 주행차와 비슷하다는 생각이 들었습니다. 둘 다 눈앞이라고 모두가 얘기하지만, 현실적으로는 아직 멀었기 때문이죠. 모두가 눈앞이라고 생각하는 것은 기술 자체는 거의 완성된 것은 맞기 때문이지만, 문제는 그 주변의 사람들입니다. 완전 자율 주행도 비록 기술적으로는 완성에 가까울지 몰라도, 여전히 주변의 인간 운전자라는 변수를 대하는 방법을 잘 몰라서 사고를 냅니다. 인공지능 챗봇 검색도 자체적으로 검색할 키워드를 정해서 나온 검색 결과에 나오는 웹페이지들의 정보를 크롤링하고 이를 정리해서 사용자에게 알려주는 것은 잘 할 수 있겠지만, 크롤링한 정보가 실제로 올바른 정보인지 너무 옛날에 올라와서 지금은 잘못됐거나 애초에 엉뚱한 정보를 올려놨는지에 대해서는 아직은 판단을 못 하는 셈입니다. 결국, 그 능력은 좋을지언정, 애초에 사람이 올린 정보가 (자의인지 타의인지는 둘째치고) 틀려버리면 사용자에게 잘못된 정보를 당당하게 알려주는 셈이 됩니다.
여기서 기존에 우리가 검색하던 방식이 왜 여태껏 살아남았는지를 알 수 있습니다. 물론 사람도 실수를 할 수 있지만, 인공지능과 다르게 최소한 이 정보가 맞긴 한지를 고려하기 때문입니다. 아직 구글이나 빙 모두 이런 고려를 아예 하지 않거나, 하더라도 매우 부족하다는 느낌이 듭니다. 결국 구글이나 마이크로소프트 모두 이 부분을 어떻게 해결해야 할지에 대한 고민은 필요해 보입니다. 최소한 지금 보다 사용자가 팩트 체크를 더 쉽게 할 수 있도록 인터페이스를 개선하는 것이 좋겠죠. 물론 모든 사람이 올바른 정보를 올렸다면 이런 일은 벌어지지 않았겠습니다만, 그건 인간이라는 존재에 대해서 너무 순진하게 생각하는 건 아닐까요?
관심종자 일론 머스크의 귀환
지난 한 주간 트위터의 추천 피드에 일론 머스크의 트윗이 지나치게 많이 보이는 것을 눈치채셨을지도 모르겠습니다. 저 같은 경우는 아무래도 머스크의 써드파티 앱 아포칼립스 이후 트위터를 잘 안 보는 관계로 약간 축약본을 본다는 느낌으로 추천 피드를 쓰려고 했는데, 머스크가 단 답글로 도배된 걸 보고 결국 팔로잉 위주로 피드를 보고 있습니다.
이게 "기분 탓"이 아니었다는 게 이후에 밝혀졌습니다. 일론 머스크가 트위터 직원들에게 추천 피드에 자신의 트윗이 먼저 뜨도록 알고리즘을 바꾼 사실이 알려졌기 때문이죠. 이 방식은 기존 트위터의 추천 알고리즘에서 머스크의 트윗을 우선순위로 지정하여 통과하도록 알고리즘을 변경한 것입니다. 머스크의 트윗은 다른 사람들의 트윗보다 무려 1,000배 더 높은 우선권이 주어졌다고 하는데요. 이 과정에서 많은 사람의 피드에 일론의 트윗들만 보이는 상황이 벌어졌던 것이고요. 결국 머스크는 "'알고리즘'을 조정하고 있다.."라는 트윗을 올려야 했습니다.
이 사단의 기원은 그 전 주로 올라갑니다. 머스크는 자신이 올리는 트윗들이 팔로워 수에 비해서 조회수가 그리 높지 않은 것을 보고 엔지니어들을 모아 회의를 열었습니다. 이 회의에 참석한 트위터의 (작년 11월의 대숙청 이후) 몇 남지 않은 시니어 엔지니어들은 머스크의 전반적 인기가 하락하고 있다는 분석을 내놨습니다. 그들은 구글 트렌드 자료를 근거로 제시했는데, 작년 4월에 트위터 인수를 발표했을 때 머스크의 인기 점수를 100점으로 친다면, 지금은 고작 9점밖에 안 된다는 것이었습니다. 사실상 대표의 면전에 "당신이 쳐 놓은 깽판 때문에 당신 인기가 떨어졌다"라고 대놓고 말한 거죠. 여기에 트위터 알고리즘 자체에는 문제가 없다는 의견도 첨부했습니다.
이에 공분한 머스크는 그 자리에서 엔지니어를 해고했습니다.
다시 지난주로 돌아와서, 월요일 새벽부터 머스크는 엔지니어들을 불러 모아서 알고리즘 수정을 지시했습니다. 그 기원은 바로 조 바이든 대통령과 자신이 똑같이 전날 있었던 슈퍼볼(미식축구 결승전) 트윗을 올렸는데, 바이든의 조회 수가 훨씬 더 많았다는 게 (머스크에겐) 문제였습니다. (바이든은 약 2,700만 회, 머스크는 910만 회) 그 결과가 모두의 피드에 도배된 머스크의 트윗이었던 것이죠.
사실 이게 머스크만의 문제는 아닙니다. 머스크는 각각 트윗의 조회 수를 보여주는 기능을 선보였었는데, 머스크는 그 당시에 "많은 트위터 사용자가 트윗을 보기만 하고 리트윗이나 '좋아요'를 누르지 않기 때문에 조회 수가 트윗의 실제 성과를 보여줄 것"이라고 밝혔었습니다.. 하지만, 조회수 카운터는 도리어 트위터가 얼마나 소셜네트워크 플랫폼으로서 죽어가고 있는지를 역설적으로 보여주는 꼴이 되었습니다. 모두가 팔로워 수와 비례해서 훨씬 적은 조회 수를 보인다는 것이 밝혀진 것이죠.
아무튼 머스크도 자신의 트윗을 우선시한 새로운 알고리즘이 역효과를 냈음을 간접적으로 인정했고, 이후에 알고리즘도 조금씩 다시 수정되는 듯한 모습입니다만, 이번 사건을 통해 머스크가 처음에 트위터를 사겠다고 했던 의도가 다시금 투명하게 보이는 부분이었다 할 수 있겠습니다. 머스크는 결국 돈 많은 관심종자니까요.
단신들
- 유튜브의 CEO였던 수잔 워치즈키가 은퇴한다고 발표했습니다. 후임은 CPO(최고제품책임자)였던 닐 모한입니다. 워치즈키는 구글의 창업자인 세르게이 브린과 래리 페이지가 구글을 창업했을 때 자신의 집의 차고를 빌려준 것으로 인연을 시작하여 구글에 사번 16번으로 입사했습니다. 그 이후 25년 동안 구글의 이미지 검색과 비디오 및 도서 검색 개발을 지휘하고, 이후에는 애드센스와 더블클릭 인수에 도움을 주는 등 구글이 지금의 인터넷 광고 공룡이 되는데 큰 공헌을 했던 인물입니다. 그 이후 2014년부터는 유튜브의 CEO로 재직하면서 크리에이터와의 수익 구조 분할이라는 사업 모델을 개발하여 지금까지도 틱톡이나 인스타그램 등 다른 플랫폼에서 따라오기 힘든 안정적인 크리에이터 수익 구조를 만드는 데 기여했습니다. 물론 여타 다른 소셜 플랫폼이 그렇듯이 유해한 콘텐츠를 관리하는 데는 어쩔 수 없는 한계를 보여줬다는 평가를 받기도 합니다.
- 마이크로소프트가 윈도우 11의 ARM 버전을 일반 사용자용으로도 정식 라이센스를 내주기로 했습니다. 이는 애플의 애플 실리콘(M1 및 M2 기반) 맥들을 위한 정책인데, 상용 가상 머신 앱인 페러렐즈 데스크톱에 윈도우를 설치할 때 자동으로 라이센스가 부여되어 설치되는 것으로 보입니다. 여태까지 ARM용 윈도우 11의 정식 버전은 ARM 칩을 장착한 하드웨어에만 OEM 라이센스 형식으로 부여됐었기 때문에 페러렐즈에 설치하려면 라이센스가 필요 없는 체험판 버전을 설치하는 방법으로 우회하는 방법밖에 없었는데, 마이크로소프트가 페러렐즈와 정식 계약을 맺고 라이센스를 공급해주는 것으로 보입니다. 마이크로소프트는 이 외에도 서버에 있는 가상 윈도우 11 PC를 빌려서 사용할 수 있는 윈도우 365 서비스를 이용해도 애플 실리콘 맥으로 윈도우를 사용할 수 있다고 안내하고 있습니다. 다만 이 솔루션은 기업 전용이라 일반인이 접근하기에는 애로사항이 많습니다.
- 테슬라가 무려 36만 대에 달하는 규모의 리콜을 발표했습니다. 대상은 완전자율주행, 즉 FSD 베타 버전을 탑재한 차량 전체라고 하는데, 사거리에서 좌/우회전 전용 차로에서 직진하거나, 정지 표지판이 있는 사거리에서 완전한 정지를 하지 않거나, 신호등에 노란불이 켜졌음에도 주의 없이 진행하는 등의 잘못된 행동 양상으로 인해 사고를 일으킬 수 있다는 점이 주요 원인으로 지적되었습니다. 결국은 소프트웨어 문제이기 때문에 OTA 업데이트를 하는 방식으로 진행됩니다. 이를 두고 머스크와 일부 테슬라 팬들은 "서비스 센터에 안 가지고 가도 되니까 리콜은 아니지 않냐"라는 주장을 펼치는 모양인데, 그 논리면 이 사건도 리콜은 아니었겠네요.