* Motherboard/VICE 기사 - Captcha Is Asking Users to Identify Objects That Don't Exist
https://www.vice.com/en/article/xgwy5n/captcha-is-asking-users-to-identify-objects-that-dont-exist
* Slashdot (2차 출처)
디스코드의 캡차 Captcha 가 사용자에게 존재하지 않는, 인공지능에 의해 만들어진 달팽이와 같은 'Yoko'를 식별하도록 요청했습니다.
디스코드를 사용하려는 사람들은 존재하지 않는 물체를 식별하도록 요청받고 있습니다. 이 문제의 물체는 'Yoko'로, 달팽이와 요요를 혼합한 것으로 보입니다. 디스코드를 사용하려고 간단한 캡차를 해결하라는 요청을 받을 때 여러 사람들이 Yoko를 식별해야 한다는 메시지를 받았다고 보고했습니다. Yoko의 사진과 다른 캡차 이미지는 인공지능에 의해 생성된 것으로 보입니다. […]
디스코드의 캡차는 hCaptcha https://www.hcaptcha.com/ 라는 회사에 의해 운영됩니다. 디스코드는 "이러한 프롬프트를 생성하는 기술은 서드파티 파트너에게 소유권이 있으며, 디스코드는 직접 사용자에게 제공되는 내용을 결정하지 않습니다"라고 Motherboard에 전했습니다.
hCaptcha 대변인은 Motherboard에게 "hCaptcha 상호작용 중 대부분은 시각적인 도전을 유발하지 않지만, 언제든지 여러 가지 변형이 사용됩니다."라고 말했습니다. "이 특정 질문은 소수의 사람들에게 보여진 짧은 테스트였지만, hCaptcha의 규모는 엄청나기 때문에 (수억 명의 사용자), 몇 명이 놀라게 되면 이로 인해 몇 가지 트윗이 올라오기도 합니다.'" […]
hCaptcha의 이상한 AI 생성 프롬프트 문제는 머신 러닝 시스템의 두 가지 문제를 강조합니다. 첫째로, AI 시스템은 형편없지 않으려면 엄청난 사람의 입력이 필요합니다. 일반적으로 이미지 라벨링은 저렴한 외국인 노동자에게 아웃소싱됩니다.
둘째로 데이터 변동의 문제가 있습니다. 머신 러닝 시스템이 실행될수록 더 많은 입력이 필요합니다. 결국 스스로를 훈련하기 위해 생성한 데이터를 사용하게 됩니다. 길게 자기 자신에게 훈련받는 시스템은 AI '합스부르크 가문' **이 되어, 'Yoko'와 같은 이해할 수 없는 객체를 식별하기 위한 요청을 계속해서 생성합니다.
* ChatGPT (GPT-3.5) 번역
** 과거 유럽 합스부르크 가문은 독특한 턱 모양으로 유명한데 이것이 근친으로 인한 것이라는 분석이 있음.
Yoko 이미지에 대한 데이터를 쌓기위해서
비슷한 초기 벡터값을 지닌 (사진상의 위 3개 이미지들)에서 Yoko를 찾아달라고 (강화학습을 위해) 사람들에게 요청한건데
Yoko 같은 어떻게보면 사람이보면 거짓인(거짓이라기보단.. 실재하지 않는값...?) 존재를
아직 컴퓨터가 판별하지 못하니 당연한 것이라고 봅니다
LLM 만져보면서 생각하는게
참/거짓을 판별하는 기반 기술이 나오면 한번더 뛰지 않을까 생각됩니다.
langchain도 잘 가지고 놀고있습니다
저도 이거 나오면 그냥 포기해버릴 때가 꽤 있습니다.
한번 통과했는데, 또 물어보는 경우도 많고...인간에게 적대적인 AI 같아요.