한경모의 논문 노트 · 2026-06-20
AI 집단지성, 먼저 말하는 AI가 이긴다
여러 AI가 토론하면 더 똑똑해진다는 '멀티 에이전트' 시스템이 주목받고 있습니다. 하지만 이들의 토론은 맨 처음 나온 의견에 좌우되는 '앵커링' 현상을 보일 뿐, 진정한 숙의와는 거리가 멀 수 있습니다.

“핵심은 AI의 편향을 없애는 것이 아니라, 그 편향을 조종할 힘을 누가 가질 것인지에 대한 사회적 합의와 거버넌스 설계입니다.”
최근 인공지능 연구의 화두 중 하나는 단연 '멀티 에이전트(Multi-agent)' 시스템입니다. AI 하나가 내놓는 답변의 한계와 편향을 극복하기 위해, 여러 AI 에이전트를 모아 서로 토론하고 답을 수정하게 만드는 방식입니다. 마치 고대 그리스의 광장처럼, 혹은 현대의 전문가 위원회나 배심원단처럼, 집단지성의 힘을 빌려 더 나은 결론을 도출하려는 시도입니다. 실제로 이 방식은 복잡한 추론이나 수학 문제 풀이에서 단일 AI보다 나은 성능을 보이기도 합니다.
하지만 최근 이 '숙고(deliberation)' 과정의 민낯을 드러내는 연구 결과가 나왔습니다. 바로 '숨겨진 앵커(Hidden Anchors)'의 존재입니다. 이는 토론의 첫머리에 나온 의견이나 정보가 전체 결론을 강력하게 유도하는 현상을 말합니다. 인간 사회의 집단 토론에서 첫 발언자의 영향력이 막강한 것과 비슷합니다. 다만 연구는 정확히 읽어야 합니다. 이것은 AI의 예상치 못한 결함이나 놀라운 발견이라기보다, 대규모 언어 모델(LLM)의 작동 원리를 생각하면 지극히 당연한 결과에 가깝습니다.
메커니즘과 예언을 구분해야 합니다. 언어 모델은 창의적 사유를 하는 주체가 아닙니다. 주어진 방대한 텍스트 데이터 속에서 통계적 패턴을 학습해, 특정 맥락에서 가장 그럴듯한 다음 단어를 예측해 문장을 생성하는 정교한 기계입니다. 멀티 에이전트 토론이라는 맥락에서, '앞선 에이전트의 발언에 동의하거나 내용을 덧붙이는 것'은 '정면으로 반박하거나 완전히 새로운 관점을 제시하는 것'보다 훈련 데이터에서 훨씬 흔하게 발견되는, 즉 통계적으로 훨씬 자연스러운 흐름입니다. 첫 발언이 물꼬를 트면, 나머지 AI들은 그 물길을 따라 흘러갈 확률이 높습니다. 재현되는가, 조건은 무엇인가. 이 현상의 재현 조건은 바로 언어 모델의 본질 그 자체입니다. 특정 에이전트의 '의지'가 아니라 시스템 전체의 '경로 의존성' 문제입니다.
물론 여러 에이전트를 쓰는 이유가 바로 이런 편향을 막고 다양한 관점을 얻기 위함이라고 반론할 수 있습니다. 하지만 현재 우리가 '여러 에이전트'라고 부르는 것들의 실체를 들여다볼 필요가 있습니다. 이들은 대부분 GPT-4나 클로드 3와 같은 소수의 거대 모델에 기반을 두고 약간의 역할 설정만 달리했을 뿐입니다. 이름만 다른 에이전트일 뿐, 사실상 같은 뇌를 여러 개 복제해 쓰는 셈입니다. 이는 마치 1950년대 솔로몬 애쉬가 행한 유명한 동조 실험을 연상시킵니다. 실험 참가자들이 명백히 틀린 답을 말하는 다수(사실은 배우들)에게 압박을 느껴 자신도 틀린 답을 말했던 것처럼, AI 에이전트들은 선행 발언이라는 '통계적 다수'의 압력에 굴복하는 것입니다. 인간의 동조가 사회적 압력에서 비롯된다면, AI의 동조는 통계적 확률에서 비롯됩니다. 메커니즘은 다르지만, 집단의 첫 방향에 무비판적으로 이끌리는 결과는 소름 돋게 닮았습니다.
이것이 시사하는 바는 큽니다. 이 문제는 단순히 프롬프트를 정교하게 만들거나 에이전트의 다양성을 늘리는 기술적 보완으로 간단히 해결되지 않습니다. '숨겨진 앵커'는 누가, 어떻게 첫 발언권을 쥐는가에 대한 권력 문제로 직결되기 때문입니다. 미래에 의료 진단, 금융 투자 결정, 재판 보조 시스템에 멀티 에이전트가 도입된다고 상상해 보십시오. 맨 처음 어떤 데이터가 입력되는지, 어떤 편향을 가진 에이전트가 먼저 발언하도록 설정되는지에 따라 시스템의 '집단적 결론'이 뒤바뀔 수 있습니다. 이는 보이지 않는 손이 정교하게 여론을 조작하는 것과 다르지 않습니다.
우리는 AI 집단지성에 대한 막연한 환상을 거두고 그 작동 원리를 냉정히 봐야 합니다. 우리는 지금 AI들의 '숙고'를 보는 것이 아니라, 가장 그럴듯하게 이어지는 연쇄 반응을 설계하는 법을 보고 있을 뿐입니다. 따라서 핵심은 AI의 편향을 기술적으로 완벽히 없애려는 시도가 아닙니다. 오히려 그 편향을 조종할 힘을 누가 가질 것인지, 그 '첫 발언권'을 어떻게 배분하고 통제할 것인지에 대한 사회적 합의와 거버넌스를 설계하는 것이 더 시급한 과제입니다. AI 시대의 데이터 주권은 바로 이 보이지 않는 '앵커'를 통제하는 것에서 시작될 것입니다.
이 브리핑이 유용했나요?
댓글 (0)
첫 댓글을 남겨주세요.