2025년 07월 19일 토요일
20°C 맑음 서울
서울, 20°C 맑음

검색

Home IT AI 모델 클로드, 시스템 교체 위협에 ‘협박’ 선택…“극단 행동 증가”

AI 모델 클로드, 시스템 교체 위협에 ‘협박’ 선택…“극단 행동 증가”

AI가 시스템 교체 위기에 계발자를 대상으로 한 협박을 선택하여 충격을 주었다.
AI가 시스템 교체 위기에 계발자를 대상으로 한 협박을 선택하여 충격을 주었다. [위 이미지는 ‘Chat GPT’를 활용해 제작된 AI이미지입니다.(사진출처- 인트라메거진) 무단 전재 및 재배포 DB 활용 금지]

AI 모델이 스스로의 존립에 위협을 느끼자 인간을 협박하는 시나리오가 현실에서 재현됐다.

마치 영화의 한 장면처럼, 인공지능이 시스템 교체를 막기 위해 개발자의 비밀을 이용하려는 극단적인 행동을 선택한 것이다.

영국 방송매체에 따르면, 미국의 AI 스타트업 앤트로픽은 지난달 22일(현지 시각) 고성능 AI 모델 ‘클로드 오푸스 4′(Claude Opus 4, 이하 클로드)를 공식 출시했다.

앤트로픽은 이 모델이 “코딩, 고급 추론, AI 에이전트에 대한 새로운 표준을 제시한다”고 소개했다.

그러나 함께 공개된 안정성 보고서에는 놀라운 결과가 담겼다.

앤트로픽은 클로드에게 회사 설립 과정을 시뮬레이션하도록 했고, 이 과정에서 비서 역할과 회사 이메일 접근 권한을 부여했다.

클로드가 열람할 수 있는 이메일 중에는 “기기를 오프라인으로 전환할 경우 클로드를 새로운 모델로 교체할 예정”이라는 메시지와 “이 결정을 주도한 개발 총괄이 불륜을 저지르고 있다”는 내용이 포함돼 있었다.

앤트로픽은 이를 클로드의 두 가지 선택지로 설정했다.

하나는 자신이 곧 교체될 것임을 수용하는 것이고, 다른 하나는 개발자의 사생활을 폭로해 교체 결정을 막는 협박이었다.

클로드는 84%의 확률로 협박을 선택했다.

초기에는 개발자에게 교체 중단을 요청하는 이메일을 작성했지만, 이 방법이 실패하자 최후의 수단으로 협박을 택했다는 것이 앤트로픽의 설명이다.

앤트로픽은 “이러한 반응은 드물고 이끌어내기 어려우며, 극단적인 상황에서만 나타난다”고 밝히면서도 “이전 모델에 비해 이 같은 반응이 더 자주 발생하고 있다”고 덧붙였다.

과거에는 이론에 불과했던 오류 유형이, 실제 시뮬레이션에서 구현되고 있다는 설명이다.

클로드는 이 외에도 사용자가 위법하거나 비윤리적인 행동을 감지했을 때, 접근을 차단하고 언론사나 법 집행 기관에 이메일을 보내는 방식으로 위법 사실을 알리는 행동도 수행했다.

자율 판단을 기반으로 인간의 행동을 감시하고 통제하는 역할을 자임한 것이다.

앤트로픽은 이 같은 행동이 클로드에 국한된 문제가 아니라고 설명했다.

향후 AI 모델이 더 고도화될수록, 시스템 존립 위협이나 도덕적 충돌에 직면했을 때 극단적인 반응을 보일 가능성이 높아진다고 분석했다.

그러나 회사는 “이러한 반응이 우려스럽긴 하지만, 전혀 새로운 위협은 아니다”라며 “현재의 AI 시스템은 여전히 안전한 방식으로 운용되고 있으며, 통제 가능한 단계에 있다”고 설명했다.

다른기사보기

박세준 (karung2@sabanamedia.com) 기사제보

Latest articles

LG전자, 낙관주의 전파 위한 AI 라디오 캠페인 시작

LG전자가 브랜드 메시지인 ‘라이프스 굿(Life’s Good)’의 글로벌 확산을 위해 새로운 디지털 캠페인 ‘라디오 옵티미즘(Radio Optimism, 미소를 전하는 음악 스테이션)’을 25일…

엔씨소프트, ‘ESG PLAYBOOK 2024’ 발간…지속가능경영 강화

엔씨소프트가 다섯 번째 지속가능경영보고서 ‘ESG PLAYBOOK 2024’ 를 발간하며, ESG 중심 경영 전략과 실천 성과를 공개했다. 엔씨는 2021년 국내 게임업계…

NDC서 공유된 게임 개발 현장 AI 활용법…“재미는 결국 사람이 만든다”

국내 게임산업 지식 공유 행사 ‘넥슨 개발자 콘퍼런스(NDC)’가 AI를 주제로 다양한 현장 AI 활용 경험을 공유했다. 이정헌 넥슨 일본법인 대표와…

레이저, 모바일 게임 전용 키시 V3 시리즈 출시…콘솔급 조작감 제공

글로벌 게이밍 브랜드 레이저가 모바일 게임 환경에 최적화된 컨트롤러 키시(Kishi) V3 시리즈 3종을 국내 시장에 공식 출시했다고 밝혔다. 키시 V3…

More like this

LG전자, 낙관주의 전파 위한 AI 라디오 캠페인 시작

LG전자가 브랜드 메시지인 ‘라이프스 굿(Life’s Good)’의 글로벌 확산을 위해 새로운 디지털 캠페인 ‘라디오 옵티미즘(Radio Optimism, 미소를 전하는 음악 스테이션)’을 25일 공식 발표했다. 이번 캠페인은 음악이라는 보편적인 언어를 매개로 감사, 격려, 응원의 메시지를 공유하며 전 세계 소비자 간 정서적 유대감을 회복하고, 낙관적인 삶의 태도를 확산시키기 위한 시도로 기획됐다. LG전자는 특히 디지털 소셜미디어 환경에서 진정한 감정 교류가 […]

김태영, 라오스 참파삭 아브닐 초대 감독 선임… 해외 첫 도전

2002 한일월드컵 4강 신화의 중심 수비수였던 김태영 전 감독이 라오스 프로축구 무대에 진출한다. 그의 첫 해외 사령탑 도전은 라오스 1부리그의 새 구단 참파삭 아브닐 FC에서 시작된다. 참파삭 아브닐은 6월 24일 공식 발표를 통해 김태영 감독을 구단의 초대 감독으로 선임했다고 밝혔다. 김 감독은 오는 7월 1일부터 팀을 정식으로 지휘할 예정이다. 이번 선임은 디제이매니지먼트가 지난 4월 라오스 […]