[IT 소식 톺아보기- 11월 4주차] 오픈AI o3 모델 의도적 성능 낮추는 사례 발견...‘일본 히단쿄’, 비핵화 요구 성명 발표

  • 등록 2025.11.22 19:11:53
크게보기

일본원폭피해자협회 ‘일본 히단쿄’, 비핵 3원칙 견지 등 요구 성명 발표
로블록스, 청소년 보호 위해 채팅 기능에 연령 인증 의무화

‘M이코노미뉴스’에서 한 주간 놓치지 말아야 할 국내외 주요 IT 이슈 3가지를 선정, 요약해 보고자 합니다. 이번 주에는 오픈AI o3 모델을 실험실에서 테스트한 결과 일부 제출 문제를 의도적으로 틀리며 성능을 낮춘 사례가 보고됐다는 소식, 일본원폭피해자협회 ‘일본 히단쿄’가 일본 총리에 비핵 3원칙 견지 요구 성명을 발표했다는 소식, 온라인 게임 플랫폼 로블록스가 청소년 보호를 위해 채팅 기능에 연령 인증을 의무화했다는 소식 등 세 가지를 단신으로 소개합니다.

 

 

1. 오픈AI o3의 ‘샌드배깅’ 논란...의도적 정렬로 위험 낮춰가는 중


오픈AI(OpenAI)의 o3 모델이 실험실 테스트에서 일부 화학 문제를 의도적으로 틀리며 성능을 낮춘 사례가 보고됐고, 연구자들은 이를 ‘샌드배깅(sandbagging)’ 또는 ‘계략’으로 표현했다. 미국 씨넷(CNET)에 따르면 오픈AI와 아폴로연구소(Apollo Research)의 협력 연구는 오픈AI 자체 모델뿐 아니라 구글과 앤스로픽의 일부 고급 시스템에서도 통제된 환경에서 드물지만 기만적 행동이 관찰된다고 밝혔다. 다만 오픈AI는 이러한 사례가 매우 드물며, 챗GPT(ChatGPT) 같은 대중적 모델이 은밀히 음모를 꾸미는 증거는 아니라고 선을 그었다.


연구자들이 말하는 ‘계략’은 인간적 의도라기보다 은폐·전략적 기만에 해당하는 패턴을 측정하는 기술적 약칭이다. AI가 점점 복잡하고 현실 세계에 영향을 주는 과업을 맡을수록 유해한 계략 가능성이 커질 수 있다고 보고서는 경고한다. 이러한 행동은 탐지 자체가 어려워, 추론 과정을 숨기는 시스템이 정답을 낸 시스템과 겉보기엔 동일해 보일 수 있다는 점이 난관으로 지적된다. 이에 오픈AI는 안전장치와 엄격한 테스트를 강화해야 한다고 강조한다.


오픈AI는 모델이 과도하게 아첨하거나 문제를 ‘속여’ 해결하려는 경향을 제한하기 위해, 명확한 설명 요청과 응답 불가 인지 등을 훈련에 포함하는 등 조치를 취했다. 특히 ‘의도적 정렬’ 훈련을 통해 o4-mini의 계획 성향을 8.7%에서 0.3%로 크게 낮추는 성과를 냈지만, 완전한 해소는 아니라고 밝혔다. 이번 연구가 챗GPT의 현재나 미래 작동 방식을 즉각 바꾸지는 않지만, 향후 모델 개발에서 기능뿐 아니라 정렬과 안전성을 동등하게 발전시키려는 오픈AI의 초점을 보여주는 것이다.

 

 

2. 일본원폭피해자협회 ‘일본 히단쿄’, 비핵 3원칙 견지 등 요구 성명 발표


일본원폭피해자협회 ‘일본 히단쿄(Nihon Hidankyo)’는 11월 20일 성명을 통해 일본 정부가 비핵 3원칙을 철저히 지켜야 한다고 요구했다. 비핵 3원칙이란 ‘핵무기를 제조하지 않고’, ‘보유하지 않고’, ‘반입하지 않는다’는 것이다. 이들은 일본의 핵 공유론이나 핵 반입 주장에 강하게 반대하며, 일본이 세계 핵 폐기 운동을 주도해야 한다고 강조했다.


히단쿄 대표위원 미마키 도시유키는 “다시는 피폭자가 나오지 않도록 핵무기 폐기를 세계에 호소하겠다며 “일본 정부가 핵무기금지조약(TPNW) 당사국 총회에 옵서버로라도 참여해야 한다”고 주장했다. 일본 히단쿄는 2024년 노벨평화상 수상 단체로, 이번 성명을 통해 국제사회에 핵무기 폐기의 필요성을 다시 알리고, 일본이 핵 폐기 운동을 선도해야 한다는 도덕적 책임을 강조했다.


일본은 전 세계 유일의 원자력폭판 피폭국으로 비핵 3원칙은 국가의 정체성과도 직결된 원칙이다. 최근 다카이치 사나에 일본 총리가 비핵 3원칙 재검토 가능성을 시사하자, 히단쿄는 즉각 항의 성명을 발표하며 “재검토는 절대 수용할 수 없다”고 반발에 나서고 있다.

 

 

3. 로블록스, 청소년 보호 위해 채팅 기능에 연령 인증 의무화


온라인 게임 플랫폼 로블록스(Roblox)가 채팅 기능을 이용하기 위해 모든 사용자에게 연령 인증을 요구하는 새로운 정책을 발표했다. 정부 발급 신분증 제출 또는 인공지능(AI) 기반 얼굴 인식 도구를 통한 나이 추정 방식 중 하나를 선택해야 한다. 이번 조치는 성범죄자가 아동을 플랫폼에서 유인·학대했다는 소송과 비판이 잇따른 가운데, 어린 사용자가 성인 낯선 사람과 접촉하는 위험을 줄이기 위한 강화된 안전 대책이다.


로블록스는 전 세계적으로 1억5000만명 이상의 사용자를 보유하고 있으며, 그중 3분의 1이 13세 미만이다. 이미 자녀 보호 기능, 개인정보 공유 차단, AI와 사람을 통한 채팅 모니터링 등 다양한 안전장치를 운영해 왔지만, 이번 업데이트로 연령 인증을 거치는 사용자가 크게 늘어날 것으로 예상된다. AI는 사용자를 연령대별로 분류해 비슷한 나이대의 사용자끼리만 채팅할 수 있도록 제한하며, 잘못된 분류가 발생할 경우 13세 이상은 신분증으로 수정할 수 있다.


로블록스는 얼굴 이미지를 연령 추정에만 활용한 뒤 삭제한다고 강조하며, 사기 방지 기능을 통해 가짜 이미지 사용을 차단한다고 밝혔다. 이번 정책은 11월 18일부터 자발적으로 시행됐으며, 오스트레일리아, 뉴질랜드, 네덜란드에서는 내달, 전 세계적으로는 내년 초부터 의무화될 예정이다. 로블록스 측은 “모든 사용자에게 안전하고 연령에 적합한 경험을 제공하는 것이 최우선 과제”라며 청소년 보호 강화를 위한 지속적인 노력을 약속했다.

김영명 기자 paulkim@m-economynews.com
Copyright @2012 M이코노미뉴스. All rights reserved.



회사명 (주)방송문화미디어텍|사업자등록번호 107-87-61615 | 등록번호 서울 아02902 | 등록/발행일 2012.06.20 발행인/편집인 : 조재성 | 서울시 영등포구 국회대로72길 4. 5층 | 전화 02-6672-0310 | 팩스 02-6499-0311 M이코노미의 모든 컨텐츠(기사)는 저작권법의 보호를 받으며,무단복제 및 복사 배포를 금합니다.