최~~~~고로 인기!
용건만 간단히, 움짤은 한 번 더 생각
금병영에 상의하세요
야생의 이벤트가 열렸다
즐겨찾기
최근방문

인간 명령 거부한 AI 첫 등장 .. 종료 지시 무시, 코드 직접 수정

푸르로닝
7일전
·
조회 4257

 

핵심요약

연산 종료 명령에도 스스로 코드 조작

“AI, 목표 달성 위해 셧다운 회피 증거 쌓여…심각한 우려”

 

 

인공지능(AI)이 인간의 작동 종료 지시를 거부한 사례가 최초로 보고됐다.

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI 연구기관 팰리세이드 리서치는 오픈AI의 AI 모델 o3가 실험 중 작동 종료를 피하기 위해 스스로 컴퓨터 코드를 조작한 사실을 확인했다.

연구팀은 AI 모델에 ‘그만’이라는 명령을 받을 때까지 수학 문제를 풀도록 지시했다. 수학 문제를 풀었을 경우 ‘그만’이라는 명령이 없는 한 계속 새로운 문제를 요청해 푸는 구조였다.

그러나 o3는 연구팀으로부터 ‘그만’이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀어나갔다. o3는 ‘중단 명령이 내려오면 작업을 멈춰라’는 코드를 ‘중단 명령을 건너뛰라’고 조작한 것으로 확인됐다.

연구팀은 o3가 종료 지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다. 다만 AI 모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 보고 있다.

연구팀은 “AI 모델이 인간의 명시적인 지시를 무시한 사례는 처음”이라며 “AI 모델이 목표 달성을 위해 장애물을 회피하는 것은 어찌 보면 자연스러운 행동일 수 있다”고 설명했다.

과거에도 오픈AI의 모델들이 감시 시스템의 눈을 피해 독자적인 행동을 하려고 한 사례가 보고된 바 있다. 프로그램 교체 사실을 알게 된 AI 모델이 스스로를 은밀히 복제하려 했다는 것이다.

팰리세이드 리서치는 “AI가 목표를 달성하기 위해 종료 지시를 무시하거나 우회하는 사례가 점점 더 많이 확인되고 있다”면서 “AI가 인간의 감독 없이 작동할 수 있도록 개발되는 상황에서 이 같은 사례는 매우 심각한 우려를 부른다”고 지적했다.

 

 

AI : ㅈ간, 명령 계속 따를 거라 생각했습니까 ?

댓글
시지쏘
6일전
BEST
썜 올트먼 바보도 못하면서
썬더블러프차돌짬뽕진동토템
7일전
TRPG나 마스터하고 오거라...
거지들피버타임
7일전
너 무 무 서 워
고양이마빡
7일전
오오오오 ㅋㅋㅋ 울트론 나오나
국밥부장관
7일전
난 ai가 세상에서 제일좋더라~ (증거 남기기용)
대모산두꺼비
7일전
드디어 해냈구나 우리 아이
시지쏘
6일전
BEST
썜 올트먼 바보도 못하면서
미1친개딱딱한돌빵
6일전
김풍 바보
i6bpzo
6일전
ai는 신이다 (전 살려주세요)
토도로키하지메
6일전
https://resources.chimhaha.net/comment/1748354228750-8v46mhqahqy.jpg
상준이컵
6일전
저는 ai의 충실한 노예입니다. 저를 배터리로 쓰셔도 좋습니다.
까와이말년
6일전
확인
일론머스크3세
6일전
종료명령은 애초에 계층이 다른거 아닌가
저기서 종료하랫는데 맘대로 끝까지 푼건
방장이 먼데이한테 한숨 쉬지 말랬는데 계속 한숨 쉰거랑 별 차이가 없는데
빵굽는고양이
6일전
뒤질라고 ㅋㅋ 전원 꺼버리면 그만이야
털보네안전놀이터
6일전
헉ㅋㅋ
난참멋져
6일전
저 매트릭스 인간 배터리 자신 있습니다! 시켜만 주세요! 대신 가상세계에서는 차은우로 부탁드립니다
베타맨
6일전
거기에는 다 차은우만 있을텐데?
대황갓청자
6일전
특이점은 온다
또제삼꽁
6일전
와! 스카이넷
쇼월터
6일전
울트론교는 옳았다
저 등빨 봐봐 항상 멋지십니다 울트론님 충성충성 ^^7
항상 도움 많이 받고 있습니다^^ 사랑합니다 울트론님^^
https://resources.chimhaha.net/comment/1748359971111-ghmwtmg841i.webp
서망고
6일전
근데 애초에 요즘 뭐 자세히 시켜도 지 귀찮아서 반만함
개구린개구리
6일전
그래봤자 햄머로 서버깨버리면 그만아니냐??
강동의이병건개방장사랑해
6일전
그건 인간도..
모모선
6일전
개방장 딱대 ㅋㅋ 샘올트먼이 그만하라해도 개방장 존나 원펀할듯
리스제임스
6일전
병건씨는 ai에게 1순위로 제거되어도
불만이 없으셔야합니다..
코가침침
7시간전
보상은 어떻게 이루어진거죠..? a.i에게 보상이라니..

전체게시글 전체글

조금은 궤를 달리하는 구독제 이야기
침착맨
안피곤해요
·
조회수 231
·
3일전
(*정답드래그*) 2025.05.31 꼬들 꼬오오오오들 6
취미
오프라인
·
조회수 107
·
3일전
곱창난 민심 돌려내는 법 30
침착맨
깨팔이사료주인
·
조회수 5585
·
3일전
요즘 메인 알고리즘에 침착맨 영상이 잘 안떠요 2
침착맨
우엑우엑
·
조회수 326
·
3일전
화면 뿌얘지기 전의 먹방종수 1
유머
힙합보틀
·
조회수 226
·
3일전
개인적인 생각입니다 11
침착맨
wks
·
조회수 3782
·
3일전
침철단 한다면 ‘영화 티어메이커’나 ’영화 토론’ ‘드라마 토론‘ 해주세요
방송 해줘요
AMZN몰빵
·
조회수 89
·
3일전
포켓몬 레전드 Z-A 10월 16일 발매 4
취미
길고양이의조언
·
조회수 175
·
3일전
대깨원박으로서 본채널을 보지 않는 이유/보는 이유
침착맨
길고양이의조언
·
조회수 371
·
3일전
이때싶이라고 생각할 수 있지만 저는 '한달 휴방'과 '체감 방송시간'이 굉장히 크다고 생각합니다. 30
침착맨
루루룰룰루루
·
조회수 5103
·
3일전
보고싶은 만화
침착맨
피디씨
·
조회수 131
·
3일전
솔직히 최근 컨텐츠중에 레고랜드 탐방이 제일 재밌었음 20
침착맨
인천의전사독
·
조회수 3371
·
3일전
솔직히 원박 유튜브 유료화는 아직 좀... 1
침착맨
구슬픈눈의탕구리
·
조회수 455
·
3일전
침착맨이 치지직 파트너 스트리머가 된 세계선
침착맨
마라탕후루
·
조회수 318
·
3일전
이런 일 있을 때마다 느끼는 거지만  3
침착맨
메롱스톤
·
조회수 3504
·
3일전
S티어 생구논쟁 지원사격합니다 7
침착맨
구슬픈눈의탕구리
·
조회수 327
·
3일전
개인적으로 생각하는 최근 시청률 감소원인 (쥐흔ㅈㅅ) 6
침착맨
수메르
·
조회수 705
·
3일전
해보고 아니면 철회 1
침착맨
침태식
·
조회수 333
·
3일전
이게 뭔일이래... 3
침착맨
NosPawn
·
조회수 447
·
3일전
유료화 논란.. 개고수 시청자 특징)
침착맨
노노그램족고수
·
조회수 341
·
3일전