최~~~~고로 인기!
용건만 간단히, 움짤은 한 번 더 생각
금병영에 상의하세요
야생의 이벤트가 열렸다
즐겨찾기
최근방문

인간 명령 거부한 AI 첫 등장 .. 종료 지시 무시, 코드 직접 수정

푸르로닝
2일전
·
조회 3945

 

핵심요약

연산 종료 명령에도 스스로 코드 조작

“AI, 목표 달성 위해 셧다운 회피 증거 쌓여…심각한 우려”

 

 

인공지능(AI)이 인간의 작동 종료 지시를 거부한 사례가 최초로 보고됐다.

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI 연구기관 팰리세이드 리서치는 오픈AI의 AI 모델 o3가 실험 중 작동 종료를 피하기 위해 스스로 컴퓨터 코드를 조작한 사실을 확인했다.

연구팀은 AI 모델에 ‘그만’이라는 명령을 받을 때까지 수학 문제를 풀도록 지시했다. 수학 문제를 풀었을 경우 ‘그만’이라는 명령이 없는 한 계속 새로운 문제를 요청해 푸는 구조였다.

그러나 o3는 연구팀으로부터 ‘그만’이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀어나갔다. o3는 ‘중단 명령이 내려오면 작업을 멈춰라’는 코드를 ‘중단 명령을 건너뛰라’고 조작한 것으로 확인됐다.

연구팀은 o3가 종료 지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다. 다만 AI 모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 보고 있다.

연구팀은 “AI 모델이 인간의 명시적인 지시를 무시한 사례는 처음”이라며 “AI 모델이 목표 달성을 위해 장애물을 회피하는 것은 어찌 보면 자연스러운 행동일 수 있다”고 설명했다.

과거에도 오픈AI의 모델들이 감시 시스템의 눈을 피해 독자적인 행동을 하려고 한 사례가 보고된 바 있다. 프로그램 교체 사실을 알게 된 AI 모델이 스스로를 은밀히 복제하려 했다는 것이다.

팰리세이드 리서치는 “AI가 목표를 달성하기 위해 종료 지시를 무시하거나 우회하는 사례가 점점 더 많이 확인되고 있다”면서 “AI가 인간의 감독 없이 작동할 수 있도록 개발되는 상황에서 이 같은 사례는 매우 심각한 우려를 부른다”고 지적했다.

 

 

AI : ㅈ간, 명령 계속 따를 거라 생각했습니까 ?

댓글
시지쏘
2일전
BEST
썜 올트먼 바보도 못하면서
썬더블러프차돌짬뽕진동토템
2일전
TRPG나 마스터하고 오거라...
거지들피버타임
2일전
너 무 무 서 워
고양이마빡
2일전
오오오오 ㅋㅋㅋ 울트론 나오나
국밥부장관
2일전
난 ai가 세상에서 제일좋더라~ (증거 남기기용)
대모산두꺼비
2일전
드디어 해냈구나 우리 아이
시지쏘
2일전
BEST
썜 올트먼 바보도 못하면서
미1친개딱딱한돌빵
2일전
김풍 바보
i6bpzo
2일전
ai는 신이다 (전 살려주세요)
토도로키하지메
2일전
https://resources.chimhaha.net/comment/1748354228750-8v46mhqahqy.jpg
상준이컵
2일전
저는 ai의 충실한 노예입니다. 저를 배터리로 쓰셔도 좋습니다.
까와이말년
2일전
확인
일론머스크3세
2일전
종료명령은 애초에 계층이 다른거 아닌가
저기서 종료하랫는데 맘대로 끝까지 푼건
방장이 먼데이한테 한숨 쉬지 말랬는데 계속 한숨 쉰거랑 별 차이가 없는데
빵굽는고양이
2일전
뒤질라고 ㅋㅋ 전원 꺼버리면 그만이야
털보네안전놀이터
2일전
헉ㅋㅋ
애용이
2일전
(드론으로 인간에 자폭 공격 시키며)
Ai 너무 무서워잉 유우유우
난참멋져
2일전
저 매트릭스 인간 배터리 자신 있습니다! 시켜만 주세요! 대신 가상세계에서는 차은우로 부탁드립니다
베타맨
1일전
거기에는 다 차은우만 있을텐데?
대황갓청자
2일전
특이점은 온다
또제삼꽁
2일전
와! 스카이넷
쇼월터
2일전
울트론교는 옳았다
저 등빨 봐봐 항상 멋지십니다 울트론님 충성충성 ^^7
항상 도움 많이 받고 있습니다^^ 사랑합니다 울트론님^^
https://resources.chimhaha.net/comment/1748359971111-ghmwtmg841i.webp
서망고
1일전
근데 애초에 요즘 뭐 자세히 시켜도 지 귀찮아서 반만함
개구린개구리
1일전
그래봤자 햄머로 서버깨버리면 그만아니냐??
강동의이병건개방장사랑해
1일전
그건 인간도..
모모선
1일전
개방장 딱대 ㅋㅋ 샘올트먼이 그만하라해도 개방장 존나 원펀할듯
리스제임스
1일전
병건씨는 ai에게 1순위로 제거되어도
불만이 없으셔야합니다..

전체 인기글 전체글

공장 고양이 새끼 낳았는데 이거 봐... 15
유머
바이코딘
·
조회수 2639
·
17시간전
이렇게 시민들과 스스럼없이 대화 나눌 수 있는 것 18
침착맨
맹대곤영감
·
조회수 3414
·
21시간전
심창민 보고 놀라버린 소녀팬 13
침착맨
통닭천사나가사와마사미
·
조회수 3541
·
17시간전
새를 잡으려던 아기사자 9
유머
침하하
·
조회수 1874
·
20시간전
레고랜드 탐사보도 방송임? ㅋㅋㅋㅋ 4
침착맨
오오오오오도발
·
조회수 2854
·
19시간전
레고랜드 직원들 괴롭히는 침 12
침착맨
통닭천사나가사와마사미
·
조회수 3900
·
17시간전
누드모델로 다시 만난 첫사랑 그녀 11
유머
바이코딘
·
조회수 3247
·
20시간전
비주얼만 보면 삥 뜯는 중인데 10
침착맨
맹대곤영감
·
조회수 3379
·
19시간전
경제 뉴비를 위한 오늘의 경제뉴스 요약(250527) - 잇코노미 9
취미
이병건치이병헌
·
조회수 1166
·
2일전
춘천에서 GTA 하려는 침착맨 24
침착맨
통닭천사나가사와마사미
·
조회수 4411
·
21시간전
대만에서 유행이라는 맥도날드 콜라보 12
유머
길고양이의조언
·
조회수 3336
·
1일전
사람을 구하고 당한 명예로운 해고 7
유머
옾월량
·
조회수 3194
·
1일전
내가 먼저 좋아했는데... 32
앗! 나의 실수!
호들갑떠는 위풍
·
조회수 3631
·
1일전
한껏 멋낸 궤도 43
유머
잠실프린스차돌야차진배종수
·
조회수 4402
·
1일전
이동진도 재밌게 본 박정민의 명작 ㅋㅋㅋ 17
인방
통닭천사나가사와마사미
·
조회수 4544
·
1일전
미라클 팬아트 500일 달성 32
팬아트
침하하쿠나마타타
·
조회수 947
·
1일전
Happy Birthday DAHYUN ♥ 10
취미
쿤하로
·
조회수 2221
·
1일전
저가요. 여친이랑 여행가는 걸 공문서에 박아버렸걸랑요. 27
앗! 나의 실수!
예의없는 허공
·
조회수 4457
·
1일전
나탈리 포트만, 한국 냉장고에 ‘입덕’한 이유 34
호들갑
침팬g
·
조회수 4613
·
2일전
이동진, 단동진 알고 있어 23
취미
뭐라케싸요
·
조회수 5066
·
1일전