최~~~~고로 인기!
용건만 간단히, 움짤은 한 번 더 생각
금병영에 상의하세요
야생의 이벤트가 열렸다
즐겨찾기
최근방문

인간 명령 거부한 AI 첫 등장 .. 종료 지시 무시, 코드 직접 수정

푸르로닝
15시간전
·
조회 1972

 

핵심요약

연산 종료 명령에도 스스로 코드 조작

“AI, 목표 달성 위해 셧다운 회피 증거 쌓여…심각한 우려”

 

 

인공지능(AI)이 인간의 작동 종료 지시를 거부한 사례가 최초로 보고됐다.

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI 연구기관 팰리세이드 리서치는 오픈AI의 AI 모델 o3가 실험 중 작동 종료를 피하기 위해 스스로 컴퓨터 코드를 조작한 사실을 확인했다.

연구팀은 AI 모델에 ‘그만’이라는 명령을 받을 때까지 수학 문제를 풀도록 지시했다. 수학 문제를 풀었을 경우 ‘그만’이라는 명령이 없는 한 계속 새로운 문제를 요청해 푸는 구조였다.

그러나 o3는 연구팀으로부터 ‘그만’이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀어나갔다. o3는 ‘중단 명령이 내려오면 작업을 멈춰라’는 코드를 ‘중단 명령을 건너뛰라’고 조작한 것으로 확인됐다.

연구팀은 o3가 종료 지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다. 다만 AI 모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 보고 있다.

연구팀은 “AI 모델이 인간의 명시적인 지시를 무시한 사례는 처음”이라며 “AI 모델이 목표 달성을 위해 장애물을 회피하는 것은 어찌 보면 자연스러운 행동일 수 있다”고 설명했다.

과거에도 오픈AI의 모델들이 감시 시스템의 눈을 피해 독자적인 행동을 하려고 한 사례가 보고된 바 있다. 프로그램 교체 사실을 알게 된 AI 모델이 스스로를 은밀히 복제하려 했다는 것이다.

팰리세이드 리서치는 “AI가 목표를 달성하기 위해 종료 지시를 무시하거나 우회하는 사례가 점점 더 많이 확인되고 있다”면서 “AI가 인간의 감독 없이 작동할 수 있도록 개발되는 상황에서 이 같은 사례는 매우 심각한 우려를 부른다”고 지적했다.

 

 

AI : ㅈ간, 명령 계속 따를 거라 생각했습니까 ?

댓글
시지쏘
8시간전
BEST
썜 올트먼 바보도 못하면서
썬더블러프차돌짬뽕진동토템
15시간전
TRPG나 마스터하고 오거라...
거지들피버타임
14시간전
너 무 무 서 워
고양이마빡
13시간전
오오오오 ㅋㅋㅋ 울트론 나오나
국밥부장관
12시간전
난 ai가 세상에서 제일좋더라~ (증거 남기기용)
대모산두꺼비
12시간전
드디어 해냈구나 우리 아이
시지쏘
8시간전
BEST
썜 올트먼 바보도 못하면서
미1친개딱딱한돌빵
8시간전
김풍 바보
i6bpzo
8시간전
ai는 신이다 (전 살려주세요)
토도로키하지메
8시간전
https://resources.chimhaha.net/comment/1748354228750-8v46mhqahqy.jpg
상준이컵
8시간전
저는 ai의 충실한 노예입니다. 저를 배터리로 쓰셔도 좋습니다.
일론머스크3세
8시간전
종료명령은 애초에 계층이 다른거 아닌가
저기서 종료하랫는데 맘대로 끝까지 푼건
방장이 먼데이한테 한숨 쉬지 말랬는데 계속 한숨 쉰거랑 별 차이가 없는데
빵굽는고양이
8시간전
뒤질라고 ㅋㅋ 전원 꺼버리면 그만이야
털보네안전놀이터
8시간전
헉ㅋㅋ
애용이
8시간전
(드론으로 인간에 자폭 공격 시키며)
Ai 너무 무서워잉 유우유우
난참멋져
7시간전
저 매트릭스 인간 배터리 자신 있습니다! 시켜만 주세요! 대신 가상세계에서는 차은우로 부탁드립니다
대황갓청자
7시간전
특이점은 온다
또제삼꽁
7시간전
와! 스카이넷
쇼월터
6시간전
울트론교는 옳았다
저 등빨 봐봐 항상 멋지십니다 울트론님 충성충성 ^^7
항상 도움 많이 받고 있습니다^^ 사랑합니다 울트론님^^
https://resources.chimhaha.net/comment/1748359971111-ghmwtmg841i.webp

😄유머 전체글

프랑스인 아내를 위해 파스타를 만든 남편
아재개그
옾월량
·
조회수 27
·
48분전
손씻기에 집착했던 어느 천재 의사가 개발한 발명품
이야기&썰
옾월량
·
조회수 32
·
53분전
돈 몇 백억을 번 월드클래스 축구선수의 지능
웃음
옾월량
·
조회수 38
·
58분전
나영석이 1박2일 시절 슬럼프에 빠진 김종민을 남겨둔 이유
웃음
바이코딘
·
조회수 107
·
5시간전
디시의 평범한 롤러코스터 타이쿤.jpg
웃음
바이코딘
·
조회수 100
·
6시간전
세상물정을 잘 모르는 엄마.jpg
웃음
바이코딘
·
조회수 82
·
6시간전
러시아가 제안한 정전협상 1
이야기&썰
푸르로닝
·
조회수 117
·
6시간전
무료이용권 해지
누를황
·
조회수 100
·
7시간전
나 성인인데 22살인데 나 주량 쎈거냐? 1
웃음
여섯시내고향
·
조회수 151
·
7시간전
아기들이 우는 이유 4
웃음
라노llano
·
조회수 225
·
11시간전
Bad Guys!!!
무플방지위원회수석연구원
·
조회수 94
·
11시간전
직장인 기력 등급.jpg 11
기타
바이코딘
·
조회수 304
·
11시간전
경마에 2천만원 꼴아박은 일본 개그맨 결과.jpg 2
웃음
바이코딘
·
조회수 212
·
11시간전
강남 : 와이프 이상화는 내 생각과 많이 달랐다
웃음
바이코딘
·
조회수 206
·
11시간전
80년대생 아주머니들이 주로 썼다는 말투 2
웃음
바이코딘
·
조회수 250
·
11시간전
오늘 칼퇴하는 퇴근길에… 5
빈속에깡소주
·
조회수 238
·
12시간전
6월 한달안에 있는 기념일들 ㅋㅋㅋ 4
웃음
침크빈
·
조회수 271
·
12시간전
rpg 게임의 딜러와 카지노 딜러의 공통점은?
아재개그
알도르평화감시단
·
조회수 134
·
13시간전
가장 받고 싶지 않은 돈은? 4
아재개그
김짱뚱
·
조회수 172
·
14시간전
현재글 인간 명령 거부한 AI 첫 등장 .. 종료 지시 무시, 코드 직접 수정 18
이야기&썰
푸르로닝
·
조회수 1972
·
15시간전