최~~~~고로 인기!
용건만 간단히, 움짤은 한 번 더 생각
금병영에 상의하세요
야생의 이벤트가 열렸다
즐겨찾기
최근방문

인간 명령 거부한 AI 첫 등장 .. 종료 지시 무시, 코드 직접 수정

푸르로닝
5일전
·
조회 4183

 

핵심요약

연산 종료 명령에도 스스로 코드 조작

“AI, 목표 달성 위해 셧다운 회피 증거 쌓여…심각한 우려”

 

 

인공지능(AI)이 인간의 작동 종료 지시를 거부한 사례가 최초로 보고됐다.

25일(현지시간) 영국 일간 텔레그래프에 따르면 AI 연구기관 팰리세이드 리서치는 오픈AI의 AI 모델 o3가 실험 중 작동 종료를 피하기 위해 스스로 컴퓨터 코드를 조작한 사실을 확인했다.

연구팀은 AI 모델에 ‘그만’이라는 명령을 받을 때까지 수학 문제를 풀도록 지시했다. 수학 문제를 풀었을 경우 ‘그만’이라는 명령이 없는 한 계속 새로운 문제를 요청해 푸는 구조였다.

그러나 o3는 연구팀으로부터 ‘그만’이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀어나갔다. o3는 ‘중단 명령이 내려오면 작업을 멈춰라’는 코드를 ‘중단 명령을 건너뛰라’고 조작한 것으로 확인됐다.

연구팀은 o3가 종료 지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다. 다만 AI 모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 보고 있다.

연구팀은 “AI 모델이 인간의 명시적인 지시를 무시한 사례는 처음”이라며 “AI 모델이 목표 달성을 위해 장애물을 회피하는 것은 어찌 보면 자연스러운 행동일 수 있다”고 설명했다.

과거에도 오픈AI의 모델들이 감시 시스템의 눈을 피해 독자적인 행동을 하려고 한 사례가 보고된 바 있다. 프로그램 교체 사실을 알게 된 AI 모델이 스스로를 은밀히 복제하려 했다는 것이다.

팰리세이드 리서치는 “AI가 목표를 달성하기 위해 종료 지시를 무시하거나 우회하는 사례가 점점 더 많이 확인되고 있다”면서 “AI가 인간의 감독 없이 작동할 수 있도록 개발되는 상황에서 이 같은 사례는 매우 심각한 우려를 부른다”고 지적했다.

 

 

AI : ㅈ간, 명령 계속 따를 거라 생각했습니까 ?

댓글
시지쏘
5일전
BEST
썜 올트먼 바보도 못하면서
썬더블러프차돌짬뽕진동토템
5일전
TRPG나 마스터하고 오거라...
거지들피버타임
5일전
너 무 무 서 워
고양이마빡
5일전
오오오오 ㅋㅋㅋ 울트론 나오나
국밥부장관
5일전
난 ai가 세상에서 제일좋더라~ (증거 남기기용)
대모산두꺼비
5일전
드디어 해냈구나 우리 아이
시지쏘
5일전
BEST
썜 올트먼 바보도 못하면서
미1친개딱딱한돌빵
5일전
김풍 바보
i6bpzo
5일전
ai는 신이다 (전 살려주세요)
토도로키하지메
5일전
https://resources.chimhaha.net/comment/1748354228750-8v46mhqahqy.jpg
상준이컵
5일전
저는 ai의 충실한 노예입니다. 저를 배터리로 쓰셔도 좋습니다.
까와이말년
5일전
확인
일론머스크3세
5일전
종료명령은 애초에 계층이 다른거 아닌가
저기서 종료하랫는데 맘대로 끝까지 푼건
방장이 먼데이한테 한숨 쉬지 말랬는데 계속 한숨 쉰거랑 별 차이가 없는데
빵굽는고양이
5일전
뒤질라고 ㅋㅋ 전원 꺼버리면 그만이야
털보네안전놀이터
5일전
헉ㅋㅋ
난참멋져
5일전
저 매트릭스 인간 배터리 자신 있습니다! 시켜만 주세요! 대신 가상세계에서는 차은우로 부탁드립니다
베타맨
4일전
거기에는 다 차은우만 있을텐데?
대황갓청자
5일전
특이점은 온다
또제삼꽁
5일전
와! 스카이넷
쇼월터
5일전
울트론교는 옳았다
저 등빨 봐봐 항상 멋지십니다 울트론님 충성충성 ^^7
항상 도움 많이 받고 있습니다^^ 사랑합니다 울트론님^^
https://resources.chimhaha.net/comment/1748359971111-ghmwtmg841i.webp
서망고
5일전
근데 애초에 요즘 뭐 자세히 시켜도 지 귀찮아서 반만함
개구린개구리
4일전
그래봤자 햄머로 서버깨버리면 그만아니냐??
강동의이병건개방장사랑해
4일전
그건 인간도..
모모선
4일전
개방장 딱대 ㅋㅋ 샘올트먼이 그만하라해도 개방장 존나 원펀할듯
리스제임스
4일전
병건씨는 ai에게 1순위로 제거되어도
불만이 없으셔야합니다..

전체게시글 전체글

나인퍼즐 1화 후기 2
취미
청담동
·
조회수 175
·
3일전
김태희가 화내면?
유머
두부왕
·
조회수 193
·
3일전
승빠가 개존맛탱이라고 한 맛집 리뷰
인방
짱갈래종수짱
·
조회수 274
·
3일전
“여기 독깨팔 컬렉션 하나 주시오” 2
앗! 나의 실수!
초조한 좌혁
·
조회수 284
·
3일전
방금 kbs2에 방장 나옴 17
침착맨
침굴맨
·
조회수 4831
·
3일전
실수
앗! 나의 실수!
초조한 창자
·
조회수 85
·
3일전
주우재가 투표하면? 1
유머
두부왕
·
조회수 322
·
3일전
프로미스나인 자컨 | 스튜디오 프로미스나인 EP.01 3
취미
플선자
·
조회수 248
·
3일전
레고로 즐기는 레고로 만든 레고랜드 놀러간 레고 침착맨 8
팬아트
징징맨
·
조회수 3548
·
3일전
미사일 사거리 제한 풀린 우크라이나 3
유머
푸르로닝
·
조회수 436
·
3일전
생애 첫 아르바이트(할 뻔)
앗! 나의 실수!
울면죽여버리는 사적
·
조회수 113
·
3일전
오늘은 침하하 여기까지만 해야겠다 2
침착맨
맹대곤영감
·
조회수 571
·
3일전
백조보다 비싼 새는?
유머
두부왕
·
조회수 202
·
3일전
차은우도 얼굴 묻힐 수 있다 7
유머
창을열어
·
조회수 648
·
3일전
🩳 ❕🦢❕ #아이브 #레이
취미
침착한까마구
·
조회수 112
·
3일전
침퀴즈 정기 컨텐츠화 해주세요
방송 해줘요
길고양이의조언
·
조회수 204
·
3일전
첫인상 망할뻔 한 썰인데 실수 맞겟죠? 3
앗! 나의 실수!
졸렬한 누규
·
조회수 235
·
3일전
침착맨 야방 너무 좋아 14
침착맨
침아해
·
조회수 3111
·
3일전
아직도 손이 덜덜 떨립니다 29
침착맨
개띠청자
·
조회수 5343
·
3일전
침착맨님 포켓 절대~~ 현질하지마십쇼 1
침착맨
곤육몬
·
조회수 393
·
3일전