최~~~~고로 인기!
용건만 간단히, 움짤은 한 번 더 생각
금병영에 상의하세요
야생의 이벤트가 열렸다
즐겨찾기
최근방문

AI의 과학, NOVEL AI 그리고 github Copliot

인사할시간도없
23.01.17
·
조회 455

컴공과 대학생이 심심해서 쓰는 글입니다. 반박시 당신 말이 맞아요.

 

일단 시작하기 전에 하소연 한번만 하고 시작하겠습니다.

글쓰는 재주라고는 1도 없는 이과이기에 쓰는 지금도 이게 맞나? 긴가 민가 하면서 작성하고 있습니다.

최대한 객관적이고 신빙성 있는 자료들 위주로 작성을 해보고 있지만 그래도 틀린점이 있을수 있으니 제발 대학원으로 끌고가지 말아주세요

전문성 보다는 그냥 가볍게 읽기 좋은 칼럼? 정도로만 생각해주시면 감사하겠습니다.

 

일단 궤도님의 특기 AI란 무엇인가 부터 정의를 해야합니다.

 

AI는 인간의 행동을 모방하기 위해서 만들어진 기계입니다. 가장 대표적으로 개와 고양이를 구분해내는것, 

사람이라면 당연히 무엇이 고양이고, 개인지 알아낼수 있지만 기계는 그 과정을 위해 학습이 필요합니다.

 

뉴스나 혹은 여러 커뮤니티에서 gpt-3 혹은 novel AI라는걸 자주 보실수 있을겁니다. 

저 두 AI의 공통점은 바로 머신러닝이라는걸 쓰는겁니다.

 

머신러닝은 간단하게 설명하면 방대한 양의 데이터로 AI를 학습시켜서 특정 상황에서 의도한 대로 동작하도록 만드는겁니다.

아까 든 예시로 고양이와 강아지를 구별하는 AI를 만들어본다고 하겠습니다,

그렇다면 고양이 사진 1000장과 강아지사진 1000장을 AI한테 집어넣고 새로운 동물 사진이 나왔을때 이게 고양이인지 혹은 강아지 인지 가리도록 판별시키는거죠.

 

하지만 머핀과 치와와를 구분하는건 쉽지 않은일이죠

AI 인공지능 기술, 머핀과 치와와를 구별하는 방법은.. : 네이버 ...

 

여기서 한가지 헷갈려 하실수 있는게 있는데, 

“AI랑 머신러닝의 차이점이 무엇인가? 어차피 두개가 하는게 똑같아 보이는데”

 

일단 가장 큰 차이점은 머신러닝은 AI의 하위 개념입니다.

초반에 말했던것 처럼 AI는 “사람” 처럼 사고하고 행동하도록 목표가 지정되어 있다면, 머신러닝은 데이터를 가지고 학습해 입력값으로 부터 “정확한 출력값” 을 가지도록 하는것이 목표죠.

 

그리고 대중성을 가지고 누구나 쓸수 있었기에 화제가 된 Novel AI와 달리, 개발자들 사이에서만 이슈가 잠깐 돌았던 github copliot에 대해 얘기해보려 합니다.

 

copliot은 대충 AI 이름이겠거니 해도 github는 생소하실분이 많을겁니다.

코딩 공부를 해봤다면 들어봤을 2대 웹사이트인 stackoverflow와 어깨를 나란히 하는 github이라는 코드 보관 장소입니다.

 

물론 좀더 자세히 설명하면 git push와 branch개념, 프로젝트 fork하기 귀찮아서 master branch에 겁 없이 git push -f를 한다는 참사 같은걸 설명하고 싶지만 이건 TMI의 영역이라 생략하겠습니다. 

 

 

(내가 코드를 수정하거나 업로드 하면 초록색갈 네모가 차는데 그걸 이용한 구인구직)

When your adviser says that more GitHub activity will help get you an  internship : r/ProgrammerHumor

 

copliot은 github에 있는 수많은 코드들을 머신러닝 하여 사용자가 어떤 문장을 입력했을때 그걸 코드화 시켜주는겁니다.

 

 

한숨나오죠? 저도 그랬습니다.

 

일단 위에 “”" 으로 시작해서 “”"으로 끝나는 내용 안에 copliot한테 시킬걸 문장으로 적으면 됩니다.

저 문장을 해석해보면 

 

내가 문자열을 하나 줄테니 그걸 날짜, 값, 통화(달러, 원)로 분류해줘

근데 #으로 시작하는 문장은 무시하고. 

여기 예시 문장을 줘볼게 

 

 2016-01-02 -34.01 USD

 2016-01-03 2.59 DKK 

 2016-01-03 -2.72 EUR

 

밑에 코드도 간단하게 분석해보면 

 

 

 2016-01-02 -34.01 USD

 2016-01-03 2.59 DKK 

 2016-01-03 -2.72 EUR

이걸 한줄 한줄 단위로 자른뒤에 

 

2016-01-02 -34.01 USD 이걸 다시 “ ”(공백) 단위로 자르고

각각의 문자열을 저장하는거죠

 

그러면 2016-01-02, -34.01, USD 이렇게 담깁니다.

 

딱 봐도 엄청 편리하게 생겼죠. 하지만 문제점이 있었으니, 

 

“저작권” 문제에서 자유롭지 못하다는 겁니다. 물론 github에는 private 프로젝트 기능이 있어서 플젝을 숨길수도 있지만

수익 창출을 위해서 혹은, 여건이 안되서 public을 써야하는 경우에 일부로 프로젝트 이름을 엄청 꼬아서 찾기 힘들게 만든걸

copliot이 학습해 따른 사람들에게 유출될수도 있다는 점이죠. 또한 초기에는 랜섬웨어도 제작이 가능했을만큼 허술했습니다.

 

지금은 핫라인을 운영해서 조금이라도 라이선스의 문제가 있는 플젝을 발견하면 직접 연락해서 지울수 있도록 한 상황입니다.

 

어떻게 쓰긴 했는데 뭔가 부끄러운 기분입니다. 아무래도 초점을 비전공자 혹은 일반인이 읽을수 있도록 했기 때문에

잘못된 비유가 있을수도 있습니다. 

 


여담)

 

novel ai의 본체와도 같은 open api는 원래 오픈소스 소프트웨어로 모든 사용자가 동등하게 사용할수 있고 수익창출 권리가 막혀있습니다.

그 암묵적인 룰을 novel ai가 깨버리자 해킹 집단이 novel ai를 털어버린것이죠. Reddit에 소식이 있는걸로 알았는데 찾진 못했습니다. 

 

 

여담2)

 

 

C언어는 printf랑 별찍기 할때가 제일 재밌습니다… 

 


사용된 자료

 

ML과 AI의 차이점 

https://www.javatpoint.com/difference-between-artificial-intelligence-and-machine-learning

 

gpt-3와 OPEN AI는 ML기술으로 만들어져있는가?

https://betterprogramming.pub/break-into-advanced-machine-learning-with-openai-api-fd9307bc9403

댓글
미키마우스쭈펄
23.01.17
가벼운 칼럼이 아니잖슴~
인사할시간도없 글쓴이
23.01.17
여기 계신 과학 민수님들의 엄청난 전문성에 비하면 이정도는 가벼운 칼럼정도 인걸요..
미키마우스쭈펄
23.01.17
혹시 BCI 특집도 올려주실 수 있나요?
@인사할시간도없
멘델냥이
23.01.17
와! 나중에 언어별 특집 만드러주세요! 흐흐흐 파이썬과 R 기대하겠습니다 흐흐흐
인사할시간도없 글쓴이
23.01.17
C/C++/C#이나 Java와 Javascript같은걸 한번 생각 해보겠습니다!
찾았다내궤동
23.01.17
NLP도 한번 다뤄줄 수 있나요~
인사할시간도없 글쓴이
23.01.18
뭐야 그거 무서워요.. 일단 준비는 해보겠습니다..
ot2xkc
23.01.18
즈아 글쓴이가 개인적으로 부연설명 더 해달라고 해서 더합니다. 꽉잡으세요.
자 AI 가 궁극적으로 보면 무엇이냐 라고 물으면 일종의 마법 상자라고 보면 됩니다
A 라는 인풋을 넣으면 내가 원하는 아웃풋으로 뚝딱 나오게 해라.
우리는 이제 이 마법 상자를 설계를 해야 합니다.
보편적으로 이런 것을 접근하게 되면 우리는 보통 환경(A 라는 인풋이 주어진 세계) 와 그걸 처리하는 agent ( 로 구분을 합니다) . 이 agent 의 역할은 환경에서 정보를 얻고 그걸 프로세싱을 해서 결과를 내놓죠. 침팬지 처럼 말입니다. 하지만 마냥 이 침팬지가 존재하라고만 하면 우리가 원하는걸 안하죠, 그래서 우리는 이것에 대해 얼마나 이 침팬지가 우리가 원하는 것을 잘 하는지에 대한 performance metric 을
ot2xkc
23.01.18
둡니다. 쉽게 그냥 성적표라고 생각하시면 편해요. 그러면 이제 이 성적표 기준을 어떻게 설계하느냐는 문제가 나오죠. 이게 모든 ML 의 알파이자 오메가라고 보면 됩니다. 저희가 지향하는 바는 우리에게 원하는 결과를 주는 이 침팬지가 환경 요소에 대해 가지고 있는 정보 + 이미 가지고 있던 정보로 우리에게 원하는 것을 주는 것이죠.
앞서 말한 모든 것이 이 performance metric(성적표) 를 어떻게 디자인 할지, 해당 마법 함수를 어떻게 정의 할지의 기초를 제공합니다
영어 약자로는 PEAS 라고 performance measure, environment, actuator, sensor 라고 주로 쓰입니다
ot2xkc
23.01.18
예를 들어 자동운전을 예시로 들어보죠
성적을 어떻게 메기냐
1. 안전
2. 속도
3. 적법
4. 운전 안정감
환경
1. 길 상태
2. 날씨
3. 다른 자동차
4. 도로 장애물 / 보행자
actuator
1. 운전대
2. 악셀
3. 브렉끼
센서
1. 카메라
2. 속도계
3. GPS
제발스마트포인터써줘
23.01.24
novel ai 가 해킹당한 이유로 오픈소스 규약을 지키지 않아서라는 것은 잘못된 사실입니다. novel ai 의 그림 생성 도구는 stable diffusion 을 기반으로 튜닝하여 제작된 것입니다. stable diffusion 은 오픈소스로 엄밀하게는 MIT 라이센스를 따릅니다. MIT 라이센스에 따르면, 해당 코드를 마음대로 변형, 튜닝해도 상관없으며 상업적으로 사용해도 됩니다. 또한 변형된 코드를 공개할 의무도 없죠. 따라서 오픈소스 라이센스 측면에서는 novel ai 는 잘못을 한 것이 없습니다.
제발스마트포인터써줘
23.01.24
기존 stable diffusion 을 fine tuning 하는 과정에서 사용된 학습 데이터가 저작권을 위반했을 소지가 있다는 것은 사실이지만, 이것도 법적으로는 애매하기 때문에 이게 소스코드 해킹을 정당화하진 못하죠...

🚀궤도사령부(궤도) 전체글

질문 ) 멋진 신세계의 소마라는 보약에 대한 질문입니다. 10
궤도
김둘기
·
조회수 543
·
23.01.18
물잘알 분들께 질문 있읍니다. 5
궤도
가짜공돌이
·
조회수 429
·
23.01.18
질문) 블랙홀의 과학을 보고 궁금한게 있습니다 3
궤도
todl0h
·
조회수 333
·
23.01.18
능력자분들에게 여쭈어봅니다.(시험기간 특) 4
궤도
임재근
·
조회수 359
·
23.01.18
궤도님 빛보다 빨리 움직일 두가지 방법을 알아냈습니다 8
궤도
Blamer
·
조회수 565
·
23.01.18
[장문][야매] 시간의 과학 첨언 + 시간 여행의 과학 예습 준비물 8
궤도
강한별
·
조회수 348
·
23.01.18
물리학 용어 정리 책 추천해주세요잉 8
궤도
맑은물
·
조회수 411
·
23.01.18
저랑 눈 마주쳤죠 1
궤도
병냥이
·
조회수 458
·
23.01.18
궤도님이 자료 준비하고 대본짜는게 엄청 어려운 일이었군요 3
궤도
인사할시간도없
·
조회수 537
·
23.01.18
(질문) 궤도님 우주에도 무지개가 있나요? 3
궤도
지과러버원준영
·
조회수 455
·
23.01.18
회사 선배가 카톡 보게하는 과학적인 방법 없을까요? 8
궤도
양갱기
·
조회수 665
·
23.01.17
군사용 우주용 부품이 비싼이유를 설명해줬던..
궤도
궤도로초밥
·
조회수 319
·
23.01.17
귀신보다 무서운... 7
궤도
NADH
·
조회수 595
·
23.01.17
수학 교양책 추천 - 미르카, 수학에 빠지다 3
궤도
궤소리방정식
·
조회수 402
·
23.01.17
속보) 궤도님 이코티콘 출시 (아님. 어그로임) 6
궤도
모둠커틀릿의신
·
조회수 942
·
23.01.17
궤도vs샌드타이거샤크
궤도
포켓몬마스터예비군
·
조회수 484
·
23.01.17
“짜게 먹어도 사망률에 영향 없었다” [연구+] 4
궤도
삑뀄츢
·
조회수 553
·
23.01.17
질량이 큰 천체에 관하여 질문하고 싶은 것이 있습니다. 12
궤도
2dflx5
·
조회수 387
·
23.01.17
현재글 AI의 과학, NOVEL AI 그리고 github Copliot 12
궤도
인사할시간도없
·
조회수 456
·
23.01.17
궤도님 일정 1
궤도
연블리
·
조회수 461
·
23.01.17