chatGPT 소개 + 공부 방법 예시
오늘 아침 chatGPT (GPT-3.5)의 최신형 모델인 GPT-4.0이 출시했다.
GPT-4.0 개발사인 OpenAI 블로그 포스트를 살펴보면,
https://openai.com/product/gpt-4
GPT-4.0은 단순히 성능이 나아진 것뿐만 아니라,
이제는 이미지를 인식하고 입력할 수 있을 뿐더러
사이트에 대한 링크를 제공하면 웹사이트의 내용을 요약할 수 있다.
위 두가지 task는 기존 NLP (자연어처리 – 인공지능의 한 분야)로
얼마든지 할 수 있었던 작업이긴 하지만,
chatGPT라는 아주 무거운 모델에 메모리 부하 없이 해당 기능을 추가했다는 점에서
아직 인공지능이라는 방대한 영역에 한 발자국 담근 학부생 입장에서
이러한 혁신을 일궈낸 openAI 개발자들이 정말 대단하다고 생각한다.
이번 글에서는 chatGPT에 대해서 간단하게 설명하고
chatGPT를 활용해 공부에 도움받는 방법을 소개하고자 한다
직접 해보면 어떻게 쓰는지 빠르게 감을 잡을 수 있으니까
웹사이트에 들어가서 일단 시도해보자.
기존 chatGPT 모델 (gpt-3.5)는 무료고
성능이 좋은 GPT-4.0 은 한달에 20달러다.
처음부터 인공지능이 이렇게 똑똑한 건 아니었다
인공지능 기준으로 18년도는 아주 오래 전이지만
불과 5년 전만해도 AI는 우가우가 침팬지만도 못한 성능을 보였다
수능은 5지선다고 하나의 숫자로 답을 밀기만 해도 최소 20점은 확보하니까
4번으로 답을 몰아 쓴 침팬지만도 못한 것이 자연어처리 AI의 현실이었다.
사실 chatGPT의 근간이 되는 기술은 이 때 수능을 푸는 AI와 거의 동일하다.
하지만 어느 점을 보완했기에 이렇게 엄청난 발전을 이룰 수 있었을까?
그 원인은 바로 이 멍청한 학생에게 아주 뛰어난 과외 선생님을 붙여줬기 때문이다.
알파고의 학습방법이기도 한 강화학습 (Reinforecement Learning)은
우리 침팬지가 오답을 내더라도, 답변에 대한 보상 (Reward)을 정의하고
이 보상을 최대화하는 방향으로 수백 번 모델을 훈련시켜서
각 훈련마다 조금씩 정답에 가까워지도록 공부시키는 AI계의 일타강사라고 할 수 있다.
chatGPT도 이와 같이 매 판마다 오차를 줄이고 정확도를 높여가면서
결국에는 이렇게 뛰어난 학습모델이 된 것이다.
그러면 우리는 이 프로그램을 사용해서 어떻게 공부에 도움을 받을 수 있을까?
대학생들은 이미 과제를 푸는 데에 있어 많이 사용하고 있을 거라 생각해서
수능 영어문제 풀이를 예시를 들어 설명하겠다.
이 문제는 작년 2023년 수능 영어 32번 문제다.
정말 당연한 듯이 정답을 맞추었지만, 이 해설을 가지고 공부하기에는 답변이 많이 빈약하다.
그래서 우리가 진짜 원하는 답변을 받으려면
선생님 혹은 과외선생님한테 질문하는 것처럼 조금 더 자세한 해설을 요구해야 한다.
설명을 요구하니까 조리 있게 잘 설명한 것 같긴 하다.
하지만 나는 영어 문단을 처음부터 독해하는 것부터 막히는 실력이라,
문단 내용을 잘 모르기 때문에 이 설명도 잘 이해가 되지 않아서 처음부터 독해하는 해설이 필요하다.
그래서 문장 단위로 해석하라고 지시해서 나온 내용이다.
그런데 영어 문단 해석에서 문법이 중요한 역할을 하는데, 문법 분석이 빠진게 약간 아쉽다.
그래서 문장 단위로 문법을 설명하라고 지시하면 얘가 알아서 출력해준다.
디테일에서 조금 빈약한 점이 느껴져서 이 부분은 다음에 더 개선된 모델을 기다리거나
내가 질문을 조금 더 자세히 입력해야 한다.
가끔가다 출력이 5000자를 넘기면 답변이 끊기는 일이 발생하는데,
이 때 이어서 출력하라는 명령을 하면 그대로 이어서 출력해준다.
내가 공부하고 있는 해설지에서는 이러한 공부방법을 제시했는데,
이 수능 문제에 해당 공부방법을 적용하고 싶어 생각이 들면
그대로 해주라고 지시하면 바로 결과가 나온다.
이렇게 chatGPT를 활용해서 실제 과외선생님에게 질문하는 것처럼
자신이 막히는 문제에 대한 해설을 요구할 수 있다.
하지만, 앞선 예시와 같이 자신이 알기를 원하는 내용을 상세히 적어야 원하는 답을 얻을 수 있다.
자신이 부족한 점이 무엇인지 인식하고,
이에 대한 해답을 chatGPT에 넣어서 해설을 보고 공부함으로 복습한다면,
정말 괜찮은 공부 방법이 될 수 있을 거라고 생각한다.
위의 문제는 2023년 국어 10번 문제인데, 너무 뻔뻔스럽게 정답을 맞혀버렸다.
이렇게 국어 등 다른 과목도 영어 때의 접근방식과 비슷하게 풀이를 불러올 수 있다.
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
일주일에 한번정도 혼자 기출 풀다가 9월쯤부터 학원다니려는데 괜찮을까요?...
-
그 라인에서 두칸 위 대학이나 두칸 아래 대학이나 향후 아웃풋에 별 차이가 없거든요...
-
나보다 높은사람 별로모ㅛ봄
-
투표 해주세여...
-
서강대식 495 0
나에게 기회가 오진 않을거같다...ㅠ
-
지금부터 2년 공부해서 칠거임 수학잘함
-
시발점들어보면 될까요? 공통은 공부 시작했는데 기하찍먹을 어떻게 해야할지 모르겠어요...
-
막 ㅈㄴ힘들진않는데 가끔생각남.. 초6때 조별과제로 뭐 뉴스만들기 이런거 했는데 난...
-
지금 국숭세단 사과대 5칸정도 뜨거든요 +성신까지 해서 고려해보거나 광명상가...
-
개인적으로 서울에 여자 자사고 생기면 인기 있을 지역 0
1. 송파 강동 2. 노원구 3 마포 or 은평
-
..?
-
제가 특별전형으러 지원할거라 맨 오른쪽으로 봐야 하는데 진학사는 맨 왼쩍으로 계산을...
-
알바면접 0
음식점 알바면접은 어케해야 받아주나요 세군데서 빠꾸먹었는데 마지막 간 곳에서...
-
군수9몬데 정신건강이슈로 올2-3등급떴음 약먹으면서 무휴반해볼까요 수학잘하는편이라...
-
생윤 99 윤사 97인데 머가 유리하나요
-
동기들 다 빠져나가네….학점도 조졌는데 각박한 우리학교에서 어케...
-
나에겐 우리가 지금 1순위야
-
아오..
-
내신 1.9인데 cc주냐?
-
연치 5
-
둘 다 붙는다고 가정하면 어디가 더 낫나요?
-
생각보다 비싸네요
-
한양대 인터칼리지 진학사기준 4칸정도였었는데 어느정도되려나
-
이명학vs 션티 0
풀커리 탈 생각인데 어떤 분이 좋을까요?
-
되나요?
-
매일 순공 12시간씩 찍어내면 성적의 향상이 있긴 할까요? 그리고 재종 비싼 값은 한다고 보시나요?
-
여자 자사고도 늘리자 아님 남대 신설해서 여자 의약로 티오 가져오든가
-
수시붙었음 10
안갈거긴한데 어쨌든 붙긴 붙었구나
-
물론 남자면 내신 딸 때는 남고를 여자면 공학을 추천하긴 할 거지만 정서적으로는...
-
내신 7.6이거든.. 제출 .. 해야하는거야?
-
빠르면 오늘 늦으면 다음주 초
-
서울대 버리고 서강시반쓸까 하
-
변표 내놓으라고 고대놈들아
-
ㅋㅋ
-
집중할수록 더더 실수를하고 ㅈㄴ노력했는데 실수하고 공부하다가 갑자기 책덮었다펴고...
-
그냥 원하는곳 쓰고 벅뚜벅뚜 걸어들어가면 되나요
-
도와주실분~~! 0
전과 관련해서 궁금한점이 있는데 잘 모르겠어서... 혹시 도움 주실분 있으신가요?!...
-
안녕하세요우... 오래간만에 인사 드립니다. (__) 다름이 아니라 올해 9월 초에...
-
ADHD 8
ADa HuDa
-
내신에 수능형 문제가 많이 출제되어 내신 공부할때 정시 공부 도움 된다 공부에 뜻이...
-
정시 컨설팅 0
이번에 반수했는데 작년보다 성적은 더 떨어졌고 전적대 지원 성적도 안될 거 같은데...
-
검사해본적은 없음뇨
-
미친 여미새인줄 알고 나의 큰 물건의 사이즈를 자랑함 근데 그런 의도가 아니더라구요 ㅋㅋㅈㅅ;;
-
ON 1
-
벡터가 생각보다 빡셌음 난 공도보다 낯설던디
-
6개월만에 하닠가 오히려 재밌는데 미쳐버린것인가
-
신소재가능할까요?
-
진짜 몰라서 그러는데 표본 숨기는건 왜 그러는 건가요? 좀 생각해봐도 모두가...
-
인강민철 0
인강민철 작년꺼하고 크게 안바뀔거 아는데 막 호마다 비슷한거임? ex) 2024...
-
공대는 바라지도않고 상경 뚫릴까요...ㅠㅠ
안녕하세요. 글의 내용에 약간 오류가 있는 거 같아 댓글 남깁니다~ chatGPT 아키텍처는 강화학습 모델이 적용되지 않았습니다. 자연어 처리 분야에서의 획기적인 성능 향상은 Encoder-Decoder에 Attention 노드를 도입한 Transformer 아키텍처의 개발 덕입니다. 사진에서 첨부한 2018년 즈음이면, attention node의 연구가 막 이루어지던 시점인 것으로 생각됩니다. 아마 사용된 모델의 아키텍처도 Transformer가 아닌 LSTM이나 GRU 계층에 의존하는 Rnnlm이었을 걸로 예상됩니다. 이 아키텍처를 개선한 Transformer모델이 성능 향상의 핵심이었지 강화학습이 자연어 처리에 적용됐다는 건 정확하지 않습니다. 강화학습은 자연어 처리보다는 다른 영역에서 더 적합한 기술이기 때문입니다. 예를 들어 말씀해주신 알파고 같은 경우가 그렇습니다. 하지만 자연어 처리 영역은 많이 다르다는 것이죠.
또한, chatGPT는 비지도 학습 또한 적용되어 학습되었기 때문에 보상을 늘리는 방식의 학습이 애플리케이션 성능을 향상시켰다는 것은 적절치 않습니다.
이 외의 chat GPT를 공부에 활용하는 방법은 참 좋은 거 같네요~ 저도 많이 배워갑니다~
즐거운 하루되세요 ^^
무슨 틀린 얘기를 이리도 길게... ㅋㅋㅋ chatgpt는 논문이 따로 없는데 instructgpt를 그대로 사용했습니다. 그러니 해당 논문을 참고해보면 RLHF를 사용했다는걸 알 수 있어요.
gpt3의 결과를 랭킹한다음 그걸로 학습한 모델을 일종의 리워드 함수로 사용한거죠..
사실 검색만 해봐도 나오는 사실을 이제막 ai배우시는분인 것 같은데...
알파고같은데만 쓰이는게 아니라 최적화와 관련된 모든 분야에 강화학습을 사용할 수 있어요.
예를들어 퓨샷같은 메타러닝에도요.. 찾아보면 in context learning을 더 잘하기 위해 퓨샷 전용 강화학습 적용하는 경우도 있어요
강화학습이 쓰이지 않았다니 ㅋㅋㅋ 당장 유저 인풋을 반영해서 새로운 보상을 제시한다고 밝힌 내용인데 chatgpt는 절대 순수 generative model로는 만들 수 없는 모델이에요 그리고 gpt모델의 베이스 모델인 transformer가 쓰이지 않았다는거는 무슨 말씀이신가요? Gru는 디퓨전 모델이나 GAN에 자주 쓰이지 gpt는 순서정보가 중요해서 트랜스포머가 우월전략이 확실합니더
트랜스포머가 아니라 rnnlm을 사용했다고 너무 당당하게 단언해버리시면 zzzzzz 설마 트랜스포머의 feed forward층에 있는 gru층을 rnn구조라고 생각하신건가요 ^^b
트랜스포머가 2018년의 혁신이긴 했지만 그로부터 gpt2까지 오면서 대중들에게 크게 와닿지 않았던 이유는 nlp모델로만 이루어진 모델은 성능에 한계점이 있었기 때문이에요 당장 gan만 봐도 아무리 비지도학습을 열심히 해도 모델 collapsing현상이 나오잖아요? 그래서 강화학습이 쓰인거고 그래서 빅테크랑 개인간의 간격이 벌어지느 거에요. 빅테크가 주도하는 사회변화는 이제 거부할 수 없을 겁니다