명령어를 주고 실행시키는 전통적인 컴퓨터 시대와는 다르게, GPT는 사고를 할 수 있고, 심지어 창의적 능력까지 갖추고 있는 것으로 보인다.
우리는 GPT의 시대에 살고 있다.
이 거대한 뇌는, 가상의 공간에 떠다니며, 우리는 방대한 분야에 대한 지식을 물을 수 있다.
아직 이 모델이 한계가 있다는 이야기들도 많이 나오고 있지만(할루시네이션과 보거스 인포),
사실 가장 중요한 것은 우리가 얼마나 더 상상력 있게, 모델과 소통하는지가 될 것이다.
AI는 이전부터 머신러닝과 딥러닝의 형태로 존재해 왔다.
GPT란 무엇이 어떻게 다른가?
Genarative
GPT라는 것은 그저 존재하는 데이터를 찾거나, 분류해주는 것을 넘어, 새로운 오리지널 컨텐츠를 생성해준다.
Pre trained
LLM은 마치 뉴런과 뇌세포처럼 일종의 숫자와 파라미터들로 이루어진 뉴럴 네트워크이다.
뉴럴 네트워크는 파라미터가 어떻게 세팅돼 있냐에 따라 오직 숫자만으로 움직인다.
즉 입력한 프롬프트는 숫자로 번역되며, 뉴럴 네트워크에 전달되어, 결과가 다시 숫자로 출력되고, 이것이 다시 텍스트로 번역된다.
흥미로운 점은 내가 입력한 것에 대한 출력을 다시 입력으로 사용해가며 add하는 것이 가능하다.
GPT는 이런식으로 단순히 한 단어와 문장 다음에 어떤 단어가 오는 것이 확률적으로 높은지 계산해가는 것에 불과하다.
단지 방대한 파라미터로 현재의 결과까지 이르렀다.
언어 모델은 어마어마한 량의 데이터를 인터넷으로 부터 받아 학습했으며, 만족할 만한 대답을 얻을때까지 다음 단어 추측을 이어가며 파라미터를 조정해 갔다. 이것이 역전파이다.
그리고 RLHF 인간 피드백 강화학습 과정을 거쳐 개인정보 유출이나 도덕적인 문제에 대해 학습한다.
이렇게 학습을 마친 모델은 추후의 파인 튜닝 이외, 거의 동결 상태가 된다.
Transformer
gpt는 인간의 언어에 매우 능숙한 트랜스 포머라는 아키텍처로 이루어진 발전된 형태의 챗봇이다.
꼭 사용을 위해 프로그래머나 AI 전문가가 될 필요는 없다. 이게 바로 혁명이라고 불리는 이유이다.
생성형 AI?
미래에는 이전과 같은 학습 모델에서 조금 더 발전해 실시간으로 계속 학습하는 모델이 등장할지도 모른다.
GPT만이 유일한 생성형 모델은 아니다. 성능과 속도면에서 매우 다양한 모델등이 존재한다.
생성형 AI모델의 종류
GPT는 text to text기능이 있고, 코드등과 json html 등 구조화된 정보를 생성하기도 한다.
text to voice, text to image, text to video, speach to text 등 생성형 ai의 종류는 매우 다양하다.
현 시점의 트랜드
현재 트렌드 중 하나는 멀티 모달이다. 여러 종류의 기능을 하나의 모델에서 전부 처리할 수 있는 것이다. GPT4는 좋은 예시이다.
GPT4에서 프롬프트만 제대로 이루어진다면 최고의 프로그래머이자 다양한 방면의전문가가 될 수 있다.
현재 우리는 인간의 지능을 인공지능이 추월하고 있는 시기에 살고 있다. 확실한건 현재 인공지능은 지수적 속도로 발전하고 있으며, (물론 지수적 성장이 계속될지, 일정 수준 단계에서 변곡점을 맞을지는 알 수 없다)
인공 지능 시대를 맞이하는 mindset
ai는 우리 일을 할 수 없다. 가치 없다. 라고 생각하는 denial
ai가 우리 일을 뺏을 것이다. 우리를 파산하게 할 것이다. 라고 생각하는 panic 사이에서.
ai가 우리를 미친듯이 생산적으로 만들어줄 것이다 라는 positive 마인드 셋이 좀더 바람직 할 지도 모른다.
생성형 ai는 목표로 가는 시간을 줄여주고, 목표 자체를 설계할 수 있는 시간을 늘려줄 것이다.
AI가 발전하더라도 세가지는 계속해서 인간의 임무로 남을 것이다.
1. 무엇을 어떻게 물을 것인가?
2. 어떻게 문맥을 제공할 것인가?
3. 어떻게 결과를 평가 할 것인가?
(GPT는 할루시네이션과 거짓정보등 더블 체크가 필요하다)
또 추가적으로
1. 법적인 문제
2. 데이터 보안 등,
어떤 데이터들이 프롬프트로 입력되는가? 어떤 데이터들이 모델에 저장되는가? 등에 대한 점검이 필요하다.
그리고 모델이 제공하는 API를 활용하여,
모델을 어떻게 파인 튜닝 할 것인가?, 어떤 ui를 제공할 것인가, 어떻게 프로덕트와 결합할 것인가? 또한 인간의 임무로 남을 것이다.
간단한 프롬프트 엔지니어링.
아무리 잘 트레이닝 된 모델이라도, 문맥을 모른다면, 고수준의 모호한 답변밖에 줄 수 없다.
기본적 프롬프트 엔지니어링의 원리는 다음과 같다.
1. 문맥을 제공하고,
2. 원하는 답이 나올때까지, 좋은 프롬프트를 계속해 제공한다.
3. 목표를 주고, 내가 원하는 고품질의 답변을 얻기위해서는 무슨 문맥을 제공해야하는지, 위 두 단계 또한 AI에 직접 질문할 수도 있다.
현 생성형 ai모델의 미래에는 완전 자율형 에이전트가 등장할 것이다.
이러한 환경에서는 자율형 에이전트에 툴을 주어주고, 원하는 목표를 고수준에서 제시만 해줘도, 알아서 목표를 달성한다.
'생성형 AI' 카테고리의 다른 글
RAG란 무엇인가?(1) (0) | 2024.04.18 |
---|
댓글