반응형
챗GPT 관련 서적들은 범람하고 있다.
기술서, 입문서, 활용서, 번역서 등 무한 확장 중이다.
어느 책부터 시작해야 하는지, 내게 맞는 서적은 무엇인지 아직 나침반은 없다.
리디 e북으로 읽으며 메모한 내용은 다음과 같다.
뒷부분은 교보문고 홈피에서 발췌한 책 속의 문장들이다.
>>>
챗GPT를 학습시키는 텍스트의 구성을 살펴보면 인터넷 콘텐츠 82%, 책 16%, 위키피디아가 3%로 되어 있다.
챗GPT의 성능은 방대한 학습 데이터와 트랜스포머 기술에 기반하고 있다. 트랜스포머는 문장 속의 단어와 같은 순차 데이터 내의 관계를 추적하여 그 의미와 맥락을 학습하는 인공 신경망을 말한다.
인공 신경망이 등장한 이후의 언어 모델은 SLM과 달리 적합한 단어의 배열을 찾는 데 그치지 않고 서로 떨어져 있는 문장 내 단어의 관계와 맥락까지도 파악하여 문장을 생성할 수 있다.
이런 작업을 수행하기 위해 트랜스포머는 인코더와 디코더라는 2개의 파트로 구성되어 있다.
이런 인간의 직관력처럼 트랜스포머의 어텐션은 입력 내용의 길이와는 관계없이 중요한 부분에 '집중'할 수 있도록 하는 기술로, 이것이 트랜스포머의 강점이다.
누군가는 '데이터는 미래의 원유'라면서 데이터를 모으면 큰돈을 벌 수 있는 것처럼 얘기하지만 데이터 사업을 오랫동안 해 온 나는 데이터가 돈이 되지 않는다고 생각한다. (중략) 데이터를 모으기 위해 들어간 비용과 대비해 사람들이 기꺼이 지불하려는 금액은 터무니없이 적은 경우가 많기 때문이다.
결국 데이터 그 자체가 돈이 되는 것이 아니라, 데이터를 필요한 사람에게 딱 맞게 가공하여 제공할 때 비로소 그 데이터는 엄청난 가치를 갖게 되는 것이다.
데이터 해석을 잘 하는 Tip
1) 혼자 해석하지 않는다. 2) 꼬아서 생각하고, 비틀어서 생각하고, 틀 밖에서 생각한다. 3) 리버스 멘토링을 한다. 똑같은 데이터라도 다른 세대의 관점에서 바라본다면 전혀 다른 해석을 할 것이다.
프롬프트 설계의 기본은 G.S.T.A.R 이 5가지를 고려하는 것이다. 바로 Goal(주제), Situation(상황), Tone(양식), Amount(분량), Remark(추가 고려)다.
그뿐 아니라 프롬프트 엔지니어들이 서로 프롬프트를 사고팔거나 공유하는 마켓의 수도 점점 증가하고 있다. (중략) 현재까지 대표적인 프롬프트 마켓플레이스는 프롬프트시(PromptSea), 챗X(ChatX), 뉴트론필드(NeutronField), 프롬프트베이스(PromptBase) 등이 있다.
데이터 관리 툴은 데이터 베이스로 시작해서 이후 데이터 웨어하우스, 데이터 댐, 데이터 레이크로 진화했다. (중략) 데이터 패브릭을 쉽게 설명하면, 물리적으로 데이터를 가져와서 합쳐놓고 활용하는 것이 아니라 필요한 데이터가 어디에 있는지만 알고 있다가 필요한 순간에 가져와서 활용한다는 개념이다.
챗GPT의 능력은 단순한 소통이나 검색 서비스를 대체하는 것뿐만 아니라 일상의 패러다임을 바꿀 가능성을 보여 주고 있다. 질문이나 명령을 하면 대답하는 것은 물론이고, 개인이나 기업의 업무를 대 체할 수 있다는 점에서 기존의 대화형 AI를 뛰어넘는 면모를 선보이고 있다. 챗GPT가 향후 각종 산업과 서비스에 영향을 미칠 것이며, 스마트폰의 등장 이상으로 판을 바꾸는 게임 체인저가 될 수 있을지 기대되는 상황이다.
_p.5, 프롤로그
오랜 시간 꾸준히 발전해 온 챗GPT 같은 생성형 AI 기술은 이제 본격적으로 비즈니스와 화려하게 결합할 시작점에 놓여 있다. 새로운 기술은 기술 그 자체로 인식하는 것이 아니라 비즈니스에 접목하여 활용하는 데 초점을 맞춰 바라봐야 한다. 강력하고 새로운 기술의 등장으로 각 기업은 새로운 방식으로 일할 기회를 얻었다.
_p.15, 새로운 기술의 등장은 새롭게 일할 때가 되었다는 의미다
알고리즘을 기반으로 성장하다 보니 트랜스포머 기반의 문장 생성에서 때로 그럴듯한 거짓을 말하기도 하고, 또 그런 부분이 시간이 지나면 보완되기도 하는 장단점을 갖게 된다. 아직은 챗GPT가 성장하는 데 인간의 개입을 통한 파인튜닝이 필요하다는 구조적 한계가 있다 보니, 완전한 비지도 학습을 통한 성능 개량이 해결 과제로 남아 있다. 하지만 다양한 용도에서 강력한 성능을 보여 주는 모델인 것은 분명하며, 앞으로 생성형 AI는 텍스트뿐 아니라 이미지나 오디오 등을 통합하여 활용하는 멀티 모달 Multi Modal 로 진화하는 추세이므로 더 많은 가능성을 기대할 수 있을 것으로 보인다.
_p.24, 챗GPT가 학습하는 방법
사람들은 기술에 굉장히 빠르게 적응한다. 간단한 정보 제공이나 채팅 기능은 ‘반짝’ 흥미를 끌고 사라질 가능성이 높다. 앞으로는 단순히 챗GPT의 신기능을 선보이는 데 그칠 것이 아니라, 챗GPT를 기업 서비스에 적용하여 서비스를 고도화하는 단계로 나아가야 한다. 즉 챗GPT를 활용한 각 기업의 서비스가 자연스럽게 사람들의 일상에 자리 잡고 지속하는 데 주력해야 한다. 이러한 프로세스를 구축했을 때 성공적으로 챗GPT를 비즈니스에 도입했다고 볼 수 있다.
_p.35, 챗GPT가 보여 주는 가능성
‘깨끗한 데이터’란 내가 필요로 하는, 내가 보고 싶은 데이터를 의미한다. 물론 엄격한 의미로 보자면 불필요한 데이터, 가비지 데이터라는 건 없다. 남자 시계와 관련한 정보가 필요한 사람에겐 부동산과 관련한 데이터는 필요 없지만, 부동산 중개업자에겐 가장 중요한 데이터일 것이다. 그래서 수집된 데이터를 ‘깨끗한 데이터’와 ‘가비지 데이터’로 분류하기 위해선 데이터 수집의 목적부터 분명히 해야 한다.
_p.54, 데이터, 버릴수록 가치가 생긴다
새로운 기술이 등장했다는 것도 중요하지만 무엇보다 이러한 기술을 활용하여 실질적인 이익을 창출해야 진정한 의미가 생길 것이다. 기술이 돈을 벌기 시작하면 그때부터 많은 사람들이 불나방처럼 뛰어들고 비즈니스 생태계가 만들어진다. 그렇다면 앞으로 생성형 AI 기술을 어떻게 활용해서 비즈니스를 할 수 있을까? 아직은 초기 단계이지만 현재로서는 크게 4가지 형태의 비즈니스가 눈에 띈다.
_p.98, 생성형 AI의 등장, 새로운 비즈니스의 탄생
챗GPT 플러그인은 오픈AI가 개발한 GPT-3.5 기반의 언어 모델인 챗GPT를 제3자 서비스나 애플리케이션에 통합할 수 있는 기능을 제공하는 도구다. 이를 통해 기업은 자체 제품이나 서비스에 자연어 이해, 대화 인터페이스, 질의응답 기능 등을 추가할 수 있다. 아직까지는 이 액세스 권한을 모든 기업에게 제공하지는 않았고, 신청하면 오픈AI에서 판단하여 사용 승인을 하는 절차를 거치게 된다. 당연히 오픈AI 측에서는 비즈니스나 마케팅적으로 도움이 되는 기업을 우선 선택하게 될 것이다.
_p.130, 문제 해결의 핵심, 챗GPT 플러그인
>>>
이 작품은 입문서와 활용서를 짬짜면처럼 반반 구성한 듯하다.
오픈AI의 챗GPT 탄생의 배경과 영향을 서술하고, 업무 등 실생활에서 적용 가능한 부분들을 짚어준다.
저자가 데이터 전문가여서 그런지 Data Analytics 관점에서도 AI를 설명해준다.
읽고 나서 책 뒷장표를 덮었는데,
솔직히 아직 벙벙하다.
제대로된 챗GTP use case가 없고, 제대로 된 BM(사업모델)을 만든 기업은 나타나지 않았다.
이미 언론과 시장은 AGI(범용AI)를 언급하며 들떠있지만, 고객과 기업은 냉담한 편이다.
수천조원의 시가총액을 보여주는 미국의 몇몇 빅테크 기업들을 제외하곤 다들 물음표를 갖고 있다.
생성형AI 기능을 구현, 개선하기 위해 필요한 인프라(데이터센터, 서버, 전력, 개발인력 등)에는 핫머니가 몰리고 있지만,
우리 일상은 다소 잠잠한 편이다.
어떻게보면 소수의 얼리어답터에게 좋은 기회이다.
아무도 유튜브를 모를 때, 유튜브에 콘텐츠를 올리기 시작한 소수의 사람들은 이런 기분이었을까.
생성형AI가 버블인지 아닌지, 그 누구도 알 수 없다.
다만 티핑 포인트에 곧 다다를 것으로 예상된다.
즉, 예전으로 다시 돌아갈 수 없지 않을까.
우리가 20년 넘게 사용한 파워포인트, 엑셀, 워드 문석 작업 방식이
앞으로 달라질 수 밖에 없다.
우리 세대가 20년 넘게 익숙히 사용하고 있는 IT 문물이 또 무엇이 있을까.
휴대폰, PC, 노트북은 큰 변화 앞에 있다.
AI 플러그인 기능이 도입되는 것은 기정사실이며,
폼 팩터가 완전히 다른 새로운 디바이스도 나올 때가 되었다.
더 세밀하게 이 현상을 지켜보고 싶다.
어떻게 발전해나갈지 궁금하다.
반응형