[세상 돌아보기] GPT-4, 사람 같은 인공지능인가

이주선 논설위원, 기업&경제연구소장, 연세대 경영대 연구교수

작년 11월 Chat-GPT를 출시했던 오픈 AI(Open AI)가 불과 넉 달이 지난 3월 14일 GPT-4를 내놓았다. Chat-GPT 등장 이후 인공지능을 잘 모르는 사람들도 풍문, 공상과학 소설이나 영화를 떠올리면서 여러 글을 언론 지상에 쏟아낼 정도로 세간의 관심은 고조되었다.

필자는 2021년 7월 말 졸저 ‘AI 임팩트’를 출간했다. 이 책은 다양한 인공지능 관련 지식을 체계적으로 정리하여 독자들의 이해를 돕는 게 목표였다. 인공지능의 역사, 기술 진화, 미래 전망, 그리고 인공지능의 일자리, 경제성장, 투자와 무역, 경쟁·무역·소득분배·투자·고용 정책 파급효과를 총망라했다.

이 책 출간 1년여 전인 2020년 6월 GPT-3가 나왔는데, 책에는 이렇게 소개되어 있다.

2020년에는 오픈 AI가 3,000억 개의 방대한 토큰(데이터 세트)과 1,750억 개의 파라미터를 가진 딥러닝 기반 자연어 처리 인공지능 GPT-3(3세대-GPT: generative pre-trained transformer-3)를 발표해서 큰 주목을 받았다. GPT-3는 지금까지의 기계번역 인공지능들과는 달리 상당히 광범위한 분야에 대한 질문에 응답할 수 있게 범용성을 확장하여 획기적이라는 평가를 받았다. 하나의 문장이 아니라 대화에서 문맥을 파악해 창의적인 응답을 할 수 있고, 사람이 쓴 기사로 착각할 정도의 기사도 쓸 수 있다. 또한 사람과 대화를 하는 경우 사람들의 어리석음과 사랑에 관해서 이야기할 수도 있고 거짓말도 할 수 있다. 이는 GPT-3가 상당히 많은 지식을 가지고 있어서 가능한 것으로 알려져 있다. 이러한 GPT-3의 광범위한 범용성과 AGI로의 발전 가능성 확장은 딥러닝이 다양한 한계에 직면하고 있으나 범용인공지능(AGI)으로 진보를 지속하고 있는 증거로 평가할 수 있다.

그러나 여전히 알파제로나 GPT-3도 AGI에 도달하기에는 한참 못 미치는 단계에 있다고 할 수 있다. 이렇게 평가하는 이유는 아직도 알파제로로 소설을 쓸 수 없고, GPT-3로 체스를 둘 수 없으며, 이 인공지능들이 소설이나 체스가 왜 사람에게 중요한지를 지능적으로 추론할 수도 없기 때문이다. 또한 GPT-3도 기존 딥러닝 인공지능들처럼 학습된 지식을 다른 일을 위해서 응용해 사용하는 전이학습 역량이나, 현실 세계에 대한 상식도 여전히 없다. 예컨대 GPT-3도 “치즈를 냉장고 안에 넣으면 녹느냐?”는 질문에 “그렇다”고 답할 정도로 여전히 ‘엉뚱이(brittle)’이다.

책이 나올 무렵 조만간 GPT-4가 나오고, AGI가 될 가능성이 있다는 추측이 있었다. 그런데 작년 11월 Chat-GPT가 출시되었다. Chat-GPT는 AI를 잘 모르는 사람들도 그 대화창에 검색어나 질문을 넣으면 구글이나 네이버와 달리 대화하는 것처럼 질문에 대한 충분한 답변을 받을 수 있게 했다. 이는 AI에 대한 대중의 관심과 다양한 논쟁을 재점화했다.

이런 와중에 갑자기 GPT-4가 발표되었다. 필자가 보기에 GPT-4는 추측과 같이 AGI는 아니나, 그 실현의 중대 장애물 2개를 돌파한 엄청난 진화이자 혁신이다.

첫째, GPT-4는 사진·그림을 보고 말이나 글로 이를 묘사·식별하는 일과 자연어(사람의 언어)를 듣거나 읽어 학습해서 사람의 다양한 질문이나 지시에 적절하거나 뛰어난 답변을 할 수 있다. 즉, 컴퓨터 비전과 자연어 처리를 한 기술로 모두 할 수 있는 다기능(multi-modal) 인공지능이다. 이는 AI가 다양하고 복잡한 일을 모두 하는 자연지능(사람의 지능)의 범용성(generality)에 상당히 가까워졌음을 의미한다.

둘째, GPT-4는 Chat-GPT와 비교할 수 없는 ‘기억 능력’을 가졌다. Chat-GPT는 한 번에 텍스트의 8000개 단어(책 4~5쪽, 4096개 토큰(말뭉치))를 변환했는데, GPT-4는 6만4000개 단어(책 50쪽, 3만2768개 토큰)를 변환할 수 있다. 기억 능력이 8배 증가한 것이다. 대화나 문서를 작성할 때 최대 50쪽을 기억할 수 있고, 20쪽 분량의 대화나, 문서를 만들거나 작문을 할 때 35쪽 전의 내용도 언급할 수 있다. GPT-4를 테스트한 전문가는 “GPT-3와 Chat-GPT가 6학년(미국 중1)이라면, GPT-4는 ‘똑똑한’ 10학년(미국 고3) 같다”고 했다. 이렇게 역량 격차가 엄청나다.

또한 26개 언어 대상 MMLU(Massive Multitask Language Understanding) 테스트에서도 다른 모든 거대 AI들을 훨씬 능가했다. 결국, 앞으로 데이터 학습에 따라 GPT-4가 모든 언어에서 월등한 다기능 역량을 가질 것이다. 이런 역량으로 GPT-4는 미국 변호사 시험에서 90번째, SAT에서는 93번째, 수학시험에서는 89번째 백분위 수를 기록, 상위 10%에 속했다.

다기능(multi-modal)과 기억 능력 향상은 결국 향후 진화되는 인공지능들이 “치즈를 냉장고에 넣으면 녹느냐?”는 질문에 “그렇다.”고 답하는 ‘엉뚱이’가 될 개연성을 획기적으로 감소시키는 진보다. 이 진보가 불과 4개월 만에 일어난 것은, 앞으로 인공지능의 진화가 ‘지수적으로(exponentially) 진전’될 것을 시사한다.

그러나 책에서 밝힌 것처럼 인공지능이 AGI가 되려면 여전히 엄청난 장애물들을 돌파해야 한다. GPT-4도 범용성 확장, 전이학습 능력, 상식 보유 등에서 더 큰 진전이 필요하다. 특히 아직은 ‘이 세상(world)이 있다.’는 인식이나 가치 판단 등을 하지 못한다.

종합하면 아직 인공지능의 진화는 여전히 ‘알려진 미지의 문제(known unknowns)’인 위험(risks)과 ‘상상조차 불가능한 해법 없는 문제(unknown unknowns)’인 불확실성(uncertainty)의 중간 어디에 있다.

그러므로 지금 우리는 이 기술이 인류의 적이 아니라 도우미가 될 방도를 반드시 찾아내야만 한다.

이주선 논설위원 press@dailyimpact.co.kr

다른기사 보기

데일리임팩트