ChatGPT는 수많은 AI 기술 중 하나에 불과하다

ChatGPT 출현에 대중은 충격에 빠졌다. 여론은 들떴고, 혹자는 AI의 지능이 조만간 인간을 따라잡을 거라고 예견했다. 소문이 흉흉한 지금, 그 오해와 진실을 정리해 줄 컴퓨터공학자를 찾았다.

2023-04-17     이영민 에디터

 

 

컴퓨터공학자의 시선

 

ChatGPT는 정말 우리의 미래 일상을 바꾸고 산업을 재편할 것인가? 현시점에 한국 사회를 관통하는 질문이다. ChatGPT의 출현 이후 대중은 이런 의문을 가졌고, 업계를 막론하고 ChatGPT와 AI를 혼용하기 시작했다. ChatGPT와 전혀 다른 계열의 AI인 구글 알파고를 비교한다거나, ChatGPT를 ‘궁극의 AI’로 치환해 버린 뉴스도 쏟아졌다. 엄밀히 말하면, 이는 과장된 뉴스에 불과하다. 컴퓨터공학자 조성배는 그런 현실이 안타깝다.

“사회적으로 ChatGPT에 대한 관심이 뜨거운 건 맞지만 그 열기에 묻어 가기에는 사실과 다른 뉴스가 너무 많다. 예를 들면 ChatGPT가 신기술인 것처럼 보도되고 있는데, 사실 오래전부터 꾸준히 시도되어 온 기술이다. A라는 단어 다음에 B 단어가 나올 가능성을 확률로 통계 내 프로그램에 도입하는 방식은 무려 40~50년 전부터 하던 일이다. 또 문장을 중심으로 채팅을 한다든지, 묻는 말에 답변을 한다는 점에서 기존 챗봇의 업그레이드 정도일 뿐 혁신기술을 구현한 것은 아니다. 다만 아주 정교하게 사람들에게 답한다는 점은 매우 놀랍다.”

실제로 ChatGPT는 그동안 인류가 IT 기술을 최대한 동원해 구현하려고 했던 AI 가운데 하나일 뿐이다. 그것이 지금까지 선보인 어떤 모델보다 좋은 결과를 냈기에 대중이 환호하는 것이다. 그는 “기술을 다 알고 있었고, 구현할 수도 있다고 생각했지만 막상 하기는 어려웠다”며 “ChatGPT가 대단한 건 단순히 ‘도움이 된다’, ‘안 된다’의 문제를 넘어 굉장히 실용적인 분야까지 서비스로 연결할 수 있다는 점”이라고 설명하며 우리가 놓치고 있는 ChatGPT 이슈들을 친절하게 안내했다.

 

ChatGPT는 ‘인공성’ 덜한 챗봇

기존 챗봇과 ChatGPT의 기술적 차이는 무엇일까? 그게 무엇이기에 이토록 세상이 떠들썩한 걸까? 가장 큰 차이는 ‘언어 생성’ 능력이다. 지금까지의 챗봇은 어떤 문장이 들어오면 그 문장에 담긴 키워드에 가장 잘 매칭될 수 있는 일종의 ‘대답 문장’을 수십, 수백 개씩 미리 갖고 있게 했다. 질문이 입력되면 저장된 답변을 내놓는 식이다. 하지만 챗봇이 아무리 물음에 답을 잘한다고 한들, 이미 의미를 파악하고 있다가 대답하는 인상을 줬다. 또 금융이면 금융, 쇼핑몰이면 쇼핑몰 등으로 그 영역이 한정되어 있다 보니 대답도 해당 카테고리에 맞춰져 있었다.

반면 ChatGPT는 이 같은 문제를 많은 부분 해결했다. 적어도 질문의 맥락을 잘 알아채는 뉘앙스를 준다. 대답도 사람과 대화하는 것처럼 자연스러운 문장으로 한다. 무엇보다 이미 준비돼 있는 대답 중 하나를 던지는 것이 아니라 물음에 관한 답변을 즉석에서 생성해 내놓는다. 이를 두고 ‘생성형 AI’라고 한다. 사실 ChatGPT 역시 챗봇과 마찬가지로 저장된 대답이 있기는 하지만 1750억 개의 매개변수(두 변수를 연결해 주는 변수)를 가지고 질문의 맥락을 계산한 뒤 문장을 생성하기 때문에 내놓는 답변의 결이 이미 저장된 문장과는 완전히 달라진다. 그런 점에서 ‘인공성’이 덜하다는 인상을 준다는 것이 조 교수의 평가다.

“일반적인 대화라든지, 카테고리에서 조금만 벗어나도 대답할 수 없는 것이 기존 챗봇의 한계였다. AI 기술은 ‘응용’을 중요하게 여기는데, 마땅히 쓸 만한 게 없었다. ChatGPT가 그런 한계를 보완했다는 것은 의미가 크다. 방대한 데이터를, 엄청나게 좋은 컴퓨터로 활용했다는 점이 기술적 성공에 기여했다. 거기에 언어 모델로서 응용할 만한 몇 가지 독창적인 아이디어를 적용한 것이 기존 챗봇과 ChatGPT의 가장 큰 차이다.”

 

알고 보면 AI는 인간보다 비효율적이다

1750억 개나 되는 매개변수를 가졌다는 건 AI 학습 기술의 현재를 말해준다. 그건 ‘강화학습’이라는 기술이 있기에 가능했다. 강화학습은 컴퓨터가 스스로 학습하되 보상을 통해 올바른 답을 찾아가도록 하는 방식으로, ChatGPT에 적용됐다. 언어 모델의 특성상 정확도를 높이기 위해 인간이 일일이 답변을 정교하게 다듬었는데, 방대한 분량의 매개변수를 모두 수작업으로 할 수는 없었다. 그래서 적용한 것이 강화학습이다.

그러나 여기에도 오해가 있다. 조성배 교수는 “흔히 하는 생각과 달리 ChatGPT의 강화학습은 ‘반자동’으로, 사람의 손길이 필요하다”며 “어떤 질문을 입력한 뒤 ‘답은 여러 개가 나올 수 있는데 그중 이 답이 더 좋아’라는 식으로 사람이 순서를 매겨주는 것이 핵심”이라고 밝혔다. 그는 “이후 보상과 벌을 주는 등 피드백을 통해 매개변수를 최적화할 수 있도록 한다”라고 덧붙였다. 그렇다면 강화학습을 위시한 머신러닝(컴퓨터가 스스로 학습하는 기술)의 한계는 없을까? 조 교수는 “한계가 명확하다”라고 말했다. 고성능 컴퓨터로 양질의 데이터를 무수히 많이 써야만 한다는 걸 가장 큰 한계로 지적했다.

“인간은 새로운 사람을 익히는 데 두세 번만 만나면 된다. 반면 머신러닝이 한 사람을 인식하려면 1만 장 가까운 데이터가 필요하다. 또한 한 번 학습시키는 데는 고성능 컴퓨터 등의 장비를 많이, 오랫동안 가동해야 한다. 그로 인한 유지관리비는 천문학적이다. 무엇보다 새로운 데이터가 들어오면 기존에 쌓았던 지식은 와장창 깨지고 만다. 결과물 역시 정확할지언정 그 값이 왜 그렇게 나왔는지는 대부분 파악도 안 된다.”

 

과연 ChatGPT가 유용한가 생각해야

머신러닝의 한계는 곧 ChatGPT의 이야기이기도 하다. 리소스(생산에 쓰이는 요소)를 많이 사용하는 만큼 비효율적 방법이라는 것을 간과해서는 안 된다는 것이 조성배 교수의 생각이다. 사람이 하는 것처럼 자연스러운 대화가 가능하다는 건 흥미로운 부분이지만, 이를 구현하기 위해서는 전력을 엄청나게 사용해야 하고, 그로 인한 이산화탄소 배출량도 어마어마하다. 이 모든 걸 감안하며 사용할 만큼 ChatGPT가 우리에게 유용할까? 가상화폐처럼 유지하는 데 들이는 공력보다 실제로는 그렇게 유용하지 않을 수 있지 않을까? 비즈니스 효율성은 또 어떤가? ChatGPT가 우리 사회에 던지는 물음들이다.

그래서 조 교수는 “프롬프트 엔지니어링을 내세운 수익성 콘텐츠가 생겨나고, 단순 반복적인 업무에 들어가는 힘을 덜어주는 도구로서 노동 생산성에 기여할지라도 ChatGPT를 궁극의 AI로 보는 지금의 분위기는 한 번쯤 환기할 필요가 있다”라고 밝혔다.

 

ChatGPT를 만든 기술은

이미 오래전부터 시도되어 왔다.

그 안에 대단한 신기술이 있다고

생각하는 건 오해다.

그보다 중요한 건 실용적 서비스로

연결됐다는 것이다.

Profile  조성배
연세대학교 컴퓨터과학과 교수
연세대학교 인공지능대학원 원장