인간으로서 해야 할 훈련은 계속 수행하라
ChatGPT로 일상이 좀 더 편해진 건 좋아할 일이다. 그러나 이내 그 기술을 의심하는 건 꼭 필요한 자세다. 문해력, 어학이 화두인 한국 사회에선 더더욱 그렇지 않을까? 언어학자에게 의견을 물었다.
언어학자의 시선
ChatGPT는 데이터의 힘을 한껏 보여줬다. 데이터를 손에 넣은 AI들은 대중의 욕구를 읽고 시대의 패턴도 읽을 수 있다. 이는 사용자가 원하는 것을 주고 원치 않는 것을 주지 않는 ‘깔끔한 일 처리’가 가능한 일종의 완벽한 시장이 탄생할 수도 있다는 얘기다.
그래서 앞으로의 세상에선 데이터가 절실하다. 직업을 불문하고 실패의 늪에서 허우적거리지 않으려면 데이터를 모아야 한다. 그런데 평범한 우리가 그토록 방대한 양의 데이터를 모을 수 있을까? 데이터를 모은다고 한들 어떻게 활용할지 막막하지 않은가? ChatGPT는 그런 데이터 문맹자들을 위한 도우미가 되기에 충분한 자질을 갖고 있다. 무엇보다 인간과 비슷하리만큼 뛰어난 이해력과 자연스러운 언어 생성 능력을 보면 개인 비서 역할을 맡겨도 될 만큼 신뢰가 간다.
언어학자 박진호도 “ChatGPT는 사용하기 쉽고, 언어학자가 봐도 이보다 자연스러울 수 있을까 싶을 정도로 뛰어난 문장을 만들어낸다”며 놀라워했다. 그러나 이는 어디까지나 아웃풋에 관한 평가다. 내막을 들여다보면 그 언어적 한계는 명확하다는 의견을 덧붙였다.
장문, 창의성, 재미는 ChatGPT의 분명한 언어적 한계
ChatGPT의 가장 큰 한계는 ‘길이’다. 한국어를 기준으로 볼 때 문법 수준이나 문학적 기법 활용도 등은 완벽에 가깝다. 소설, 시 등 장르도 가리지 않고 굉장히 잘 쓰는 편이다. 하지만 내용을 자세히 들여다보면 소설보다 시의 작품성이 더 높다. 이를 두고 박 교수는 시는 글의 길이가 짧기 때문이라고 해석했다.
“소설, 수필 등에 비해 상대적으로 길이가 짧은 문학에 속하는 시는 AI가 언어를 생성하기에 더 쉬울 수 있다. 또 장르의 특성상 논리적이지 않아도 되고, 엉뚱한 말이 나오더라도 사람들이 오히려 ‘신선하다’고 받아들일 수 있다. 반면 소설은 호흡이 길다 보니 ChatGPT도 한계에 부딪히는 느낌이다.”
아직 장문의 글을 쓰는 능력이 부족하더라도 단 수 초 만에 글을 써낸다는 건 혁명적인 일이다. 그건 창의성을 요하지 않는 영역에서 유용하게 활용될 여지를 준다. 이를테면 기획안을 작성할 때 반복되는 문구나 템플릿 등은 ChatGPT가 생성하고, 달라지는 부분만 수기로 입력하면 효율적으로 일을 처리할 수 있다. 신문 기사 역시 천편일률적인 보도가 필요한 경우에 ChatGPT가 대신 글을 생산할 수도 있다. 이를 두고 AI가 인간을 넘어선다고 보는 시각도 있는데, 박 교수의 생각은 다르다.
“글을 쓰는 것과 창의성, 재미 등은 별개의 영역이다. 누구나 글을 쓸 수 있지만 아무나 노벨 문학상을 받는 건 아니다. 그것과 똑같다. ChatGPT와 인간은 저마다 잘하는 분야가 있다. 무작정AI가 인간을 넘어선다고 보는 건 과도한 우려다.”
ChatGPT는 문해력, 어학의 영역을 침범하지 않는다
ChatGPT는 쓰기 나름이라고 한다면 21세기 한국 사회의 화두인 문해력, 어학 등에 미치는 영향은 어떠할까? ChatGPT를 피상적으로만 사용하는 사람들은 문해력을 악화시키는 ‘악재’로 보고 있다. 그들의 논리는 분명하다. ChatGPT가 많은 걸 해주다 보면 인간으로서 갖는 ‘고등한 상호작용’을 키우는 훈련을 게을리하게 될 것이라는 주장이다.
이에 박 교수는 “컴퓨터, 계산기 등 다른 도구들도 인간에게 편의를 제공한 건 마찬가지”라며 “수학자가 자신의 연구 이론이나 방정식 등을 제대로 이해한 상태에서 컴퓨터에 계산을 맡겨도 별 지장은 없다”라고 밝혔다. 도구를 어떻게 활용하느냐의 문제이지 ChatGPT 자체의 문제가 아니라는 말이다.
“문해력을 키우려면 글을 쓰면서 생각을 정리하고, 논리적으로 배치하는 등의 훈련이 중요하다. 이를 착실히 해나가면서 필요시 ChatGPT를 활용하는 건 별문제가 되지 않는다. 그건 어학 역시 마찬가지다. 스스로 영어를 학습한 사람과 번역기에 의지해 온 사람의 수준 차이는 갈수록 벌어질 것이다. 일각에서는 번역기가 점점 발전해 격차가 좁혀질 것이라고 보기도 하는데, 어폐가 있다. 만족감을 주는 번역기가 나오려면 아직 멀었다.”
번역 기술이 한계에 봉착할 것이라고 보는 이유는 영어 데이터가 한글 데이터보다 훨씬 많기 때문이다. AI가 영어로는 학습했지만 한글로는 학습하지 못한 데서 오는 격차가 번역을 매끄럽지 못하게 한다는 건 자명한 사실이다.
ChatGPT로도 양질의 한글 정보를 얻을 수 있다
ChatGPT만 해도 영어로 했을 때 얻을 수 있는 정보의 질이 한글로 했을 때보다 좋다. 이 역시 AI가 영어 위주로 학습했기 때문이다. 그렇다면 한글의 데이터화가 유독 느린 이유는 무엇일까? 박진호 교수는 한글과 영어의 구조 차이 때문이라고 설명한다. 하나의 문장이 있다고 가정했을 때 영어는 단어들을 쭉 나열하는 구조다. 이에 AI는 띄어쓰기만 신경 쓰면 된다. 단어 하나하나를 해체하지 않아도 의미를 처리할 수 있다. 반면 한글은 문장을 이루는 각 단어들을 초성, 중성, 종성으로 분류하고, 품사별로 해체까지 해야 한다.
예를 들어 영어로 ‘John loves Mary’라는 문장이 있다고 치자. 여기에는 ‘John’, ‘loves’, ‘Mary’ 세 단어가 전부다. 하지만 한글로 ‘존은 메리를 사랑한다’라는 문장이 있다면 명사 ‘존’과 조사 ‘~은’을 떼고, ‘메리’와 조사 ‘~를’을 분류해야 한다. ‘사랑한다’도 ‘사랑’, ‘하’, ‘ㄴ다’로 세 등분해야 한다.
“영어를 기반으로 만든 AI는 한글의 특성을 모르기 때문에 단어를 분해하지 못한다. 이에 따라 한국어의 품질이 떨어질 수밖에 없다. 이를 극복하려면 한국어에 맞는 ‘형태소 분석’ 기술을 도입해야 한다.”
박진호 교수에 따르면 현재 개발되어 있는 한글 형태소 분석기는 98%의 정확도를 자랑한다. ChatGPT 등 AI 언어 모델에 적용하기만 하면 쉽게 사용할 수 있다. 그런 노력들이 더해지면 향후 펼쳐질 AI 세상에서 한글의 사용도 훨씬 폭넓어질 전망이다.
ChatGPT는 글을 쓸 줄 알지만
잘 쓰는 건 별개의 영역이다.
누구나 글을 쓸 수 있지만
아무나 노벨 문학상을 받는 건 아니다.
그것과 같다.
Profile 박진호
서울대학교 국어국문학과 교수
서울대학교 AI연구원 기획부원장