요즘 챗GPT와 같은 인공지능이 사람처럼 자연스럽게 대화하는 것을 보면 마치 안에 사람이 들어있는 것 같은 착각이 든다. 하지만 이 기술의 핵심은 마법이나 자아가 아니라 철저히 수학적인 확률 계산이다. 이를 전문 용어로 거대 언어 모델이라고 부른다.

AI가 글을 쓰는 방식은 친구와 빈칸 채우기 놀이를 하는 것과 매우 비슷하다. 예를 들어 "오늘 급식 메뉴는 정말 [ ? ]"라는 문장이 있다고 해보자. 빈칸에 들어갈 말로 맛있다, 맛없다, 매웠다 등은 확률이 아주 높지만, 갑자기 비행기다, 책상이다 같은 단어가 올 확률은 거의 0에 가깝다.
AI는 인터넷에 있는 수억 개의 문장 데이터를 학습하여, 특정 단어 뒤에 어떤 단어가 따라오는 것이 가장 자연스러운지 통계적으로 계산해 둔 상태다.
우리가 질문을 던지면 AI는 그 질문의 문맥을 파악한 뒤, 다음에 올 수 있는 수만 가지 단어 중에서 가장 확률이 높은 단어를 하나씩 선택해서 이어 붙인다. 이것은 마치 수많은 단어 카드를 펼쳐 놓고, 현재 상황에 가장 알맞은 카드를 주사위 굴리듯 확률에 따라 뽑는 과정의 연속이다.
즉, AI는 문장을 한 번에 완성하는 것이 아니라, 앞 단어를 보고 뒷 단어를 예측하는 과정을 엄청나게 빠른 속도로 반복하는 것이다.
따라서 엄밀히 말하면 AI는 문장의 의미를 사람처럼 깊이 이해하고 공감해서 말하는 것이 아니다. 단지 학습된 데이터에 따라 가장 그럴듯해 보이는 단어 조합을 확률적으로 내놓는 예측 기계에 가깝다.
이 원리를 이해하면 AI가 가끔 뻔뻔하게 거짓말을 하는 환각 현상도 이해할 수 있다. 학습 데이터가 부족하거나 잘못된 경우, 엉뚱한 단어를 높은 확률로 착각하여 선택하기 때문이다. 결국 인공지능의 유려한 말솜씨는 방대한 데이터와 확률이 만들어낸 정교한 이어 말하기 기술이다.
[※ 칼럼의 그림 및 도표는 AI 활용하여 작성됨]










