AI AI는 다음 단어를 어떻게 알까? : 확률과 예측의 언어 모델
요즘 챗GPT와 같은 인공지능이 사람처럼 자연스럽게 대화하는 것을 보면 마치 안에 사람이 들어있는 것 같은 착각이 든다. 하지만 이 기술의 핵심은 마법이나 자아가 아니라 철저히 수학적인 확률 계산이다. 이를 전문 용어로 거대 언어 모델이라고 부른다. AI가 글을 쓰는 방식은 친구와 빈칸 채우기 놀이를 하는 것과 매우 비슷하다. 예를 들어 "오늘 급식 메뉴는 정말 [ ? ]"라는 문장이 있다고 해보자. 빈칸에 들어갈 말로 맛있다, 맛없다, 매웠다 등은 확률이 아주 높지만, 갑자기 비행기다, 책상이다 같은 단어가 올 확률은 거의 0에 가깝다. AI는 인터넷에 있는 수억 개의 문장 데이터를 학습하여, 특정 단어 뒤에 어떤 단어가 따라오는 것이 가장 자연스러운지 통계적으로 계산해 둔 상태다. 우리가 질문을 던지면 AI는 그 질문의 문맥을 파악한 뒤, 다음에 올 수 있는 수만 가지 단어 중에서 가장 확률이 높은 단어를 하나씩 선택해서 이어 붙인다. 이것은 마치 수많은 단어 카드를 펼쳐 놓고, 현재 상황에 가장 알맞은 카드를 주사위 굴리듯 확률에 따라 뽑는 과정의 연속이다. 즉, AI는 문장을 한 번에 완성하는 것이 아니라, 앞 단어를 보고 뒷 단어를 예측하는 과정을