AI 이야기 #5 - 기계는 어떻게 배우는가?

2025. 8. 25. 23:52Deepin sights

반응형

앞선 이야기에서 우리는 AI가 무엇인지, 머신러닝과 딥러닝의 차이가 무엇인지,

그리고 데이터가 어떤 의미를 가지는지 차례대로 짚어왔다.


이제 자연스러운 다음 질문은 이것이다. 그렇다면 기계는 실제로 어떻게 배우는 걸까.
아이가 말을 배우고, 학생이 수학 문제를 푸는 것처럼, 기계에게도 학습의 방식이 있을까.

학습(training)은 말 그대로 모델이 데이터에서 규칙을 스스로 찾아내는 과정이다.
사람은 교과서를 읽고, 문제를 풀고, 틀린 답을 고쳐가면서 배운다.
기계 역시 크게 다르지 않다.
다만 교과서가 데이터이고, 문제집이 손실 함수(loss function: 정답과 예측의 차이를 수치로 표현하는 방법)이며, 틀린 답을 고치는 과정이 바로 파라미터 조정이다.
기계가 머리 속에 펜을 굴리는 대신, 수많은 가중치(weight: 입력이 결과에 끼치는 영향의 크기)를 조금씩 바꾸어 나가는 셈이다.

훈련 과정은 생각보다 단순하다. 사진이 들어오면 모델은 ‘이건 고양이’라고 예측한다.
정답이 ‘개’라면, 손실 함수는 두 결과의 차이를 숫자로 알려준다.
그러면 옵티마이저(optimizer: 손실을 줄이기 위해 가중치를 조정하는 알고리즘)가 등장해, “조금만 귀 모양 쪽에 더 신경을 써봐” 하듯 파라미터를 조정한다.
이런 시행착오가 수천, 수만 번 반복되면서 모델은 점점 더 정답에 가까워진다.
결국 기계 학습의 본질은 틀림을 통해 바로잡아가는 과정이다.

이 과정을 아이가 자전거를 배우는 장면으로 바꿔보면 이해가 쉽다.
처음에는 넘어지고, 무릎이 까이고, 핸들이 엉뚱한 쪽으로 돌아가지만, 반복할수록 균형 감각이 자리 잡는다.

기계도 마찬가지다.
데이터라는 길 위를 수없이 달리며 넘어지고, 다시 일어서며, 어느 순간부터는 자연스럽게 주행을 이어간다.
이게 바로 기계가 배우는 풍경이다.

그렇다면 추론(inference)이란 무엇일까. 학습이 훈련 과정이라면, 추론은 시험 무대다.
아이가 집에서 수학 문제를 풀 때는 교과서 예제를 보고 따라 할 수 있다.
하지만 시험장에서는 새로운 문제가 나온다.

마찬가지로 모델은 훈련 데이터로만 연습하다가, 추론 단계에서 처음 보는 데이터를 만난다.
이때 배운 규칙을 적용해 답을 내는 것이 추론이다. 훈련이 내적 소화 과정이라면, 추론은 바깥으로 꺼내는 말하기다.

학습과 추론의 관계는 요리로도 비유할 수 있다.
학습은 재료를 다듬고, 조리법을 연습하며 수없이 맛을 보고 고쳐나가는 주방의 시간이다.

추론은 완성된 요리를 손님 앞에 내놓는 순간이다.
주방에서는 실수해도 괜찮지만, 식탁 위에서는 결과만 남는다. 그래서 추론 단계에서 모델의 진짜 실력이 드러난다.

기계 학습의 중요한 특징은, 인간처럼 직관을 단번에 잡지 못한다는 점이다.
사람은 사과 몇 번만 봐도 개념을 이해하지만, 기계는 수만 번을 반복해야 겨우 감을 잡는다.

대신 한 번 규칙을 배우고 나면, 지치지 않고 똑같은 기준으로 무한히 적용할 수 있다.
피곤하지 않고, 감정에 흔들리지 않으며, 어제와 오늘이 똑같은 성실함을 유지한다.
그게 기계가 가진 특유의 힘이다.

하지만 이 힘에도 불구하고 기계 학습은 늘 위험을 안고 있다.
학습 데이터에만 지나치게 익숙해져서 새로운 상황에서 실수를 저지르는 경우다.
이를 오버피팅(overfitting: 학습 데이터에는 과도하게 맞추지만 새로운 데이터에는 약한 현상)이라 부른다.

아이가 예상 문제만 달달 외우고 시험장에서 다른 문제가 나오면 당황하는 것과 똑같다.
그래서 연구자들은 기계가 단순한 암기꾼이 아니라, 진짜로 패턴을 이해하는 학습자가 되도록 수많은 장치를 마련해왔다.

이쯤 되면 한 가지 흥미로운 차이가 드러난다.
인간은 배우는 과정에서 질문을 던지고, 의미를 찾으며, 맥락을 이해한다.

하지만 기계는 단순히 입력과 출력 사이의 상관관계를 수학적으로 최적화한다.
의미를 이해한다기보다, 확률적으로 가장 가능성 높은 답을 고른다.

그렇다고 해서 그 답이 쓸모없다는 건 아니다.
실제로 번역기, 자율주행, 의료 영상 판독 같은 분야에서 이미 인간을 압도하는 성능을 보여주고 있다.
그러나 그 안쪽에 있는 방식은 여전히 ‘패턴 맞추기’에 가깝다.

나는 종종 이 과정을 생각하다보면 초등학교의 운동장이 떠오른다.
아이들이 달리기 시합을 할 때, 처음엔 출발선에서 서로 다르게 뛰기 시작하지만, 시간이 지날수록 달리는 법이 몸에 배어 간다.

기계 학습도 그런 식이다. 수많은 시행착오 속에서 서서히 리듬을 찾고, 더 빨리, 더 안정적으로 달린다.
결국 학습은 리듬을 만드는 일이고, 추론은 그 리듬으로 세상을 해석하는 순간이다.

이제 질문은 다시 우리에게 돌아온다.
기계가 이렇게 배우고 추론하는 과정을 인간은 어디까지 신뢰할 수 있을까.

반복과 수학으로 만들어진 규칙은 분명 유용하지만, 거기엔 맥락과 의미가 빠져 있다.
기계가 잘하는 건 계산이고, 우리가 잘하는 건 해석이다.
그 차이를 명확히 이해할 때, 우리는 AI를 도구로서 더 똑똑하게 다룰 수 있다.

기계는 이렇게 배운다. 수없이 넘어지고, 다시 일어나며, 작은 틀림을 고쳐나가는 과정 속에서.
그리고 언젠가 처음 보는 문제를 만났을 때, 자신이 쌓아온 규칙을 꺼내 답을 내놓는다.
그것이 기계의 학습과 추론이다. 이 단순하고 꾸준한 과정이 모여, 지금 우리가 보고 있는 거대한 AI의 시대를 지탱하고 있다.

반응형