AI는 어떻게 작동하나요 — 입문자를 위한 가이드

AI · 머신러닝 · 딥러닝 · 신경망까지 한 줄기로

엑스디노드 기술팀

읽는 시간 약

13분

ChatGPT, AI, 머신러닝, 딥러닝. 매일 듣는 단어인데 막상 누가 물어보면 답하기 어렵습니다. 어떤 게 어떤 것의 부분인지, 무엇이 무엇을 가능하게 하는지 머릿속에 그림이 그려지지 않아요.

이 글은 컴퓨터를 잘 모르는 분도 따라올 수 있도록, AI 분야에서 가장 기본이 되는 단어들을 처음부터 풀어드리려고 해요. 영어 약자가 나오면 무엇의 약자인지부터 풀고, 새로운 용어가 등장하면 이름의 뜻부터 짚고 넘어갑니다. AI라는 게 도대체 무엇이고, 어떻게 사람처럼 판단하는 걸까? 라는 한 가지 질문을 따라가면서, 등장하는 단어들이 무엇인지 자연스럽게 알려드릴게요.

읽고 나면 ChatGPT 같은 AI 서비스를 더 정확히 이해하게 되고, 다음 단계로 무엇을 더 알아야 할지 감이 잡힐 거예요.



AI라는 단어부터 풀어볼게요

가장 큰 단어부터 정리합니다.

AI는 무슨 뜻인가요?

AI는 영어 Artificial Intelligence의 약자예요. 한국어로 직역하면 "인공지능"입니다. Artificial은 "인공의, 사람이 만든"이라는 뜻이고, Intelligence는 "지능"이라는 뜻이에요. 합치면 "사람이 만든 지능"입니다.

사람의 뇌가 가진 능력, 그러니까 보고 판단하고 결정하는 능력을 컴퓨터가 흉내 낼 수 있게 만든 모든 기술을 통틀어 AI라고 불러요.

우리 일상에 이미 많은 AI

사실 AI는 갑자기 등장한 새 기술이 아니에요. 우리가 매일 쓰는 서비스 곳곳에 이미 들어와 있습니다.

스마트폰의 음성 비서가 우리 말을 알아듣고 답하는 것, 유튜브가 다음에 볼 영상을 추천해주는 것, 자동차가 스스로 주차하는 것, 사진 앱이 얼굴을 인식해서 같은 사람을 묶어주는 것, 그리고 ChatGPT가 우리 질문에 답하는 것까지 전부 AI예요. 적용 분야는 달라도 "컴퓨터가 사람처럼 판단하거나 만들어낸다"는 점에서 같은 우산 아래 있습니다.

머신러닝이라는 단어

AI라는 큰 우산 아래에 머신러닝(Machine Learning)이라는 분야가 있어요. Machine은 "기계", Learning은 "학습"이에요. 그대로 옮기면 "기계 학습"입니다.

머신러닝이 왜 별도의 이름을 가지는지 알려면 옛날 컴퓨터 프로그램을 떠올려 봐야 해요. 옛날 프로그램은 사람이 모든 규칙을 직접 적어줘야 했습니다. 예를 들어 "이메일에 '광고'라는 단어가 있으면 스팸이다", "물건 가격에 부가세 10%를 더하라" 같은 규칙을 일일이 입력해야 컴퓨터가 그걸 따라 했어요.

그런데 어떤 일은 규칙을 적기가 너무 어려워요. 사진을 보고 강아지인지 고양이인지 판단하는 규칙을 적어보라고 하면 막막해요. "귀가 뾰족하면 고양이"라고 적자니 강아지도 귀가 뾰족한 종이 있고, "꼬리가 짧으면 고양이"라고 적자니 꼬리가 긴 고양이도 있어요. 예외가 끝없이 많아서 사람이 모든 규칙을 적는 게 불가능합니다.

머신러닝이 옛날 컴퓨터와 다른 점

머신러닝은 이 문제를 다르게 푹니다. 사람이 규칙을 적어주는 대신, 컴퓨터에게 강아지 사진과 고양이 사진을 수만 장 보여주고 "이건 강아지, 이건 고양이"라는 정답만 알려줘요. 그러면 컴퓨터가 사진들을 보고 스스로 패턴을 찾아냅니다.

사람이 규칙을 적는 게 아니라, 기계가 데이터를 보고 학습한다고 해서 머신러닝이라고 부르는 거예요. IBM의 설명에 따르면, 이 방식 덕분에 사람이 일일이 가르치기 어려운 복잡한 패턴까지 컴퓨터가 학습할 수 있게 됐어요.



딥러닝과 신경망, 왜 이런 이름인가요?

머신러닝 안에서 가장 강력한 갈래가 딥러닝(Deep Learning)이에요. Deep은 "깊은"이라는 뜻이에요. 그대로 "깊은 학습"입니다. 왜 "깊다"고 부르는지는 뒤에서 보여드릴게요. 신경망이라는 구조를 깊게 쌓아 올려서 학습한다는 뜻이에요.

딥러닝이 등장하면서 AI가 달라졌어요

딥러닝이 자리잡기 전까지 AI는 수십 년 동안 더디게 발전했어요. 그러다가 2010년대에 딥러닝이 등장하면서 이미지 인식, 음성 인식, 자연어 처리 같은 어려운 작업의 성능이 비약적으로 올라갔습니다. IBM의 설명에 따르면, 딥러닝은 사람이 따로 가르치지 않아도 대량의 데이터에서 복잡한 패턴을 스스로 찾아낸다는 점이 핵심 강점이에요.

오늘날 우리가 쓰는 AI 서비스의 대부분이 딥러닝 기반이에요. ChatGPT도, 사진 앱의 얼굴 인식도, 자동차의 자율주행도 전부 딥러닝으로 만들어졌습니다.

신경망이라는 이름은 어디서 왔을까요?

딥러닝의 뿌리는 신경망이에요. 영어로는 Neural Network입니다. Neural은 "신경의", Network는 "그물망, 연결된 망"이라는 뜻이에요. 그대로 옮기면 "신경의 그물망"입니다.

왜 "신경"이라는 단어가 들어가는지 알려면 사람의 뇌를 잠깐 떠올려 봐야 해요. 사람의 뇌 안에는 뉴런(Neuron)이라는 신경 세포가 수백억 개 있습니다. 뉴런은 다른 뉴런들과 연결되어 있어서, 한 뉴런이 받은 신호를 다른 뉴런들에게 전달해요. 우리가 무언가를 보고 판단하거나 기억할 때, 이 뉴런들 사이로 신호가 흐르면서 일이 처리됩니다.

컴퓨터 안의 가짜 뉴런

1950~60년대 연구자들은 이 뉴런의 작동 방식을 컴퓨터로 흉내 내 보자는 아이디어를 냈어요. 컴퓨터 안에 뉴런처럼 신호를 주고받는 작은 단위들을 만들고, 그것들을 그물처럼 연결해서 정보를 처리하게 만든 거예요. 사람 뇌의 신경 세포 그물망을 본떠 만들었다고 해서 신경망이라는 이름이 붙었습니다.

즉 신경망은 컴퓨터 안에서 뉴런처럼 작동하는 작은 계산 단위들이 그물처럼 연결된 구조예요. 진짜 신경 세포는 아니고, 사람의 뇌에서 아이디어만 빌려와서 컴퓨터로 흉내 낸 겁니다.



신경망은 어떻게 생겼나요?

신경망 안을 들여다보면 두 가지 단위가 보여요. 노드와 층입니다.

노드 — 신경망의 가장 작은 단위

신경망 안에서 뉴런 역할을 하는 작은 단위를 노드(Node)라고 불러요. Node는 영어로 "점, 마디"라는 뜻입니다.

노드 하나가 하는 일은 단순해요. 다른 노드들로부터 숫자를 받아들이고, 그 숫자들에 정해진 계산을 적용한 다음, 결과 숫자를 다른 노드들에 전달합니다. 노드 한 개만 보면 그저 숫자를 받아 숫자를 내보내는 작은 계산기 같은 존재예요.

중요한 건 이 노드가 혼자 있지 않다는 점입니다. 수많은 노드가 그물처럼 연결되어 있고, 그 연결을 따라 숫자가 흘러다니면서 전체 신경망이 일을 해내요.

층 — 노드를 줄지어 묶은 단위

신경망 안에서 노드들은 무작위로 흩어져 있지 않아요. 층(Layer)이라는 단위로 줄지어 묶여 있습니다. Layer는 "층, 단계"라는 뜻이에요. 한 층 안에 노드 여러 개가 옆으로 나란히 있고, 그 층 위에 또 다른 층이 쌓여 있어요.

입력, 출력, 그리고 그 사이의 은닉

신경망에는 세 종류의 층이 있어요.

첫 번째는 입력 계층(Input Layer)입니다. 신경망에 외부 데이터가 처음 들어오는 층이에요. 사진을 처리하는 신경망이라면, 입력 계층이 사진의 점(픽셀) 값들을 받아들여요.

두 번째는 출력 계층(Output Layer)이에요. 신경망의 최종 답이 나오는 마지막 층입니다. 강아지인지 고양이인지 판단하는 신경망이라면, 출력 계층이 "강아지 80%, 고양이 20%" 같은 최종 결과를 내놓아요.

세 번째는 그 사이에 있는 모든 층, 은닉 계층(Hidden Layer)입니다. Hidden은 "숨겨진"이라는 뜻이에요. 외부에서 안 보이게 신경망 안쪽에서 일하는 층이라는 의미예요. 신경망의 진짜 일은 이 은닉 계층에서 일어납니다.

'딥(deep)'이라는 단어가 등장하는 이유

앞서 딥러닝이 "깊은 학습"이라는 뜻이라고 했어요. 이제 그 "깊다"가 무엇을 뜻하는지 답할 수 있습니다. 바로 은닉 계층을 깊게 많이 쌓아 올린 신경망을 쓴다는 뜻이에요.

옛날 신경망은 은닉 계층이 한두 개 정도였어요. 이 정도로는 복잡한 패턴을 잘 못 잡아냈습니다. 그런데 컴퓨터 성능이 좋아지면서 은닉 계층을 수십, 수백 개까지 쌓는 게 가능해졌고, 그러자 신경망이 훨씬 똑똑해졌어요. 이렇게 층이 깊은 신경망으로 학습하는 방식을 딥러닝이라고 부릅니다.

왜 깊을수록 똑똑해지는지는 사진을 처리하는 신경망의 예가 알기 쉬워요. 첫 번째 층은 단순한 선과 점을 잡아내고, 두세 번째 층은 곡선과 모서리를 잡아내고, 더 깊은 층은 눈·코·입 같은 모양을 잡아내고, 가장 깊은 층은 "이건 강아지의 얼굴이다" 같은 큰 패턴을 잡아내요. 층을 깊이 쌓을수록 더 정교한 판단이 가능해집니다.



가중치 — AI가 '학습한다'는 말의 정체

신경망의 구조를 알았으니, 이제 가장 중요한 개념을 볼 차례예요. 바로 가중치입니다.

연결마다 붙어 있는 숫자

신경망의 노드들은 다음 층의 노드들과 연결되어 있다고 했어요. 이 연결 하나하나에 가중치(Weight)라는 숫자가 붙어 있습니다. Weight는 영어로 "무게, 비중"이라는 뜻이에요.

가중치는 그 연결의 "중요도"를 나타냅니다. 한 노드가 다음 노드로 숫자를 전달할 때, 그 숫자에 가중치가 곱해진 형태로 전달돼요. 가중치가 크면 그 정보가 강하게 전달되고, 가중치가 0에 가까우면 그 정보는 거의 무시됩니다.

신경망이 '학습한다'는 게 무슨 뜻인가요?

여기서 이 글의 가장 중요한 개념이 나옵니다. 신경망이 "학습한다"는 말의 정체가 바로 이 가중치 숫자들을 적절한 값으로 조정해 가는 일이에요.

신경망 구조 자체는 학습 중에 바뀌지 않아요. 층의 개수, 노드의 개수는 고정되어 있습니다. 학습 과정에서 바뀌는 건 오직 이 가중치 값들이에요. 처음에는 무작위 숫자였던 가중치가 학습을 거치며 점점 절묘한 값으로 자리잡아 갑니다.

파라미터라는 단어를 자주 듣는 이유

우리가 AI 뉴스에서 자주 듣는 "파라미터"라는 단어가 거의 다 이 가중치예요. Parameter는 영어로 "매개 변수"라는 뜻이지만, AI 분야에서는 "학습으로 조정되는 숫자"를 가리킵니다.

"GPT-3가 1,750억 개의 파라미터를 가졌다"는 말은, GPT-3 안에 1,750억 개의 가중치 숫자가 들어 있다는 뜻이에요. 학습이 끝났을 때 이 1,750억 개의 숫자가 절묘한 값으로 자리잡았기 때문에, ChatGPT 같은 서비스가 사람처럼 답할 수 있는 거예요.

한 가지 더 알아둑니다. 노드는 받은 숫자들을 가중치와 곱해 더한 뒤 그대로 다음 층에 보내지 않습니다. 한 번 더 "다듬는" 단계를 거쳐요. 이걸 담당하는 게 활성화 함수(Activation Function)예요. "노드의 출력을 그대로 내보내지 말고 정해진 규칙으로 다듬어서 내보내라"는 규칙입니다. 자세한 종류는 외울 필요 없고, 매 층마다 출력을 한 번씩 다듬어주는 단계가 있다는 사실만 알면 충분해요.



AI는 어떻게 학습하나요?

"학습"이라는 단어는 일상에서도 쓰지만, AI 맥락에서는 정확한 뜻이 따로 있어요. 학습(Training)은 신경망의 가중치를 점점 좋은 값으로 조정해 가는 자동화된 과정을 가리킵니다. Training은 영어로 "훈련"이라는 뜻이에요. 그래서 학습 대신 "훈련"이라는 단어도 같이 쓰입니다.

학습은 4단계 사이클의 반복이에요

학습은 한 사이클에 네 단계로 이루어집니다. 이 사이클을 수백만에서 수십억 번 반복하면서 가중치가 점점 정교해져요. 단계 하나씩 차근차근 봅니다.

1단계. 순전파 — 일단 답해보기

학습용 데이터, 예를 들어 정답이 "강아지"라고 표시된 사진 한 장을 신경망에 넣어 봅니다. 데이터가 입력 계층에 들어가고, 여러 은닉 계층을 거치면서 가중치를 따라 흘러가서, 출력 계층에서 답이 나옵니다. "강아지 35%, 고양이 65%" 같은 식으로요.

데이터가 신경망의 앞쪽에서 뒤쪽으로 한 방향으로 흘러간다고 해서, 이 과정을 순전파(Forward Pass)라고 불러요. Forward는 "앞으로", Pass는 "지나감"입니다.

학습 초기에는 가중치가 모두 무작위 값이라서, 신경망의 답이 엉터리입니다. 강아지 사진을 보고 "고양이"라고 답할 수도 있어요. 하지만 일단 답을 내놓았다는 게 중요해요. 이 틀린 답을 가지고 다음 단계에서 학습이 시작됩니다.

2단계. 손실 — 얼마나 틀렸는지 숫자로 표현하기

신경망이 낸 답("고양이 65%")과 진짜 정답("강아지")을 비교해서, 얼마나 틀렸는지를 하나의 숫자로 표현합니다. 이 숫자를 손실(Loss)이라고 불러요. 영어로 "잃은 정도, 손실"이라는 뜻이에요. 정답에서 얼마나 멀어졌는지를 잰 숫자라고 보면 됩니다.

손실이 0에 가까우면 정답에 가깝게 맞혔다는 뜻이고, 손실이 크면 많이 틀렸다는 뜻입니다. 학습의 목표는 결국 이 손실 숫자를 점점 줄이는 방향으로 가중치를 조정해 가는 일이에요.

3단계. 역전파 — 어떤 가중치가 얼마나 잘못했나

손실이 50이라고 칩시다. 신경망이 50만큼 틀렸어요. 그런데 신경망 안에는 가중치가 수백만, 수십억 개 있는데, 그중 어떤 가중치가 이번 오답에 얼마나 책임이 있는지 알아내야 가중치를 조정할 수 있어요.

이걸 자동으로 계산해주는 알고리즘이 역전파(Backpropagation)예요. Back은 "뒤로, 거꾸로", Propagation은 "전파"라는 뜻입니다. 합치면 "거꾸로 전파하기"예요. 이름 그대로 흐름이 반대로 갑니다.

IBM의 설명에 따르면, 역전파는 출력 계층에서 시작해서 입력 계층 방향으로 거꾸로 거슬러 올라가면서, 각 가중치가 이번 오답에 얼마나 기여했는지를 수학적으로 계산해냅니다. 자세한 수학을 모르더라도 결과만 이해하면 돼요. 신경망 안의 모든 가중치에 대해 "이 가중치가 이번 오답에 얼마나 책임이 있는지"를 숫자로 알아낸다는 게 핵심입니다.

4단계. 가중치 조정

각 가중치의 책임 비율이 계산되면, 이제 그 책임에 따라 가중치를 손실이 줄어드는 방향으로 살짝 조정해요. 책임이 큰 가중치는 많이, 책임이 작은 가중치는 적게 움직입니다.

한 번에 얼마나 크게 가중치를 조정할지 정하는 값이 학습률(Learning Rate)이에요. 학습률이 크면 가중치가 큰 폭으로 움직이고, 작으면 살짝 움직여요. 너무 크면 가중치가 휙휙 움직여서 안정적으로 자리잡지 못하고, 너무 작으면 학습이 한없이 느려집니다. 적절한 학습률을 찾는 게 AI 개발자의 기본 과제 중 하나예요.

한 사이클을 수백만 번 반복합니다

데이터 한 묶음으로 위의 네 단계, 그러니까 순전파에서 가중치 조정까지를 한 사이클 돌립니다. 그다음 다른 데이터로 또 한 사이클, 또 다른 데이터로 또 한 사이클을 돌려요. 이 과정을 수백만에서 수십억 번 반복합니다.

학습이 잘 진행되면 손실 숫자가 점점 줄어들고, 가중치들이 절묘한 값으로 자리잡아요. 처음에는 무작위로 답하던 신경망이 점점 정확한 답을 내기 시작해요. 이게 우리가 "AI 모델이 학습한다"고 말할 때 안에서 벌어지는 일이에요.



정리하자면

이 글의 핵심을 한 줄기로 다시 따라가 봅니다.

먼저 AI(인공지능)라는 큰 우산 안에 머신러닝(기계가 데이터로 배우는 분야)이 있고, 그 안에 딥러닝(신경망을 깊이 쌓아 올린 방식)이 있다는 위계를 잡았어요. ChatGPT 같은 현대 AI 서비스의 대부분이 이 딥러닝으로 만들어집니다.

딥러닝의 모든 계산은 신경망 안에서 일어나요. 신경망은 사람 뇌의 뉴런 그물망에서 영감을 받아 만든 컴퓨터 안의 구조로, 노드(작은 계산 단위)들이 층(layer)으로 쌓여 있어요. 입력 계층으로 데이터가 들어오고, 여러 은닉 계층을 거쳐, 출력 계층에서 답이 나옵니다.

노드 사이의 모든 연결에는 가중치라는 숫자가 붙어 있어요. 이 가중치들이 절묘한 값으로 자리잡으면 신경망이 정확한 답을 내고, 엉뚱한 값이면 엉뚱한 답을 냅니다. "AI가 학습한다"는 말은 결국 이 가중치 숫자들을 적절한 값으로 조정해 가는 자동화된 과정을 가리켜요.

학습은 네 단계의 사이클이에요. 신경망에 데이터를 넣어 답을 내게 하고(순전파), 그 답이 얼마나 틀렸는지를 숫자로 잴 다음(손실), 각 가중치가 그 오답에 얼마나 책임이 있는지를 계산하고(역전파), 책임에 따라 가중치를 조금씩 조정합니다(가중치 조정). 이 사이클을 수백만 번 반복하면서 가중치가 점점 정교해져요.

처음에는 막막했던 단어들이 이제 자기 자리를 가지게 됐을 거예요. AI라는 우산, 머신러닝과 딥러닝의 관계, 신경망의 구조, 가중치와 학습의 의미까지 한 줄기로 이어졌습니다.

이 흐름은 ChatGPT 같은 LLM(거대 언어 모델)에도 그대로 적용돼요. 다만 LLM은 한국어 문장이라는 특수한 입력을 처리해야 하고, 트랜스포머라는 특별한 신경망 구조를 쓰고, 학습 과정도 세 단계로 나뉘어요. LLM이 어떻게 만들어지고, 어떻게 우리 질문에 답하는지는 별도의 글에서 같은 방식으로 풀어드릴게요.

Newsletter

AI 인프라 인사이트, 메일로 받아보세요

GPU 시세 동향, 신제품 출시, 인프라 구축 기술 가이드를 월 2회 정리해 보내드립니다.

XDNODE를 통해 한정된 예산을
얼마나 잘 활용할 수 있을지 확인해 보세요.

XDNODE를 통해 한정된 예산을
얼마나 잘 활용할 수 있을지 확인해 보세요.

XDNODE를 통해 한정된 예산을
얼마나 잘 활용할 수 있을지 확인해 보세요.