AI 미래를 그리는 가장 수학적인 방법: 추세선과 '회귀 분석'의 마법
우리는 종종 과거의 경험을 바탕으로 미래를 짐작한다. "기온이 오르고 있으니 에어컨 판매량이 늘어나겠지", 혹은 "광고비를 이만큼 늘리면 매출이 어느 정도 오를 거야"라는 식이다. 인간의 이러한 직관적인 예측을 차가운 숫자의 언어로 가장 정교하게 번역해 낸 것이 바로 통계학의 꽃이라 불리는 '회귀 분석(Regression Analysis)'이다. 불규칙해 보이는 방대한 데이터의 홍수 속에서도, 회귀 분석은 변수들 사이의 숨겨진 규칙을 찾아내어 미래를 향해 뻗어가는 선명한 '추세선'을 그어준다. 회귀 분석의 원리는 흩뿌려진 수많은 점(데이터)들을 가장 잘 대표하는 최적의 직선을 찾아내는 과정이다. 가상의 2차원 그래프 위에 X축을 '기온', Y축을 '아이스크림 판매량'으로 두고 그동안 수집한 데이터를 점으로 찍어보자. 점들은 이리저리 무질서하게 흩어져 있겠지만, 전체적으로는 우상향하는 무리의 형태를 띨 것이다. 이때 통계학은 대충 눈대중으로 선을 긋지 않는다. 직선을 긋는 핵심 비결은 '오차의 최소화'에 있다. 수학적으로 각 데이터 점들과 가상의 직선 사이의 거리(오차)를 제곱하여 모두 더한 값이 가장 작아지도록 정밀하게 계산하는데, 이를 '최소제곱법(Leas