동네 빵집을 운영하는 사람들의 가장 큰 고민 중 하나는 매일 아침 얼마나 많은 빵을 구워야 할지 결정하는 일이다. 빵을 너무 적게 구우면 늦게 온 손님들이 발길을 돌려야 하고, 반대로 너무 많이 구우면 남은 빵을 고스란히 버려야 하기 때문이다. 과거에는 오로지 오랜 경험과 직감에 의존해 그날의 생산량을 정했지만 이제는 데이터 분석 기술이 이 까다로운 숙제를 대신 해결해주고 있다.

그 비결은 바로 시간의 흐름에 따라 기록된 시계열 데이터와 주변 환경 변수를 결합하는 분석 기법에 있다. 빵집의 결제 기기에는 매일의 판매량이 시간대별로 고스란히 저장된다. 여기에 기상청의 날씨 데이터인 기온, 강수량과 달력의 요일, 공휴일 정보를 하나의 데이터 세트로 묶는 전처리 과정을 거친다. 이렇게 정제된 데이터는 다중 선형 회귀라는 통계 모델이나 머신러닝 알고리즘의 학습 재료로 사용된다.
알고리즘은 과거의 데이터를 분석하여 숨겨진 규칙을 찾아낸다. 비가 오는 주말에는 외출이 줄어 식빵이나 바게트 같은 식사 대용 빵의 판매가 늘어나고, 화창한 평일 오후에는 달콤한 디저트류의 판매가 급증한다는 식의 패턴을 수학적으로 계산해내는 것이다. 모델 학습이 완료되면 내일의 날씨 예보와 요일 정보만 입력해도 각 빵의 예상 판매량이 정확한 수치로 계산되어 나온다.
이러한 예측 결과는 꺾은선그래프나 막대그래프를 통해 시각화되어 화면에 나타난다. 내일 비가 온다는 예보가 있다면 그래프는 식사류 빵의 생산량을 늘리라는 명확한 지표를 직관적으로 보여준다. 거대 기업의 전유물로만 여겨지던 데이터 과학이 이제는 골목 상권으로 들어와 버려지는 음식물을 줄이고 매장의 수익을 극대화하는 든든한 조력자 역할을 하고 있는 것이다.
[※ 칼럼의 그림 및 도표는 AI 활용하여 작성됨]










