동네 골목에 자리 잡은 작은 빵집이 대형 프랜차이즈와 경쟁하기 위해서는 자신만의 독특한 매력, 즉 브랜드 정체성이 필요하다. 하지만 멋진 로고를 만들고 캐릭터를 디자인하는 일은 소상공인에게 만만치 않은 비용과 시간이 드는 숙제다. 최근에는 인공지능 기술이 이 어려운 브랜딩 과정을 누구나 쉽게 시도할 수 있는 창작의 영역으로 바꾸어 놓고 있다. 그 시작은 매일 쌓이는 고객들의 영수증 리뷰 데이터에서 출발한다. 텍스트 마이닝 기술은 수많은 고객이 남긴 리뷰 글에서 의미 있는 패턴을 찾아내는 자연어 처리 기법이다. 고객들이 무심코 남긴 리뷰를 분석 알고리즘에 넣으면 불필요한 조사와 접속사는 걸러지고 따뜻한, 포근한, 어릴 적 추억이 떠오르는 같은 감성적인 형용사들만 추출된다. 이렇게 뽑아낸 핵심 단어들은 워드 클라우드라는 시각화 기법을 통해 빈도수가 높을수록 더 큰 글씨로 화면에 나타나며, 우리 가게만의 고유한 분위기를 직관적으로 보여준다. 데이터 분석으로 찾아낸 이 감성 키워드들은 이제 이미지 생성 인공지능의 훌륭한 재료가 된다. 텍스트를 이미지로 변환하는 확산 모델 기반의 생성형 인공지능에 포근한 오븐, 밀가루를 반죽하는 귀여운 곰돌이, 따뜻한 색감과 같은 수
지난달 자라 매장에서 찜해두었던 트렌디한 셔츠를 사러 이번 주에 다시 방문했더니 흔적도 없이 사라진 경험이 있을 것이다. 다른 브랜드는 계절이 바뀔 때까지 물건을 쌓아두고 대대적인 세일을 하는데, 왜 유독 자라의 옷들은 빛의 속도로 매장에서 자취를 감추는 것일까? 그 비밀은 바로 제품 수명 주기(PLC)를 관리하는 놀라운 스피드에 있다. 모든 제품은 시장에 처음 나오는 도입기, 인기가 치솟는 성장기, 판매가 안정되는 성숙기, 그리고 인기가 시드는 쇠퇴기라는 과정을 거친다. 이를 제품 수명 주기라고 한다. 일반적인 패션 브랜드는 이 주기를 몇 개월 단위로 길게 잡고 미리 대량으로 옷을 만들어 둔다. 하지만 유행은 바람처럼 빨리 변하기 때문에 주기를 길게 잡으면 결국 유행이 지난 뒤 팔리지 않는 악성 재고가 남게 된다. 자라는 이 문제를 해결하기 위해 제품 수명 주기를 극단적으로 짧게 압축했다. 전 세계 매장의 판매 데이터를 실시간으로 분석해 지금 당장 유행하는 디자인을 2주 만에 뚝딱 만들어 매장에 내놓는다. 그리고 유행이 성숙기에 접어들기도 전에 다음 유행으로 갈아치운다. 제품이 쇠퇴기에 접어들어 가치가 떨어지기 전에 아예 생산을 중단하고 새로운 제품으로 매
소규모 게스트하우스나 파티룸을 운영할 때 가장 어려운 결정 중 하나는 하루의 숙박 요금을 정하는 일이다. 평일과 주말, 성수기와 비수기의 요금을 다르게 받는 것은 기본이지만, 날씨나 주변 지역의 축제, 심지어는 예약이 채워지는 속도에 따라 적정 가격은 매일 달라진다. 과거에는 주변 숙소의 가격을 일일이 검색해 보고 눈치껏 요금을 올리거나 내렸다면, 이제는 데이터 분석 기반의 탄력 요금제가 그 해답을 제시하고 있다. 탄력 요금제, 즉 다이내믹 프라이싱의 핵심은 수요의 변화를 미리 예측하는 머신러닝 기술에 있다. 이를 위해 먼저 과거의 예약 데이터, 주변 행사의 일정, 기상청의 날씨 예보 등 다양한 외부 변수를 하나의 데이터 세트로 모으는 전처리 과정을 거친다. 이렇게 모인 복잡한 변수들은 의사결정 나무라는 머신러닝 알고리즘에 입력된다. 의사결정 나무는 마치 스무고개 놀이를 하듯, 주말인가, 비가 오는가, 주변에 대형 콘서트가 있는가 등의 질문을 거치며 최적의 가격을 찾아가는 예측 모델이다. 여기에 여러 개의 의사결정 나무를 숲처럼 묶어 예측의 정확도를 높이는 앙상블 기법을 적용하면, 데이터의 불확실성을 크게 줄일 수 있다. 모델이 꼼꼼하게 학습을 마치면, 내일
주말을 맞아 집안 대청소를 해야 하는 상황을 상상해 보자. 직접 팔을 걷어붙이고 하루 종일 청소할 수도 있고 비용을 지불하고 청소 전문 업체를 부를 수도 있다. 만약 당신이 평일에 너무 바빠 주말에는 반드시 충분한 휴식을 취해야 하거나 주말에 아르바이트를 해서 청소 비용보다 더 많은 돈을 벌 수 있다면 어떨까. 이런 경우라면 돈을 조금 쓰더라도 전문가에게 청소를 맡기고 자신의 시간을 더 가치 있는 곳에 쓰는 것이 현명한 선택이다. 이러한 고민은 기업이 물건을 만들 때 매일 겪는 문제와 완전히 똑같다. 기업은 제품을 완성하기 위해 수많은 부품과 서비스가 필요하다. 이때 모든 것을 회사 내부에서 직접 만들지 아니면 외부의 다른 기업으로부터 사 올지를 결정해야 하는데 이를 메이크 오어 바이 결정이라고 부른다. 과거의 기업들은 자동차를 만들 때 들어가는 유리창, 타이어, 나사 하나까지 모두 직접 만들려고 노력했다. 하지만 세상이 복잡해지고 기술이 발전하면서 모든 것을 다 잘하는 것은 불가능해졌다. 그래서 현대의 기업들은 자신이 가장 잘할 수 있고 돈을 벌어다 주는 핵심적인 일에만 에너지를 집중한다. 자동차의 엔진이나 디자인처럼 브랜드의 핵심과 직결되는 부분은 직접
동네 헬스장이나 필라테스 학원을 운영하는 사람들에게 가장 큰 고민 중 하나는 말없이 등록을 연장하지 않는 회원들이다. 새로운 회원을 유치하는 것보다 기존 회원을 유지하는 것이 훨씬 경제적이지만, 누가 언제 운동을 그만둘지 미리 알아채기란 쉽지 않다. 과거에는 운영자의 직감에 의존해 안부를 묻는 것이 전부였으나, 이제는 머신러닝 기술이 회원들의 이탈 시그널을 미리 포착해 내고 있다. 비결은 매일 쌓이는 출입 데이터와 시설 이용 기록에 있다. 회원의 주간 방문 횟수, 평균 체류 시간, 마지막 방문일로부터 지난 시간 등의 원시 데이터를 수치화하는 가공 과정을 거친다. 이렇게 정리된 데이터는 머신러닝의 분류 모델 중 하나인 로지스틱 회귀 알고리즘에 입력된다. 로지스틱 회귀는 특정 사건이 일어날 확률을 0과 1 사이의 값으로 예측하는 통계 기법으로, 이 경우에는 특정 회원이 다음 달에 재등록을 하지 않을 확률을 계산하는 데 사용된다. 알고리즘은 수많은 과거 회원의 행동 패턴을 학습하여 이탈의 전조 증상을 찾아낸다. 예를 들어 일주일에 세 번 오던 회원이 한 번으로 방문을 줄이거나, 런닝머신 이용 시간이 절반으로 급감하는 패턴을 위험 신호로 인식하는 것이다. 분석 결과
우리 집 냉장고를 열어보면 재미있는 사실을 발견할 수 있다. 어떤 집은 오늘 당장 먹을 신선한 식재료만 조금씩 사다 놓고, 어떤 집은 라면과 생수, 냉동식품을 마트 진열대처럼 가득 채워둔다. 이 냉장고 속 풍경은 기업의 생산관리에서 가장 중요한 두 가지 전략을 그대로 보여준다. 그날 먹을 것만 조금씩 사는 방식은 기업의 JIT(Just-In-Time) 생산 방식과 같다. 이는 필요한 물건을 필요한 때에 필요한 만큼만 생산하거나 주문하는 전략이다. 창고 공간을 차지하지 않아 유지 비용이 줄어들고 식재료가 상해서 버릴 일도 없으니 매우 효율적이다. 하지만 갑자기 밤에 배가 고프거나 손님이 찾아오면 대접할 음식이 없다는 치명적인 단점이 있다. 반대로 라면과 통조림을 산더미처럼 쟁여두는 방식은 안전재고 전략이다. 안전재고는 예기치 못한 품절이나 위기 상황에 대비해 창고에 여유 있게 쌓아두는 물량이다. 갑작스러운 상황에도 당황하지 않고 대처할 수 있어 마음이 든든하지만, 공간을 많이 차지하고 유통기한이 지나 버리게 되는 낭비가 발생할 수 있다. 기업 역시 이 두 가지 사이에서 끊임없이 고민한다. 재고를 최소화해 비용을 줄이는 것도 중요하지만, 부품이 모자라 공장이 멈
푸드트럭을 창업하거나 동네에 작은 가게를 열 때 가장 중요한 것은 자리, 즉 입지 선정이다. 과거에는 유동 인구가 많아 보이는 길목에 서서 직접 사람들의 숫자를 세어보거나 주변 사람들의 조언과 개인의 직감에 의존해야 했다. 하지만 이제는 인공지능과 데이터 분석 기술이 가장 장사가 잘될 이른바 대박 자리를 과학적으로 찾아주는 시대가 되었다. 이 과정의 핵심은 지도 위에서 발생하는 다양한 공간 데이터를 분석하는 것이다. 통신사 기지국을 통해 수집된 시간대별 유동 인구 데이터, 주변 상가들의 신용카드 결제 위치, 대중교통 승하차 정보 등이 지도 위의 좌표 형태로 수집된다. 이렇게 모인 방대한 정보는 컴퓨터가 이해할 수 있는 숫자로 변환되는 전처리 과정을 거친다. 수치화된 공간 데이터는 커널 밀도 추정이라는 통계 분석 기법을 통해 가공된다. 이 기법은 개별적으로 흩어져 있는 사람들의 위치 데이터를 바탕으로 특정 지역에 인구가 얼마나 빽빽하게 밀집해 있는지를 연속적인 확률 분포로 계산해낸다. 즉, 단순히 사람이 몇 명 지나갔는지가 아니라, 잠재적인 고객들이 어느 지점을 중심으로 가장 강하게 응집해 있는지를 수학적으로 분석하는 것이다. 이렇게 분석된 결과는 히트맵이라는
아침마다 옷장 문을 열면 옷이 빽빽하게 걸려 있지만 막상 입을 옷이 없다고 한탄한 경험이 있을 것이다. 실제로 옷장에 있는 수십 벌의 옷 중에서 우리가 평소에 즐겨 입는 옷은 겨우 세네 벌에 불과하다. 경영학과 생산관리 분야에서는 이처럼 전체 결과의 80%가 전체 원인의 20%에서 일어나는 현상을 파레토 법칙이라고 부른다. 이 법칙은 기업의 재고 관리 현장에서도 똑같이 적용된다. 편의점이나 대형 마트에는 수만 가지의 상품이 진열되어 있지만, 실제 매장 매출의 80%를 벌어들이는 효자 상품은 전체 품목의 20% 정도밖에 되지 않는다. 만약 매장 관리자가 100원짜리 사탕과 5만 원짜리 고급 화장품의 재고를 똑같은 시간과 정성을 들여 관리한다면 엄청난 인력 낭비가 발생할 것이다. 그래서 기업들은 창고에 있는 물건들을 중요도에 따라 나누어 관리하는데 이를 ABC 재고 관리라고 한다. A등급은 매출에 가장 큰 기여를 하는 상위 20%의 핵심 제품으로, 매일 재고를 확인하고 절대 품절되지 않도록 특별 관리를 한다. B등급은 중간 정도의 중요도를 가진 제품들로 주기적으로 재고를 파악한다. 반면 C등급은 종류는 가장 많지만 매출 기여도는 매우 낮은 하위 제품들로, 재고가
동네 카페나 식당을 운영하다 보면 매일 오던 손님이 어느 순간 보이지 않거나, 어쩌다 한 번 와서 큰 금액을 결제하는 손님을 만나게 된다. 모든 손님에게 똑같은 서비스와 쿠폰을 제공하는 것은 비용 대비 효율이 떨어진다. 이때 매장의 결제 기기에 고스란히 쌓여 있는 결제 데이터를 활용하면 손님들의 숨겨진 패턴을 찾아내고 맞춤형 마케팅을 펼칠 수 있다. 이 과정을 위해 먼저 데이터를 가공하는 작업이 필요하다. 주로 고객이 얼마나 최근에 방문했는지, 얼마나 자주 방문하는지, 그리고 얼마나 많은 돈을 썼는지를 수치화하는 분석 기법을 사용한다. 이렇게 정리된 데이터는 인공지능 머신러닝의 한 분야인 비지도 학습, 그중에서도 군집화 알고리즘을 거치게 된다. 군집화는 정답이 없는 상태에서 데이터 자체의 유사성을 바탕으로 비슷한 특징을 가진 무리를 만들어주는 기술이다. 알고리즘이 수많은 결제 데이터를 분석하면 손님들은 몇 개의 의미 있는 그룹으로 나뉜다. 예를 들어 매일 아침 커피를 한 잔씩 사는 출근족 그룹, 한 달에 한 번 오지만 올 때마다 디저트를 대량으로 구매하는 큰손 그룹, 그리고 최근 발길이 뜸해진 이탈 예상 그룹 등으로 묶이는 것이다. 이렇게 분류된 결과는 점들
출근 시간, 카페의 드라이브스루에 차량이 길게 늘어서 있다. 고객들의 불만이 폭주하자 점장님은 큰 결심을 하고 주문을 받는 직원을 1명에서 3명으로 늘렸다. 3대의 마이크로 동시에 주문을 받으니 차들이 금방금방 빠질 것 같지만, 현실은 참담하다. 차들은 주문 결제 창구에서만 빨리 넘어갈 뿐, 결국 음료를 받는 픽업 창구 앞에서 똑같이 거대한 주차장이 되어버린다. 대기 시간은 단 1분도 줄어들지 않았다. 도대체 무엇이 문제일까? 경영학과 생산관리에서는 이를 물리학자 엘리 골드랫(Eliyahu M. Goldratt)이 창안한 '제약 이론(TOC, Theory of Constraints)'과 '병목 현상(Bottleneck)'으로 완벽하게 설명한다. 병목(Bottleneck)이란 글자 그대로 '병의 목'을 뜻한다. 병의 몸통이 아무리 넓고 물이 가득 차 있어도, 물이 밖으로 쏟아져 나오는 속도는 오직 좁아진 '병의 목'의 크기가 결정한다. 드라이브스루의 상황도 완벽히 똑같다. 에스프레소 머신이 1분에 커피를 1잔밖에 뽑지 못한다면(이곳이 병목이다), 밖에서 주문을 1분에 10잔씩 받아봤자 아무 소용이 없다. 커피가 나오는 속도는 여전히 1분에 1잔이기 때문이다.
동네 빵집을 운영하는 사람들의 가장 큰 고민 중 하나는 매일 아침 얼마나 많은 빵을 구워야 할지 결정하는 일이다. 빵을 너무 적게 구우면 늦게 온 손님들이 발길을 돌려야 하고, 반대로 너무 많이 구우면 남은 빵을 고스란히 버려야 하기 때문이다. 과거에는 오로지 오랜 경험과 직감에 의존해 그날의 생산량을 정했지만 이제는 데이터 분석 기술이 이 까다로운 숙제를 대신 해결해주고 있다. 그 비결은 바로 시간의 흐름에 따라 기록된 시계열 데이터와 주변 환경 변수를 결합하는 분석 기법에 있다. 빵집의 결제 기기에는 매일의 판매량이 시간대별로 고스란히 저장된다. 여기에 기상청의 날씨 데이터인 기온, 강수량과 달력의 요일, 공휴일 정보를 하나의 데이터 세트로 묶는 전처리 과정을 거친다. 이렇게 정제된 데이터는 다중 선형 회귀라는 통계 모델이나 머신러닝 알고리즘의 학습 재료로 사용된다. 알고리즘은 과거의 데이터를 분석하여 숨겨진 규칙을 찾아낸다. 비가 오는 주말에는 외출이 줄어 식빵이나 바게트 같은 식사 대용 빵의 판매가 늘어나고, 화창한 평일 오후에는 달콤한 디저트류의 판매가 급증한다는 식의 패턴을 수학적으로 계산해내는 것이다. 모델 학습이 완료되면 내일의 날씨 예보와 요
배달 앱에서 저녁 메뉴를 고르고 있다. A 식당은 배달 소요 시간이 '평균 25분'이라고 적혀 있다. 하지만 리뷰를 보니 어쩔 때는 10분 만에 오지만, 주문이 밀리면 50분이 넘게 걸리기도 한다. 반면 B 식당은 '평균 30분'이 걸린다고 되어 있는데, 비가 오나 눈이 오나 무조건 29분에서 31분 사이에 도착한다는 후기가 가득하다. 당신이라면 어느 식당에 주문하겠는가? 십중팔구는 조금 더 느리더라도 언제 도착할지 확실히 예측할 수 있는 B 식당을 선택할 것이다. 언제 올지 몰라 샤워도 못 하고 기다리는 스트레스가 훨씬 크기 때문이다. 생산관리와 품질경영에서는 A 식당처럼 결과값이 이리저리 널뛰는 현상을 '산포(Variation, 편차)'라고 부른다. 그리고 경영학의 대가들은 "품질 관리의 가장 큰 적은 낮은 평균 점수가 아니라, 예측할 수 없는 들쭉날쭉함(산포)이다"라고 단언한다. 이 산포를 극단적인 수준까지 통제하여 불량을 없애려는 품질 혁신 운동이 바로 모토로라에서 시작되어 제너럴 일렉트릭(GE)을 통해 꽃피운 '식스 시그마(Six Sigma)'다. 식스 시그마의 목표는 100만 번의 공정(기회) 중에서 불량품이 단 3.4개만 나오는 경이로운 수준(9
현대 사회에서 사람들은 소셜 미디어를 통해 끊임없이 관계를 맺고 정보를 주고받는다. 겉보기에는 수많은 글과 사진이 무작위로 흩어져 있는 것 같지만, 그 이면에는 사람과 사람을 잇는 거대하고 정교한 연결고리가 존재한다. 이 보이지 않는 구조를 파악하고 눈으로 볼 수 있게 만드는 기술이 바로 네트워크 분석과 시각화이다. 네트워크 분석은 수학의 그래프 이론을 바탕으로 한다. 이 분석에서 개별 사용자는 하나의 점, 즉 노드가 되고 사용자 간의 관계인 팔로우, 좋아요, 공유 등은 점들을 연결하는 선, 즉 엣지가 된다. 수만 명의 데이터가 이러한 점과 선의 결합으로 변환되면, 복잡한 사회적 상호작용이 하나의 거대한 거미줄 형태를 띠게 된다. 이렇게 가공된 데이터는 누가 가장 중심에 있는지, 정보가 어떤 경로를 타고 확산되는지 명확하게 보여준다. 데이터 시각화는 이 복잡한 거미줄에 생명력을 불어넣는다. 수많은 선이 교차하는 중심부에는 정보의 흐름을 주도하는 이른바 핵심 인플루언서가 위치한다. 시각화 과정에서 이 중심 노드는 다른 노드들보다 크고 밝은 색상으로 표현되어 한눈에 파악할 수 있도록 가공된다. 반면, 서로 촘촘하게 얽힌 노드 무리들은 특정한 관심사로 뭉친 커뮤니
일반적인 사람들에게 책상이나 작업대의 높이 '1cm' 차이는 눈에 띄지도 않는 사소한 문제다. 하지만 도요타를 비롯한 세계 최고의 제조 현장에서 이 1cm는 치열한 토론의 주제가 된다. 작업자가 부품을 집기 위해 하루에 1,000번 팔을 뻗는다고 가정해 보자. 작업대가 1cm 높아서 팔과 어깨에 미세한 무리가 간다면, 이는 곧 작업자의 피로 누적과 근골격계 질환으로 이어진다. 또한 부품을 집는 데 0.1초의 시간이 더 걸린다면, 1만 명의 작업자가 1년 동안 버리는 시간은 수만 시간에 달한다. 이처럼 일상 속에 숨겨진 아주 작은 낭비와 불편함을 찾아내어 끊임없이 고쳐나가는 철학을 생산관리에서는 '카이젠(Kaizen, 지속적 개선)'이라고 부른다. 경영학에서 말하는 '혁신(Innovation)'과 '카이젠'은 접근 방식이 완전히 다르다. 서양식 혁신이 수백억 원을 들여 최신식 로봇을 도입하고 시스템을 갈아엎는 '하향식(Top-down)' 대공사라면, 카이젠은 돈을 거의 들이지 않고 현장 작업자의 지혜를 모아 조금씩 고쳐나가는 '상향식(Bottom-up)' 개선이다. 공구함의 위치를 10cm 앞으로 당기기, 자주 쓰는 나사의 색깔을 눈에 띄게 칠하기, 불필요한
음악 스트리밍 앱을 열면 나보다 내 마음을 더 잘 아는 듯한 추천 목록이 등장한다. 수천만 곡의 노래 중에서 어떻게 내가 좋아할 만한 곡들만 쏙쏙 골라내는 것일까. 이 마법 같은 일의 배후에는 데이터 과학의 핵심 기술 중 하나인 클러스터링, 즉 군집화 기술이 자리 잡고 있다. 클러스터링은 정답이 정해지지 않은 상태에서 데이터 자체의 특성을 분석하여 서로 비슷한 것들끼리 묶어주는 비지도 학습 방법이다. 음악 데이터의 경우, 곡의 빠르기, 리듬의 강세, 사용된 악기의 종류, 가수의 음색 등을 수치화하여 좌표 평면 위의 데이터로 변환한다. 예를 들어, 빠른 비트와 강한 베이스를 가진 곡들은 특정 영역에 모이게 되고, 잔잔한 피아노 선율과 느린 템포를 가진 곡들은 또 다른 영역에 뭉치게 된다. 이 과정에서 데이터 시각화는 매우 중요한 역할을 한다. 수만 곡의 음악 데이터를 다차원 공간에 점으로 뿌려보면, 비슷한 성향을 가진 곡들이 마치 밤하늘의 성단처럼 무리를 지어 있는 모습을 확인할 수 있다. 이를 군집이라고 부른다. 알고리즘은 사용자가 평소 즐겨 듣던 노래들이 어느 군집에 속해 있는지를 파악한다. 만약 사용자가 'A 군집'에 속한 노래들을 주로 들었다면, 시스템