AI 당신이 좋아할 만한 노래, 클러스터링으로 묶는 취향의 지도
음악 스트리밍 앱을 열면 나보다 내 마음을 더 잘 아는 듯한 추천 목록이 등장한다. 수천만 곡의 노래 중에서 어떻게 내가 좋아할 만한 곡들만 쏙쏙 골라내는 것일까. 이 마법 같은 일의 배후에는 데이터 과학의 핵심 기술 중 하나인 클러스터링, 즉 군집화 기술이 자리 잡고 있다. 클러스터링은 정답이 정해지지 않은 상태에서 데이터 자체의 특성을 분석하여 서로 비슷한 것들끼리 묶어주는 비지도 학습 방법이다. 음악 데이터의 경우, 곡의 빠르기, 리듬의 강세, 사용된 악기의 종류, 가수의 음색 등을 수치화하여 좌표 평면 위의 데이터로 변환한다. 예를 들어, 빠른 비트와 강한 베이스를 가진 곡들은 특정 영역에 모이게 되고, 잔잔한 피아노 선율과 느린 템포를 가진 곡들은 또 다른 영역에 뭉치게 된다. 이 과정에서 데이터 시각화는 매우 중요한 역할을 한다. 수만 곡의 음악 데이터를 다차원 공간에 점으로 뿌려보면, 비슷한 성향을 가진 곡들이 마치 밤하늘의 성단처럼 무리를 지어 있는 모습을 확인할 수 있다. 이를 군집이라고 부른다. 알고리즘은 사용자가 평소 즐겨 듣던 노래들이 어느 군집에 속해 있는지를 파악한다. 만약 사용자가 'A 군집'에 속한 노래들을 주로 들었다면, 시스템