Search

클러스터링 사례

클러스터링의 비즈니스 응용

한 식료품 소매업체는 클러스터링을 사용하여 130만 명의 로열티 카드 고객을 구매 행동에 따라 5가지 그룹으로 분류했습니다. 그런 다음 보다 효과적으로 타겟팅하기 위해 이러한 각 부문에 대한 맞춤형 마케팅 전략을 채택했습니다.
신선한 음식 애호가
그룹 중 하나는 '신선한 음식 애호가'였습니다. 유기농 식품, 신선한 야채, 샐러드 등을 많이 구매하는 고객으로 구성되어 있습니다. 과일과 야채의 신선도와 매장에서 연중 내내 구입할 수 있는 유기농 제품을 강조한 마케팅 캠페인이 이 고객 그룹의 관심을 끌었습니다.
편의점 중독자
또 다른 클러스터는 '편의 중독자'라고 불렸습니다. 조리/반 조리, 준비하기 쉬운 식사를 쇼핑한 사람들로 구성되었습니다. 소매업체의 자체 냉동 식품 라인과 매장의 계산대 속도에 초점을 맞춘 마케팅 캠페인이 이 청중과 잘 어울렸습니다.

클러스터링의 특징

클러스터링은 무방향 데이터 마이닝 기술입니다. 즉, 특정 가설을 공식화하지 않고도 데이터의 숨겨진 패턴과 구조를 식별하는 데 사용할 수 있습니다.
클러스터링에는 대상 변수가 없습니다. 위의 경우 식료품 소매업체는 분석 초기에 신선 식품 애호가를 식별하기 위해 적극적으로 노력하지 않았습니다. 고객 기반의 다양한 구매 행동을 이해하려는 시도였습니다.
클러스터링은 특정 행동이나 차원과 관련하여 유사성을 식별하기 위해 수행됩니다. 이 예에서 목표는 유사한 구매 행동을 가진 고객 세그먼트를 식별하는 것이었습니다. 따라서 고객 구매 패턴을 나타내는 변수를 사용하여 클러스터링을 수행했습니다.
클러스터 분석은 설명이나 해석을 제공하지 않고 데이터의 구조를 발견하는 데 사용할 수 있습니다. 즉, 클러스터 분석은 존재 이유를 설명하지 않고 단순히 데이터에서 패턴을 발견합니다. 결과 클러스터는 그 자체로 의미가 없습니다. 그들은 자신의 정체성을 구축하기 위해 광범위하게 프로파일링되어야 합니다. 즉, 자신이 무엇을 나타내고 부모 집단과 어떻게 다른지 이해해야 합니다.
소매업체의 경우 각 클러스터는 구매 행동에 대해 프로파일링되었습니다. 클러스터 1의 고객은 총 지출의 4분의 1을 신선한 유기농 농산물에 지출했습니다. 이는 이 카테고리에서 5% 미만을 지출한 다른 고객보다 훨씬 더 높았습니다. 이 고객 세그먼트는 다른 고객과 구별되는 '신선한 음식 애호가'라고 불렸습니다.

클러스터링 유형

클러스터링에 사용할 수 있는 다른 알고리즘이 있으며 각각은 다른 클러스터 집합을 제공할 수 있습니다. 특정 방법의 선택은 클러스터링의 목적, 원하는 출력 유형, 사용 가능한 하드웨어 및 소프트웨어 시설, 데이터 세트의 크기에 따라 달라집니다. 일반적으로 클러스터링 기술은 생성하는 클러스터 구조에 따라 두 가지 범주로 나눌 수 있습니다.
클러스터링 유형 비계층적 방법은 N 개체의 데이터세트를 M 클러스터로 나눕니다. 비계층적 기법인 K-평균은 비즈니스 분석에서 가장 일반적으로 사용되는 기법입니다.
계층적 방법은 하나의 클러스터만 남을 때까지 개체 또는 클러스터의 각 쌍이 더 큰 클러스터에 점진적으로 중첩되는 중첩 클러스터 세트를 생성합니다.

클러스터링은 언제 사용합니까?

클러스터링은 주로 고객, 제품 또는 매장 세분화를 수행하는 데 사용됩니다. 위의 예에서 클러스터 분석을 사용한 고객 세분화에 대해 이미 이야기했습니다. 유사하게 제품은 용도, 크기, 브랜드, 풍미 등과 같은 속성을 기반으로 계층적 그룹으로 함께 클러스터링될 수 있습니다. 비슷한 판매, 크기, 고객 기반 등 유사한 특성을 가진 상점을 함께 클러스터링할 수 있습니다.
클러스터링은 사기 거래 식별과 같은 이상 탐지에도 사용할 수 있습니다. 클러스터 감지 방법은 "정상" 클러스터의 모양과 크기를 결정하기 위해 양호한 트랜잭션만 포함하는 샘플에 사용할 수 있습니다. 어떤 이유로든 클러스터 외부에 있는 트랜잭션이 발생하면 의심됩니다. 이 접근 방식은 의료에서 조직 샘플에서 비정상적인 세포의 존재를 감지하고 통신에서 사기를 나타내는 호출 패턴을 감지하는 데 사용되었습니다.
클러스터링은 대규모 데이터 세트를 다른 기술에 더 적합한 더 작은 그룹으로 나누는 데 자주 사용됩니다. 예를 들어, 로지스틱 회귀 분석 결과는 다르게 동작하고 약간 다른 분포를 따를 수 있는 더 작은 클러스터에서 별도로 수행하여 개선할 수 있습니다.
요약하면 클러스터링은 데이터 내의 패턴 구조를 탐색하는 강력한 기술이며 비즈니스 분석에 광범위한 응용 프로그램이 있습니다. 클러스터링에는 다양한 방법이 있습니다. 분석가는 여러 클러스터링 알고리즘에 익숙해야 하며 비즈니스 요구 사항에 따라 가장 관련성이 높은 기술을 적용할 수 있어야 합니다.
비즈니스에서 k-평균 클러스터링에 대한 흥미로운 사용 사례 소비자 세분화
클러스터 분석을 완료하면 소비자 세그먼트를 식별할 수 있습니다. 이를 위해 인구 통계, 심리 및 행동 데이터와 성능 데이터를 사용하여 특정 제품 범주에 대한 소비자를 클러스터링할 수 있습니다.
다음으로 클러스터를 프로파일링하여 소비자를 더 잘 이해하고 클러스터 분석에 사용되는 변수에 따라 소비자를 설명할 수 있습니다. 이 정보를 활용하여 마케팅 메시지, 제품 구색 및 전반적인 쇼핑 경험을 맞춤화하여 고객의 요구 사항을 충족하고 ROI를 높일 수 있습니다.
배달 최적화
소매업체와 공급업체는 k-평균 클러스터링을 사용하여 배송 프로세스를 최적화하려고 했습니다. 트럭과 드론의 배송 경로와 패턴을 모니터링하여 회사의 최적의 발사 위치, 경로 및 목적지를 찾습니다.
문서 정렬 및 그룹화
k-means 클러스터링을 사용하여 범주, 태그, 콘텐츠 또는 사용 빈도에 따라 전자 파일을 그룹화할 수 있습니다. 알고리즘은 문서를 분류하고 그룹화하기 위해 각 문서를 벡터 및 특정 용어의 빈도로 봅니다.
고객 유지
k-means 클러스터링을 사용하여 고객 이탈을 분석하고 그룹화하여 유지율을 기반으로 소비자를 식별하고 프로파일링할 수 있습니다. 구매 빈도, 소비자가 매장을 방문한 시간, 여행당 평균 지출 및 바구니 구성과 같은 변수를 사용하여 특정 고객 세그먼트의 유지율을 분석하고 예측할 수 있습니다.
할인 분석
k-평균 클러스터링을 사용하여 할인 구매 행동에 따라 다양한 쇼핑객 그룹을 분석할 수 있습니다. 고객은 묶음 상품, 일상 저가 전략 상품, 유통기한 전에 판매 중인 상품을 구매할 가능성이 더 높을 수 있습니다. 알고리즘을 사용하여 구매자 간의 구매 패턴을 식별하고 이 정보를 사용하여 가격 책정 및 판촉 전략에 관한 결정을 내릴 수 있습니다.
결론 k-평균 클러스터링 알고리즘을 사용하기로 결정하기 전에 비즈니스에 적합한 알고리즘 을 검토해야 합니다 . 이 결정을 내릴 때 목표, 목표 및 사용 가능한 자원을 평가해야 합니다. K-평균은 클러스터링을 시작할 때 시도할 수 있는 간단하고 유연한 알고리즘이지만 알고 있어야 하는 몇 가지 문제가 있습니다.