mkk4726 2021. 5. 13. 06:52

고객 세그먼트(Customer Segmentation)이란 다양한 기준으로 고객을 분류하는 기법을 말한다.

이는 CRM이나 마케팅에서 중요한 부분이라고 한다.

다양한 기법들이 존재하는데 이 중 RFM기법에 대해 공부했다.

 

RFM은 Recency, Frequency, Monetary Value를 기준으로 군집화하는 것을 말한다.

정확히는 데이터 집합을 이 3가지에 대한 집합으로 만든 후 군집화를 수행한다.

 

원래 데이터

위와 같은 데이터집합을 아래와 같은 데이터 집합으로 바꿔준다.

그 후에 군집화를 수행하면 되는데 그 전에 데이터 값의 분포도를 그려보면

굉장히 왜곡된 분포도를 가지고 있음을 알 수 있다. 더 구체적인 값을 보면.

mean과 median값을 비교해보면 그 차이가 꽤나 큼을 알 수 있고 std값도 엄청 크다. 이런 데이터 분포도를 데이터 세트에 K-평균을 적용해도 변별력이 떨어지는 군집화가 수행된다고 한다.

n_clusters=2일 때는 너무 개괄적으로 군집화가 수행되었고 n_cluster >= 3 인 경우에는 실루엣 계수값이 편차가 너무 심하게 나옴을 알 수 있다. 

이를 통해서는 우리가 그 전에 모르던, 새로운 의미를 발견하기 어렵다. 따라서 log함수를 적용한다. 

그러면 다음과 같은 결과를 얻을 수 있다. 실루엣 계수의 값은 떨어졌지만 군집간 실루엣 계수가 균등하게 나타남을 알 수 있다. 이럴 때 더 유의미한 결과를 얻을 수 있다고 한다.

 


결국 그 방법과 디테일에서 많은 차이가 있겠지만 RFM이란 Recency, Frequency, Monetary Value에 대해 고객을 분석하는 것을 말한다. 

 

군집화를 수행하여 고객을 분류하면 마케팅에 유용한 자료로 쓰일 수 있다.