Data analysis

군집화 강의

keepgroovin' 2015. 12. 19. 18:13

군집화 강의

1. 파생변수는 '의미'로부터 나온다
--> 왜 의미있는건가?

예시 > 아파트 평형 : life stage 를 추정할 수 있기 때문에

2. 클러스터링은 '거리' 개념

3.클러스터링 할 때는 항상 정규화 시킬 것 (키와 몸무게는 100kg 차이)


4. 군집화 모델링
가설 도출 -> 가설적 후보 변수 도출 -> 의미있는지 확인하여 핵심 변수 core variables 확정

5. 범주형변수는 SOM 쓰는 게 좋다고

- SOM self organizing map (Kohonen feature map)


6. 사례

니즈

라이프 사이클이나 고객/라이프 밸류와 합쳐지면 전략이 나오고

세그의 전이를 보면 방안이 나온다

크 ㅜㅠ 이 부분 감동