마케팅 입력 다중공선성
개괄 설명
다중 공선성은 MMM에서 문제가 될 수 있습니다. 한 채널의 지출/노출이 다른 채널과 더 많이 연관될수록 모델이 해당 채널의 영향을 분리하기가 더 어렵기 때문입니다. 즉, 입력 데이터의 기간이 길수록 다중 공선성이 덜 중요한 문제가 됩니다. 그 이유는 특정 캠페인에 대한 지출과 노출을 결정하는 많은 요인이 있고 대부분은 마케터가 통제할 수 없는 영역에 있기 때문입니다(예: 광고 네트워크 알고리즘, 입찰 경쟁, 산업 변동 등). 충분한 시간이 지나면 각 캠페인의 지출 및 노출의 일간 변동은 일반적으로 자연스럽게 다른 캠페인과 차이가 날 것입니다.
공선성 파일
공선성 파일에는 각 채널, 캠페인 및 사이트(vif 열)에 대한 VIF(분산팽창요인)통계가 포함되어 있습니다. 이러한 통계는 입력 데이터가 변환되고 표준화된후 평가되며(적어도 부분적으로는 다중 공선성을 처리하는 데 도움이 됨) 공선성으로 인해 계수의 분산이 얼마나 증가하는지를 측정합니다. 대부분의 MMM(미디어 믹스 모델)에는 많은 수의 채널과 캠페인에 대한 지출/노출이 포함되기 때문에 2차원 상관 행렬과 같은 단순한 공선성 진단으로는 충분하지 않습니다.
일반적으로 VIF가 10보다 크면 모델에서 일정 수준의 불확실성을 생성하기에 충분한 다중 공선성이 감지되었음을 의미합니다. VIF 통계량이 높을수록 불확실성이 커집니다. 종종 VIF가 높은 트래픽에 대한 실험을 실행하는 것이 도움이 될 수 있습니다. Ground Truth는 불확실성을 제거하는 보정으로 모델을 자동으로 개선함으로써 훨씬 더 큰 가치를 지니고 있습니다.
업데이트 날짜: 09/11/2022
감사합니다!