kyejin0412 님의 블로그
Week 13-3 실전 프로젝트 - 마케팅 주요 데이터 분석 정리 본문
마케팅 분야에서 전문으로 하는 데이터 분석을 하고 싶었는데, 마케팅을 잘 몰라서 제미나이의 도움을 받아 정리해보았다.
마케팅에서 자주 하는 데이터 분석 및 필요한 컬럼
1. ROAS (Return On Ad Spend, 광고비 대비 매출액)
- 정의: 지출한 광고비 대비 얼마의 매출을 올렸는지 측정하는 효율성 지표입니다.
- 계산: (광고를 통한 매출 / 광고 집행 비용) × 100
- 필수 컬럼: 광고비(Spend), 주문금액(Revenue), 주문일자(Date), 매체/캠페인명(Campaign_ID/Name)
2. CAC (Customer Acquisition Cost, 고객 획득 비용)
- 정의: 신규 고객 1명을 데려오기 위해 사용된 전체 비용입니다.
- 계산: 총 마케팅 비용 / 신규 획득 고객 수
- 필수 컬럼: 총 마케팅 비용(Total_Marketing_Spend), 고객ID(Customer_ID), 가입일/첫구매일(Join_Date), 신규여부(Is_New_Customer)
3. LTV (Lifetime Value, 고객 생애 가치)
- 정의: 한 명의 고객이 우리 서비스 이용 기간 동안 발생시킬 것으로 예상되는 총 이익입니다.
- 계산: 평균 구매 단가 × 구매 빈도 × 고객 유지 기간 (또는 AI 예측 모델 사용)
- 필수 컬럼: 고객ID(Customer_ID), 주문금액(Order_Amount), 주문일자(Order_Date), 최종접속일/탈퇴일(Last_Active_Date)
4. 코호트 분석 (Cohort Analysis)
- 정의: 특정 기간에 특정 경험을 공유한 집단(예: 1월 가입자)을 시간 흐름에 따라 분석하는 방법입니다. 주로 리텐션(재방문/재구매)을 볼 때 사용합니다.
- 필수 컬럼: 고객ID(Customer_ID), 최초 획득 시점(Cohort_Date/Join_Month), 이후 행동일자(Action_Date), 행동종류(Action_Type)
5. 퍼널 분석 (Funnel Analysis)
- 정의: 고객이 서비스에 유입되어 최종 목표(구매 등)에 이르기까지의 단계를 시각화하여, 어느 단계에서 가장 많이 이탈하는지 파악하는 분석입니다.
- 필수 컬럼: 사용자ID(User_ID), 이벤트명(Event_Name: 페이지뷰, 장바구니, 결제 등), 이벤트발생시간(Timestamp), 세션ID(Session_ID)
6. A/B 테스트 (A/B Testing)
- 정의: 두 가지 이상의 시안(A안, B안)을 무작위로 사용자에게 보여준 뒤, 어떤 안이 더 높은 성과를 거두었는지 통계적으로 검증하는 방법입니다.
- 필수 컬럼: 사용자ID(User_ID), 노출그룹(Test_Group: Control/Experimental), 전환여부(Is_Converted), 전환시간(Conversion_Time)
스타벅스 데이터셋 - 마케팅 데이터 분석 (파생변수 O)
1. 프로모션 반응 경로 및 성과 분석 (Attribution Analysis)
단순히 프로모션을 완료했는지가 아니라, '의도된 반응'이었는지를 분석합니다.
- 파생변수:
- is_influenced: 오퍼를 확인(viewed)한 후에 완료(completed)했는지 여부 (확인 안 하고 완료했다면 프로모션 없이도 살 고객이었음)
- view_rate: offer viewed / offer received (채널별/오퍼별 주목도)
- completion_rate: offer completed / offer viewed (확인 후 실제 매력도)
- 분석 포인트:
- 체리피커(Cherry Picker) 식별: 리워드(reward)가 클 때만 움직이는 집단 분석.
- 비의도적 전환 분석: 오퍼를 보지 않고 구매한 고객에게 나가는 비용(리워드)을 절감하여 마케팅 ROI 개선.
2. 채널별 가중치 및 선호도 분석 (Channel Affinity)
channels 컬럼의 리스트 데이터를 분리하여 어떤 채널이 가장 효과적인지 분석합니다.
- 파생변수:
- channel_count: 한 오퍼에 할당된 채널의 개수
- social_exposure_yn: 소셜 채널 포함 여부 (0/1)
- 분석 포인트:
- 채널 조합 최적화: 'web+email' 조합과 'social+mobile' 조합 중 어떤 것이 view_rate가 더 높은가?
- 비용 대비 효율: 소셜 채널은 보통 비용이 높으므로, 소셜이 포함된 오퍼가 그만큼 높은 추가 매출을 발생시키는지 검증.
3. 고객 세분화 및 LTV 분석 (Customer Segmentation)
profile의 인구통계 정보와 transcript의 소비 행태를 결합합니다.
- 파생변수:
- membership_days: 분석 시점 - became_member_on (멤버십 근속 기간)
- avg_order_value(AOV): 총 거래 금액 / 총 거래 횟수
- income_level: 소득 수준별 그룹화 (Low, Mid, High)
- 분석 포인트:
- 소득 vs 난이도(difficulty) 상관관계: 고소득자일수록 난이도가 높은(지출액이 커야 하는) 오퍼에 더 잘 반응하는가?
- 신규 고객 온보딩: membership_days가 짧은 고객에게 어떤 offer_type이 가장 효과적인가?
4. RFM 기반의 고객 가치 분석
transcript의 로그 데이터를 활용해 고객의 현재 상태를 정의합니다.
- 파생변수:
- Recency: 마지막 transaction 발생 시간(time)
- Frequency: 전체 기간 내 transaction 횟수
- Monetary: 전체 기간 내 총 amount 합계
- 분석 포인트:
- 이탈 예측: Recency가 급격히 길어지는 고객에게 duration이 긴 오퍼를 보내 방어 마케팅 실행.
- VIP 타겟팅: Frequency와 Monetary가 높은 상위 10% 고객에게만 리워드(reward)가 큰 프리미엄 오퍼 제공.
5. 효율성(Efficiency) 분석 및 파생 지표
마케팅 비용 최적화를 위한 핵심 분석입니다.
- 파생변수:
- net_revenue: amount - reward (리워드 비용을 제외한 순매출)
- cost_per_completion: 지급된 총 리워드 / 완료된 오퍼 수
- 분석 포인트:
- 오퍼별 ROI: offer_type(BOGO vs Discount) 중 어떤 유형이 net_revenue 증대에 더 기여하는가?
- 난이도 최적화: difficulty 대비 reward 비율이 어느 지점일 때 고객의 반응률이 급증(Inflection Point)하는가?
스타벅스 데이터셋 - 마케팅 데이터 분석 (파생변수 X)
1. 오퍼 유형별 전환율 분석 (Offer Type Efficiency)
portfolio의 offer_type과 transcript의 event를 단순 매칭하여 분석합니다.
- 분석 내용: BOGO(1+1), 할인(Discount), 단순 정보 제공(Informational) 중 어떤 오퍼가 가장 많이 완료(offer completed)되는가?
- 마케팅 활용: 반응률이 가장 높은 오퍼 유형에 마케팅 예산을 집중 편성합니다.
2. 인구통계학적 선호 오퍼 분석 (Demographic Profiling)
profile의 gender, age와 portfolio의 offer_type을 결합합니다.
- 분석 내용:
- 여성은 BOGO와 할인 중 무엇을 더 선호하는가?
- 20대와 50대 중 difficulty(최소 주문 금액)가 높은 오퍼를 더 잘 수행하는 집단은 누구인가?
- 마케팅 활용: 타겟 세그먼트별로 전송할 오퍼 리스트를 개인화합니다.
3. 소득 수준별 소비 규모 분석 (Income vs. Spending)
profile의 income과 transcript의 transaction 이벤트 내 amount를 결합합니다.
- 분석 내용: 소득이 높을수록 한 번의 거래(amount)당 지출 금액이 비례해서 커지는가? 아니면 소득과 상관없이 특정 가격대에 소비가 몰려있는가?
- 마케팅 활용: 평균 지출액보다 살짝 높은 금액을 difficulty로 설정하여 업셀링(Up-selling) 전략을 세웁니다.
4. 오퍼 유효 기간과 반응 속도 분석 (Duration vs. Time)
portfolio의 duration과 transcript의 time 컬럼을 비교합니다.
- 분석 내용: 유효 기간이 긴 오퍼(예: 10일)와 짧은 오퍼(예: 3일) 중 고객이 더 빨리 반응하는 것은 무엇인가? (마감 임박 효과 확인)
- 마케팅 활용: 고객의 빠른 방문을 유도해야 할 때 최적의 오퍼 유효 기간을 결정합니다.
5. 멤버십 가입 연도별 충성도 비교 (Tenure Analysis)
profile의 became_member_on 컬럼을 연도별로 그룹화하여 분석합니다.
- 분석 내용: 2023년 가입자와 2025년 가입자 중 누가 더 빈번하게 transaction을 발생시키는가?
- 마케팅 활용: 오래된 고객(Old-vibe)의 이탈이 감지된다면 리텐션을 위한 특별 리워드를 설계합니다.
6. 채널별 오퍼 도달율 분석 (Channel Reach)
portfolio의 channels 컬럼에 포함된 값(web, email, mobile, social)에 따른 offer viewed 빈도를 확인합니다.
- 분석 내용: 소셜(social) 채널을 포함한 오퍼가 이메일만 보낸 오퍼보다 고객이 확인(viewed)할 확률이 얼마나 더 높은가?
- 마케팅 활용: 가장 '조회율'이 높은 채널 조합을 기본 발송 채널로 설정합니다.
7. 거래 시간대별 패턴 분석 (Time-series Pattern) - 가지고 있는 시간 컬럼이 상대적 시간이라 이 분석은 할 수 없음
transcript의 time 컬럼(t=0부터의 흐름)을 그대로 활용합니다.
- 분석 내용: 전체 고객의 거래(transaction) 활동이 피크를 이루는 지점은 언제인가? 오퍼가 살포된 직후인가, 아니면 일정 시간이 지난 후인가?
- 마케팅 활용: 고객 활동이 가장 활발한 시간(t)에 맞춰 실시간 푸시 알림을 발송합니다.
고객이 오퍼를 [받고 → 보고 → 완료]하는 일련의 과정을 단계별로 분석합니다.
- 단계 설정:
- 1단계: offer received (유입)
- 2단계: offer viewed (관심)
- 3단계: offer completed (전환)
- 분석 방법:
- 각 offer_id별로 1단계 대비 2단계의 비율(노출률), 2단계 대비 3단계의 비율(전환율)을 계산합니다.
- 인사이트:
- 어떤 오퍼는 많이 뿌려졌는데 왜 확인을 안 할까? (채널이나 제목의 문제)
- 어떤 오퍼는 확인은 많이 하는데 왜 완료를 안 할까? (난이도가 너무 높거나 보상이 적은 문제)
특정 시점에 가입한 고객들이 시간이 지나도 여전히 결제를 잘 하는지(리텐션) 분석합니다.
- 코호트 기준: became_member_on (가입 시기)
- 예: 2024년 1월 가입자 그룹, 2024년 2월 가입자 그룹...
- 시간 축: transcript의 time (상대적 시간 흐름)
- 측정 지표: transaction 횟수 또는 결제 금액
- 분석 방법:
- 가입 월별로 고객을 묶은 뒤, 가입 후 10시간, 20시간, 50시간이 지났을 때 얼마나 많은 고객이 여전히 transaction을 발생시키는지 표(Heatmap)로 시각화합니다.
- 인사이트:
- 최근 가입한 고객들이 과거 가입자들보다 더 빨리 이탈하는가?
- 특정 시기에 가입한 고객들의 구매력이 유독 높은가? (당시 진행한 마케팅 효과 확인)
[심화] 이 데이터셋으로만 할 수 있는 특수 분석
단순한 퍼널/코호트를 넘어, 이 데이터의 특성을 살린 분석 2가지를 더 추천합니다.
진짜 퍼널: received → viewed → completed (직렬 구조)우연한 완료: received → (viewed 없이) → completed이 두 그룹을 나누어 퍼널 분석을 하면, 우리 마케팅이 실제로 고객의 행동을 변화시켰는지 아니면 줄 필요가 없는 리워드를 줬는지 판별할 수 있습니다.
② 리워드 민감도 코호트
고객을 '소득 수준(income)별' 또는 '가입 연도별'로 나누어(코호트), difficulty가 높아질 때 completion_rate가 어떻게 변하는지 분석합니다.
- 인사이트: "사회 초년생 코호트는 5달러 지출 미션에는 잘 반응하지만, 10달러가 넘어가면 급격히 이탈한다"는 식의 구체적인 가이드라인을 얻을 수 있습니다.
요약하자면:
- 퍼널 분석을 통해 오퍼의 UI/UX(채널, 보상 수준)를 개선할 수 있고,
- 코호트 분석을 통해 고객의 라이프사이클(가입 시기별 특징)을 파악할 수 있습니다.
'내일배움캠프-데이터분석' 카테고리의 다른 글
| Week 14-3 실전 프로젝트 발표 피드백 정리 (1) | 2026.01.21 |
|---|---|
| Week 13-4 실전 프로젝트 - 대시보드 기획 (0) | 2026.01.16 |
| Week 13-2 실전 프로젝트 - 스타벅스 한국 매장 지도 크롤링, 맵 시각화 (1) | 2026.01.13 |
| Week 13-1 실전 프로젝트 - 주제 정하기 (1) | 2026.01.12 |
| Week 12-7 크롤링 (2) | 2026.01.11 |