
🎯 들어가며
서비스 성장의 핵심은 유입이 아니라 유지입니다.
유입이 많아도 사용자가 금세 이탈한다면, 결국 데이터는 “일회성 트래픽”으로 사라집니다.
그래서 데이터를 볼 때 가장 중요한 질문은
“우리의 사용자는 얼마나 오래 남아있는가?” 입니다
그리고 이 질문에 가장 명확하게 답할 수 있는 분석 방법이 바로 Cohort 분석입니다.
🧩 1. 코호트(Cohort)란 무엇인가
‘코호트(cohort)’는 공통된 시점이나 특성을 가진 사용자 집단을 뜻합니다.
즉, “언제 가입했는가”, “어떤 경로로 유입되었는가”처럼 공통 조건으로 사용자를 묶고, 그들의 행동 패턴을 추적하는 방식입니다.
| 구분 | 설명 | 예시 |
| 코호트 단위 | 사용자 그룹을 구분하는 기준 | 가입일, 첫 결제일, 캠페인별 유입 |
| 측정 대상 | 시간에 따른 행동 유지 여부 | 1일/7일/30일 잔존율 |
| 핵심 질문 | “특정 시점의 사용자는 시간이 지나도 남아있는가?” | 예: 1월 가입자는 3개월 뒤에도 남아있는가? |
💡 즉, 코호트 분석은 ‘시간을 기준으로 한 사용자 잔존 추적’입니다.
📊 2. 리텐션(Retention)을 보는 관점
리텐션은 단순히 “재방문 비율”이 아닙니다.
시간의 흐름 속에서 제품의 지속 사용성을 보여주는 지표입니다.
예를 들어,
- 1일 리텐션: 다음 날 다시 방문한 사용자 비율
- 7일 리텐션: 일주일 후 다시 돌아온 사용자 비율
- 30일 리텐션: 한 달 후에도 남은 사용자 비율
리텐션은 서비스가 습관처럼 자리잡았는가, 혹은 단발성 사용으로 끝났는가를 보여줍니다.
⚙️ 3. 코호트 분석의 기본 구조
코호트 분석은 보통 행(Row) 은 “코호트(가입 주차·월)”이고, 열(Column) 은 “경과 기간(1일, 7일, 30일…)”입니다.
| 가입 월 | 1일 | 7일 | 14일 | 30일 |
| 1월 가입자 | 100% | 55% | 40% | 25% |
| 2월 가입자 | 100% | 60% | 42% | 28% |
| 3월 가입자 | 100% | 65% | 50% | 35% |
여기서 눈여겨볼 부분은 “같은 시점”이 아니라 “같은 출발점(가입 시점)”에서의 변화입니다.
일반적인 트렌드 그래프는 “전체 평균 리텐션”을 보여주지만, 코호트는 “시점별 사용자 집단의 리텐션 차이”를 드러냅니다.
🔍 4. 코호트 분석으로 읽는 인사이트
① 리텐션의 구조적 패턴 파악
- 모든 코호트가 일정하게 하락 → 구조적 UX 문제
- 특정 시점 이후의 코호트만 급락 → 기능 업데이트나 정책 영향 가능
② 신규 유입 품질 비교
- 마케팅 캠페인별 코호트 분석으로
→ 어떤 채널에서 들어온 사용자가 오래 남는지 비교 가능
③ 개선 효과 검증
- 기능 개선 이후 생성된 코호트의 리텐션 상승 → 개선 효과 확인
코호트는 ‘현재의 사용자’가 아니라 ‘과거의 실험 결과’를 보여줍니다.
즉, 리텐션은 실험과 학습의 지표입니다.
5. 코호트 분석의 시각화
기본 형태: 히트맵(Heatmap)
가장 일반적인 코호트 시각화는 ‘잔존율 히트맵’으로 나타냅니다.
각 셀의 색이 진할수록 잔존율이 높고, 시간이 지날수록 색이 옅어지는 구조입니다.
예시)
1월 ████████▒▒░░
2월 ██████▒▒▒░░░
3월 ███████▒▒░░░
시각화 포인트
- 수평 비교: “같은 코호트의 시간별 유지율”
- 수직 비교: “다른 코호트 간의 초기 리텐션 차이”
- 대각선 비교: “전체 리텐션의 트렌드”
시각화의 목적은 숫자를 나열하는 게 아니라, “남는 사용자들의 패턴을 시각적으로 드러내는 것”입니다.
💡 6. 실무에서 코호트 분석을 적용하는 방법
① Looker Studio / Metabase에서 시각화
- “가입일 기준”으로 필터링
- DATEDIFF(event_date, signup_date) 형태로 경과일 계산
- 잔존율 계산: 활성 사용자 수 / 최초 사용자 수 * 100
② BigQuery 예시 쿼리
SELECT
signup_week,
DATEDIFF(event_date, signup_date) AS day_diff,
COUNT(DISTINCT user_id) / FIRST_VALUE(COUNT(DISTINCT user_id)) OVER (PARTITION BY signup_week ORDER BY day_diff ASC) AS retention_rate
FROM user_activity
GROUP BY signup_week, day_diff
ORDER BY signup_week, day_diff;
이런 형태로 데이터를 변환하면 히트맵이나 라인 차트로 시각화 가능합니다.
③ 코호트를 대시보드에 포함시키기
- 상단: 전체 리텐션 추이 (7일, 30일 평균)
- 중단: 코호트 히트맵 (가입 주차 기준)
- 하단: 기능 업데이트·캠페인 로그와 비교
리텐션이 언제, 왜 바뀌었는지를 연결하는 게 핵심입니다.
7. 코호트로 리텐션을 ‘이해’한다는 것
코호트 분석은 단순히 숫자를 보는 게 아니라, “시간이 만든 사용자 관계”를 이해하는 과정입니다.
- 꾸준히 리텐션이 유지되는 코호트 → 제품이 습관화되었다는 증거
- 리텐션이 급격히 떨어지는 코호트 → 첫 경험 설계의 문제
- 개선 후 리텐션이 상승하는 코호트 → 제품 학습의 결과
코호트는 결국 “유입의 결과가 남는가”를 증명하는 데이터입니다.
☕ 마무리하며
데이터 분석에서 리텐션은 “얼마나 많은 사람이 남아있는가”를 묻는 지표가 아니라,
“왜 어떤 사람은 떠나고, 어떤 사람은 남는가”를 이해하는 과정입니다.
코호트 분석은 그 과정을 가장 투명하게 보여주는 도구입니다.
시간을 축으로 사용자 관계를 읽을 수 있다면, 성장은 숫자가 아니라 습관으로 증명됩니다.
'Learning Journey > Data Analytics & Insight' 카테고리의 다른 글
| SQL 조인, 결국 어떻게 이해하면 되는가 (0) | 2025.11.25 |
|---|---|
| 🧪 A/B 테스트 설계와 분석 방법 (데이터로 가설을 검증하는 실험의 언어) (0) | 2025.11.14 |
| 🧭 AARRR 퍼널 분석으로 사용자 흐름 이해하기 (데이터로 보는 성장의 여정) (1) | 2025.11.11 |
| 의사결정이 빠른 팀은 대시보드를 이렇게 만든다 (지표 중심 대시보드 설계 프로세스) (0) | 2025.11.09 |
| 📊 업종별 KPI 설계의 기술 (비즈니스마다 지표가 달라야 하는 이유) (0) | 2025.11.08 |

데이터 분석을 공부하고 카페를 열심히 돌아다니는 이야기
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!