2026-05-09 · 박서준 (선임연구원)

코호트 분석(Cohort Analysis)이란 무엇인가요? SaaS 스타트업 리텐션·LTV를 정확히 측정하는 가장 솔직한 방법

#스타트업#코호트분석#saas리텐션#ltvcac#pmf검증#그로스해킹#데이터분석#페이백기간#리텐션마케팅

코호트 분석은 가입 시점이 같은 사용자 그룹을 묶어서 시간이 지남에 따라 어떻게 행동하는지 추적하는 데이터 분석 방법입니다. 평균값으로 가려져 있던 리텐션 곡선과 매출 확장 패턴, 페이백 기간을 솔직하게 드러내 주기 때문에 스타트업이 프로덕트 마켓 핏(Product-Market Fit)을 검증하고 LTV/CAC 비율을 개선하는 출발점으로 자리 잡았습니다. 이 아티클에서는 코호트 테이블 3종 설계법과 코호트 기반 LTV 계산식, 2026년 SaaS 벤치마크, 그리고 4단계 실전 도입 가이드를 정리했습니다.

목차

실패한 스타트업의 LTV 계산이 만든 1억 원의 환상

3년 전 시드 라운드를 막 마친 한 B2B SaaS 스타트업의 IR 자료를 검토한 적이 있습니다. 월 구독료 4만 9천 원, 평균 월 처닝 5%, 그래서 평균 고객 생애 가치(LTV)는 약 980,000원이라고 적혀 있었습니다. 페이지 한 켠에는 LTV/CAC=3.4라는 황금비율이 큼지막하게 표시돼 있었고요. 모든 숫자가 깔끔했습니다.

문제는 코호트별로 데이터를 다시 그렸을 때 드러났는데요. 1월 가입 코호트는 6개월 차에 71%가 남아 있었지만, 4월 가입 코호트는 같은 6개월 차에 38%만 남아 있었습니다. 같은 회사가 1분기에는 PMF에 거의 도달했다가, 2분기에 페이드 광고 비중을 늘리면서 잘못된 고객을 대량으로 데려온 것이지요. 평균 LTV 980,000원은 이 두 그룹을 섞어버린 환상이었고, 실제로는 4월 코호트의 LTV가 31만 원에 불과했습니다.

이 회사는 제대로 된 코호트 분석 한 번으로 다음 분기 광고 예산 1억 원의 행선지를 바꿨습니다.저는 그날 이후 평균 처닝, 평균 LTV, 블렌디드 CAC라는 세 단어가 나오면 무조건 "코호트로 다시 보여달라"고 요청합니다. 평균은 늘 거짓말을 하니까요.

코호트 분석이 무엇이고 왜 평균 지표는 거짓말을 하는가

코호트(cohort)는 라틴어 cohors에서 온 말로, 같은 시점에 같은 사건을 경험한 집단을 가리킵니다. 마케팅·프로덕트 분야에서는 보통 가입 월이 같은 사용자, 첫 결제 월이 같은 고객, 같은 캠페인으로 유입된 사용자처럼 시간 또는 행동을 기준으로 묶은 그룹을 의미하는데요. 코호트 분석은 이렇게 묶인 그룹이 시간이 지나며 어떻게 변하는지를 추적하는 작업입니다.

평균 지표의 함정

블렌디드 평균에는 세 가지 치명적인 문제가 숨어 있습니다.

첫째,개선되는 흐름과 악화되는 흐름을 같은 숫자로 덮어버립니다. 신규 코호트의 리텐션이 좋아지고 있어도 과거 약한 코호트가 평균을 끌어내려 PMF가 멀어보이게 만들 수 있습니다. 반대도 마찬가지로요.

둘째, 채널별 가치를 왜곡합니다. 블렌디드 LTV는 모든 고객이 동등하게 가치 있다는 잘못된 신호를 주고, 채널 ROI를 평준화시켜 자본 배분 의사결정을 망칩니다. 이런 점은 실제 그로스 해킹 현장에서 가장 자주 발견되는 함정입니다.

셋째, 시간을 평탄화합니다. 평균은 "지금까지의 평균"이지 "앞으로의 예상"이 아닙니다. 코호트는 시간을 보존하기 때문에 미래를 추정하는 단서를 제공합니다.

코호트 분석이 답하는 3가지 질문

질문 유형답을 주는 코호트핵심 지표
누가 남는가리텐션 코호트M1~M24 잔존율
누가 더 많이 쓰는가매출 확장 코호트NRR, 평균 ARPU 변화
언제 본전을 뽑는가페이백 코호트CAC 회수 개월 수

이 세 가지 질문은 스타트업의 단계와 무관하게 항상 유효합니다. 시드 단계라면 리텐션 곡선이 평탄화(flatten)되는지가 PMF 시그널이고, 시리즈 A 단계라면 매출 확장 코호트가 100% 이상에서 안정되는지가 추가 자본을 받을 만한 비즈니스인지 가르는 기준이 됩니다.

모든 SaaS가 만들어야 할 3가지 코호트 테이블

코호트 분석을 처음 도입하는 팀이 흔히 저지르는 실수는 한 장의 거대한 테이블에 모든 지표를 우겨넣는 것인데요. 시각적으로는 풍부해 보이지만 의사결정에는 도움이 되지 않습니다. 실전에서는 작은 테이블 세 개로 나누는 편이 훨씬 효과적입니다.

1. 리텐션 코호트 테이블

가로축은 가입 후 경과 월(M0, M1, M2…), 세로축은 가입 월입니다. 각 셀에는 해당 시점에 살아있는 사용자 비율을 적습니다. 예를 들어 2026년 1월에 100명이 가입했고 6개월 차에 64명이 남아 있다면 M6=64%로 표기하지요.

이 테이블에서 봐야 할 것은 두 가지입니다. 코호트별 리텐션이 시간이 지나며 평탄화되는지, 그리고 신규 코호트가 과거 코호트보다 더 좋은 곡선을 그리는지입니다. 평탄화는 PMF의 시그널이고, 신규 코호트의 개선은 프로덕트와 온보딩이 진화하고 있다는 증거입니다.

2. 매출 확장(NRR) 코호트 테이블

같은 구조에 셀 값만 매출로 바꿉니다. M0의 매출을 100으로 두고 이후 코호트의 매출이 어떻게 변하는지를 봅니다. 다운셀·이탈만 있다면 100 아래로 떨어지고, 업셀·확장이 활발하면 120, 140으로 올라갑니다.

NRR(Net Revenue Retention)이 100%를 넘으면 신규 고객 한 명도 추가하지 않아도 매출이 자연 증가한다는 뜻이라서, B2B SaaS의 가장 강력한 성장 엔진으로 평가됩니다. 토발 코호트의 NRR이 110~130% 사이에 안정적으로 머무는 SaaS는 시리즈 B 이후 구조적 우위를 갖게 됩니다.

3. 페이백 코호트 테이블

코호트별 누적 매출이 해당 코호트의 CAC를 넘어서는 시점을 추적합니다. 셀에는 누적 ARPU 또는 누적 그로스 마진을 적고, CAC와 같아지는 월을 페이백 기간으로 표기합니다.

소비자 SaaS는 페이백 6개월 이내, B2B SaaS는 12~18개월이 일반적인 기준입니다. 페이백이 24개월을 넘어가면 자본 효율이 빠르게 악화되니까요. 시리즈 A 투자자가 가장 먼저 들여다보는 자료가 이 테이블이라고 보면 됩니다.

코호트 기반 LTV 계산법: 단일 처닝 가정 버리기

전통적인 LTV 공식은 "ARPU ÷ 처닝율"이지만, 이 단순한 공식은 모든 코호트가 동일한 처닝율을 갖는다는 비현실적인 가정 위에 서 있습니다. 실제로는 가입 직후 첫 90일 처닝율이 가장 높고, 12개월을 넘긴 고객은 거의 떠나지 않는 패턴이 일반적입니다.

코호트 LTV 산식

코호트 LTV는 관측된 리텐션 곡선을 그대로 사용합니다. 한 코호트의 LTV는 매월 잔존율 × 그 달의 ARPU × 그로스 마진을 합산한 값으로 계산하는데요. 식으로 풀어쓰면 다음과 같습니다.

코호트 LTV = Σ ( 잔존율(t) × ARPU(t) × 그로스마진 )   [t = 0 \~ 36 또는 관측 가능한 끝]

이 방식은 평균 처닝을 가정하지 않고 실제 곡선을 그대로 반영하기 때문에 코호트가 좋아지면 LTV도 같이 올라가고, 나빠지면 같이 내려갑니다. 솔직한 숫자를 만들어 주지요.

평균 LTV vs 코호트 LTV 비교

구분평균 LTV코호트 LTV
처닝 가정단일 평균값월별 관측 잔존율
코호트 차이 반영불가가능
신규 코호트 개선 반영지연됨즉시
채널·캠페인 진단어려움직접 가능
LTV/CAC 비율 신뢰도낮음높음

업계 표준 LTV/CAC 비율은 3:1입니다. 다만 이 비율을 평균 LTV로 계산해 3.0을 맞춰놓고 안심하는 것은 위험한데요. 코호트별로 다시 그렸을 때 가장 비중이 큰 채널의 LTV/CAC가 1.5에 머물고 있다면, 그 채널은 자본을 태워 매출을 만드는 구조라는 뜻이기 때문입니다.

2026년 SaaS 코호트 벤치마크와 의미 해석법

벤치마크 숫자는 절대적인 합격선이 아니라 자신의 코호트를 해석할 때 참고하는 좌표라고 보면 됩니다. 2026년 시점에 자주 인용되는 SaaS 코호트 기준은 다음과 같습니다.

리텐션 벤치마크

B2B SaaS 계약 기반 리텐션은 12개월 차에 약 71%, 24개월 차에 64%에서 평탄화되는 경향이 보고됩니다. 셀프서브 SaaS는 더 가파른 곡선을 보여서 6개월 차 50% 부근까지 떨어지는 경우가 많습니다. PLG 모델과 SLG 모델이 섞인 제품은 두 곡선이 합쳐져 해석을 어렵게 만들기 때문에 채널별로 분리해 보는 편이 정확합니다.

NRR 벤치마크

상장 SaaS의 NRR 중간값은 약 109%이고, 상위 25%는 120%를 넘는 것이 일반적입니다. 100% 미만이면 매출이 자연 감소 구조라는 뜻이라서 신규 고객 획득에 더 많은 자본을 태워야 하지요.

페이백 벤치마크

B2B SaaS 페이백은 12~18개월이 정상 범위로 평가됩니다. 24개월을 넘어가면 자본 효율이 급격히 떨어지고, 시리즈 B 이후로는 라운드를 돌릴 때마다 희석률이 커지는 구조에 빠집니다. 페이백을 줄이는 가장 빠른 방법은 CAC를 줄이는 게 아니라 NRR을 끌어올려 누적 매출 곡선을 가파르게 만드는 것입니다.

다만 모든 벤치마크에는 산업·BM·고객 세그먼트별 분산이 큽니다. 같은 SaaS라도 SMB 타겟과 엔터프라이즈 타겟의 페이백은 두 배 이상 차이가 나기도 하니까요. 자기 업의 같은 BM·같은 ICP를 가진 회사들과 비교해야 의미 있는 진단이 됩니다.

코호트 분석 4단계 실전 도입 가이드

스타트업이 코호트 분석을 처음 도입할 때 가장 큰 장벽은 도구가 아니라 데이터 정의입니다. "어디서부터를 가입으로 볼 것인가", "결제 시점을 M0으로 볼 것인가, 가입 시점을 M0으로 볼 것인가" 같은 질문이 먼저 정리되어야 도구가 의미를 갖습니다.

1단계: 이벤트와 정의 정렬

먼저 회사 내부에서 다음을 합의합니다.

  • 코호트 기준 시점: 가입일 / 첫 결제일 / 첫 활성 행동일 중 하나로 통일
  • 활성 사용자 정의: 단순 로그인 vs 핵심 기능 N회 사용
  • 매출 정의: 인보이스 발행 기준 vs 실제 입금 기준

이 정의가 흔들리면 모든 코호트가 거짓말을 하게 됩니다. 정의는 한 페이지짜리 메모로 만들어 모두가 같은 곳을 보게 만들어야 합니다.

2단계: 도구 선택과 파이프라인 구축

초기 단계라면 GA4·Mixpanel·Amplitude 같은 SaaS 분석 도구의 기본 코호트 기능으로 충분합니다. 시리즈 A 이후로는 BigQuery·Snowflake에 이벤트를 적재하고 dbt로 코호트 모델을 빌드한 뒤 Looker 또는 Metabase로 시각화하는 구조가 일반적입니다. 처음부터 데이터 웨어하우스에 욕심내기보다는 SaaS 도구로 첫 두 분기를 운영하며 정의를 굳히고, 그 다음에 웨어하우스로 옮기는 편이 낫습니다.

3단계: 의사결정 회의에 코호트 끼워넣기

가장 중요한 단계인데요. 매주 또는 매월 그로스 회의에서 평균 처닝 한 줄 대신 리텐션 코호트 테이블을 띄우는 것만으로도 의사결정의 질이 달라집니다. 코호트가 평탄화 됐는지, 신규 코호트가 과거 코호트보다 좋아지고 있는지를 매번 묻는 회의 룰을 정해두면 좋습니다.

4단계: 채널별·세그먼트별 분리

전체 코호트 위에 채널별·세그먼트별 코호트를 겹쳐 보면 광고 예산 배분의 답이 보입니다. 페이드 채널 코호트의 페이백이 오가닉보다 6개월 이상 늦다면 즉시 채널 믹스를 조정해야 한다는 신호이지요. AARRR 프레임워크와 결합하면 활성화·매출·추천 단계 어디에서 코호트가 깨지는지를 정확히 짚어낼 수 있습니다.

FAQ

코호트 분석을 처음 도입할 때 사용 난이도가 어느 정도인가요?

데이터 정의만 명확하면 SaaS 분석 도구의 기본 코호트 화면으로 1주일 안에 첫 테이블을 만들 수 있습니다. 다만 정의가 흔들리면 도구 사용법보다 합의 과정에 더 많은 시간이 들어가는데요. 첫 도입 단계에서는 코호트 기준 시점과 활성 정의를 한 페이지로 문서화하는 데 시간을 쓰는 편이 결과적으로 빠릅니다.

코호트 분석의 정확도는 어떻게 검증하나요?

같은 코호트의 잔존율을 두 가지 다른 데이터 소스(예: 결제 DB와 이벤트 DB)에서 뽑아 비교하는 방식이 가장 확실합니다. 두 결과의 오차가 1~2% 이내면 신뢰할 만한 코호트라고 볼 수 있고, 5%를 넘으면 이벤트 누락이나 정의 차이를 먼저 점검해야 합니다.

상업적 사용·외부 보고에 코호트 데이터를 그대로 써도 되나요?

IR 자료, 투자자 업데이트, 보드 미팅 자료에 코호트 테이블을 그대로 사용하는 것이 권장됩니다. 평균 LTV·평균 처닝만 적힌 자료는 시리즈 A 이상의 투자자에게는 오히려 신뢰를 깎는 경우가 많기 때문이지요. 단, 셀 값의 정의(잔존율인지, 매출 인덱스인지, 페이백 누적인지)를 표 아래에 항상 명시해 주세요.

코호트 분석을 도입하면 시간 절감 효과가 얼마나 되나요?

월간 그로스 회의 기준으로 의사결정 회의 시간이 약 30~40% 줄었다는 사례가 많습니다. 평균 지표를 두고 "왜 이렇게 됐는지" 토론하는 시간이 사라지고, 어느 코호트가 어떻게 다른지를 먼저 보고 액션 아이템으로 바로 넘어갈 수 있기 때문입니다.

전통적인 평균 LTV/CAC 분석과 가장 큰 차이는 무엇인가요?

가장 큰 차이는 "시간을 보존하느냐"입니다. 평균 LTV/CAC는 모든 시점·채널·세그먼트를 한 숫자로 압축하지만, 코호트 분석은 시간·채널·세그먼트를 그대로 살린 상태로 보여주기 때문에 어디를 고쳐야 할지가 표 위에 그대로 드러납니다. 의사결정 정밀도가 다른 것이지요.

같이 읽으면 좋은 것들