剖析數據的利器:Cohort Analysis組群分析

0 評論 1077 瀏覽 5 收藏 11 分鐘

Cohort Analysis組群分析是一種能深入挖掘數據的分析方法,通過將數據進行多維度的呈現,暴露問題時點,聚焦分群,助力問題的有效定位。

一、留存率的背后隱藏著什么?

上圖為某公司近半年的留存率變化情況(數據為舉例),通過圖中我們發現留存率隨著時間逐漸減少,這是一個總體結果的呈現,而當我們想要了解更細節的信息,比如說:

  • 當出現異常下降點時,如何再細分拆解原因?
  • 單個月份下的留存率是由什么部分構成的?
  • 單個月份下新增的用戶隨著時間的推移的流失情況?等等……

有什么辦法能讓我們深挖數據呢?同期組群分析可以解決。

二、使用Cohort Analysis組群分析剖析數據

Cohort Analysis同期組群分析,即針對不同分組的用戶在相同的時段內的分析方法。通過以下步驟我們來看看如何運用組群分析剖析留存分析的問題。

1. 建立分析框架:分組+時間

  • 橫軸是時間線,從聚焦觀察的起點開始統計1個月后,2個月后,3個月后等等以后的情況。為了便于從時間視角去觀察數據,在表述的時候,我們轉化成具體時間段下的維度。例如轉化成1月、2月、3月……。
  • 縱軸是組群,在留存率的例子下,我們劃分的組群以每月新增的用戶量為分組,即1月份增加的用戶,2月份增加的用戶,3月份增加的用戶…

2. 定義研究的主體變量,采集數據填充

在通過坐標軸建立好分組標準和時間周期粒度后,我們需要確定研究的主體變量。在例子留存率分析中的主體研究對象是“每月下的新增用戶”,我們把它放在對應分組的旁邊,代表的是當前月份分組下對應的“新增用戶”數值。

當用戶群、時間、研究主體都確定后,我們可以進行數據的采集及填充。隨著時間的推移,年初至7月份的數據:

分別從橫軸及縱軸這二維的角度來展開剖析數據:

1)橫向比較:時間的延展性

橫軸的視角是具體分組下隨著時間變化的情況,分組間體現了時間的延展性,你可以看到每個月新增的用戶留存隨著時間的推移的數量變化情況。觀察圖表我們可以發現的問題是:

  • 留存情況是否合理?合理參考標準可以是:自己往期的平均水平、同行的平均水平、預期目標等。
  • 是否有某個月份數據異常?超出均值范圍內的大的增長或減退,再結合具體時間節點前后發生的產品動作進行排查。

2)縱向比較:聚焦時間段下的細分結構

縱向的數據,即具體月份下的數據是對每期分組的新增用戶進行累加,各分群組成結構清晰可見。

針對留存的分析,轉化成留存率的視角,觀察每月新增用戶、每月下各期組成分群的留存率變化趨勢,理想態是要提升的,說明數據的留存比之前更好,體現出公司不斷在產品功能上進行優化,使得留存率提升。如果發現背離理想態的狀況,再聚焦異常的節點進行分析。

另外談一下增強數據的可讀性,可以通過對數值區間進行顏色深淺的設置,或者將橫縱軸分別轉化成折線圖,使得對于數據的波動幅度得到更直觀的呈現。

三、靈活運用分組分析

上例留存率問題已經簡要說明了組群分析的基本使用步驟,它達成了把問題拆解到時間維度呈現變化趨勢及組成結構。那么Cohort Analysis組群分還能怎么靈活運用?它有沒有局限性呢?我們嘗試著抽象出它的幾類運用模式。首先,看下它的基礎框架是這樣:

1. 研究縱軸的分組對象:可以是時間、人、事/物

1)“時間”為縱軸的分組

它的特點為分組是對不同時期進入的用戶,分別考察其后續行為的變化情況,這個特性決定了每期分組下存在持續新增用戶,此時的分析才有意義。

由于C端類產品用戶是獨立的個體,單獨使用,滿足這種情況;而B端類產品就不適用了,B端類產品的用戶往往是在系統上線時,大批量應公司要求開始使用,后續零星的新員工繼續加入使用,在每期分組下不滿足有持續新增用戶。

再說說此類表格數據的呈現形式,由于是對不同時間批次的數據進行收集,在表格數據呈現形式上是三角形。

2)“人(用戶群)”、“事/物”為縱軸的分組

  • 人(用戶群)分組聚焦用戶群在時間下的發展差異,這種分類方式比較常用于驗證某項產品功能迭代的效果。比如:新上線的優惠券功能對用戶留存的影響。
  • “事/物”的分組比如研究渠道的獲客質量,縱軸的分組是各渠道,收集的是各渠道在時間維度下獲客的留存情況。又或者是研究公司產品更命中大企業還是中小企業的痛點,縱軸的分組是大客戶定價方案,中小企業定價方案,收集的是各體量客戶定價方案下的成交單量。

它們在表格數據呈現形式上是整齊劃一,也是我們最常見的柱狀圖/曲線圖表格化的呈現。

2. 研究橫向時間軸的劃分方式

1)如何設定觀察時間的起點

a.留出對比時間段:若要突出某項功能上線前后對產品的影響和貢獻,需要將觀察時間的起點提前設定,留出一定的時間好對比功能前后的變化。

b.結合用戶使用頻次特點:這里要說說C端和B端用戶的差異。C端產品服務于用戶個人,特點是主要用戶群體對于核心功能高頻的使用。B端用戶是企業內部的用戶群,他們使用各自職能下需要的系統功能,并且個別使用還呈現出周期性的特點,比如:月度的工資計算、季度的物料盤點、周期性的物品采購等等。因此,在對于B端產品的觀察時,需要針對到具體角色使用的時段下研究才有意義。

2)設置時間間隔的考量

時間間隔的大小代表了多久分析一次,設置合理的時間間隔的大小,有助于降低時間中的噪音。

當研究更聚焦宏觀周期時,時間段的間隔傾向設置得較大,比如按月或按年進行分割;當聚焦細節變化時,時間段的設計的間隔設置得相對較小,比如:按周、按天、按小時段等等。

3)事件記錄

記錄研究全時段內的發生事件,便于在對時間節點進行分析時有落腳點,成為相關性分析中的研究事件。

以上是搭建組群分析框架的思路,在組群分析方法搭建好之后,是對于數據的收集、觀察、異常問題的定位,枚舉可能性的原因,通過相關性分析聚焦具體的原因。

本文由@tomato 原創發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自 Unsplash,基于 CC0 協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!