-
當(dāng)前位置:首頁(yè) > 創(chuàng)意學(xué)院 > 技術(shù) > 專題列表 > 正文
rfm分析法的優(yōu)缺點(diǎn)(rfm模型分析案例)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于rfm分析法的優(yōu)缺點(diǎn)的問題,以下是小編對(duì)此問題的歸納整理,讓我們一起來看看吧。
開始之前先推薦一個(gè)非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計(jì)劃、工作報(bào)告、論文、代碼、作文、做題和對(duì)話答疑等等
只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準(zhǔn),寫出的就越詳細(xì),有微信小程序端、在線網(wǎng)頁(yè)版、PC客戶端
官網(wǎng):https://ai.de1919.com。
創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀的企業(yè),服務(wù)客戶遍布全球各地,如需了解SEO相關(guān)業(yè)務(wù)請(qǐng)撥打電話175-8598-2043,或添加微信:1454722008
本文目錄:
一、基于RFM的客戶價(jià)值分析報(bào)告
項(xiàng)目背景
在面向客戶制定運(yùn)營(yíng)策略、營(yíng)銷策略時(shí),我們希望針對(duì)不同的客戶推行不同的策略,實(shí)現(xiàn)精準(zhǔn)化運(yùn)營(yíng),以期獲取最大的轉(zhuǎn)化率。精準(zhǔn)化運(yùn)營(yíng)的前提是客戶分類。通過客戶分類,對(duì)客戶群體進(jìn)行細(xì)分,區(qū)別出低價(jià)值客戶、高價(jià)值客戶,對(duì)不同的客戶群體開展不同的個(gè)性化服務(wù),將有限的資源合理地分配給不同價(jià)值的客戶,實(shí)現(xiàn)效益最大化。在客戶分類中,RFM模型是一個(gè)經(jīng)典的分類模型,模型利用通用交易環(huán)節(jié)中最核心的三個(gè)維度——最近消費(fèi)(Recency)、消費(fèi)頻率(Frequency)、消費(fèi)金額(Monetary)細(xì)分客戶群體,從而分析不同群體的客戶價(jià)值。
項(xiàng)目目標(biāo)
本項(xiàng)目借助某電商客戶數(shù)據(jù),探討如何對(duì)客戶群體進(jìn)行細(xì)分,以及細(xì)分后如何利用RFM模型對(duì)客戶價(jià)值進(jìn)行分析。在本項(xiàng)目中,主要希望實(shí)現(xiàn)以下三個(gè)目標(biāo):1.借助某電商客戶數(shù)據(jù),對(duì)客戶進(jìn)行群體分類;2.比較各細(xì)分群體的客戶價(jià)值;3.對(duì)不同價(jià)值的客戶制定相應(yīng)的運(yùn)營(yíng)策略。
分析過程
1.數(shù)據(jù)預(yù)覽
我們的源數(shù)據(jù)是訂單表,記錄著用戶交易相關(guān)字段
通過數(shù)據(jù)可以發(fā)現(xiàn),訂單狀態(tài)有交易成功和退款關(guān)閉的,檢查是否還有其他情況
只有這兩種情況,后續(xù)清洗中需剔除退款訂單。然后觀察數(shù)據(jù)類型與缺失情況
訂單一共28833行,沒有缺失,付款日期是時(shí)間格式,實(shí)付金額、郵費(fèi)和購(gòu)買數(shù)量是數(shù)值型,其他均為字符串類型
2. 數(shù)據(jù)清洗
(1)剔除退款
(2)關(guān)鍵字段提?。禾崛FM模型所需要的買家昵稱,付款時(shí)間,實(shí)付金額
(3)關(guān)鍵字段構(gòu)造:構(gòu)建模型所需的三個(gè)字段,R(最近一次購(gòu)買時(shí)間間隔),F(購(gòu)買頻次),M(平均或累計(jì)購(gòu)買金額)
首先構(gòu)造R值,思路是按買家昵稱分組,選取付款日期最大值
為了得到最終的R值,用今天減去每位用戶最近一次付款時(shí)間,就得到R值了,這份訂單是7月1日生成的,所以這里我們把“2019-7-1”當(dāng)作“今天”
然后處理F,即每個(gè)用戶累計(jì)購(gòu)買頻次( 明確一下單個(gè)用戶一天內(nèi)購(gòu)買多次訂單合并為一次訂單 )
思路:引入一個(gè)精確到天的日期標(biāo)簽,依照“買家昵稱”和“日期標(biāo)簽”分組,把每個(gè)用戶一天內(nèi)的多次下單合并,再統(tǒng)計(jì)購(gòu)買次數(shù)
最后處理M,本案例M指用戶平均支付金額,可以通過總金額除以購(gòu)買頻次計(jì)算出來
三個(gè)指標(biāo)合并
3. 維度打分
維度確認(rèn)的核心是分值確定。RFM模型中打分一般采取5分制,依據(jù)數(shù)據(jù)和業(yè)務(wù)的理解,進(jìn)行分值的劃分
R值依據(jù)行業(yè)經(jīng)驗(yàn),設(shè)置為30天一個(gè)跨度,區(qū)間左閉右開
F值和購(gòu)買頻次掛鉤,每多購(gòu)買一次,分值多加一分
M值我們按照50元的一個(gè)區(qū)間來進(jìn)行劃分
這一步我們確定了一個(gè)打分框架,每一個(gè)用戶的每個(gè)指標(biāo),都有其對(duì)應(yīng)的分值
4. 分值計(jì)算
(1)算出每個(gè)用戶的R,F,M分值
(2)簡(jiǎn)化分類結(jié)果
通過判斷每個(gè)客戶的R,F,M值是否大于平均值,來簡(jiǎn)化分類結(jié)果。0表示小于平均值,1表示大于平均值,整體組合下來有8個(gè)分組
5.客戶分層
RFM經(jīng)典分層按照R,F,M每一項(xiàng)指標(biāo)是否高于平均值,把用戶劃分為8類
Python實(shí)現(xiàn)思路如下:先定義一個(gè)人群數(shù)值,將之前判斷的R,F,M是否大于均值的三個(gè)值加起來
人群數(shù)值是數(shù)值類型,位于前面的0會(huì)自動(dòng)略過,比如1代表001的高消費(fèi)喚回客戶人群,10對(duì)應(yīng)010的一般客戶
然后在python中定義一個(gè)判斷函數(shù),通過判斷人群數(shù)值,來返回對(duì)應(yīng)的分類標(biāo)簽
數(shù)據(jù)解讀與建議:
首先查看各類用戶占比情況
然后查看不同類型客戶消費(fèi)金額貢獻(xiàn)占比
最后導(dǎo)出數(shù)據(jù),在tableau中數(shù)據(jù)可視化展示
通過數(shù)據(jù)可視化后,我們可以發(fā)現(xiàn):
1.客戶流失情況嚴(yán)重,高消費(fèi)喚回客戶,流失客戶占比超過總客戶的50%
2.高消費(fèi)喚回客戶和頻次深耕客戶的金額總占比約66%,這兩部分客戶是消費(fèi)的重點(diǎn)客戶
3.流失客戶和新客戶的總?cè)藬?shù)占比約38%,但金額總占比只有約13%
建議:
1.針對(duì)高消費(fèi)喚回客戶,流失客戶采用喚回策略,推送相關(guān)信息,發(fā)禮品券等挽留客戶
2.針對(duì)高消費(fèi)喚回客戶和頻次深耕客戶,考慮繼續(xù)挖掘其消費(fèi)特性,如喜愛購(gòu)買的產(chǎn)品,消費(fèi)的時(shí)間段,后續(xù)據(jù)此加強(qiáng)店鋪產(chǎn)品與時(shí)間段的改進(jìn),最大程度留住這兩部分客戶
3.針對(duì)流失客戶和新客戶金額總占比低,建議推出一些低價(jià)產(chǎn)品,用來拉取新客戶,保證店鋪的活躍性。
二、rfm模型的三個(gè)指標(biāo)是什么?
根據(jù)美國(guó)數(shù)據(jù)庫(kù)營(yíng)銷研究所Arthur Hughes的研究,客戶數(shù)據(jù)庫(kù)中有3個(gè)神奇的要素,這3個(gè)要素構(gòu)成了數(shù)據(jù)分析最好的指標(biāo):
1、最近一次消費(fèi)
最近一次消費(fèi)意指上一次購(gòu)買的時(shí)候——顧客上一次是幾時(shí)來店里、上一次根據(jù)哪本郵購(gòu)目錄購(gòu)買東西、什么時(shí)候買的車,或在你的超市買早餐最近的一次是什么時(shí)候。
理論上,上一次消費(fèi)時(shí)間越近的顧客應(yīng)該是比較好的顧客,對(duì)提供即時(shí)的商品或是服務(wù)也最有可能會(huì)有反應(yīng)。營(yíng)銷人員若想業(yè)績(jī)有所成長(zhǎng),只能靠偷取競(jìng)爭(zhēng)對(duì)手的市場(chǎng)占有率,而如果要密切地注意消費(fèi)者的購(gòu)買行為,那么最近的一次消費(fèi)就是營(yíng)銷人員第一個(gè)要利用的工具。
歷史顯示,如果能讓消費(fèi)者購(gòu)買,他們就會(huì)持續(xù)購(gòu)買。這也就是為什么,0至3個(gè)月的顧客收到營(yíng)銷人員的溝通信息多于3至6個(gè)月的顧客。
2、消費(fèi)頻率
消費(fèi)頻率是顧客在限定的期間內(nèi)所購(gòu)買的次數(shù)。我們可以說最常購(gòu)買的顧客,也是滿意度最高的顧客。如果相信品牌及商店忠誠(chéng)度的話,最常購(gòu)買的消費(fèi)者,忠誠(chéng)度也就最高。增加顧客購(gòu)買的次數(shù)意味著從競(jìng)爭(zhēng)對(duì)手處偷取市場(chǎng)占有率,由別人的手中賺取營(yíng)業(yè)額。
分類:
根據(jù)這個(gè)指標(biāo),我們又把客戶分成五等分,這個(gè)五等分分析相當(dāng)于是一個(gè)“忠誠(chéng)度的階梯”(loyalty ladder),如購(gòu)買一次的客戶為新客戶,購(gòu)買兩次的客戶為潛力客戶,購(gòu)買三次的客戶為老客戶,購(gòu)買四次的客戶為成熟客戶,購(gòu)買五次及以上則為忠實(shí)客戶。
其訣竅在于讓消費(fèi)者一直順著階梯往上爬,把銷售想象成是要將兩次購(gòu)買的顧客往上推成三次購(gòu)買的顧客,把一次購(gòu)買者變成兩次的。
3、消費(fèi)金額
消費(fèi)金額是所有數(shù)據(jù)庫(kù)報(bào)告的支柱,也可以驗(yàn)證“帕雷托法則”(Pareto’s Law)——公司80%的收入來自20%的顧客。
它顯示出排名前10%的顧客所花費(fèi)的金額比下一個(gè)等級(jí)者多出至少2倍,占公司所有營(yíng)業(yè)額的40%以上。如看累計(jì)百分比的那一欄,我們會(huì)發(fā)現(xiàn)有40%的顧客貢獻(xiàn)公司總營(yíng)業(yè)額的80%;而有60%的客戶占營(yíng)業(yè)額的90%以上。
最右的一欄顯示每一等分顧客的平均消費(fèi),表現(xiàn)最好的 10%的顧客平均花費(fèi)1195美元,而最差的10%僅有18美元 。
應(yīng)用意義
RFM模型較為動(dòng)態(tài)地顯示了一個(gè)客戶的全部輪廓,這對(duì)個(gè)性化的溝通和服務(wù)提供了依據(jù),同時(shí),如果與該客戶打交道的時(shí)間足夠長(zhǎng),也能夠較為精確地判斷該客戶的長(zhǎng)期價(jià)值(甚至是終身價(jià)值),通過改善三項(xiàng)指標(biāo)的狀況,從而為更多的營(yíng)銷決策提供支持。
在RFM模式中,R(Recency)表示客戶購(gòu)買的時(shí)間有多遠(yuǎn),F(xiàn)(Frequency)表示客戶在時(shí)間內(nèi)購(gòu)買的次數(shù),M (Monetary)表示客戶在時(shí)間內(nèi)購(gòu)買的金額。一般的分析型CRM著重在對(duì)于客戶貢獻(xiàn)度的分析,RFM則強(qiáng)調(diào)以客戶的行為來區(qū)分客戶。
RFM非常適用于生產(chǎn)多種商品的企業(yè),而且這些商品單價(jià)相對(duì)不高,如消費(fèi)品、化妝品、小家電、錄像帶店、超市等;
它也適合在一個(gè)企業(yè)內(nèi)只有少數(shù)耐久商品,但是該商品中有一部分屬于消耗品,如復(fù)印機(jī)、打印機(jī)、汽車維修等消耗品;RFM對(duì)于加油站、旅行保險(xiǎn)、運(yùn)輸、快遞、快餐店、KTV、行動(dòng)電話信用卡、證券公司等也很適合。
RFM可以用來提高客戶的交易次數(shù)。業(yè)界常用的DM(直接郵寄),常常一次寄發(fā)成千上萬封郵購(gòu)清單,其實(shí)這是很浪費(fèi)錢的。
根據(jù)統(tǒng)計(jì)(以一般郵購(gòu)日用品而言),如果將所有R(Recency)的客戶分為五級(jí),最好的第五級(jí)回函率是第四級(jí)的三倍,因?yàn)檫@些客戶剛完成交易不久,所以會(huì)更注意同一公司的產(chǎn)品信息。如果用M(Monetary)來把客戶分為五級(jí),最好與次好的平均回復(fù)率,幾乎沒有顯著差異。
三、用戶分層-RFM分層方法論
我們都知道,所有的運(yùn)營(yíng)工作都是圍繞著用戶展開的。運(yùn)營(yíng)策略從某種程度來說,就是資源對(duì)用戶的有效分配。那么,知道什么用戶應(yīng)該制定什么樣的運(yùn)營(yíng)策略,就尤為重要了,而這就要依賴于我們的用戶分層了。
在運(yùn)營(yíng)過程中,用戶分層的作用很明顯,它能 幫助我們把用戶分成各個(gè)層次和群體,然后我們根據(jù)各個(gè)層次和群體的不同,才能有的放矢的制定出更精準(zhǔn)、更有針對(duì)性的運(yùn)營(yíng)策略。
我們?cè)谶\(yùn)營(yíng)工作中,經(jīng)常會(huì)聽到“用戶畫像”、“用戶分層”、“用戶分群”這幾個(gè)詞,貌似有些類似特別是后面兩個(gè),但如果嚴(yán)格說的話,還是有區(qū)別的。
本篇準(zhǔn)確地說應(yīng)該是包括了“用戶分層+用戶分群”,這里就統(tǒng)稱為用戶分層了。而本篇我們也會(huì)通過一個(gè)實(shí)例,用一張Excel表作為工具,從零開始一步一步的完成一次用戶分層過程。
關(guān)于用戶分層,我們需先明白以下幾點(diǎn):
一、用戶分層在不同的行業(yè)中是不一樣的,而且可能是多樣化的。
比如滴滴打車,用軟件打車的人是一種用戶;司機(jī)也是一種用戶;廣告商也是一種用戶。如果要做用戶分層的話,就需要對(duì)這三種類型的用戶分別做一套不同的用戶分層體系。
二、用戶分層在產(chǎn)品發(fā)展的不同階段會(huì)有不同的變化。
比如我們區(qū)分價(jià)值用戶和一般用戶,
初期我們產(chǎn)品少,一個(gè)月買2次化200元錢可能就是我們的價(jià)值用戶了。
隨著公司的發(fā)展我們產(chǎn)品的不斷增多,需要一個(gè)月買10次化5000元才有能算是我們的價(jià)值用戶了。
三、用戶分層需要定性和定量
如上面的例子一樣,我們需要對(duì)用戶有一個(gè)定性的過程,如價(jià)值用戶、一般用戶,或者VIP,超級(jí)VIP等等;然后必須要對(duì)此進(jìn)行定量,比如消費(fèi)多少金額才能算價(jià)值用戶。
那么如何用科學(xué)化的手段進(jìn)行一次用戶分析,以確定各用戶群體的行為特征,完成一次用戶分層的過程,就必須要說到經(jīng)典的RFM用戶模型了。如下圖:
RFM模型歷史悠久,其理論知識(shí)這里就不闡述了,簡(jiǎn)單的說就是通過 最近一次消費(fèi)(Recency)、消費(fèi)頻率(Frequency)、消費(fèi)金額(Monetary)這三個(gè)指標(biāo) ,然后把每個(gè)指標(biāo)按照實(shí)際的情況,分成5檔,一共形成了125類的用戶。然后為了執(zhí)行方便,把125類的用戶歸納成8大類, 如下圖 ,最后根據(jù)這8大類用戶的情況制定運(yùn)營(yíng)策略。
這里要說明的一點(diǎn)是,RFM模型不是互聯(lián)網(wǎng)時(shí)代的產(chǎn)物,事實(shí)上在傳統(tǒng)行業(yè)里也用的很廣,所以其指標(biāo)主要針對(duì)的是付費(fèi)用戶。 如果我們的互聯(lián)網(wǎng)產(chǎn)品用戶人群是免費(fèi)用戶,一樣可以用這個(gè)RFM模型并使用它的方法 ,只是指標(biāo)換成了 最后一次登錄、登錄頻率、產(chǎn)品使用時(shí)間。
接下來我們就用實(shí)例來操作一遍:
我們現(xiàn)在手上有500份付費(fèi)用戶數(shù)據(jù),包含(用戶、最后一次消費(fèi)時(shí)間間隔、消費(fèi)頻率、消費(fèi)金額)四個(gè)字段,我們?nèi)绾芜M(jìn)行用戶分層并制定有效運(yùn)營(yíng)策略呢?
第一步:我們把數(shù)據(jù)導(dǎo)入或粘貼到Excel當(dāng)中,再原有的4個(gè)表頭基礎(chǔ)上,再增加R值、F值、M值三個(gè)表頭。做好這樣一張Excel表,如下圖:
(此處只選10條數(shù)據(jù)做實(shí)例)
第二步:分別確定好RFM這三個(gè)指標(biāo)五檔的標(biāo)準(zhǔn)。
這是比較難的一步,因?yàn)椴煌男袠I(yè)不同的產(chǎn)品不同的階段都有不同的劃分標(biāo)準(zhǔn)。比如消費(fèi)金額,1000個(gè)用戶里面,最低1元,最高10000元。大部分情況下,20%的用戶占據(jù)了80%的金額,而80%的用戶占了20%的金額,是一個(gè)長(zhǎng)尾的分布效果。所以我們不能簡(jiǎn)單的用最高金額/5,或者用戶總數(shù)/5的平均分法,這樣分出來的結(jié)果不能代表一個(gè)擁有類似行為表現(xiàn)的群體。
這個(gè)主要還是依靠大家在本身各自行業(yè)中的理解和實(shí)際場(chǎng)景需求來確定了。 當(dāng)然,如果我們實(shí)在沒有什么頭緒的話,我們可以 通過散點(diǎn)圖大致分辨一下 ,如下圖:
大家可以看到,通過散點(diǎn)圖,我們可以比較直觀的看清用戶的分布(上圖為用戶的消費(fèi)金額分布)。 我們?nèi)シ謾n的時(shí)候就盡可能的將密集的一部分分在一起,這樣,該檔用戶群體的行為共性也就更大一點(diǎn)。
需要說明的是,這不是一個(gè)很嚴(yán)謹(jǐn)?shù)姆址?,需要大家在?shí)際過程中進(jìn)行不斷的調(diào)整。而如果我們面臨海量數(shù)據(jù)的時(shí)候,最好是通過聚類算法等技術(shù)手段,才能更加科學(xué)精準(zhǔn)的幫助我們進(jìn)行判斷。
以本例來說,我們最后定下了RFM各個(gè)指標(biāo)下的五個(gè)分檔標(biāo)準(zhǔn)。如圖:
第三步:分別計(jì)算出每條記錄的R、F、M值。
我們通過在Excel里面加入if判斷,自動(dòng)計(jì)算出該記錄對(duì)應(yīng)的R、F、M值,比如我們RFM分層表中,0001用戶對(duì)應(yīng)的R值,
即單元格E3:=IF(B3>10,1,IF(B3>8,2,IF(B3>5,3, IF(B3>3,4,5))))
我們來解釋一下這條if判斷語句:
同樣的算法,我們寫出計(jì)算每一條記錄F值和M值的判斷條件。
然后,我們把Excel的單元格往下拉,最后形成這樣的圖:
第四步:分別算出總的R、F、M的平均值。
這一步比較簡(jiǎn)單,我們以上全部算完之后,再最下面增加一行,用AVERAGE()計(jì)算出以上所有行數(shù)的平均值。如圖:
第五步:根據(jù)每條記錄的R、F、M值和所有記錄的平均值,判斷出每條記錄的R、F、M值是在平均值之上,還是平均值之下。
首選,我們先增加三個(gè)表頭,如圖:
然后,我們用每一條記錄的R值來R的平均值進(jìn)行比較,如果<平均值則顯示“低”,如果大于等于則顯示“高”。
我們還是用If判斷語句進(jìn)行自動(dòng)判斷,以上圖為例,用戶0001的“R高低值”即:
這樣,我們就變成了下圖:
這個(gè)時(shí)候,我們發(fā)現(xiàn)了一個(gè)問題,當(dāng)我們把單元格往下拉的時(shí)候,E3固然變成了E4,但E13也變成了E14,由于E13是一個(gè)固定格子的數(shù)字,我們不希望它隨著單元格的下拉而改變。我們就需要在if語句中在E13兩邊加上“$”這個(gè)符號(hào)了。
如下:
同時(shí),為了更直觀,我們?cè)O(shè)置一個(gè)條件格式,若文本中含有“高”則背景色為紅色,若含有“低”則背景色為綠色。這時(shí)候再往下拖一下單元格,就變成這樣拉,如圖:
第六步:根據(jù)比較值,進(jìn)行八大類的歸類。
接下來,我們就要根據(jù)我們的“R高低值”“F高低值”“M高低值”,自動(dòng)計(jì)算出我們的用戶層級(jí)拉。我們先加個(gè)表頭“用戶層級(jí)”。
這一次,我們要寫一串稍微長(zhǎng)一點(diǎn)的IF判斷語句,如下:
本文所寫的都是在Excel里面的IF判斷語句,建議大家能夠自己寫一下,不想寫或?qū)懖怀鲆矝]關(guān)系,直接保存好上面的if語句Copy一下直接用就行了(修改一下單元格的序號(hào)就可以了)。
最后,如下圖:
當(dāng)然,我們還可以在用戶層級(jí)的表頭上加上“篩選”功能,可以直接搜索到我們需要的那些用戶。大家也可以通過不同的顏色來區(qū)分不同的用戶層級(jí),這個(gè)就自由發(fā)揮拉。
好了,到這里,我們就已經(jīng)通過用一張Excel表,完成了一次用戶分層的全過程。 這張表最后的效果是,就像一個(gè)程序一樣,我們?nèi)我廨斎肴齻€(gè)RFM數(shù)字,表格將自動(dòng)會(huì)跳出這個(gè)用戶的層級(jí)。 大家保存好這張excel表,以后用起來套一下就可以了,效率是相當(dāng)快的。大家可以嘗試自己從頭做一遍,若有需要的話可在留言區(qū)留下郵箱,我會(huì)發(fā)送給大家。
完成后上面六步之后,我們已經(jīng)得到了完成用戶分層之后的所有用戶記錄,這時(shí)我們需要做成圖表的形式,開個(gè)會(huì)、做個(gè)匯報(bào)啥的,如下圖:
回到我們上面說的,做用戶分層的目的是為了有的放矢的制定出更精準(zhǔn)、更有針對(duì)性的運(yùn)營(yíng)策略。所以,我們最終我們還是回到制定運(yùn)營(yíng)策略上來。我們的例子可參考下圖:
再接下來要如何具體實(shí)施和執(zhí)行,就不在本篇文章的范疇里了。
用戶分層是運(yùn)營(yíng)過程中非常重要的一個(gè)環(huán)節(jié),快速的進(jìn)行用戶分層也是我們必備的一個(gè)方法。我們把用戶分的層,其實(shí)用戶本身是不知道的。如果我們分一個(gè)層級(jí)讓用戶知道,不僅知道而且還非常喜歡,以此來不斷引導(dǎo)用戶進(jìn)行自我層級(jí)的上升。
四、數(shù)據(jù)分析之聚類分析
RFM分析只能對(duì)客戶的行為進(jìn)行分析,包含的信息量有點(diǎn)少。一般來說,對(duì)人群進(jìn)行分類,要綜合考慮其行為、態(tài)度、模式以及相關(guān)背景屬性,通過使用特定的方法,發(fā)現(xiàn)隱藏在這些信息背后的特征,將其分成幾個(gè)類別,每一類具有一定的共性,進(jìn)而做出進(jìn)一步的探索研究。這個(gè)分類的過程就是聚類分析。
聚類分析,就是按照個(gè)體的特征將它們分類,目的在于讓同一個(gè)類別內(nèi)的個(gè)體之間具有較高的相似度,而不同類別之間具有較大的差異性。這樣,就能夠根據(jù)不同類別的特征有的放矢地進(jìn)行分析,并制定出適用于不同類別的解決方案。
聚類可以對(duì)變量進(jìn)行聚類,但是更常見的還是對(duì)個(gè)體進(jìn)行聚類,也就是樣本聚類。例如對(duì)用戶、渠道、商品、員工等方面的聚類,聚類分析主要應(yīng)用在市場(chǎng)細(xì)分、用戶細(xì)分等領(lǐng)域。
為了合理的聚類,需要采用適當(dāng)?shù)闹笜?biāo)來衡量研究對(duì)象之間的聯(lián)系緊密程度,常用的指標(biāo)有“距離”和“相似系數(shù)”,相似系數(shù)一般指的是相關(guān)系數(shù)。假設(shè)將研究對(duì)象采用點(diǎn)表示,聚類分析時(shí),將“距離”較小的點(diǎn)或“相似系數(shù)”較大的點(diǎn)歸為同一類,將“距離”較大的點(diǎn)或“相似系數(shù)”較小的點(diǎn)歸為不同的類。
聚類分析具有如下特點(diǎn):
1.對(duì)于聚類結(jié)果是未知的,不同的聚類分析方法可能得到不同的分類結(jié)果,或者相同的聚類分析方法但是所分析的變量不同,也會(huì)得到不同的聚類結(jié)果;
2.對(duì)于聚類結(jié)果的合理性判斷比較主觀,只要類別內(nèi)相似性和類別間差異性都能得到合理的解釋和判斷,就認(rèn)為聚類結(jié)果是可行的。
聚類分析可以應(yīng)用于以下場(chǎng)景:
聚類分析的步驟:
(1)確定需要參與聚類分析的變量;
(2)對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理;
因?yàn)楦鱾€(gè)變量間的變量值的數(shù)量級(jí)別差異較大或者單位不一致,例如一個(gè)變量的單位是元,另一個(gè)變量的單位是百分比,數(shù)量級(jí)別差異較大,而且單位也不一致,無法直接進(jìn)行比較或者計(jì)算“距離”和“相似系數(shù)”等指標(biāo)。
(3)選擇聚類方法和類別個(gè)數(shù);
(4)聚類分析結(jié)果解讀;
常用的聚類方法包括:
1.快速聚類:也稱K均值聚類,它是按照一定的方法選取一批聚類中心點(diǎn),讓個(gè)案向最近的聚類中心點(diǎn)聚集形成初始分類,然后按照最近距離原則調(diào)整不合理的分類,直到分類合理為止。
2.系統(tǒng)聚類:也稱層次聚類,首先將參與聚類的個(gè)案(或變量)各視為一類,然后根據(jù)兩個(gè)類別之間的聚類或者相似性逐步合并,直到所有個(gè)案(或變量)合并為一個(gè)大類為止。實(shí)際上,系統(tǒng)聚類分析結(jié)果展現(xiàn)了每個(gè)個(gè)案的聚類過程和分類結(jié)果。系統(tǒng)聚類之后,要制作交叉表通過每一個(gè)類別的均值來了解每一類別的特征。
3.二階聚類:也稱兩步聚類,它是隨著人工智能的發(fā)展起來的一種智能聚類方法。整個(gè)聚類方法分為兩個(gè)步驟,第一個(gè)步驟是預(yù)聚類,就是根據(jù)定義的最大類別數(shù)對(duì)個(gè)案進(jìn)行初步歸類;第二個(gè)步驟是正式聚類,就是對(duì)第一步得到的初步歸類進(jìn)行再聚類并確定最終聚類結(jié)果,并且在這一步中,會(huì)根據(jù)一定的統(tǒng)計(jì)標(biāo)準(zhǔn)確定聚類的類別數(shù)。
(1)系統(tǒng)聚類分析不僅支持輸入單個(gè)分類數(shù)量,還支持輸入分類數(shù)量的范圍。這對(duì)于暫時(shí)無法確定類別數(shù),或者想進(jìn)行多類別數(shù)的結(jié)果比較時(shí),非常方便。
(2)系統(tǒng)聚類分析支持生成聚類結(jié)果圖,從而更加直觀地查看聚類過程。系統(tǒng)聚類分析支持兩種圖形:
譜系圖(樹狀圖):它以樹狀的形式展現(xiàn)個(gè)案被分類的過程;
冰柱圖:它以“X”的形式顯示全部類別或指定類別數(shù)的分類過程。
(3)系統(tǒng)聚類分析提供多種聚類方法和適用于不同數(shù)據(jù)類型的測(cè)量方法。
其中,測(cè)量方法(度量標(biāo)準(zhǔn)):
(i)區(qū)間:適用于連續(xù)變量,雖然SPSS提供了8種測(cè)量方法,但是通常選用默認(rèn)的【平方歐式距離】即可。
(ii)計(jì)數(shù):適用于連續(xù)或分類變量,SPSS提供了2種測(cè)量方法,通常選用【卡式測(cè)量】即可。
(iii)二元:適用于0/1分類變量,SPSS提供多達(dá)27種測(cè)量方法,通常選用【平方歐式距離】即可。
通過方法里的轉(zhuǎn)換值項(xiàng)來進(jìn)行標(biāo)準(zhǔn)化處理。由于參與聚類分析的變量是連續(xù)變量,所以,【測(cè)量】應(yīng)選擇【區(qū)間】項(xiàng),方法為默認(rèn)的【平方歐式距離】,標(biāo)準(zhǔn)化可以選擇【Z得分】,選擇按【變量項(xiàng)】,用以每個(gè)變量單獨(dú)進(jìn)行標(biāo)準(zhǔn)化。
二階聚類分析能夠?qū)B續(xù)變量和分類變量同時(shí)進(jìn)行處理,無需提前指定聚類的數(shù)目,二階聚類會(huì)自動(dòng)分析并輸出最優(yōu)聚類數(shù)。二階聚類的自動(dòng)聚類結(jié)果借由統(tǒng)計(jì)指標(biāo)施瓦茲貝葉斯準(zhǔn)則(BIC)幫助判斷最佳分類數(shù)量。判斷一個(gè)聚類方案的依據(jù)是BIC的數(shù)值越小,同時(shí),“BIC變化量”的絕對(duì)值和“距離測(cè)量比率”數(shù)值越大,則說明聚類效果越好。
聚類分析屬于探索性數(shù)據(jù)分析方法,它沒有一個(gè)所謂的標(biāo)準(zhǔn)流程和答案,不同的數(shù)據(jù)有不同的適用方法,即使相同的數(shù)據(jù),應(yīng)用不同的方法也可能會(huì)得到不同的結(jié)果。只要能有效解決實(shí)際業(yè)務(wù)問題即可。
以上就是關(guān)于rfm分析法的優(yōu)缺點(diǎn)相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會(huì)為您講解更多精彩的知識(shí)和內(nèi)容。
推薦閱讀:
colouful怎么說(colourful用英語怎么說讀音)
paper免費(fèi)查重入口官網(wǎng)(paperfree免費(fèi)查重入口官網(wǎng))
從聯(lián)想思維中獲得靈感——如何更有效地激發(fā)創(chuàng)意
通過互聯(lián)網(wǎng)掙錢有哪些渠道(通過互聯(lián)網(wǎng)掙錢有哪些渠道和方法)