-
當前位置:首頁 > 創(chuàng)意學院 > 技術 > 專題列表 > 正文
用戶畫像分析(用戶畫像分析案例)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關于用戶畫像分析的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。
開始之前先推薦一個非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等
只需要輸入關鍵詞,就能返回你想要的內容,越精準,寫出的就越詳細,有微信小程序端、在線網頁版、PC客戶端
創(chuàng)意嶺作為行業(yè)內優(yōu)秀的企業(yè),服務客戶遍布全球各地,如需了解SEO相關業(yè)務請撥打電話175-8598-2043,或添加微信:1454722008
本文目錄:
一、用戶畫像分析怎么做
首先,是找到目標用戶。以Tik Tok為例。在Tik Tok剛剛開始上線之后,分析我們的用戶是誰是非常重要的,比如什么年齡,性別,地域教育等等。這樣可以快速幫助產品找到當前的主流用戶群體是否是產品的初始定位。如果完全不同,那就是產品的設計出了問題,偏離了方向。
上線一段時間后,我們可以把用戶分成不同的活躍程度。比如都玩Tik Tok,有的天天玩有的偶爾玩,有的能刷很久,有的刷完就走了。頻率和時長成了此時用戶最大的特征差異。那么,不同頻率和時長的用戶在年齡、性別、地域上有什么區(qū)別呢?這些是對特征的進一步認識。
一段時間后,部分用戶會保留和流失用戶,需要分析保留用戶和流失用戶在行為特征上是否有特殊差異。
https://iknow-pic.cdn.bcebos.com/f703738da977391294357ff1ea198618367ae20b?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_600%2Ch_800%2Climit_1%2Fquality%2Cq_85%2Fformat%2Cf_auto
二、用戶畫像數(shù)據(jù)建模方法_用戶畫像分析
近些年,互聯(lián)網進入了“ 大數(shù)據(jù) 時代”。經歷了12、13兩年熱炒之后,人們逐漸冷靜下來,更加聚 焦于如何利用大數(shù)據(jù)挖掘潛在的商業(yè)價值,如何在企業(yè)中實實在在的應用大數(shù)據(jù)技術。伴隨著大數(shù)據(jù)應用的討論、創(chuàng)新,個性化技術成為了一個重要落地點。伴隨著對人的了解逐步深入,一個概念悄然而生: 用戶畫像 (UserProfile),完美地抽象出一 個用戶的信息全貌,可以看作企業(yè)應用大數(shù)據(jù)的根基。
一、什么是用戶畫像?
男,31歲,已婚,收入1萬以上,愛美食,團購達人,喜歡紅酒配香煙。
這樣一串描述即為用戶畫像的典型案例。如果用一句話來描述,即:用戶信息標簽化。
如果用一幅圖來展現(xiàn),即:
二、為什么需要用戶畫像
用戶畫像的核心工作是為用戶打標簽,打標簽的重要目的之一是為了讓人能夠理解并且方便計算機處理,如,可以做分類統(tǒng)計:喜歡紅酒的用戶有多少?喜歡紅酒的人群中,男、女比例是多少?
也可以做數(shù)據(jù)挖掘工作:利用關聯(lián)規(guī)則計算,喜歡紅酒的人通常喜歡什么運動品牌?利用聚類算法分析,喜歡紅酒的人年齡段分布情況?
大數(shù)據(jù)處理,離不開計算機的運算,標簽提供了一種便捷的方式,使得計算機能夠程序化處理與人相關的信息,甚至通過算法、模型能夠“理解” 人。當計算機具備這樣的能力后,無論是搜索引擎、推薦引擎、廣告投放等各種應用領域,都將能進一步提升精準度,提高信息獲取的效率。
三、如何構建用戶畫像
一個標簽通常是人為規(guī)定的高度精煉的特征標識,如年齡段標簽:25~35歲,地域標簽:北京,標簽呈現(xiàn)出兩個重要特征:語義化,人能很方便地理解每 個標簽含義。這也使得用戶畫像模型具備實際意義。能夠較好的滿足業(yè)務需求。如,判斷用戶偏好。短文本,每個標簽通常只表示一種含義,標簽本身無需再做過多 文本分析等預處理工作,這為利用機器提取標準化信息提供了便利。
人制定標簽規(guī)則,并能夠通過標簽快速讀出其中的信息,機器方便做標簽提取、聚合分析。所以,用戶畫像,即:用戶標簽,向我們展示了一種樸素、簡潔的方法用于描述用戶信息。
3.1 數(shù)據(jù)源分析
構建用戶畫像是為了還原用戶信息,因此數(shù)據(jù)來源于:所有用戶相關的數(shù)據(jù)。
對于用戶相關數(shù)據(jù)的分類,引入一種重要的分類思想:封閉性的分類方式。如,世界上分為兩種人,一種是學英語的人,一種是不學英語的人;客戶分三類, 高價值客戶,中價值客戶,低價值客戶;產品生命周期分為,投入期、成長期、成熟期、衰退期…所有的子分類將構成了類目空間的全部集合。
這樣的分類方式,有助于后續(xù)不斷枚舉并迭代補充遺漏的信息維度。不必擔心架構上對每一層分類沒有考慮完整,造成維度遺漏留下擴展性隱患。另外,不同的分類方式根據(jù)應用場景,業(yè)務需求的不同,也許各有道理,按需劃分即可。
本文將用戶數(shù)據(jù)劃分為靜態(tài)信息數(shù)據(jù)、動態(tài)信息數(shù)據(jù)兩大類。
靜態(tài)信息數(shù)據(jù)
用戶相對穩(wěn)定的信息,如圖所示,主要包括人口屬性、商業(yè)屬性等方面數(shù)據(jù)。這類信息,自成標簽,如果企業(yè)有真實信息則無需過多建模預測,更多的是數(shù)據(jù)清洗工作,因此這方面信息的數(shù)據(jù)建模不是本篇文章重點。
動態(tài)信息數(shù)據(jù)
用戶不斷變化的行為信息,如果存在上帝,每一個人的行為都在時刻被上帝那雙無形的眼睛監(jiān)控著,廣義上講,一個用戶打開網頁,買了一個杯子;與該用戶 傍晚溜了趟狗,白天取了一次錢,打了一個哈欠等等一樣都是上帝眼中的用戶行為。當行為集中到互聯(lián)網,乃至電商,用戶行為就會聚焦很多,如上圖所示:瀏覽凡 客首頁、瀏覽休閑鞋單品頁、搜索帆布鞋、發(fā)表關于鞋品質的微博、贊“雙十一大促給力”的微博消息。等等均可看作互聯(lián)網用戶行為。
本篇文章以互聯(lián)網電商用戶,為主要分析對象,暫不考慮線下用戶行為數(shù)據(jù)(分析方法雷同,只是數(shù)據(jù)獲取途徑,用戶識別方式有些差異)。
在互聯(lián)網上,用戶行為,可以看作用戶動態(tài)信息的唯一數(shù)據(jù)來源。如何對用戶行為數(shù)據(jù)構建數(shù)據(jù)模型,分析出用戶標簽,將是本文著重介紹的內容。
3.2 目標分析
用戶畫像的目標是通過分析用戶行為,最終為每個用戶打上標簽,以及該標簽的權重。如,紅酒 0.8、李寧 0.6。
標簽,表征了內容,用戶對該內容有興趣、偏好、需求等等。
權重,表征了指數(shù),用戶的興趣、偏好指數(shù),也可能表征用戶的需求度,可以簡單的理解為可信度,概率。
3.3 數(shù)據(jù)建模方法
下面內容將詳細介紹,如何根據(jù)用戶行為,構建模型產出標簽、權重。一個事件模型包括:時間、地點、人物三個要素。每一次用戶行為本質上是一次隨機事件,可以詳細描述為:什么用戶,在什么時間,什么地點,做了什么事。
什么用戶 :關鍵在于對用戶的標識,用戶標識的目的是為了區(qū)分用戶、單點定位。
以上列舉了互聯(lián)網主要的用戶標識方法,獲取方式由易到難。視企業(yè)的用戶粘性,可以獲取的標識信息有所差異。
什么時間 :時間包括兩個重要信息,時間戳+時間長度。時間 戳,為了標識用戶行為的時間點,如,1395121950(精度到秒),1395121950.083612(精度到微秒),通常采用精度到秒的時間戳即 可。因為微秒的時間戳精度并不可靠。瀏覽器時間精度,準確度最多也只能到毫秒。時間長度,為了標識用戶在某一頁面的停留時間。
什么地點 :用戶接觸點,Touch Point。對于每個用戶接觸點。潛在包含了兩層信息:網址 + 內容。網址:每一個url鏈接(頁面/屏幕),即定位了一個互聯(lián)網頁面地址,或者某個產品的特定頁面??梢允荘C上某電商網站的頁面url,也可以是手機 上的微博,微信等應用某個功能頁面,某款產品應用的特定畫面。如,長城紅酒單品頁,微信訂閱號頁面,某游戲的過關頁。
內容 :每個url網址(頁面/屏幕)中的內容??梢允菃纹返南嚓P信息:類別、品牌、描述、屬性、網站信息等等。如,紅酒,長城,干紅,對于每個互聯(lián)網接觸點,其中網址決定了權重;內容決定了標簽。
注:接觸點可以是網址,也可以是某個產品的特定功能界面。如,同樣一瓶礦泉水,超市賣1元,火車 上賣3元,景區(qū)賣5元。商品的售賣價值,不在于成本,更在于售賣地點。標簽均是礦泉水,但接觸點的不同體現(xiàn)出了權重差異。這里的權重可以理解為用戶對于礦 泉水的需求程度不同。即,愿意支付的價值不同。
標簽 權重
礦泉水 1 // 超市
礦泉水 3 // 火車
礦泉水 5 // 景區(qū)
類似的,用戶在京東商城瀏覽紅酒信息,與在品尚紅酒網瀏覽紅酒信息,表現(xiàn)出對紅酒喜好度也是有差異的。這里的關注點是不同的網址,存在權重差異,權重模型的構建,需要根據(jù)各自的業(yè)務需求構建。
所以,網址本身表征了用戶的標簽偏好權重。網址對應的內容體現(xiàn)了標簽信息。
什么事 :用戶行為類型,對于電商有如下典型行為:瀏覽、添加購物車、搜索、評論、購買、點擊贊、收藏 等等。
不同的行為類型,對于接觸點的內容產生的標簽信息,具有不同的權重。如,購買權重計為5,瀏覽計為1
紅酒 1 // 瀏覽紅酒
紅酒 5 // 購買紅酒
綜合上述分析,用戶畫像的數(shù)據(jù)模型,可以概括為下面的公式:用戶標識 + 時間 + 行為類型 + 接觸點(網址+內容),某用戶因為在什么時間、地點、做了什么事。所以會打上**標簽。
用戶標簽的權重可能隨時間的增加而衰減,因此定義時間為衰減因子r,行為類型、網址決定了權重,內容決定了標簽,進一步轉換為公式:
標簽權重=衰減因子×行為權重×網址子權重
如:用戶A,昨天在品尚紅酒網瀏覽一瓶價值238元的長城干紅葡萄酒信息。
標簽:紅酒,長城
時間:因為是昨天的行為,假設衰減因子為:r=0.95
行為類型:瀏覽行為記為權重1
地點:品尚紅酒單品頁的網址子權重記為 0.9(相比京東紅酒單品頁的0.7)
假設用戶對紅酒出于真的喜歡,才會去專業(yè)的紅酒網選購,而不再綜合商城選購。
則用戶偏好標簽是:紅酒,權重是0.95*0.7 * 1=0.665,即,用戶A:紅酒 0.665、長城 0.665。
上述模型權重值的選取只是舉例參考,具體的權重值需要根據(jù)業(yè)務需求二次建模,這里強調的是如何從整體思考,去構建用戶畫像模型,進而能夠逐步細化模型。
四、總結 :
本文并未涉及具體算法,更多的是闡述了一種分析思想,在計劃構建用戶畫像時,能夠給您提供一個系統(tǒng)性、框架性的思維指導。
核心在于對用戶接觸點的理解,接觸點內容直接決定了標簽信息。內容地址、行為類型、時間衰減,決定了權重模型是關鍵,權重值本身的二次建模則是水到渠成的進階。模型舉例偏重電商,但其實,可以根據(jù)產品的不同,重新定義接觸點。
比如影視產品,我看了一部電影《英雄本色》,可能產生的標簽是:周潤發(fā) 0.6、槍戰(zhàn) 0.5、港臺 0.3。
最后,接觸點本身并不一定有內容,也可以泛化理解為某種閾值,某個行為超過多少次,達到多長時間等。
比如游戲產品,典型接觸點可能會是,關鍵任務,關鍵指數(shù)(分數(shù))等等。如,積分超過1萬分,則標記為鉆石級用戶。鉆石用戶 1.0。
百分點現(xiàn)已全面應用用戶畫像技術于推薦引擎中,在對某電商客戶,針對活動頁新訪客的應用中,依靠用戶畫像產生的個性化效果,對比熱銷榜,推薦效果有顯著提升:推薦欄點擊率提升27%, 訂單轉化率提升34%。
三、Bilibili用戶畫像分析
本文整理自金渡江的一次公開分享,由于數(shù)據(jù)保密原因和時長原因,只從一些比較粗的顆粒度來闡述了B站的用戶畫像,以及不同用戶畫像群體在同一個社區(qū)內的沖突。
niconico的用戶年齡組成呈紡錘形,更加穩(wěn)定健康,bilibili呈金字塔型,整個B站的用戶更加年輕化,也是說明B站是一個處于用戶發(fā)展早期的網站。
2015年bilibili因為“鬼畜”出村,實現(xiàn)了日系文化與中國文化結合起來,將B站文化落地到中國,所以用戶量大幅度增長,用戶畫像也發(fā)生了變化。
一般網站的年齡會是相對固定1的,像B站這樣年齡一直往下走,說明網站仍然存在一定不確定性。
B站最早的用戶是來源PC,大多數(shù)是80/90初的,主要是通過電視+DVD接觸動漫的,但是廣電2003年封禁日本漫畫,2004年PC開始降價普及,這部分人開始使用互聯(lián)網方式接入動漫文化,這部分人動手能力強,為B站創(chuàng)造了很多有價值的新內容。
B站的分區(qū)喜好:轉向小區(qū),音MAD,vovaloid,番劇延伸;
最愛的動漫:clannad,fate,小圓,lovelive,石頭門;
喜歡的聲優(yōu):釘宮,香菜,水樹,u‘s;
國產動畫:拒絕。
用戶行為與場景:關閉彈幕率高,評論參與度低,網頁端的忠實客戶,也會使用手機端;
B站20歲以下的用戶更多是直接通過網絡接觸到動漫文化,標志性事件是2008年迅雷開啟動漫頻道;2012年智能手機在中國的用戶是2億,2013年是4億,2018年達到8億,智能手機的普及的是B站用戶量騰飛的一個關鍵原因。
從眾心理比較重,
B站分區(qū)喜好:鬼畜愛好者;
最愛的動漫:刀劍神域,fate,夏目,約會大作戰(zhàn),lovelive;
喜歡的聲優(yōu):香菜,釘宮,神谷,u‘s;
對于國產動畫:擁抱變化。
用戶行為與場景:熱衷于發(fā)送彈幕,樂于討論,網頁端一般不用。
由于兩者用戶畫像不同,所以從2015年開始在社區(qū)里爆發(fā)了一個“大勢所趨”的沖突,喜歡音MAD的PC世代用戶與喜歡鬼畜的手機世代的用戶發(fā)生了大爭論。
女性用戶在B站出現(xiàn)了兩級分化,一類喜歡動漫,其關鍵詞是:冰上的尤里,一年生,夏目,銀魂,狐妖小紅狼,新年的聲音;另一類則喜歡偶像,與愛奇藝的用戶畫像更為相近,關鍵詞是張藝興,楊洋,TFboy,SNH48,張繼科,羽生結弦等。
如張藝興,主要是在《極限挑戰(zhàn)》選擇了與B站合作,在B站上張藝興的人氣很高,順便把粉絲也聚攏在B站。
社群象限模型主要討論的是,對于內容的互動性,對于對于興趣外內容的包容性;
例如看電視劇的用戶,看就安安靜靜的看,不喜歡互動,甚至關掉彈幕,也不愿意看其他用戶群的內容,這就是內向+孤立社群。對于時尚人群,這些人會在社群內頻繁互動,但對于其他用戶不感興趣。喜歡鬼畜、番劇的人群,則是外向而又開放的;內向比較開放的,可能是喜歡色色內容的一個群體。
在獲取用戶填寫的數(shù)據(jù)時,感到安全,感到能夠獲取到利益。同時可以給一個設定,如半年內不能更改。
在設計調查問卷時,設計一些重復確認的題目,篩選掉無效問卷。
B站是一年一次。
在大規(guī)模正式的周期性重分析,日常也可以從社區(qū)文化中感受到整站的用戶畫像變化。
四、用戶畫像介紹
用戶畫像是指根據(jù)用戶的屬性、用戶偏好、生活習慣、用戶行為等信息而抽象出來的標簽化用戶模型。
通俗說就是給用戶打標簽,而標簽是通過對用戶信息分析而來的高度精煉的特征標識。通過打標簽可以利用一些高度概括、容易理解的特征來描述用戶,可以讓人更容易理解用戶,并且可以方便計算機處理。
標簽的分類方法比較多樣,可以按標簽的產出方式分,也可以按實際業(yè)務分,也可以組合起來分類。
按產出方式來分的話:
1)事實統(tǒng)計類標簽 例如近7日活躍時長、近7日活躍次數(shù)等等
2)事實規(guī)則類標簽 例如消費活躍:近30天交易次數(shù)>=2
3)模型類標簽 例如RFM模型,AARRR模型
4)算法類標簽 例如根據(jù)用戶購買的商品判斷其購物性別、對某商品的偏好程度
按實際業(yè)務來分的話:
1)用戶屬性標簽
2)用戶消費標簽
3)用戶行為標簽
4)風險控制標簽
。。。
在互聯(lián)網、電商領域用戶畫像常用來作為精準營銷、推薦系統(tǒng)的基礎性工作,其作用總體包括:
1)精準營銷:根據(jù)歷史用戶特征,分析產品的潛在用戶和用戶的潛在需求,針對特定群體,利用短信、郵件等方式進行營銷,提升營銷效率和營銷效果。
2)用戶統(tǒng)計:根據(jù)用戶的屬性、行為特征對用戶進行分類后,統(tǒng)計不同特征下的用戶數(shù)量、分布;分析不同用戶畫像群體的分布特征。
3)數(shù)據(jù)挖掘:以用戶畫像為基礎構建推薦系統(tǒng)、搜索引擎、廣告投放系統(tǒng),提升服務精準度。
4)服務產品:對產品進行用戶畫像,對產品進行受眾分析,更透徹地理解用戶使用產品的心理動機和行為習慣,完善產品運營,提升服務質量。
5)行業(yè)報告&用戶研究:通過用戶畫像分析可以了解行業(yè)動態(tài),比如人群消費習慣、消費偏好分析、不同地域品類消費差異分析
6)ABtest:用于創(chuàng)建ABtest實驗,和實驗效果分析
用戶畫像必須從實際業(yè)務場景出發(fā),解決實際的業(yè)務問題,之所以進行用戶畫像,要么是獲取新用戶,要么是提升用戶體驗、或者挽回流失用戶等具有明確的業(yè)務目標。
數(shù)據(jù)源的數(shù)據(jù)是標簽構建的最底層,來源于各個業(yè)務端的數(shù)據(jù),主要有離線和實時兩大數(shù)據(jù)來源,一般的大數(shù)據(jù)架構會有流批處理的鏈路分別處理,也有流批一體的架構,數(shù)據(jù)產品可不重點關注。
數(shù)據(jù)層開始數(shù)據(jù)產品會比較關注,數(shù)據(jù)產品在設計標簽時需要關注標簽的生產在數(shù)據(jù)倉庫的流轉口徑,特別是在定義原子標簽的時候,需要深入理解業(yè)務,了解用戶的來源,狀態(tài),訂單的渠道,線上線下,訂單狀態(tài)等等。
標簽層一般的,會按照上面說的實際業(yè)務分類進行標簽的建設,一般構建原子標簽就足夠了,在服務層的標簽工廠可以個性化的創(chuàng)建新的派生標簽。
服務層主要包含兩塊,一個是畫像平臺的應用,一個是畫像數(shù)據(jù)的統(tǒng)一API服務,給前臺的營銷系統(tǒng)、廣告系統(tǒng)等提供標簽分群數(shù)據(jù)支持。
以上是用戶畫像系統(tǒng)的基礎概念,下一節(jié)我們了解下畫像系統(tǒng)的難點之一:如何構建oneid?
以上就是關于用戶畫像分析相關問題的回答。希望能幫到你,如有更多相關問題,您也可以聯(lián)系我們的客服進行咨詢,客服也會為您講解更多精彩的知識和內容。
推薦閱讀:
抖音商家能看用戶退款記錄嗎(抖音商家能看用戶退款記錄嗎安全嗎)
sem利用用戶對搜索引擎的(sem利用用戶對搜索引擎的需求分析)