很可惜 T 。T 您現(xiàn)在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請把文章發(fā)送到郵箱tougao@appcpx.com,一經(jīng)錄用會有專人和您聯(lián)系
咨詢?nèi)绾纬蔀榇河鹱髡哒埪?lián)系:鳥哥筆記小羽毛(ngbjxym)
隨著社會的發(fā)展,中國消費者所處環(huán)境在變,消費觀念也在變:大家從應(yīng)付生活轉(zhuǎn)變?yōu)榻?jīng)營生活、享受生活。在急劇變化的市場環(huán)境下,影響消費品牌成長的因素很多,其中深刻理解消費者,并對消費者心理、行為變化做出及時的反應(yīng)是關(guān)鍵的一環(huán),這也就是通常大家所說的 “消費者洞察”。
我們可以借用 Laddering 模型理解消費者洞察:“從產(chǎn)品屬性、功能性利益、情感性利益、價值觀等不同層面來分析消費者的不同層次的偏好和動機,了解贏得他們好感的因素”。
在互聯(lián)網(wǎng)領(lǐng)域,消費者洞察(即用戶調(diào)研)是產(chǎn)品工作中重要的一環(huán)。只有深入理解用戶的行為習(xí)慣及背后的的訴求,才能為用戶帶來好的用戶體驗。
同樣在營銷領(lǐng)域,消費者洞察也是所有營銷動作的起點,產(chǎn)品定位環(huán)節(jié)需要挖掘目標群體在不同場景的訴求,產(chǎn)品推廣環(huán)節(jié)需要找到匹配消費訴求的溝通話術(shù)觸達消費者,已經(jīng)投入市場的產(chǎn)品需要通過口碑分析來診斷產(chǎn)品的健康度。
在互聯(lián)網(wǎng)時代來臨之前,消費者洞察基本都是通過問卷結(jié)合用戶訪談的形式展開,這種形式的好處在于,想問什么就可以問什么。但是問題也很明顯,樣本量少,用戶表達不一定真實。
而在互聯(lián)網(wǎng)時代,網(wǎng)上已經(jīng)有大量消費者的表達,如微博、電商評論、論壇帖子(比如寶寶樹),甚至是一些像醫(yī)療專業(yè)領(lǐng)域,也有如好大夫等問診平臺承載用戶表達。這給消費者洞察提供了更優(yōu)質(zhì)的 “土地” :
1)樣本量更大。不像過去問卷調(diào)研,幾百個樣本都已經(jīng)很大,線上可供研究的消費者是億級別;
2)場景更豐富。比如消費者用薯片來炒菜這樣的場景,是很難在問卷中被問出來的;
3)表達更真實。不是被問題引導(dǎo)出來的回答,而是消費者自己說的。
所以圍繞著線上文本展開的消費者洞察已被品牌方廣泛認可。
下面以母嬰行業(yè)的紙尿褲品類為例,給大家介紹介紹如何基于文本大數(shù)據(jù)做消費者洞察。
1)確定目標群體,抓取相關(guān)數(shù)據(jù)
在紙尿褲市場,雖然用戶是 0-3 歲的寶寶,但真正的消費者是媽媽群體,而且媽媽們從孕期開始就會關(guān)注紙尿褲,所以孕期媽媽到寶寶 1 歲的媽媽是我們的目標分析用戶。為了獲取目標用戶的線上言論,筆者通過爬蟲技術(shù)從相應(yīng)的母嬰論壇去抓取媽媽們的數(shù)據(jù),這些數(shù)據(jù)包括基礎(chǔ)信息的數(shù)據(jù)、文本相關(guān)數(shù)據(jù)(帖子、問答)、媽媽關(guān)注關(guān)系的數(shù)據(jù),如下圖。
2)通過打標簽,把文本數(shù)據(jù)結(jié)構(gòu)化
比如 “花王紙尿褲實在有點厚”,這句話中包含 “花王紙尿褲”、“有點厚” 兩個信息維度。如何提取這兩個信息維度呢?于是筆者就構(gòu)建了包含不同維度信息的關(guān)鍵詞詞庫,如果句子中有相應(yīng)的關(guān)鍵詞,那么這個句子就有對應(yīng)的維度標簽。
舉個例子:假設(shè)已經(jīng)構(gòu)建好的詞庫中【紙尿褲品牌-花王】維度包含三個關(guān)鍵詞:花王、kao、妙而舒。因為 “花王有點厚”、“kao 的紙尿褲有點厚”、“妙而舒有點厚” 這三句話都匹配上了花王維度中某個關(guān)鍵詞,所以都包含花王品牌這個信息點。具體如何實操,下面我們詳細展開~
(1)構(gòu)建詞庫
(a)通過專業(yè)信息初步搭建詞庫框架。比如構(gòu)建紙尿褲領(lǐng)域的詞庫,可以先通過電商網(wǎng)站抓取商品相關(guān)的信息。以下是京東上可以抓取的幫寶適的品牌信息、功能特點信息。結(jié)合一些行業(yè)經(jīng)驗,筆者初步梳理出點詞庫框架,并將這些官方的表達作為初步的詞庫維度內(nèi)容。
(b)應(yīng)用 NLP 分詞技術(shù),對詞庫做擴展補充。隨機選取一定量的文本,可采用 python 軟件中的 jieba 包對每個句子做分詞。按照詞頻的順序從高到低,把關(guān)鍵詞放入到對應(yīng)的維度中。已有的分類做關(guān)鍵詞補充即可;如果沒有的維度則添加新維度,形成相對完成的詞庫。
為了更靈活的適配消費者表達,可以采用正則表達式的模式替代普通的關(guān)鍵詞。詞庫落地后的具體形式如下表,其中,tagname 表示詞的維度名,keywords 是關(guān)鍵詞的正則表達。
(c)人工抽查樣本數(shù)據(jù),審核詞庫覆蓋率&準確率。隨機抽取 1000 條文本,遍歷看完每一條文本,并對其中沒有命中的關(guān)鍵詞做補充,匹配錯的關(guān)鍵詞做限定修改(小技巧:借助軟件高亮已經(jīng)匹配的詞,可大大提升審核效率)。
覆蓋率=文本中所有關(guān)鍵信息點被覆蓋/抽查的文本數(shù)量;
某維度準確率=對應(yīng)維度正確標注的文本數(shù)量/命中該維度的文本數(shù)量。
當(dāng)覆蓋率>90%,詞庫整體準確率>90%,即可將詞庫投入使用。
(2)通過詞庫對文本打標簽;
寫一個 python 小腳本,輸入詞庫,輸出打標后的數(shù)據(jù)?;静襟E如下:
輸入文本文件 -> 基于一定的規(guī)則對每個獨立的文本做短句切分(比如按照句號/分號)-> 基于詞庫對每一個短句做打標 -> 形成標簽數(shù)據(jù)。
具體結(jié)果形式如下表(sessionid 即切分的短句 id),基于標簽數(shù)據(jù)就可以做維度的交叉分析。
(3)情感識別
識別情感主要通過機器學(xué)習(xí)模型做情感分類?;谠~庫打標,已經(jīng)可以從文本中捕捉出對應(yīng)的「實體-特征」(比如「花王-透氣」),我們進一步抽取一定量的數(shù)據(jù)做情感人工標注(負面/正面/中性)。最后再交由模型去訓(xùn)練,并對更多的文本數(shù)據(jù)做情感預(yù)測。
3)數(shù)據(jù)分析
文本數(shù)據(jù)結(jié)構(gòu)化后,筆者就可以對消費者進行挖掘分析。下面以品類市場的需求分析、品牌認知的差異分析為例子展開說明。
(1)品類市場的的需求分析
分析紙尿褲品類文本對不同需求的提及量,和不同需求的正向言論比例,可以發(fā)現(xiàn) “紅屁屁/過敏” 是現(xiàn)在消費者認為非常重要,且并沒有很好被滿足的需求點。根據(jù)需求重要度、需求滿意度兩個公式,得出相應(yīng)結(jié)果,如下圖。
需求重要度=某需求的關(guān)注用戶數(shù)/提及紙尿褲品類或品牌的用戶數(shù);
需求滿意度=某需求的正向表達言論數(shù)/某需求的提及言論數(shù)。
(2)品牌認知的差異分析
從有品牌認知的消費者中看,不同品牌的提及量具有顯著差別(如下圖)。
花王、好奇、幫寶適是最受關(guān)注的 TOP3 品牌,其中,好奇和第一名花王的差距非常??;
好奇的系列辨識度要遠高于幫寶適,其中,幫寶適品牌中僅 3% 的用戶會明確提及產(chǎn)品系列。
品牌關(guān)注度=提及某品牌的用戶數(shù)/提及任意品牌的用戶數(shù)。
從消費者的正面評價中不同需求點的分布看,用戶選擇各品牌的原因主要是(如下圖):
「不紅屁屁/過敏」「好用」是品牌都被消費者認可的點;
好奇更被消費者認可的是「不紅屁屁/過敏」、「柔軟」、「透氣性」;
花王更被認可的是「產(chǎn)地」;
幫寶適更被認可的是「吸水性」、「價格」。
總結(jié):
本文的目的在于以案例的方式讓大家理解如何通過文本數(shù)據(jù)進行消費者洞察,如果工作中有相關(guān)數(shù)據(jù)場景的可按照文章的思路進行基礎(chǔ)實操。
-END-
本文為作者獨立觀點,不代表鳥哥筆記立場,未經(jīng)允許不得轉(zhuǎn)載。
《鳥哥筆記版權(quán)及免責(zé)申明》 如對文章、圖片、字體等版權(quán)有疑問,請點擊 反饋舉報
我們致力于提供一個高質(zhì)量內(nèi)容的交流平臺。為落實國家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內(nèi)容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內(nèi)容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時也將采取必要措施管理違法、侵權(quán)或有其他不良影響的網(wǎng)絡(luò)信息。
一、根據(jù)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權(quán),破壞國家統(tǒng)一,損害國家榮譽和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團結(jié);
6)破壞國家宗教政策,宣揚邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結(jié)社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權(quán)益;
11)通過網(wǎng)絡(luò)以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網(wǎng)絡(luò)欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內(nèi)容;
2. 不友善:不尊重用戶及其所貢獻內(nèi)容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽;
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應(yīng),蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進行負面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網(wǎng)站秩序的內(nèi)容,或進行相關(guān)行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產(chǎn)品、提供服務(wù)、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內(nèi)容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當(dāng)曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關(guān)交易。
7)發(fā)布包含欺騙性的惡意營銷內(nèi)容,如通過偽造經(jīng)歷、冒充他人等方式進行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經(jīng)驗的細節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內(nèi)容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚低俗、庸俗、媚俗內(nèi)容。
5. 不實信息,主要表現(xiàn)為:
1)可能存在事實性錯誤或者造謠等內(nèi)容;
2)存在事實夸大、偽造虛假經(jīng)歷等誤導(dǎo)他人的內(nèi)容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構(gòu)或個人存在關(guān)聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治??;
2)求推薦算命看相大師;
3)針對具體風(fēng)水等問題進行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導(dǎo)用戶;
2)內(nèi)容與標題之間存在嚴重不實或者原意扭曲;
3)使用夸張標題,內(nèi)容與標題嚴重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導(dǎo)未成年人應(yīng)援集資、高額消費、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網(wǎng)絡(luò)水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導(dǎo)未成年人不良嗜好影響未成年人身心健康的;
2)不當(dāng)評述自然災(zāi)害、重大事故等災(zāi)難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網(wǎng)絡(luò)生態(tài)造成不良影響的其他內(nèi)容。
二、違規(guī)處罰
本網(wǎng)站通過主動發(fā)現(xiàn)和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當(dāng)一個用戶發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將依據(jù)相關(guān)用戶違規(guī)情節(jié)嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當(dāng)涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將加重處罰。
三、申訴
隨著平臺管理經(jīng)驗的不斷豐富,本網(wǎng)站出于維護本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網(wǎng)站進行反饋。
(規(guī)則的最終解釋權(quán)歸屬本網(wǎng)站所有)