很可惜 T 。T 您現(xiàn)在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請把文章發(fā)送到郵箱tougao@appcpx.com,一經(jīng)錄用會有專人和您聯(lián)系
咨詢?nèi)绾纬蔀榇河鹱髡哒埪?lián)系:鳥哥筆記小羽毛(ngbjxym)
有同學問:陳老師,每次被面試都被問“你使用過哪些數(shù)據(jù)分析的方法”。結果都感覺答不上來。到底數(shù)據(jù)分析有什么方法?為啥我在做數(shù)據(jù)分析,卻感覺沒什么方法?今天系統(tǒng)解答一下。
首先,并不是名字帶“分析”倆字的,就是數(shù)據(jù)分析方法。有很多XX分析,是統(tǒng)計學、運籌學、數(shù)學的專業(yè)工具,并不直接指向業(yè)務問題的答案。當人們在問:“有什么分析方法”的時候,更多期望聽到一個能給出結論的方法。
所以想回答好這個問題,要回到:數(shù)據(jù)分析到底解決哪些業(yè)務問題上去。
從業(yè)務用途上看,數(shù)據(jù)分析可以解決5大類問題
1、是多少(數(shù)據(jù)描述狀況)
2、是什么(樹立數(shù)據(jù)標準)
3、為什么(探索問題原因)
4、會怎樣(預測業(yè)務走勢)
5、又如何(綜合判斷狀況)
圍繞每個問題場景,有特定的方法組合(如下圖)
用數(shù)據(jù)描述狀況,需要建立完善的數(shù)據(jù)指標體系。建立數(shù)據(jù)指標體系,則需要梳理清楚數(shù)據(jù)指標之間的邏輯。數(shù)據(jù)指標間有兩種基本的邏輯:串行邏輯和并行邏輯,因此衍生出兩種基本的分析方法:漏斗分析法&指標拆解法。
拆解的業(yè)務多了,人們發(fā)現(xiàn),某些數(shù)據(jù)指標可以固定的組合使用,比如:
用戶運營場景:AARRR指標、RFM指標
零售門店場景:人、貨、場指標
商品管理場景:進、銷、存指標
這些也習慣性被稱為:分析模型。但注意,這些都只是在展示數(shù)據(jù)。數(shù)據(jù)+判斷標準,才有分析結論。有關判斷標準的分析,就是:是什么類問題。
判斷標準可以很簡單,比如領導的指令、KPI要求、過往同期數(shù)據(jù),都能作為標準。這些統(tǒng)稱為:簡單標準。但很多時候,指標走勢是否正常,并無明確的KPI約束,甚至KPI達標,但是走勢奇特,領導們還是會覺得有問題。這時候就需要找其他參照物。因此衍生出一系列分析方法。
比如:
與業(yè)務自身規(guī)律比較,判斷好壞:生命周期法、自然周期法
與同類型,同期發(fā)展的業(yè)務比較:同期群分析法
與其他業(yè)務個體進行比較:分層分析法
這樣對比,即使只有1個數(shù)據(jù)指標,也能得出好壞判斷。如果業(yè)務發(fā)展違背過往規(guī)律,明顯比其他個體更差,則可以判定為:不好。
當然,也可以使用2個指標,比如經(jīng)典的矩陣分析法,通過兩指標交叉+兩指標平均值,分出四類業(yè)務,從而得出好壞判斷。
如果用更多指標也行,比如常用的Kmean聚類,可以先利用多個指標對業(yè)務個體聚類,之后再看各類型之間表現(xiàn)優(yōu)劣。
以上這些方法,都能將業(yè)務的好/壞區(qū)分出來,從而在一定程度上輔助判斷。
“分析下這個問題是什么原因導致的……”是常見的要求,這就是“為什么”問題。解決為什么問題,有兩大基本思路:
一:結果推斷:問題發(fā)生后,用各種數(shù)據(jù)尋找差異,建立假設。
常見的,比如:
結構分析法:通過結構分析,找到問題發(fā)生點
標簽分析法:通過打標簽,做個體對比,找到問題原因
相關分析法:通過計算指標相關關系,找到相關指標,再形成假設
MECE法:講多個業(yè)務假設,按MECE原則合并成分析邏輯,一一驗證
結果推斷,可以把業(yè)務口中“我覺得這是XX原因”,抽象成一個數(shù)據(jù)可驗證的假設,因此適用范圍非常廣。但結果推斷只是單方面從結果做歸納,有可能有偏頗,還需要實驗驗證。
二:實驗推斷:先有假設,然后通過實驗/分組對比,驗證假設。常見的方法,包括ABtest、DID、PSM、RDD、Uplift等方法。
這些方法更接近傳統(tǒng)統(tǒng)計學的實驗,大部分都要求:
1、開展數(shù)據(jù)實驗,驗證假設
2、設參照組/實驗組,且參照組/實驗組特征相似
3、區(qū)分控制變量、環(huán)境變量,重點測控制變量的影響
實驗推斷有統(tǒng)計學依據(jù),計算過程復雜,看起來更量化一些。但是對實驗條件要求太高,比如大促銷類ALL in的業(yè)務,比如商品、店鋪這些無法控制環(huán)境的業(yè)務場景,比如業(yè)務員行為、內(nèi)容傳播等難采集數(shù)據(jù)的領域,都很難用。
理想的狀態(tài),肯定是兩者結合,事實-假設-驗證,不斷循環(huán),接近真相。但現(xiàn)實中有很多條件制約。導致我們只能從一個角度切入,慢慢靠近真相。
預測類問題,是所有人都感興趣的話題,也是統(tǒng)計學/算法最有可能發(fā)揮作用的地方。唯一限制方法使用的,是:到底有多少數(shù)據(jù)&業(yè)務人員要不要參與。
如果業(yè)務人員堅持參與預測過程,就只能用業(yè)務假設法或者滾動預測法,這些方法把影響結果的參數(shù)都列出來,方便業(yè)務人員拍腦袋,也能幫他們清晰:我要做多少。
如果業(yè)務人員不參與,則視數(shù)據(jù)量的多少。數(shù)據(jù)少,則使用時間序列預測,數(shù)據(jù)多,且有影響結果的原因數(shù)據(jù),則可以用諸如回歸模型一類算法預測。
綜合評估與分配問題,統(tǒng)稱“又如何”問題。這是決策的最后一步,決定是否對業(yè)務做動作,做多大動作。有些簡單的評估是很容易的,比如銷售簽了生死狀,達不成業(yè)績目標就炒魷魚。
但大部分情況,評估很復雜,要考慮方方面面。這里最大的區(qū)別,在于要不要考慮領導的主觀意見。如果要,果斷使用主觀評分法!滿足領導的打分欲是第一位的。如果不要,再考慮使用有監(jiān)督的機器學習算法,或者因子分析法,DEA法(求的是相對效率)等客觀方法。
至于:做多少,誰來做。就是更復雜的問題了。想做好分配,得先把前邊幾步分析做完,對每個業(yè)務線基礎能力有充分認識,才好下判斷。這里,線性規(guī)劃的方法,可以用來做支持。
綜上可見,數(shù)據(jù)分析的方法是非常多的。但為什么很多同學感覺自己沒用上方法呢?因為每種方法是和業(yè)務場景、領導風格、數(shù)據(jù)質量、息息相關的。
比如因果推斷算法大多基于分組測試展開,而實際業(yè)務中,很多因果分析是事后再查原因,也不給二次實驗的機會。
比如很多公司的分配方案,根本就是領導拍腦袋,一言堂,根本沒機會讓分析師用算法。
比如預測問題,很多公司根本沒有足夠數(shù)據(jù)積累,只有一條銷售數(shù)據(jù),那撐死了也只能用時間序列法。
這種理想與現(xiàn)實的差距,讓很多同學很痛苦。一方面不清楚到底這些方法該如何用,另一方面不了解,自己該如何應對業(yè)務需求。面試和工作都很吃力。
為了幫助同學們,我會在知識星球中,分階段地對這些方法介紹,第一階段,先選了9種,不需要統(tǒng)計學、運籌學、算法知識的基礎方法,整理成《九大數(shù)據(jù)分析方法》系列,供大家參考。
同時,數(shù)據(jù)分析方法也要結合業(yè)務場景,才好發(fā)揮作用。我會在知識星球中,更新《數(shù)據(jù)分析七大場景系列》第一期《經(jīng)營分析》場景已經(jīng)更新,供大家參考。
當然,一兩個講座,不可能窮盡所有的業(yè)務場景,如果對具體如何分析問題缺少思路,可以直接在知識星球內(nèi)向我提問,之前提問的同學,都收獲了很多具體詳細的回答,配合分析方法一起看,進步更快哦
本文為作者獨立觀點,不代表鳥哥筆記立場,未經(jīng)允許不得轉載。
《鳥哥筆記版權及免責申明》 如對文章、圖片、字體等版權有疑問,請點擊 反饋舉報
我們致力于提供一個高質量內(nèi)容的交流平臺。為落實國家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內(nèi)容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內(nèi)容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質內(nèi)容,同時也將采取必要措施管理違法、侵權或有其他不良影響的網(wǎng)絡信息。
一、根據(jù)《網(wǎng)絡信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權,破壞國家統(tǒng)一,損害國家榮譽和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團結;
6)破壞國家宗教政策,宣揚邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權益;
11)通過網(wǎng)絡以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網(wǎng)絡欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內(nèi)容;
2. 不友善:不尊重用戶及其所貢獻內(nèi)容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽;
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應,蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進行負面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網(wǎng)站秩序的內(nèi)容,或進行相關行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產(chǎn)品、提供服務、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內(nèi)容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉網(wǎng)站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關交易。
7)發(fā)布包含欺騙性的惡意營銷內(nèi)容,如通過偽造經(jīng)歷、冒充他人等方式進行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經(jīng)驗的細節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內(nèi)容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚低俗、庸俗、媚俗內(nèi)容。
5. 不實信息,主要表現(xiàn)為:
1)可能存在事實性錯誤或者造謠等內(nèi)容;
2)存在事實夸大、偽造虛假經(jīng)歷等誤導他人的內(nèi)容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構或個人存在關聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治??;
2)求推薦算命看相大師;
3)針對具體風水等問題進行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導用戶;
2)內(nèi)容與標題之間存在嚴重不實或者原意扭曲;
3)使用夸張標題,內(nèi)容與標題嚴重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導未成年人應援集資、高額消費、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網(wǎng)絡水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導未成年人不良嗜好影響未成年人身心健康的;
2)不當評述自然災害、重大事故等災難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網(wǎng)絡生態(tài)造成不良影響的其他內(nèi)容。
二、違規(guī)處罰
本網(wǎng)站通過主動發(fā)現(xiàn)和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當一個用戶發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將依據(jù)相關用戶違規(guī)情節(jié)嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將加重處罰。
三、申訴
隨著平臺管理經(jīng)驗的不斷豐富,本網(wǎng)站出于維護本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網(wǎng)站進行反饋。
(規(guī)則的最終解釋權歸屬本網(wǎng)站所有)