很可惜 T 。T 您現(xiàn)在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請把文章發(fā)送到郵箱tougao@appcpx.com,一經(jīng)錄用會有專人和您聯(lián)系
咨詢?nèi)绾纬蔀榇河鹱髡哒埪?lián)系:鳥哥筆記小羽毛(ngbjxym)
現(xiàn)階段,許多企業(yè)嘗試落地 CDP,但卻很難在短期內(nèi)看到應有的 ROI 成效,初始投入與后期產(chǎn)出不對稱,這嚴重打擊了企業(yè)建設 CDP 的信心。在中國數(shù)據(jù)市場,企業(yè) CDP 項目的重要關注點聚焦在數(shù)據(jù)治理上,致力于通過構(gòu)建 CDP,打破數(shù)據(jù)割裂、上下游系統(tǒng)數(shù)據(jù)口徑不一致、數(shù)據(jù)污染等困境,統(tǒng)一用戶數(shù)據(jù)標識是企業(yè) CDP 數(shù)據(jù)體系建設的關鍵問題。
《CDP 全域用戶關聯(lián)數(shù)據(jù)體系建設與實踐》白皮書中提到,企業(yè)要想真正落地 CDP 項目并產(chǎn)生業(yè)務價值,其用戶數(shù)據(jù)體系建設的終極目標是全域用戶的標識唯一化,即把來自不同渠道、生態(tài)、業(yè)務系統(tǒng)的用戶標識為同一個對象。本文將詳細介紹企業(yè)如何通過全域用戶關聯(lián)實現(xiàn)用戶標識唯一化,整體可概括為以下五個步驟。
如何從零開始開展 CDP 的用戶數(shù)據(jù)基礎建設?企業(yè)的首要任務是理清 CDP 上下游的數(shù)據(jù)情況,以用戶為主體梳理數(shù)據(jù)應用場景,比如業(yè)務數(shù)據(jù)如何收集、用戶數(shù)據(jù)在什么情況下輸出、用戶觸達場景有哪些等。全域用戶關聯(lián)作為 CDP 系統(tǒng)的基礎能力支撐,會對上游數(shù)據(jù)的收集以及下游業(yè)務系統(tǒng)造成影響,所以在方案設計之初需要盡可能對上下游相關的數(shù)據(jù)現(xiàn)狀進行盤點。
典型的數(shù)據(jù)現(xiàn)狀盤點流程包括:
1、數(shù)據(jù)源梳理:梳理各業(yè)務線涉及到的業(yè)務系統(tǒng)。
2、用戶主體 ID 梳理:梳理各業(yè)務系統(tǒng)中用于標記用戶主體和數(shù)據(jù)相關的 ID,比如設備 ID、企 微 ID、Union ID、Open ID、Cookie ID 等。
3、用戶屬性梳理:梳理各業(yè)務系統(tǒng)中用戶標識 ID 對應的數(shù)據(jù)屬性,業(yè)務 ID 對應的用戶業(yè)務屬性有卡號、身份、微信號、手機號等。
4、識別用戶標識數(shù)據(jù)在源端存儲的質(zhì)量:例如在數(shù)據(jù)梳理的過程會發(fā)現(xiàn)一個手機號對應多個證件號,這時候需要對數(shù)據(jù)源產(chǎn)生的原因進行分析,找到異常數(shù)據(jù)產(chǎn)生的原因,如何在用戶關聯(lián)過程中處理。
5、ID 應用場景梳理:梳理圍繞 CDP 應用的整個業(yè)務流程中,涉及用戶 ID 應用的典型場景,比如 CDP 全域數(shù)據(jù)接入場景、用戶分群數(shù)據(jù)輸出場景等。
輸出用戶 ID 關聯(lián)方案的首要步驟是明確各業(yè)務線中哪些 ID 參與用戶的關聯(lián),并確定 ID 的優(yōu)先級、數(shù)量、父節(jié)點等信息。
1、ID 優(yōu)先級:優(yōu)先級的設定是為了解決當一條數(shù)據(jù)中有多個 ID,又無法關聯(lián)時,數(shù)據(jù)歸屬的問題。按照設定,數(shù)據(jù)會歸屬優(yōu)先級更高的 ID 所對應的用戶。
2、業(yè)務唯一 ID:系統(tǒng)中唯一標識一個用戶的 ID 類型,其優(yōu)先級最高。以電商業(yè)務為例,用戶的登錄 ID 由于和用戶購物等行為直接產(chǎn)生關聯(lián)且可以通過很多途徑獲取到,往往可以作為「業(yè)務唯一 ID」來定義。
3、數(shù)量:取決于實際業(yè)務中一個用戶可以擁有單個還是多個該類型的 ID,可以用來校驗關聯(lián)關系是否符合規(guī)則。
4、父節(jié)點:在一些業(yè)務生態(tài)中,ID 之間存在著父子關系。父節(jié)點的定義可以用于解綁時一并解綁子節(jié)點,比如在微信生態(tài)中,Union ID 是 Open ID 的父節(jié)點,如果要將 Union ID 進行解綁,則附屬的所有 Open ID 也將隨之被解綁掉。
完整梳理 ID 之后,就可以針對性地采用埋點、ETL 等方式,完成用戶關聯(lián)的持續(xù)落地了。通俗來講,就是明確將哪些業(yè)務系統(tǒng)中的哪些數(shù)據(jù)提取出來再導入 CDP 系統(tǒng)中。業(yè)務中每一個事件對應的屬性和涉及的 ID 都需要在埋點和 ETL 方案中體現(xiàn),可以大大減少技術人員的理解成本。
完成全域用戶關聯(lián)后,會在用戶數(shù)據(jù)中發(fā)現(xiàn)歷史關聯(lián)錯誤的數(shù)據(jù)。根據(jù)新的關聯(lián)結(jié)果,需要對這些錯誤數(shù)據(jù)進行解綁并綁定至正確的歸屬用戶,重新完善用戶全生命周期畫像,從而提升 CDP 的用戶數(shù)據(jù)質(zhì)量。
舉例來說,在用戶關聯(lián)過程中,基于同一個用戶的唯一昵稱「A」同時對應兩個用戶「張三 2020 年注冊」「李四 2021 年注冊」,由此識別為同一個用戶,需要對重復關聯(lián)數(shù)據(jù)進行合并。在這種情況下,可以參考最早觸達用戶的時間來完成用戶屬性的修復:「張三」2020 年注冊早于「李四」2021 年注冊,因此選擇將數(shù)據(jù)關聯(lián)至「張三」下。
同理,當歷史數(shù)據(jù)中存在其他類似的「唯一用戶 ID」并與當前產(chǎn)生沖突時,需要根據(jù)時間先后順序,將兩個「唯一用戶 ID」進行合并,完成數(shù)據(jù)關聯(lián)的回溯。
企業(yè)在進行用戶 ID 關聯(lián)的過程中,會遇到用戶關聯(lián)同類屬性沖突的情況,在進行屬性合并的過程中,可以遵循以下四個規(guī)則:
第一,預置規(guī)則:特殊類型屬性使用固定的預置規(guī)則來處理,比如按照訪問時間先后順序進行屬性合并。
第二,缺省規(guī)則:默認以數(shù)據(jù)生成最早的時間為準,如果沒有數(shù)據(jù)生成時間的相關字段就按照 ID 的優(yōu)先級進行合并。
第三,設置基準規(guī)則:設置某個來源的數(shù)據(jù)為基準,例如相比 CRM 銷售人員手動錄入的信息數(shù)據(jù)和業(yè)務系統(tǒng)自動獲取的訂單數(shù)據(jù),訂單數(shù)據(jù)的準確性和穩(wěn)定性顯然更高,則選擇以業(yè)務系統(tǒng)訂單數(shù)據(jù)為基準。
第四,設置首末次規(guī)則:以最先接入數(shù)據(jù)的屬性為準或者保持最末次的屬性。
日常業(yè)務中會出現(xiàn)當前用戶關聯(lián)信息錯誤的情況,比如,用戶更換手機導致設備 ID 變更等,這種情況就需要將現(xiàn)有的綁定關系解綁;另一方面,我們也發(fā)現(xiàn),曾經(jīng)認為某個 ID 和用戶不相關,但后來經(jīng)過人工等方式確認兩者是相關的,這種情況就需要能夠在自動關聯(lián)未成功的情況下,以手動的方式將一個獨立 ID 關聯(lián)到現(xiàn)有用戶上去。
以神策數(shù)據(jù)的 ID-Mapping 全域用戶關聯(lián)為例,數(shù)據(jù)校驗及測試驗收整體可以分為五個部分:
1、用戶關聯(lián)是否成功
完成全域用戶關聯(lián)的部署之后,首先應檢查對應埋點方案的上報邏輯是否生效,比如,搜索埋點方案中設計的對應事件是否正常存在。
2、用戶關聯(lián)全端執(zhí)行情況
確認事件上報后,可以基于埋點事件確認不同 SDK 類型上報的關聯(lián) ID/綁定 ID 的總次數(shù)。在前后端都調(diào)用的情況下,如果不同 SDK 間上報次數(shù)相差很多,則需要排查調(diào)用時機是否出了問題。
3、用戶關聯(lián)報錯校驗
這一步驟旨在確認事件上報的準確性,使用 ID-Mapping 可以在「神策數(shù)據(jù)治理」→「數(shù)據(jù)質(zhì)量」→「埋點數(shù)據(jù)查詢」過程中,查看是否有大量用戶關聯(lián)的報錯,并確認錯誤數(shù)據(jù)量、錯誤分類、錯誤原因等細節(jié)信息。
4、ID 格式校驗
檢查業(yè)務 ID 的格式、長度等是否符合預期。一般來說,業(yè)務 ID 都會有相對固定的格式或長度,例如手機號一般都是 11 位,微信生態(tài)的 Union ID 和 Open ID 也都有固定的長度,驗收人員可以使用 SQL 檢查是否有不符合預期的數(shù)據(jù)。
5、ID 關聯(lián)情況排查
一般可以分為三種情況:
第一,只有登錄 ID 的用戶:此類用戶的特征是業(yè)務意義上的登錄 ID 有值,其他 ID 均為空。查詢只有登錄 ID 用戶的數(shù)量占比,如果發(fā)現(xiàn)此類用戶占比過高,則可以推斷出用戶關聯(lián)可能出現(xiàn)問題,登錄用戶沒有與其他觸點的 ID 成功關聯(lián)上。
第二,只有某個特定觸點相關 ID 的用戶:例如只有微信生態(tài) Union ID 或 Open ID 的用戶,其他業(yè)務 ID 均為空。如果此類用戶占比過高,則表示該觸點可能沒有與其他觸點打通。
第三,只有設備 ID 的用戶:例如發(fā)現(xiàn)用戶表中存在大量只用 Android_id 的用戶,則標明對應 Android 的用戶關聯(lián)可能沒有做。
從業(yè)務邏輯上來說,一個用戶肯定是先有 xxx ID 再有 yyy ID,對此類用戶關聯(lián)情況進行排查時,可以進行 SQL 查詢,如果查詢結(jié)果不符合業(yè)務邏輯,則需要進一步排查是否確實沒有實現(xiàn)關聯(lián)的用戶,還是用戶關聯(lián)出現(xiàn)了問題,或者 ID 數(shù)據(jù)本身存在錯誤。
本文為作者獨立觀點,不代表鳥哥筆記立場,未經(jīng)允許不得轉(zhuǎn)載。
《鳥哥筆記版權及免責申明》 如對文章、圖片、字體等版權有疑問,請點擊 反饋舉報
我們致力于提供一個高質(zhì)量內(nèi)容的交流平臺。為落實國家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內(nèi)容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內(nèi)容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時也將采取必要措施管理違法、侵權或有其他不良影響的網(wǎng)絡信息。
一、根據(jù)《網(wǎng)絡信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權,破壞國家統(tǒng)一,損害國家榮譽和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團結(jié);
6)破壞國家宗教政策,宣揚邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結(jié)社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權益;
11)通過網(wǎng)絡以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網(wǎng)絡欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內(nèi)容;
2. 不友善:不尊重用戶及其所貢獻內(nèi)容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽;
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應,蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進行負面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網(wǎng)站秩序的內(nèi)容,或進行相關行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產(chǎn)品、提供服務、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內(nèi)容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關交易。
7)發(fā)布包含欺騙性的惡意營銷內(nèi)容,如通過偽造經(jīng)歷、冒充他人等方式進行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經(jīng)驗的細節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內(nèi)容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚低俗、庸俗、媚俗內(nèi)容。
5. 不實信息,主要表現(xiàn)為:
1)可能存在事實性錯誤或者造謠等內(nèi)容;
2)存在事實夸大、偽造虛假經(jīng)歷等誤導他人的內(nèi)容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構(gòu)或個人存在關聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治?。?br /> 2)求推薦算命看相大師;
3)針對具體風水等問題進行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導用戶;
2)內(nèi)容與標題之間存在嚴重不實或者原意扭曲;
3)使用夸張標題,內(nèi)容與標題嚴重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導未成年人應援集資、高額消費、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網(wǎng)絡水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導未成年人不良嗜好影響未成年人身心健康的;
2)不當評述自然災害、重大事故等災難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網(wǎng)絡生態(tài)造成不良影響的其他內(nèi)容。
二、違規(guī)處罰
本網(wǎng)站通過主動發(fā)現(xiàn)和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當一個用戶發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將依據(jù)相關用戶違規(guī)情節(jié)嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將加重處罰。
三、申訴
隨著平臺管理經(jīng)驗的不斷豐富,本網(wǎng)站出于維護本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網(wǎng)站進行反饋。
(規(guī)則的最終解釋權歸屬本網(wǎng)站所有)