很可惜 T 。T 您現(xiàn)在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請把文章發(fā)送到郵箱tougao@appcpx.com,一經(jīng)錄用會有專人和您聯(lián)系
咨詢?nèi)绾纬蔀榇河鹱髡哒埪?lián)系:鳥哥筆記小羽毛(ngbjxym)
眾所周知,數(shù)據(jù)是企業(yè)數(shù)字化轉(zhuǎn)型的核心要素,大數(shù)據(jù)建設的目標是為了融合組織數(shù)據(jù),增加組織的洞察力和競爭力,實現(xiàn)業(yè)務創(chuàng)新和產(chǎn)業(yè)升級。而數(shù)據(jù)能發(fā)揮價值的大小依賴于其數(shù)據(jù)的質(zhì)量高低。
如果沒有良好的數(shù)據(jù)質(zhì)量,大數(shù)據(jù)將會對決策產(chǎn)生誤導,甚至產(chǎn)生有害的結(jié)果,比如:
在金融企業(yè)中,因數(shù)據(jù)質(zhì)量問題導致的信用卡欺詐失察在2008年即造成48億美元的損失;
在商業(yè)上,美國零售業(yè)每年僅因標價錯誤就損失25億美元;
在經(jīng)濟損失上,數(shù)據(jù)錯誤每年對美國工業(yè)界造成的經(jīng)濟損失約占GDP的6%;
在醫(yī)療事故上,美國醫(yī)療委員會統(tǒng)計表明,由于數(shù)據(jù)錯誤引起的醫(yī)療事故僅在美國每年就導致高達98000名患者喪生;
在電信產(chǎn)業(yè)上,數(shù)據(jù)錯誤經(jīng)常導致故障排除的延誤、多余設備租用和服務費收取錯誤,損害了企業(yè)信譽甚至會因此失去很多用戶;
在數(shù)倉建設上,50%的數(shù)據(jù)倉庫因數(shù)據(jù)質(zhì)量而被取消或延遲……
提高數(shù)據(jù)質(zhì)量是為了鞏固大數(shù)據(jù)建設成果,因此,高質(zhì)量的數(shù)據(jù)是企業(yè)業(yè)務能力的基礎。今天小億就來為大家說說什么是數(shù)據(jù)質(zhì)量管理?數(shù)據(jù)質(zhì)量問題產(chǎn)生的原因是什么?以及我們該如何做好數(shù)據(jù)質(zhì)量管理?
一、什么是數(shù)據(jù)質(zhì)量管理?
1.數(shù)據(jù)質(zhì)量
數(shù)據(jù)質(zhì)量在業(yè)務環(huán)境下,數(shù)據(jù)符合數(shù)據(jù)消費者的使用目的,數(shù)據(jù)質(zhì)量需要滿足業(yè)務場景具體的需求。數(shù)據(jù)質(zhì)量包含兩個方面:數(shù)據(jù)自身的質(zhì)量和數(shù)據(jù)的過程質(zhì)量。
數(shù)據(jù)自身的質(zhì)量很好理解,比如數(shù)據(jù)必須真實準確地反映實際發(fā)生的業(yè)務,任何業(yè)務操作的數(shù)據(jù)都沒有被遺漏,數(shù)據(jù)存在各種約束條件,這種約束條件不能自相矛盾等等。
數(shù)據(jù)的過程質(zhì)量就是數(shù)據(jù)的使用過程符合標準規(guī)范,比如數(shù)據(jù)存儲:數(shù)據(jù)是否被安全的存儲到了合適的介質(zhì)上,能夠保證數(shù)據(jù)不受外來因素的破壞。當然數(shù)據(jù)存儲只是數(shù)據(jù)使用過程的一個環(huán)節(jié),除此之外還包括獲取、傳輸、應用和刪除等一系列的使用過程,這其實也是數(shù)據(jù)生命周期的各個階段。
2.數(shù)據(jù)質(zhì)量管理
數(shù)據(jù)質(zhì)量管理指對數(shù)據(jù)在每個階段里可能引發(fā)的各類數(shù)據(jù)質(zhì)量問題進行識別、度量、監(jiān)控、預警等一系列管理活動,并通過改善和提高組織的管理水平確保數(shù)據(jù)質(zhì)量的提升。
換句話說,數(shù)據(jù)質(zhì)量管理是一個集方法論、管理、技術和業(yè)務為一體的解決方案,不是一時的數(shù)據(jù)治理方法,是一個不斷循環(huán)的管理過程。一方面反映出企業(yè)數(shù)據(jù)很難一次性就達到使用的標準規(guī)范,畢竟數(shù)據(jù)治理是一個相對漫長的過程;另一方面也反映出數(shù)據(jù)質(zhì)量的重要性以及數(shù)據(jù)質(zhì)量工作的零散性和瑣碎性。
3.數(shù)據(jù)質(zhì)量評估
至于如何去評估數(shù)據(jù)質(zhì)量管理的過程的好壞,我們可以從以下五個維度來進行數(shù)據(jù)質(zhì)量評估:
(1)完整性:描述信息的完整程度,如電話號碼是否有空值;
(2)準確性:描述數(shù)據(jù)和客觀實體的特征是否相一致,如數(shù)據(jù)庫中記錄的電話和實際電話不一致;
(3)有效性:數(shù)據(jù)是否滿足用戶定義條件、內(nèi)容規(guī)范約束等,如年齡為-32歲,違反常理;
(4)一致性:描述同一個信息主體在不同數(shù)據(jù)集中的屬性是否相同,如崗位名稱在CRM系統(tǒng)中和人力系統(tǒng)中不一致;
(5)及時性:描述從業(yè)務發(fā)生到相關數(shù)據(jù)能夠被使用的及時程度,如實時查看用戶行為相關數(shù)據(jù)。
五個維度共同構(gòu)成了數(shù)據(jù)質(zhì)量評估的基本框架,每個維度都可以通過設置評估問卷隨機抽取一些問題然后收集相應的數(shù)據(jù);注意收集數(shù)據(jù)的時候可以采用不同的方式,訪談、發(fā)放鏈接、隨機抽檢等等。
二、數(shù)據(jù)質(zhì)量問題產(chǎn)生的原因
大數(shù)據(jù)的建設和管理是一個專業(yè)且復雜的工程,涵蓋了業(yè)務梳理、標準制定、元數(shù)據(jù)管理、數(shù)據(jù)模型管理、數(shù)據(jù)匯聚、清洗加工、中心存儲、資源目錄編制、共享交換、數(shù)據(jù)維護、數(shù)據(jù)失效等等過程,在任何一個環(huán)節(jié)中出錯,都將導致數(shù)據(jù)的錯誤。因此數(shù)據(jù)質(zhì)量問題產(chǎn)生的原因主要有以下3類:
1.技術原因
(1)數(shù)據(jù)標準制定
數(shù)據(jù)輸入規(guī)范不統(tǒng)一,不同的業(yè)務部門、不同的時間、甚至在處理相同業(yè)務的時候,由于數(shù)據(jù)輸入規(guī)范不同,造成數(shù)據(jù)沖突或矛盾。如果在數(shù)據(jù)的生成過程中包含主觀判斷的結(jié)果,必然會導致數(shù)據(jù)中含有主觀的偏見因素。并且,不是所有行業(yè)都有公認可信的數(shù)據(jù)標準,而組織標準制定過程中容易出現(xiàn)數(shù)據(jù)元描述及理解錯誤,代碼碼集定義不正確、不完整等情況。
(2)數(shù)據(jù)模型設計
由于對業(yè)務理解的不到位或技術實踐水平不到位,數(shù)據(jù)庫表結(jié)構(gòu)、數(shù)據(jù)庫約束條件、數(shù)據(jù)校驗規(guī)則的設計不合理,造成數(shù)據(jù)存儲混亂、重復、不完整、不準確。
(3)數(shù)據(jù)源本身
在生產(chǎn)系統(tǒng)中有些數(shù)據(jù)就存在不規(guī)范、不完整、不準確、不一致等問題,而采集過程沒有對這些問題做清洗加工處理,或清洗加工的程序代碼不正確。
(4)數(shù)據(jù)梳理過程
在數(shù)據(jù)采集之前,需要梳理組織機構(gòu)、業(yè)務事項、信息系統(tǒng)、數(shù)據(jù)資源清單等信息,那么對業(yè)務的理解不到位,將造成梳理報告的不完整或不正確。
(5)數(shù)據(jù)采集過程
采集點、采集頻率、采集內(nèi)容、映射關系等采集參數(shù)和流程設置的不正確,數(shù)據(jù)采集接口效率低,導致的數(shù)據(jù)采集失敗、數(shù)據(jù)丟失、數(shù)據(jù)映射和轉(zhuǎn)換失敗。
(6)數(shù)據(jù)清洗加工
數(shù)據(jù)清洗規(guī)則、數(shù)據(jù)轉(zhuǎn)換規(guī)則、數(shù)據(jù)裝載規(guī)則配置有問題,甚至未按照數(shù)據(jù)標準開展相應的清洗加工工作,自由發(fā)揮的空間過大。并且在數(shù)據(jù)匯聚的過程中,沒有及時建立數(shù)據(jù)的相關性,導致后期很難補充完善。
2.業(yè)務原因
(1)業(yè)務理解不到位
數(shù)據(jù)的業(yè)務描述、業(yè)務規(guī)則、相關性分析不到位,導致技術無法構(gòu)建出合理、正確的數(shù)據(jù)模型。
(2)業(yè)務流程的變更
業(yè)務流程一變,數(shù)據(jù)模型設計、數(shù)據(jù)錄入、數(shù)據(jù)采集、數(shù)據(jù)傳輸、數(shù)據(jù)清洗、數(shù)據(jù)存儲等環(huán)節(jié)都會受到影響,稍有不慎就會導致數(shù)據(jù)質(zhì)量問題的發(fā)生。
(3)數(shù)據(jù)輸入不規(guī)范
常見的數(shù)據(jù)錄入問題,如:大小寫、全半角、特殊字符等一不小心就會錄錯,甚至還會將數(shù)據(jù)輸入到錯誤的字段中,造成“張冠李戴”。人工錄入的數(shù)據(jù)質(zhì)量與錄數(shù)據(jù)的業(yè)務人員密切相關,錄數(shù)據(jù)的人工作嚴謹、認真,數(shù)據(jù)質(zhì)量就相對較好,反之就較差。
(4)業(yè)務系統(tǒng)煙囪林立
過去 20 年中,只要是稍大一點的企業(yè)和政府部門,都建設了一批信息化系統(tǒng)來解決業(yè)務問題,但也導致了如今信息化整合的痛點和困難,變先發(fā)優(yōu)勢為數(shù)據(jù)困境。
(5)數(shù)據(jù)作假
操作人員為了提高或降低考核指標,對一些數(shù)據(jù)進行處理,使得數(shù)據(jù)真實性無法保證。
3.管理原因
(1)人才缺乏
組織以自身的業(yè)務發(fā)展的主要原則組建團隊,數(shù)據(jù)建設則依賴于外部服務公司,而自身沒有建立相應的管理手段和監(jiān)督機制,從而無法準確判斷數(shù)據(jù)項目的建設成效。
(2)流程管理不完善
缺乏有效的數(shù)據(jù)質(zhì)量保障機制和問題處理機制,數(shù)據(jù)質(zhì)量問題從發(fā)現(xiàn)、指派、處理、優(yōu)化沒有一個統(tǒng)一的流程和制度支撐,數(shù)據(jù)質(zhì)量問題無法閉環(huán)。
(3)成員意識不開放
組織管理缺乏數(shù)據(jù)思維,沒有認識到數(shù)據(jù)質(zhì)量的重要性,重系統(tǒng)而輕數(shù)據(jù),認為系統(tǒng)是萬能的,數(shù)據(jù)質(zhì)量差些也沒關系。組織成員沒有從組織戰(zhàn)略的視角來看待數(shù)據(jù)資產(chǎn),而把數(shù)據(jù)看成是創(chuàng)造它的部門的資產(chǎn),從而導致數(shù)據(jù)冗余、數(shù)據(jù)不一致、數(shù)據(jù)割裂,從而導致數(shù)據(jù)價值難以發(fā)掘。
(4)獎懲機制不明確
沒有明確數(shù)據(jù)歸口管理部門或崗位,缺乏數(shù)據(jù)認責機制,出現(xiàn)數(shù)據(jù)質(zhì)量問題找不到權(quán)威源頭或找不到負責人。缺乏數(shù)據(jù)規(guī)劃,沒有明確的數(shù)據(jù)質(zhì)量目標,沒有制定數(shù)據(jù)質(zhì)量相關的政策和制度。
三、如何做好數(shù)據(jù)質(zhì)量管理
1.從數(shù)據(jù)的整個生命周期來管理
即在數(shù)據(jù)生命周期的任何一個階段,都有嚴格的數(shù)據(jù)規(guī)劃和約束來防止臟數(shù)據(jù)產(chǎn)生,總的來說將其分為事前預防、事中監(jiān)控、事后改善三個階段。
(1)事前預防
①制定質(zhì)量管理機制:基于數(shù)據(jù)管理的復雜性和誘因的多重性特點,解決數(shù)據(jù)質(zhì)量問題僅僅依靠一個技術工具是不夠的,我們需要建立長效工作機制。即根據(jù)組織特點,制定符合自身環(huán)境的工作制度,制定每個環(huán)節(jié)的工作流程,規(guī)定各個參與方的責任,確定各項數(shù)據(jù)的權(quán)威部門,制定數(shù)據(jù)質(zhì)量指標,制定數(shù)據(jù)質(zhì)量修復流程等等;
②制定數(shù)據(jù)質(zhì)量標準:數(shù)據(jù)標準成功定義的與否,直接決定了大數(shù)據(jù)建設的成果和數(shù)據(jù)質(zhì)量的高低,需要在融合國家標準、行業(yè)標準和地方標準的基礎上,融合組織自身的業(yè)務特色需求;
③制定質(zhì)量監(jiān)測模型:數(shù)據(jù)質(zhì)量模型代表的是業(yè)務需求,它是從業(yè)務需求的角度而描述出來的質(zhì)量需求;
④制定質(zhì)量監(jiān)測規(guī)則:數(shù)據(jù)監(jiān)測規(guī)則代表的具體的質(zhì)量檢測手段,它是從技術角度來描述數(shù)據(jù)質(zhì)量要求是如何被滿足的,包括規(guī)范性、完整性、準確性、致性、時效性、可訪問性,等等。
(2)事中監(jiān)控
①監(jiān)控原始數(shù)據(jù)質(zhì)量:數(shù)據(jù)采集工作從數(shù)據(jù)源頭獲取最原始的數(shù)據(jù),在數(shù)據(jù)采集過程中將數(shù)據(jù)分為“好數(shù)據(jù)”“壞數(shù)據(jù)”,“好數(shù)據(jù)”入庫,“壞數(shù)據(jù)”則反饋給源頭修復,因為數(shù)據(jù)來源部門最懂這些數(shù)據(jù),也最能在源頭上把數(shù)據(jù)問題徹底修復掉。
②監(jiān)控數(shù)據(jù)中心質(zhì)量:經(jīng)過各種采集、清洗、加工過程,數(shù)據(jù)被存入數(shù)據(jù)倉庫中,這些數(shù)據(jù)也將被業(yè)務部門使用,所以,對于這些成果數(shù)據(jù)的質(zhì)量監(jiān)控和修復則猶為重要。對于這類數(shù)據(jù)問題,我們可能使用簡單的空值檢查、規(guī)范性檢查、值域檢查、邏輯檢查、一致性檢查、等等規(guī)則就可以檢查出來,也可能需要諸如多源比較、數(shù)據(jù)佐證、數(shù)據(jù)探索、波動檢查、離群檢查等等方法才可以檢查出來。
③反饋數(shù)據(jù)質(zhì)量問題:數(shù)據(jù)質(zhì)量監(jiān)控過程中,會發(fā)現(xiàn)兩類問題,一類是源頭的數(shù)據(jù)質(zhì)量問題,一類是數(shù)據(jù)中心的數(shù)據(jù)質(zhì)量問題,數(shù)據(jù)質(zhì)量團隊需要將這些問題及時反饋給源頭部門和數(shù)據(jù)倉庫建設團隊。
④考核數(shù)據(jù)質(zhì)量考核:數(shù)據(jù)質(zhì)量的考核是為了能夠引起各個參與部門和參與團隊對數(shù)據(jù)質(zhì)量的重視,需要及時統(tǒng)計分析各種數(shù)據(jù)質(zhì)量問題,并制定出相應的應對措施。
(3)事后改善
①修復數(shù)據(jù)質(zhì)量問題:發(fā)現(xiàn)質(zhì)量問題不是最終的目標,我們?nèi)砸⑾嚓P的流程和工具,通過手工、工單、自動化等等手段將質(zhì)量問題修復掉,從而為業(yè)務創(chuàng)新提供可靠的數(shù)據(jù)支撐。
②收集數(shù)據(jù)質(zhì)量需求:通過數(shù)據(jù)中心的建設,質(zhì)量問題的修復,必然能夠促進數(shù)據(jù)的應用,我們?nèi)砸⑼〞车臄?shù)據(jù)質(zhì)量反饋通道,讓各個部門參與到數(shù)據(jù)質(zhì)量的再次完善中來,從而形成建設、應用和反饋的良性循環(huán)。
③完善質(zhì)量管理制度:制度和流程的建設并不是一蹴而就的,我們要在數(shù)據(jù)建設和質(zhì)量完善的過程中,結(jié)合自身組織結(jié)構(gòu)和業(yè)務特色,不斷完善工作制度。
④完善數(shù)據(jù)質(zhì)量標準:各行各業(yè)不斷涌現(xiàn)新的業(yè)務形態(tài),原有的業(yè)務也在不斷的變化,我們要緊跟業(yè)務的變化,不斷完善符合業(yè)務需求的數(shù)據(jù)標準。
⑤完善質(zhì)量監(jiān)測模型:如前所述,監(jiān)測模型代表的業(yè)務需求,業(yè)務形態(tài)的變化、數(shù)據(jù)標準的變化和質(zhì)量新需求的出現(xiàn),同樣要求監(jiān)測模型能夠做出相應的變化。
⑥完善質(zhì)量監(jiān)測規(guī)則:同樣,如今的信息化技術發(fā)展日新月異,我們要不斷引入各種新技術來更加智能地發(fā)現(xiàn)和修復數(shù)據(jù)質(zhì)量問題。
2.從數(shù)據(jù)質(zhì)量問題解決依賴的知識來管理
(1)數(shù)據(jù)梳理
數(shù)據(jù)梳理是明確企業(yè)數(shù)據(jù)現(xiàn)狀,知道整體數(shù)據(jù)質(zhì)量情況,將具有共同的特征數(shù)據(jù)提取出來,按照主題域的方式進行劃分,方便后續(xù)的數(shù)據(jù)管理。先明確企業(yè)數(shù)據(jù)的種類,根據(jù)數(shù)據(jù)的不同分類,選擇不同的提升數(shù)據(jù)質(zhì)量的方法。
梳理企業(yè)目前的數(shù)據(jù)情況,知道企業(yè)現(xiàn)階段有什么數(shù)據(jù),數(shù)據(jù)來自什么業(yè)務系統(tǒng),數(shù)據(jù)用在哪里,數(shù)據(jù)如何存儲,數(shù)據(jù)安全和數(shù)據(jù)隱私是什么情況;業(yè)務可以采集到什么數(shù)據(jù);還缺什么數(shù)據(jù)以及目前企業(yè)數(shù)據(jù)建設的情況,做好數(shù)據(jù)評估與分析報告,為數(shù)據(jù)質(zhì)量提升提供一個全方位的數(shù)據(jù)現(xiàn)狀參考。
從業(yè)務角度出發(fā),梳理出目前企業(yè)數(shù)據(jù)之間的流向關系、數(shù)據(jù)的分類情況和數(shù)據(jù)分類之間的關系,明確什么數(shù)據(jù)是基礎數(shù)據(jù),什么數(shù)據(jù)是由基礎數(shù)據(jù)衍生出來的只有先梳理清楚目前企業(yè)數(shù)據(jù)情況,才能認清企業(yè)數(shù)據(jù)的情況,從中找到提升數(shù)據(jù)質(zhì)量的關鍵突破點。
正所謂,工欲善其事,必先利其器。億信華辰睿治數(shù)據(jù)治理平臺的數(shù)據(jù)質(zhì)量管理模塊以全面質(zhì)量管理PDCA循環(huán)管理方法為指導,充分結(jié)合國內(nèi)數(shù)據(jù)質(zhì)量管理工作的特點,運用元數(shù)據(jù)管理、數(shù)據(jù)挖掘、數(shù)據(jù)分析、工作流、評分卡、可視化等技術最終幫助企業(yè)和政府建立數(shù)據(jù)質(zhì)量管理體系,全面提升數(shù)據(jù)的完整性、規(guī)范性、及時性、一致性、邏輯性等,降低數(shù)據(jù)管理成本,減少因數(shù)據(jù)不可靠導致的決策偏差和損失。
(2)數(shù)據(jù)規(guī)范
主要從數(shù)據(jù)模型和數(shù)據(jù)標準兩個方面定義好數(shù)據(jù)規(guī)范:
①數(shù)據(jù)模型:是數(shù)據(jù)特征的抽象,是獲取和明確企業(yè)數(shù)據(jù)需求的方法,也是數(shù)據(jù)需求分析與建模工作的基礎,通過對展現(xiàn)客觀事物的信息進行抽象、綜合、分類,組織為具有某種結(jié)構(gòu)的數(shù)據(jù),對這些數(shù)據(jù)結(jié)構(gòu)、其相互之間邏輯關系、數(shù)據(jù)操作方式及約束的描述。在實際的建模過程中,數(shù)據(jù)模型所描述的內(nèi)容包括數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)操作、數(shù)據(jù)約束三個部分。
②數(shù)據(jù)標準:是對數(shù)據(jù)模型的另一種延伸,是數(shù)據(jù)資產(chǎn)管理的核心基礎,也是對企業(yè)數(shù)據(jù)資產(chǎn)化進行準確重定義的過程。數(shù)據(jù)標準可以促進企業(yè)數(shù)據(jù)模型落地,對企業(yè)業(yè)務系統(tǒng)中關鍵數(shù)據(jù)進行標準化起到了關鍵性作用。但是,真正數(shù)據(jù)標準并不是規(guī)范文檔、流程文檔、制度文檔等,而是通過一套由管理規(guī)范、管控流程與技術工具共同組成的體系逐步實現(xiàn)數(shù)據(jù)信息化標準的過程。
在數(shù)據(jù)模型的落地和推動過程當中,往往會遇到由于各組織人員認知不同、看待問題的角度不同以及其他內(nèi)外部原因等限制,導致數(shù)據(jù)在集成與互通的時候會遇到數(shù)據(jù)不一致的問題。所以,在做業(yè)務系統(tǒng)的數(shù)據(jù)模型設計之前,企業(yè)要設計一套相對標準的數(shù)據(jù)規(guī)范。通過數(shù)據(jù)標準規(guī)范來反向推動業(yè)務進行數(shù)據(jù)收集,解決數(shù)據(jù)不一致的問題。
常用的策略有以下幾種:
①在需求規(guī)劃階段:梳理企業(yè)現(xiàn)有的數(shù)據(jù)模型是否合理,有則改之無則加勉,然后根據(jù)現(xiàn)有的模型來設計整體系統(tǒng)的模型,整個過程始終遵循數(shù)據(jù)標準的規(guī)范要求;
②在數(shù)據(jù)獲取階段:重點關注數(shù)據(jù)的安全性與隱私性問題、數(shù)據(jù)的及時性問題,數(shù)據(jù)傳輸?shù)葐栴};
③在數(shù)據(jù)存儲和共享階段:重點關注數(shù)據(jù)的整合問題,數(shù)據(jù)的一致性問題,數(shù)據(jù)的完整性等問題。
四、注意事項
1.數(shù)據(jù)質(zhì)量管理要對其業(yè)務目標,企業(yè)的數(shù)據(jù)治理不是為了治理數(shù)據(jù)而治理數(shù)據(jù),其最終目的都是為了支持業(yè)務和管理目標實現(xiàn)。因此提升數(shù)據(jù)質(zhì)量的主要目的是推動業(yè)務發(fā)展;
2.企業(yè)要不時進行主動的數(shù)據(jù)清理和處理補救,以糾正現(xiàn)有的數(shù)據(jù)問題,因為盡管有效數(shù)據(jù)質(zhì)量控制可以在很大程度上起到控制和預防不良數(shù)據(jù)發(fā)生的作用,但事實上,再嚴格的質(zhì)量控制也無法做到100%數(shù)據(jù)問題防治,甚至有時候嚴格的數(shù)據(jù)質(zhì)量控制還會引出其他更多的數(shù)據(jù)問題;
3.建立企業(yè)組織保障體系,企業(yè)需要建立一種文化,以讓更多的人認識到數(shù)據(jù)質(zhì)量的重要性,比如成立數(shù)據(jù)治理委員會,為數(shù)據(jù)質(zhì)量定下基調(diào),制定有關數(shù)據(jù)基礎架構(gòu)和流程的決策等。
五、小結(jié)
對于不同行業(yè)、不同規(guī)模、甚至處于不同發(fā)展階段的企業(yè)來說,按照同樣的業(yè)務規(guī)則產(chǎn)出的數(shù)據(jù),數(shù)據(jù)質(zhì)量是不一樣的,因此我們首先要記住的是數(shù)據(jù)質(zhì)量的高低本質(zhì)上代表了這些數(shù)據(jù)使用者的滿意程度。
其次,數(shù)據(jù)質(zhì)量管理是數(shù)據(jù)治理很重要的一個部分,企業(yè)數(shù)據(jù)治理的所有工作都是圍繞著提升數(shù)據(jù)質(zhì)量目標而展開的,但是治理與管理是兩個矛盾的對立面,數(shù)據(jù)的質(zhì)量歸根結(jié)底主要是受到人的影響,對于管理類的數(shù)據(jù)質(zhì)量問題,更多往往在于企業(yè)人對于數(shù)據(jù)的理解、支持和認知程度有很大的關系,通??梢詮臄?shù)據(jù)規(guī)劃、數(shù)據(jù)治理的組織與職責、數(shù)據(jù)規(guī)范的制度和流程等方面去做工程規(guī)劃。
本文為作者獨立觀點,不代表鳥哥筆記立場,未經(jīng)允許不得轉(zhuǎn)載。
《鳥哥筆記版權(quán)及免責申明》 如對文章、圖片、字體等版權(quán)有疑問,請點擊 反饋舉報
我們致力于提供一個高質(zhì)量內(nèi)容的交流平臺。為落實國家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評論自律管理,為了保護用戶創(chuàng)造的內(nèi)容、維護開放、真實、專業(yè)的平臺氛圍,我們團隊將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內(nèi)容進行管理。平臺鼓勵用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時也將采取必要措施管理違法、侵權(quán)或有其他不良影響的網(wǎng)絡信息。
一、根據(jù)《網(wǎng)絡信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權(quán),破壞國家統(tǒng)一,損害國家榮譽和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽、榮譽;
4)宣揚恐怖主義、極端主義或者煽動實施恐怖活動、極端主義活動;
5)煽動民族仇恨、民族歧視,破壞民族團結(jié);
6)破壞國家宗教政策,宣揚邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動非法集會、結(jié)社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽、隱私和其他合法權(quán)益;
11)通過網(wǎng)絡以文字、圖片、音視頻等形式,對未成年人實施侮辱、誹謗、威脅或者惡意損害未成年人形象進行網(wǎng)絡欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內(nèi)容;
2. 不友善:不尊重用戶及其所貢獻內(nèi)容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動成果;
2)誹謗:捏造、散布虛假事實,損害他人名譽;
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應,蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進行負面評價;
7)歧視:煽動人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗、擾亂本網(wǎng)站秩序的內(nèi)容,或進行相關行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產(chǎn)品、提供服務、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
2)單個帳號多次發(fā)布包含垃圾廣告的內(nèi)容;
3)多個廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點擊鏈接
5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當曝光;
6)購買或出售帳號之間虛假地互動,發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關交易。
7)發(fā)布包含欺騙性的惡意營銷內(nèi)容,如通過偽造經(jīng)歷、冒充他人等方式進行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經(jīng)驗的細節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內(nèi)容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚低俗、庸俗、媚俗內(nèi)容。
5. 不實信息,主要表現(xiàn)為:
1)可能存在事實性錯誤或者造謠等內(nèi)容;
2)存在事實夸大、偽造虛假經(jīng)歷等誤導他人的內(nèi)容;
3)偽造身份、冒充他人,通過頭像、用戶名等個人信息暗示自己具有特定身份,或與特定機構(gòu)或個人存在關聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測字、占卜、解夢、化解厄運、使用迷信方式治??;
2)求推薦算命看相大師;
3)針對具體風水等問題進行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導用戶;
2)內(nèi)容與標題之間存在嚴重不實或者原意扭曲;
3)使用夸張標題,內(nèi)容與標題嚴重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導未成年人應援集資、高額消費、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網(wǎng)絡水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導未成年人不良嗜好影響未成年人身心健康的;
2)不當評述自然災害、重大事故等災難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網(wǎng)絡生態(tài)造成不良影響的其他內(nèi)容。
二、違規(guī)處罰
本網(wǎng)站通過主動發(fā)現(xiàn)和接受用戶舉報兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當一個用戶發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將依據(jù)相關用戶違規(guī)情節(jié)嚴重程度,對帳號進行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個帳號發(fā)布違規(guī)內(nèi)容時,本網(wǎng)站將加重處罰。
三、申訴
隨著平臺管理經(jīng)驗的不斷豐富,本網(wǎng)站出于維護本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網(wǎng)站進行反饋。
(規(guī)則的最終解釋權(quán)歸屬本網(wǎng)站所有)