很可惜 T 。T 您現(xiàn)在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請(qǐng)把文章發(fā)送到郵箱tougao@appcpx.com,一經(jīng)錄用會(huì)有專人和您聯(lián)系
咨詢?nèi)绾纬蔀榇河鹱髡哒?qǐng)聯(lián)系:鳥(niǎo)哥筆記小羽毛(ngbjxym)
作者 | harryzhong
在過(guò)去的幾年里,質(zhì)量控制作為微信看一看推薦的基石,我們?cè)诓粩嗟牡?jí)中積累了一定的技術(shù)和經(jīng)驗(yàn)。本文主要跟大家分享一下總體框架的設(shè)計(jì)思路,以及如何通過(guò)平臺(tái)通用化來(lái)解決組合爆炸的問(wèn)題。文章為了盡可能的給讀者描述一個(gè)完整質(zhì)量控制體系的框架,這里既有技術(shù)上,架構(gòu)上考慮,也會(huì)有產(chǎn)品上,業(yè)務(wù)上的考慮。
微信作為國(guó)內(nèi)最大用戶群體的應(yīng)用,在人們的生活,工作,學(xué)習(xí)中提供社交功能的同時(shí),還提供了工具,游戲,購(gòu)物,支付,內(nèi)容,搜索,小程序等服務(wù)??匆豢醋鳛槲⑿诺闹匾M成部分,在原有公眾平臺(tái)資訊閱讀的基礎(chǔ)上,為用戶提供中心化的內(nèi)容消費(fèi)平臺(tái),旨在提升內(nèi)容發(fā)現(xiàn)效率,優(yōu)化內(nèi)容質(zhì)量,豐富內(nèi)容種類。
01、(內(nèi)在屬性)一個(gè)產(chǎn)品的出身和環(huán)境決定了其的調(diào)性,微信內(nèi)在也決定了看一看的調(diào)性。在這里,調(diào)性這個(gè)詞更多的是形容內(nèi)容質(zhì)量可以被用戶接受的底線。用戶對(duì)微信的期待也提高了這個(gè)底線。
02、(外部壓力)微信的每一次改動(dòng)都會(huì)受到廣泛的關(guān)注,在功能上線初期面臨著比其他應(yīng)用更大的輿論壓力和監(jiān)管壓力。
03、(黑產(chǎn)對(duì)抗)因?yàn)橛脩舳?,流量大,?qiáng)大的經(jīng)濟(jì)效益引來(lái)黑產(chǎn)的參與,使得內(nèi)容生產(chǎn)的大環(huán)境很差,低質(zhì)量數(shù)據(jù)充斥各個(gè)角落;問(wèn)題也在不斷地的變化,識(shí)別控制難度也在持續(xù)加大。
既然質(zhì)量控制作為推薦系統(tǒng)必不可少的一部分,那么在推薦系統(tǒng)中處質(zhì)量控制處于什么位置,包含哪些子模塊,又是從哪幾方面方面進(jìn)行控制?
首先,我們先看一下內(nèi)容數(shù)據(jù)在推薦系統(tǒng)的一生。
01、數(shù)據(jù)從內(nèi)容生產(chǎn)方發(fā)表產(chǎn)生,由平臺(tái)收集數(shù)據(jù)。這里生產(chǎn)方來(lái)自四面八方,生產(chǎn)的內(nèi)容五花八門(mén),質(zhì)量也是參差不齊。所以,平臺(tái)將數(shù)據(jù)接入之后第一件事情就是將這些內(nèi)容進(jìn)行格式化和特征提取,方便后面的流程能通用化地處理這些內(nèi)容數(shù)據(jù)。
02、內(nèi)容經(jīng)過(guò)前面的初步處理后,質(zhì)量控制模塊根據(jù)已有的特征對(duì)內(nèi)容進(jìn)行過(guò)濾,主要是過(guò)濾不符合平臺(tái)規(guī)則的低質(zhì)量數(shù)據(jù)和提供后面排序需要考慮的質(zhì)量因子。這里面涉及到過(guò)濾效率的問(wèn)題,一般會(huì)分為粗過(guò)濾還有細(xì)過(guò)濾。排序推薦模塊將根據(jù)內(nèi)容特征還有用戶行為對(duì)數(shù)據(jù)進(jìn)行排序。
03、最后,平臺(tái)將內(nèi)容推薦給用戶進(jìn)行消費(fèi),消費(fèi)的過(guò)程中會(huì)與內(nèi)容產(chǎn)生很多交互行為。這些行為數(shù)據(jù),可以用于平臺(tái)的質(zhì)量控制和推薦排序;也可以反饋給生產(chǎn)者,讓生產(chǎn)者能夠了解到內(nèi)容被消費(fèi)的情況,生產(chǎn)更多符合用戶需求的內(nèi)容。
也可以對(duì)生產(chǎn)者和用戶進(jìn)行引導(dǎo),評(píng)估。
01、根據(jù)生產(chǎn)者生產(chǎn)內(nèi)容的質(zhì)量,還有用戶對(duì)內(nèi)容的反饋,平臺(tái)可以對(duì)生產(chǎn)者進(jìn)行分級(jí)分類。對(duì)不同等級(jí)的生產(chǎn)者,使用不同質(zhì)量控制策略,如,高質(zhì)量的賬號(hào)頒發(fā)個(gè)免檢標(biāo)簽,在質(zhì)量控制的時(shí)候避免誤傷。而對(duì)于一些已經(jīng)被檢測(cè)到有低質(zhì)量?jī)?nèi)容的賬號(hào)進(jìn)行一定時(shí)間的封禁,減少相似問(wèn)題的爆發(fā),增加長(zhǎng)尾問(wèn)題的召回,提升系統(tǒng)的響應(yīng)速度。不同類目也是同樣的道理,比如高危的內(nèi)容類(社會(huì)民生,養(yǎng)生健康,娛樂(lè))需要加強(qiáng)控制。
02、而對(duì)于用戶,我們同樣可以根據(jù)一下用戶的基礎(chǔ)數(shù)據(jù)(地域,年齡,性別)和用戶在微信內(nèi)的一下閱讀信息,對(duì)用戶進(jìn)行分類。不同用戶可以使用不同的控制策略。這樣在保證了用戶對(duì)體驗(yàn)有不同要求的前提下,盡可能地保證推薦系統(tǒng)的效率。
除了上面說(shuō)的三個(gè)部分之外,還有幾個(gè)同樣非常重要的質(zhì)量控制輔助模塊,這些模塊對(duì)保證整個(gè)質(zhì)量控制的正常運(yùn)行至關(guān)重要。
01、監(jiān)控系統(tǒng):監(jiān)控系統(tǒng)需要對(duì)平臺(tái),生產(chǎn),用戶的各個(gè)方面進(jìn)行監(jiān)控,有些數(shù)值監(jiān)控指標(biāo)可以通過(guò)機(jī)器持續(xù)監(jiān)控,而有些數(shù)據(jù)本身的問(wèn)題則需要人工的輪詢與審核,還有就是新問(wèn)題的發(fā)現(xiàn)與歸納匯總。其中最重要的是能夠進(jìn)行全方位覆蓋,不同范圍,不同領(lǐng)域,有時(shí)候問(wèn)題可能隱藏的茫茫大盤(pán)數(shù)據(jù)中。
02、干預(yù)系統(tǒng):干預(yù)系統(tǒng)是對(duì)問(wèn)題出現(xiàn)后,進(jìn)行快速處理的手段。這樣能夠在模型策略迭代較慢的時(shí)候暫時(shí)壓制問(wèn)題,減少影響范圍。干預(yù)系統(tǒng)除了生效快之外,還有一個(gè)重要的能力是相似內(nèi)容的查找(去重指紋),如相似標(biāo)題的封禁和相似圖片的封禁。
03、標(biāo)注系統(tǒng):標(biāo)注系統(tǒng)作為一個(gè)提升樣本收集效率的平臺(tái),不僅能有效提升標(biāo)注人員的標(biāo)注效率,進(jìn)而有效提升模型的迭代效率;而且標(biāo)注系統(tǒng)方便對(duì)問(wèn)題的收集,總結(jié),歸納,形成各個(gè)領(lǐng)域的知識(shí)庫(kù)。
前面介紹了質(zhì)量控制的必要性,也介紹了質(zhì)量控制的大體框架。那么到底數(shù)據(jù)是指哪些數(shù)據(jù)?所謂的質(zhì)量又指的是哪些質(zhì)量指標(biāo)?這些數(shù)據(jù)跟這些質(zhì)量指標(biāo)帶給我們什么問(wèn)題與挑戰(zhàn)呢?
豐富的數(shù)據(jù)源,多維度的質(zhì)量指標(biāo),個(gè)性化的業(yè)務(wù)場(chǎng)景帶來(lái)的其實(shí)是組合爆炸問(wèn)題。如果對(duì)每一種組合都單獨(dú)處理,不僅導(dǎo)致大量人力的浪費(fèi);同時(shí),也無(wú)法對(duì)速度要求高的質(zhì)量控制問(wèn)題進(jìn)行快速響應(yīng)。毫無(wú)疑問(wèn)從體系上進(jìn)行通用化,模板化,可復(fù)用,可遷移是我們解決問(wèn)題的方向。下一節(jié),我們會(huì)從一個(gè)普通任務(wù)的迭代周期出發(fā),分析上面對(duì)話對(duì)應(yīng)的迭代過(guò)程的那一部分,并對(duì)相應(yīng)的部分進(jìn)行相應(yīng)的通用化。
01、規(guī)則制定:規(guī)則制定可以說(shuō)是質(zhì)量問(wèn)題解決中最重要的工作,問(wèn)題分析清楚了,解法也就出來(lái)了。這里簡(jiǎn)單列幾個(gè)小原則,不進(jìn)行展開(kāi)。
主要組成:需要對(duì)問(wèn)題進(jìn)行全面的分析,包括場(chǎng)景數(shù)據(jù)是什么,問(wèn)題有多少子類型,問(wèn)題比例有多大,影響范圍有多廣,業(yè)界是否也有同樣的問(wèn)題,做法是什么。
基于需求:這個(gè)階段更應(yīng)該從需求出發(fā)進(jìn)行問(wèn)題的分解,盡量減少技術(shù)性的考慮。很多時(shí)候人會(huì)往往會(huì)混淆“需要做”和“怎么做”。因?yàn)橛X(jué)得這個(gè)東西難做,或者不能做而將這個(gè)東西認(rèn)為不需要做。
基于數(shù)據(jù):規(guī)則的制訂需要結(jié)合數(shù)據(jù)進(jìn)行討論,不能幾個(gè)人憑主觀想法就定下規(guī)則。數(shù)據(jù)往往會(huì)提供很多我們意想不到的沖突情況。
衡量標(biāo)準(zhǔn):規(guī)則必須能在人與人之間傳遞。
02、特征提?。哼@里涉及如何將業(yè)務(wù)需求轉(zhuǎn)化為技術(shù)需求。根據(jù)問(wèn)題分析的結(jié)論,對(duì)直接特征進(jìn)行提取,如標(biāo)題,正文,封面圖,隱藏內(nèi)容,頁(yè)面結(jié)構(gòu),跳轉(zhuǎn)鏈接,錨文本,賬號(hào),統(tǒng)計(jì)特征等。
03、樣本收集:根據(jù)需要從原始數(shù)據(jù)中收集一定量的正負(fù)樣本,這些樣本可以通過(guò)相似樣本挖掘,也可以通過(guò)人工標(biāo)注。
04、模型訓(xùn)練:使用模型對(duì)提取的特征進(jìn)行組合,并對(duì)收集的樣本分布進(jìn)行擬合。
特征組合:模型將問(wèn)題需要考慮的特征進(jìn)行組合。有些問(wèn)題只需要考慮標(biāo)題(標(biāo)題黨),有些問(wèn)題需要考慮文章標(biāo)題的匹配程度(文不對(duì)題),有些問(wèn)題需要同時(shí)考慮文本與圖片的結(jié)合(低俗色情);有些問(wèn)題只需要考慮主題詞(廣告),有些問(wèn)題需要考慮上下文語(yǔ)境(假新聞)。
數(shù)據(jù)分布:模型會(huì)盡可能貼合樣本數(shù)據(jù)的分布,降低 Loss。有些數(shù)據(jù)源問(wèn)題比例高,有些數(shù)據(jù)源問(wèn)題比例低。切換數(shù)據(jù)源的時(shí)候,如果樣本分布與目標(biāo)數(shù)據(jù)源的分布不一致,效果往往有較大的差異。
01、細(xì)粒度化:在進(jìn)行規(guī)則制定階段,要避免指定一個(gè)很大的質(zhì)量問(wèn)題進(jìn)行優(yōu)化,盡量把問(wèn)題定義成“獨(dú)立”,“明確”,“與業(yè)務(wù)無(wú)關(guān)”的細(xì)粒度問(wèn)題。這樣可以減少后面因?yàn)闃I(yè)務(wù)變化導(dǎo)致的不確定監(jiān)督問(wèn)題,提升模型適用性。舉個(gè)例子:我們之前有個(gè)質(zhì)量問(wèn)題是黑四類(廣告,活動(dòng),通知,招聘),標(biāo)注的時(shí)候沒(méi)有區(qū)分,訓(xùn)練的時(shí)候也是用一個(gè)模型。這樣在有新的業(yè)務(wù)出現(xiàn)的時(shí)候突然發(fā)現(xiàn)我們不需要黑四類,而是黑三類。還有其他一些不建議的問(wèn)題類型:"標(biāo)題不規(guī)范","正文質(zhì)量差","內(nèi)容不優(yōu)質(zhì)"。
02、共享特征:雖然不同數(shù)據(jù)源的樣式不一樣,這樣需要對(duì)不同的數(shù)據(jù)源通過(guò)頁(yè)面解析進(jìn)行特征抽取,統(tǒng)計(jì)。但是對(duì)于同一個(gè)數(shù)據(jù)源,不同的質(zhì)量問(wèn)題,往往會(huì)用到很多相同的特征。一個(gè)數(shù)據(jù)源抽取后的結(jié)果可以保存在結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu)中方便各個(gè)質(zhì)量模型,還有其他的業(yè)務(wù)模型使用。如文本的位置,是否有鏈接,是否隱藏,是否模板內(nèi)容等。
03、樣本增強(qiáng):通過(guò)相似樣本挖掘和人工標(biāo)注容易導(dǎo)致過(guò)擬合,標(biāo)注效率低的問(wèn)題。這里可以結(jié)合數(shù)據(jù)增強(qiáng)提升模型的魯棒性,結(jié)合主動(dòng)學(xué)習(xí)提升標(biāo)注效率。
01、通用模型
02、 廣告模型
這里介紹一下廣告識(shí)別模型在構(gòu)建過(guò)程中,涉及的幾個(gè)通用問(wèn)題模型。廣告模型主要是負(fù)責(zé)識(shí)別文章里面的廣告內(nèi)容。從內(nèi)容上,分為文字廣告,圖片廣告,圖文廣告。從位置上分頂部廣告,中間廣告,底部廣告。從篇幅上分主體廣告,插播廣告。那么這里可以抽象成 3 個(gè)通用的問(wèn)題:
問(wèn)題內(nèi)容的定位(插播廣告)
多類型特征的融合(圖文廣告)
文章結(jié)構(gòu)的序列化(頂部,中部,尾部,篇幅)
問(wèn)題內(nèi)容的定位:這類問(wèn)題與圖像中的物體檢測(cè)相似,都是需要識(shí)別相應(yīng)目標(biāo)及其對(duì)應(yīng)的位置。據(jù)此,我們提供一個(gè)全新的用于文本問(wèn)題檢測(cè)的框架 TADL。通過(guò)滑動(dòng)窗口的檢測(cè)方法將大段文本切分成多個(gè)小片段,并對(duì)每個(gè)小片段進(jìn)行廣告概率打分和反推定位,從而在一個(gè)模型框架內(nèi)同時(shí)實(shí)現(xiàn)了廣告文字的識(shí)別和定位,并且只需要文章級(jí)別的標(biāo)注就能完成訓(xùn)練。
多類型特征的融合:圖片廣告定義廣泛,廣告的程度需要同時(shí)考慮多種類型的特征(文本大小,文本位置,文本語(yǔ)義,圖片場(chǎng)景,圖片內(nèi)容)。相對(duì)于端到端的需要大規(guī)模標(biāo)注的深度模型,對(duì)問(wèn)題進(jìn)行分而治之的 wide&deep 模型框架具有更好的解釋性,更高的召回。
文章結(jié)構(gòu)的序列化:一篇文章是否有廣告問(wèn)題,需要對(duì)整篇文章中多模態(tài)廣告的占比,位置進(jìn)行綜合考慮。將不同廣告文章中的文本廣告概率和圖片廣告概率進(jìn)行序列化的可視化展示,發(fā)現(xiàn)通過(guò)對(duì)有限的序列模式進(jìn)行識(shí)別檢測(cè)可以用來(lái)解決多模態(tài)文章分類問(wèn)題。模型通過(guò) Multi-CNN 檢測(cè)異?!巴黄稹?,通過(guò) BiLSTM 檢測(cè)概率變化趨勢(shì)。
數(shù)據(jù)源之間的數(shù)據(jù)分布一定是會(huì)存在差異的。模型遷移主要是想要解決數(shù)據(jù)分布不一致的問(wèn)題。這里我們以色情低俗識(shí)別為例子,分“詞向量”和“特征分布”兩個(gè)方面來(lái)考慮遷移問(wèn)題。
01、 詞向量統(tǒng)一
詞向量在不同的場(chǎng)景中會(huì)表現(xiàn)不一樣的語(yǔ)義,如“下面”在圖文和視頻標(biāo)題里面就有不同的語(yǔ)義。多數(shù)據(jù)源數(shù)據(jù)訓(xùn)練的詞向量因?yàn)楂@得了更多的信息量要好于多個(gè)數(shù)據(jù)源單獨(dú)訓(xùn)練的向量。到后來(lái)基于更大量訓(xùn)練集的 bert 的出現(xiàn)更是極大的豐富了詞向量的信息量。
02、 特征空間統(tǒng)一
這里面的方法主要有 finetune,多任務(wù)學(xué)習(xí),還有對(duì)抗學(xué)習(xí)。
Finetune 的目的是使用已有模型的特征提取能力,然后目標(biāo)數(shù)據(jù)源進(jìn)行組合調(diào)整達(dá)到較好的效果。這個(gè)模型在源領(lǐng)域數(shù)據(jù)標(biāo)注量要比較大,模型框架能夠表示足夠多的共同特征時(shí)比較有效,如 bert。
多任務(wù)學(xué)習(xí)通過(guò)不同任務(wù)間建立共享層,學(xué)習(xí)不同 domain 之間的共享知識(shí),進(jìn)而實(shí)現(xiàn)雙贏。缺點(diǎn)是需要大量的目標(biāo)領(lǐng)域的有標(biāo)數(shù)據(jù)。
對(duì)抗學(xué)習(xí)充分利用了大量的無(wú)標(biāo)數(shù)據(jù)消除一些鄰域間分布不同的差異。
前面所提到的多樣化的問(wèn)題,更多的是平臺(tái)內(nèi)部因?yàn)闃I(yè)務(wù)需求主動(dòng)引入更多的數(shù)據(jù)和質(zhì)量指標(biāo)導(dǎo)致。這些問(wèn)題相對(duì)來(lái)說(shuō)是靜態(tài)的。在業(yè)務(wù)上線之前,平臺(tái)會(huì)進(jìn)行摸底優(yōu)化,不會(huì)有太多的意外。
接下來(lái)我們討論數(shù)據(jù)動(dòng)態(tài)變化的問(wèn)題。在日常的內(nèi)容生產(chǎn)過(guò)程中,內(nèi)容生產(chǎn)者根據(jù)平臺(tái)的環(huán)境和用戶的反饋不斷修改內(nèi)容的樣式,類目。這些變化會(huì)改變數(shù)據(jù)的分布,從而導(dǎo)致平臺(tái)對(duì)新數(shù)據(jù)出現(xiàn)漏召或者誤判。其中,黑產(chǎn)的持續(xù)不斷的有意對(duì)抗最為頻繁,花樣最多,也是我們最為關(guān)注的。這些對(duì)抗具有形式類目多,迭代周期多的特征。
形式類目多:?jiǎn)栴}數(shù)據(jù)類型不斷變化演進(jìn),從文本,圖片,視頻一直到鏈接。類目上也是在多個(gè)高危類目上來(lái)回切換,不斷創(chuàng)新。
迭代周期短:某個(gè)特殊的色情標(biāo)題黨樣式,在某一時(shí)間短獲得不錯(cuò)的曝光后,黑產(chǎn)立即進(jìn)行了大規(guī)模的投產(chǎn),而在受到打壓后又迅速的轉(zhuǎn)向其他類型的 case。
由于敵暗我明,完全杜絕幾乎是不可能的。原則上是提高黑產(chǎn)的作弊成本,降低平臺(tái)的維護(hù)成本。我們還是從前面提到質(zhì)量控制體系的三部分入手。
平臺(tái):每天都有少量的標(biāo)注人工對(duì)線上數(shù)據(jù)進(jìn)行輪詢,對(duì)有問(wèn)題的數(shù)據(jù)進(jìn)行屏蔽收集。
用戶:對(duì)大量用戶反饋有問(wèn)題的數(shù)據(jù)進(jìn)行限制。
生產(chǎn):
黑名單:對(duì)歷史上劣跡斑斑的賬號(hào)進(jìn)行封禁,同時(shí),對(duì)跟這些賬號(hào)關(guān)聯(lián)緊密的賬號(hào)進(jìn)行挖掘封禁。
沙盒機(jī)制:對(duì)新注冊(cè)的,發(fā)文較少,未被平臺(tái)驗(yàn)證的賬號(hào),限制其推廣范圍。
樣本擴(kuò)散,模型迭代:
用戶反饋和平臺(tái)監(jiān)控,雖然能發(fā)現(xiàn)新的問(wèn)題,但是泛化性不夠。
賬號(hào)打壓雖然具有泛化性,但是無(wú)法將新問(wèn)題,新賬號(hào)發(fā)現(xiàn)。
為了解決原有體系的不足,我們嘗試結(jié)合兩部分,通過(guò)人工監(jiān)控跟負(fù)反饋收集樣本進(jìn)行擴(kuò)散,然后提供給模型進(jìn)行迭代提升召回。最后再?gòu)馁~號(hào)維度進(jìn)行泛化打擊。這里跟前文提到的樣本增強(qiáng)的區(qū)別在于樣本擴(kuò)散更多的是對(duì)新問(wèn)題樣本的收集。
01、正常流程
那么怎么進(jìn)行樣本擴(kuò)散,加快模型的迭代周期呢?下面是一個(gè)樣本收集周期里面大概需要做些什么事情。
首先根據(jù)發(fā)現(xiàn)的問(wèn)題數(shù)據(jù)通過(guò)相似度計(jì)算,我們?cè)谠磾?shù)據(jù)(source data)找到一批跟問(wèn)題數(shù)據(jù)(sample data)相似度較高的未標(biāo)注數(shù)據(jù)(unlabeled data)。
a.賬號(hào):一個(gè)賬號(hào)的內(nèi)容大部分比較相似,同一個(gè)黑產(chǎn)內(nèi)容跟也往往相同。
b.類目:對(duì)問(wèn)題比較集中的類目進(jìn)行數(shù)據(jù)挖掘。
c.關(guān)鍵詞:用一些匹配式框定一個(gè)范圍。
d.聚類模型:簡(jiǎn)單的計(jì)算樣本內(nèi)容的文本相似性。
e.分類模型:構(gòu)建簡(jiǎn)單的分類模型進(jìn)行初篩。
然后對(duì)這批未標(biāo)注的數(shù)據(jù)進(jìn)行人工標(biāo)注,這樣可以篩選出一批能有效提升模型對(duì)新問(wèn)題識(shí)別效率的標(biāo)注樣本(selected data)。
最后將篩選的樣本跟原有的標(biāo)注數(shù)據(jù)(labeld data)進(jìn)行合并作為訓(xùn)練樣本進(jìn)行模型訓(xùn)練。訓(xùn)練好模型之后在測(cè)試數(shù)據(jù)(test data)上面進(jìn)行測(cè)試效果。
02、 加速流程
工作周期主要的工作量是在兩個(gè)部分,一是相似樣本的挖掘,二是人工標(biāo)注樣本;相似樣本挖掘的精度越高,覆蓋的樣式越全,人工標(biāo)注的樣本量就越少。而這兩方面我們可以使用半監(jiān)督學(xué)習(xí)跟強(qiáng)化學(xué)習(xí)的方法來(lái)進(jìn)行優(yōu)化。
03、自動(dòng)化流程
更進(jìn)一步我們嘗試使用強(qiáng)化學(xué)習(xí)代替整個(gè)問(wèn)題樣本的挖掘過(guò)程,強(qiáng)化學(xué)習(xí)選擇器從源數(shù)據(jù)里面選擇樣本,跟已有標(biāo)注樣本送入判別器訓(xùn)練,然后將判別器在測(cè)試數(shù)據(jù)和問(wèn)題數(shù)據(jù)的表現(xiàn)當(dāng)成 Reward 反饋給強(qiáng)化學(xué)習(xí)選擇器。
前面討論了框架內(nèi)部的通用性,那么這個(gè)框架整體是否具有通用性,能否在其他平臺(tái)適用呢?其實(shí)因?yàn)楦黝悆?nèi)容平臺(tái)在問(wèn)題類型跟數(shù)據(jù)類型本身就存在大量的共性;所以看一看的控制框架和技術(shù),在面對(duì)如搜一搜,公眾平臺(tái),朋友圈等其他場(chǎng)景時(shí),依然可以提供相應(yīng)的經(jīng)驗(yàn)和能力。近半年來(lái),搜一搜作為用戶獲取內(nèi)容重要場(chǎng)景,我們?cè)趶?fù)用看一看能力的基礎(chǔ)上也構(gòu)建了類似的控制框架。
雖然我們已經(jīng)掌握了各式各樣的能力,能夠解決很多問(wèn)題,但是相比起知道的知識(shí),我們不了解的內(nèi)容更多,經(jīng)常會(huì)出現(xiàn)讓我們意想不到的狀況。質(zhì)量控制,乃至于機(jī)器學(xué)習(xí)的主要矛盾在于用有限的知識(shí)處理無(wú)限的未知。持續(xù)的知識(shí)獲取意味著自主學(xué)習(xí),也意味著持續(xù)的與現(xiàn)實(shí)交互。
一個(gè)平臺(tái)的質(zhì)量控制系統(tǒng)就像是人體的免疫組織,當(dāng)病毒來(lái)臨,免疫細(xì)胞產(chǎn)生抗體,消滅病毒。人類在漫長(zhǎng)的進(jìn)化過(guò)程中,構(gòu)建了復(fù)雜的免疫系統(tǒng),同時(shí),病毒也在不斷的進(jìn)步。越是復(fù)雜的系統(tǒng),出現(xiàn)問(wèn)題的可能性越高,出現(xiàn)問(wèn)題后解決問(wèn)題的成本難度也越大。在構(gòu)建強(qiáng)健的內(nèi)部免疫系統(tǒng)的同時(shí),我們同樣需要營(yíng)造良好的外部環(huán)境,讓更多優(yōu)質(zhì)的內(nèi)容生產(chǎn)者進(jìn)來(lái),才是解決質(zhì)量問(wèn)題之根本。
-END-
本文為作者獨(dú)立觀點(diǎn),不代表鳥(niǎo)哥筆記立場(chǎng),未經(jīng)允許不得轉(zhuǎn)載。
《鳥(niǎo)哥筆記版權(quán)及免責(zé)申明》 如對(duì)文章、圖片、字體等版權(quán)有疑問(wèn),請(qǐng)點(diǎn)擊 反饋舉報(bào)
測(cè)一測(cè)
我們致力于提供一個(gè)高質(zhì)量?jī)?nèi)容的交流平臺(tái)。為落實(shí)國(guó)家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評(píng)論自律管理,為了保護(hù)用戶創(chuàng)造的內(nèi)容、維護(hù)開(kāi)放、真實(shí)、專業(yè)的平臺(tái)氛圍,我們團(tuán)隊(duì)將依據(jù)本公約中的條款對(duì)注冊(cè)用戶和發(fā)布在本平臺(tái)的內(nèi)容進(jìn)行管理。平臺(tái)鼓勵(lì)用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時(shí)也將采取必要措施管理違法、侵權(quán)或有其他不良影響的網(wǎng)絡(luò)信息。
一、根據(jù)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國(guó)未成年人保護(hù)法》等法律法規(guī),對(duì)以下違法、不良信息或存在危害的行為進(jìn)行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對(duì)憲法所確定的基本原則;
2)危害國(guó)家安全,泄露國(guó)家秘密,顛覆國(guó)家政權(quán),破壞國(guó)家統(tǒng)一,損害國(guó)家榮譽(yù)和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽(yù)、榮譽(yù);
4)宣揚(yáng)恐怖主義、極端主義或者煽動(dòng)實(shí)施恐怖活動(dòng)、極端主義活動(dòng);
5)煽動(dòng)民族仇恨、民族歧視,破壞民族團(tuán)結(jié);
6)破壞國(guó)家宗教政策,宣揚(yáng)邪教和封建迷信;
7)散布謠言,擾亂社會(huì)秩序,破壞社會(huì)穩(wěn)定;
8)宣揚(yáng)淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動(dòng)非法集會(huì)、結(jié)社、游行、示威、聚眾擾亂社會(huì)秩序;
10)侮辱或者誹謗他人,侵害他人名譽(yù)、隱私和其他合法權(quán)益;
11)通過(guò)網(wǎng)絡(luò)以文字、圖片、音視頻等形式,對(duì)未成年人實(shí)施侮辱、誹謗、威脅或者惡意損害未成年人形象進(jìn)行網(wǎng)絡(luò)欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內(nèi)容;
2. 不友善:不尊重用戶及其所貢獻(xiàn)內(nèi)容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動(dòng)成果;
2)誹謗:捏造、散布虛假事實(shí),損害他人名譽(yù);
3)嘲諷:以比喻、夸張、侮辱性的手法對(duì)他人或其行為進(jìn)行揭露或描述,以此來(lái)激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對(duì)方對(duì)自己的言論作出回應(yīng),蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對(duì)方難堪;
6)謾罵:以不文明的語(yǔ)言對(duì)他人進(jìn)行負(fù)面評(píng)價(jià);
7)歧視:煽動(dòng)人群歧視、地域歧視等,針對(duì)他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來(lái)迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗(yàn)、擾亂本網(wǎng)站秩序的內(nèi)容,或進(jìn)行相關(guān)行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產(chǎn)品、提供服務(wù)、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
2)單個(gè)帳號(hào)多次發(fā)布包含垃圾廣告的內(nèi)容;
3)多個(gè)廣告帳號(hào)互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點(diǎn)擊鏈接
5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當(dāng)曝光;
6)購(gòu)買(mǎi)或出售帳號(hào)之間虛假地互動(dòng),發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關(guān)交易。
7)發(fā)布包含欺騙性的惡意營(yíng)銷內(nèi)容,如通過(guò)偽造經(jīng)歷、冒充他人等方式進(jìn)行惡意營(yíng)銷;
8)使用特殊符號(hào)、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經(jīng)驗(yàn)的細(xì)節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內(nèi)容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚(yáng)低俗、庸俗、媚俗內(nèi)容。
5. 不實(shí)信息,主要表現(xiàn)為:
1)可能存在事實(shí)性錯(cuò)誤或者造謠等內(nèi)容;
2)存在事實(shí)夸大、偽造虛假經(jīng)歷等誤導(dǎo)他人的內(nèi)容;
3)偽造身份、冒充他人,通過(guò)頭像、用戶名等個(gè)人信息暗示自己具有特定身份,或與特定機(jī)構(gòu)或個(gè)人存在關(guān)聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測(cè)字、占卜、解夢(mèng)、化解厄運(yùn)、使用迷信方式治病;
2)求推薦算命看相大師;
3)針對(duì)具體風(fēng)水等問(wèn)題進(jìn)行求助或咨詢;
4)問(wèn)自己或他人的八字、六爻、星盤(pán)、手相、面相、五行缺失,包括通過(guò)占卜方法問(wèn)婚姻、前程、運(yùn)勢(shì),東西寵物丟了能不能找回、取名改名等;
7. 文章標(biāo)題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來(lái)誘導(dǎo)用戶;
2)內(nèi)容與標(biāo)題之間存在嚴(yán)重不實(shí)或者原意扭曲;
3)使用夸張標(biāo)題,內(nèi)容與標(biāo)題嚴(yán)重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導(dǎo)未成年人應(yīng)援集資、高額消費(fèi)、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動(dòng)「飯圈」粉絲攀比炫富、奢靡享樂(lè)等行為
4)以號(hào)召粉絲、雇用網(wǎng)絡(luò)水軍、「養(yǎng)號(hào)」形式刷量控評(píng)等行為
5)通過(guò)「蹭熱點(diǎn)」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會(huì)公德行為、誘導(dǎo)未成年人不良嗜好影響未成年人身心健康的;
2)不當(dāng)評(píng)述自然災(zāi)害、重大事故等災(zāi)難的;
3)美化、粉飾侵略戰(zhàn)爭(zhēng)行為的;
4)法律、行政法規(guī)禁止,或可能對(duì)網(wǎng)絡(luò)生態(tài)造成不良影響的其他內(nèi)容。
二、違規(guī)處罰
本網(wǎng)站通過(guò)主動(dòng)發(fā)現(xiàn)和接受用戶舉報(bào)兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺(tái)氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當(dāng)一個(gè)用戶發(fā)布違規(guī)內(nèi)容時(shí),本網(wǎng)站將依據(jù)相關(guān)用戶違規(guī)情節(jié)嚴(yán)重程度,對(duì)帳號(hào)進(jìn)行禁言 1 天、7 天、15 天直至永久禁言或封停賬號(hào)的處罰。當(dāng)涉及欺凌未成年人、危害未成年人身心健康、通過(guò)作弊手段注冊(cè)、使用帳號(hào),或者濫用多個(gè)帳號(hào)發(fā)布違規(guī)內(nèi)容時(shí),本網(wǎng)站將加重處罰。
三、申訴
隨著平臺(tái)管理經(jīng)驗(yàn)的不斷豐富,本網(wǎng)站出于維護(hù)本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對(duì)本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過(guò)「建議反饋」功能向本網(wǎng)站進(jìn)行反饋。
(規(guī)則的最終解釋權(quán)歸屬本網(wǎng)站所有)