很可惜 T 。T 您現(xiàn)在還不是作者身份,不能自主發(fā)稿哦~
如有投稿需求,請把文章發(fā)送到郵箱tougao@appcpx.com,一經(jīng)錄用會有專人和您聯(lián)系
咨詢?nèi)绾纬蔀榇河鹱髡哒埪?lián)系:鳥哥筆記小羽毛(ngbjxym)
無論算法推薦如何發(fā)展,都只是輔助人類獲取信息的調(diào)味品,切不要迷信與神話算法推薦!
“讓人類永遠(yuǎn)保持理智,確實(shí)是一種奢求”。《流浪地球》中MOSS直到毀滅,也沒弄明白航天員劉培強(qiáng)為什么甘愿赴死。
MOSS是人類已經(jīng)能夠制造出推動(dòng)地球航行的行星發(fā)動(dòng)機(jī),科技來到新高度下的高級人工智能,但與007這樣具有自主智慧的人工智能還相距甚遠(yuǎn),本質(zhì)上與現(xiàn)在通過數(shù)據(jù)層、算法層、應(yīng)用層給用戶帶來最優(yōu)解的算法推薦是一樣的。
談及算法推薦,大部分人腦子可能閃過的第一個(gè)詞就是“今日頭條”。的確,字節(jié)跳動(dòng)旗下的今日頭條、抖音等產(chǎn)品在推薦算法的賦能下,給大眾留下了千人千面的深刻印象。
其實(shí),除字節(jié)跳動(dòng)外,阿里巴巴在天貓、淘寶,網(wǎng)易在網(wǎng)易云音樂,B站在視頻推薦流中都有廣泛使用推薦算法??梢院敛豢鋸埖恼f,互聯(lián)網(wǎng)行業(yè)中只要不是用戶主動(dòng)尋找的直接信息,甚至是廣告背后都有推薦算法的身影。
1994年,美國美國明尼蘇達(dá)大學(xué)GroupLens研究組推出第一個(gè)自動(dòng)化推薦系統(tǒng) GroupLens,提出了將協(xié)同過濾作為推薦系統(tǒng)的重要技術(shù),也是最早的自動(dòng)化協(xié)同過濾推薦系統(tǒng)之一。
4年后(1998年),亞馬遜上線了基于物品的協(xié)同過濾算法,這便是算法推薦的最早商用案例,后面Facebook、Netflix,乃至中國的字節(jié)跳動(dòng)、阿里巴巴等企業(yè)都廣泛應(yīng)用了算法推薦。
其實(shí)算法推薦并不復(fù)雜,總結(jié)起來就是信息的“統(tǒng)計(jì)、分類、分發(fā)”6個(gè)字。通俗的來講,算法推薦就是APP利用大數(shù)據(jù)科學(xué)的給用戶“算命”。
首先,后端系統(tǒng)會通過應(yīng)用層的注冊信息、用戶點(diǎn)擊行為收集統(tǒng)計(jì)所有信息;然后再通過策略層的相關(guān)算法對信息進(jìn)行分類,勾畫用戶畫像;最后策略層再對平臺上的其他信息與用戶畫像相匹配,把結(jié)果在應(yīng)用層呈現(xiàn)到用戶眼中。
這個(gè)過程就好比算命,你把生辰八字告訴算命先生,然后算命先生根據(jù)生辰八字和相關(guān)法則給出你想要的答案。
按觸發(fā)條件不同,算法推薦系統(tǒng)目前大致有兩類:
一類是被動(dòng)觸發(fā)的,需要用戶圈定一定限制條件后,系統(tǒng)給你推薦最優(yōu)解;
另一類是主動(dòng)觸發(fā),你只要打開APP后系統(tǒng)就會自動(dòng)給你推薦內(nèi)容,無需用戶設(shè)置條件。
被動(dòng)觸發(fā)的算法推薦中,58同城可當(dāng)成一個(gè)經(jīng)典案例。58同城是一個(gè)集房產(chǎn)、招聘、汽車、家政、本地服務(wù)于一體的綜合性網(wǎng)站,這就造成了用戶行為目的的不確定性,僅前面列舉的5項(xiàng)功能就有21種可能,如進(jìn)入里面的子項(xiàng)其組合可能將會成指數(shù)級增長,因此算法推薦對于他們而言的目的是幫助用戶更快找到合適的信息。
例如租房時(shí),58同城會根據(jù)用戶的選購條件,例如價(jià)格、區(qū)位、戶型等在數(shù)據(jù)層做出統(tǒng)計(jì),然后策略層通過對房源特征分類,將每個(gè)特征賦予一個(gè)權(quán)重,再然后通過用戶數(shù)據(jù)與房源特征組合形成召回?cái)?shù)據(jù),最終召回?cái)?shù)據(jù)在應(yīng)用層優(yōu)先推薦權(quán)重高的召回?cái)?shù)據(jù),直至與用戶要求完全相違背。
主動(dòng)觸發(fā)類的算法推薦,頭條系的抖音必須擁有姓名。抖音與58同城的多品類、多層級的復(fù)雜信息流不同,抖音的宗旨就是讓信息找人,人就是平臺的流量池。
因此抖音會率先先對用戶上傳的視頻進(jìn)行統(tǒng)計(jì),然后通過關(guān)鍵詞對視頻分類歸入內(nèi)容流量池,與此同時(shí)進(jìn)行的是系統(tǒng)后臺會對用戶的行為關(guān)鍵詞進(jìn)行統(tǒng)計(jì)、分類,勾畫用戶畫像,然后將用戶畫像與視頻流量池的內(nèi)容相匹配,最終給用戶分發(fā)用戶更感興趣的內(nèi)容,在這個(gè)過程中幾乎不需要用戶主動(dòng)篩選。
《老子》第五十八章言:禍兮,福之所倚;福兮,禍之所伏。前面提到,無論是被動(dòng)觸發(fā)類的算法推薦還是主動(dòng)觸發(fā)類的算法推薦,其主要目的就是減少用戶獲取信息的效率。
例如之前我們看長視頻,要么是按電影、電視劇、綜藝等分類找視頻看,要么就是直接搜索劇名直接觀看,反正要早一個(gè)符合自己口味的視頻很是麻煩。而在算法推薦主導(dǎo)的短視頻時(shí)代,一直刷一直看已經(jīng)成為常態(tài)。
但算法推薦帶來信息獲取效率提升的同時(shí),也給我們帶入了信息牢籠中。2017年10月10日,又是一個(gè)忙碌的周一,《華盛頓郵報(bào)》報(bào)道了一則讓美國人民無比憤怒的消息,F(xiàn)acebook在美國總統(tǒng)大選期間投放的數(shù)千個(gè)廣告影響了選舉,甚至還扒出了“通俄門”。
據(jù)報(bào)道,獲取Facebook 5000萬用戶數(shù)據(jù)的劍橋數(shù)據(jù),利用性格五力模型制作廣告,再通過Facebook的算法推薦最終實(shí)現(xiàn)了影響美國大選目的,算法推薦成為了幫兇。
一方面,算法推薦在信息傳播中占據(jù)主導(dǎo)地位。
公元前135年,本該在漢使面前宣揚(yáng)國威的夜郎國國王,且因與漢王朝比大成為千古笑柄,而其原因不僅是因?yàn)閲跎罹訉m內(nèi)信息閉塞,更因?yàn)橹苓叴蟪奸L期推薦“夜郎天下第一”的信息讓國王深信不疑。
從知網(wǎng)《推薦系統(tǒng)》的信息可以直觀的看出,算法推薦就是夜郎國王身邊的大臣,雖然個(gè)個(gè)都是人才,說話又好聽,但其傳達(dá)的信息十分有限,且傳達(dá)的信息比較單一,例如你喜歡看搞笑視頻,算法推薦就會在10個(gè)視頻中給你推薦7個(gè),剩下的才會拓展其他視頻,這也是為何Facebook會影響總統(tǒng)大選的原因。
另一方面,算法推薦在信息傳播時(shí)還具有不穩(wěn)定性。
算法推薦系統(tǒng)是由程序員設(shè)計(jì)的一套信息分發(fā)系統(tǒng),說到底還是未逃離機(jī)器分發(fā)的范疇,就以當(dāng)前人工智能的發(fā)展水平來說,要想鉆算法推薦的空子還是較為容易的。
這樣一來,那些掌握了平臺算法規(guī)則的第三方投遞更多挾帶私貨,人們豈不是每天都在垃圾信息的海洋中沖浪?畢竟,現(xiàn)在只要在搜索引擎中輸入某某平臺和算法推薦關(guān)鍵詞,就會出現(xiàn)上千萬相關(guān)信息助你鉆算法推薦的空子。
一千位讀者心中就有一千位哈姆雷特,對待千人千面的算法推薦不同的人也有不同的態(tài)度,算法推薦面前,有人吃到紅利對其推崇,有人沉迷其中,還有因幸存者故事將其神化,迷信算法推薦正成為互聯(lián)網(wǎng)行業(yè)的普遍現(xiàn)象。
但前面提到,算法推薦在信息傳播過程中具有壟斷性與不穩(wěn)定性,極易對普通用戶造成信息牢籠,那么這樣一個(gè)不完美的算法推薦未來會走向何方呢?
其一,算法推薦并行化
并行與串行是數(shù)據(jù)通訊傳輸?shù)膬煞N不同方式,據(jù)大數(shù)據(jù)期刊的《信息過載的大數(shù)據(jù)時(shí)代,大數(shù)據(jù)推薦系統(tǒng)如何搭建,趨勢何方》報(bào)告顯示,傳統(tǒng)的算法推薦系統(tǒng)大多采取串行的傳輸方式,這種傳輸方式的好處是適合長距離傳輸,但單次只能傳輸一個(gè)數(shù)據(jù)單元,所以就限制了算法推薦在獲取用戶數(shù)據(jù)與反饋信息給用戶的數(shù)據(jù)量,深化了信息牢籠的可能性。
而算法推薦并行化,可以利用并行單次可傳輸多個(gè)數(shù)據(jù)單元的特征,獲取更多信息勾畫更精準(zhǔn)的用戶畫像,同時(shí)還能反饋更多信息,以足夠的信息降低算法推薦形成信息牢籠的可能性。
其二,算法推薦逐步引入人文社科等新參數(shù)。
前面提到,由于機(jī)器沒有人的生物性和思想性,當(dāng)前算法推薦面臨不良信息鉆空子的局面,而造成這種局面的主要原因是因?yàn)闄C(jī)器缺少人文情感判定標(biāo)準(zhǔn)。
因此算法推薦未來需要在推薦系統(tǒng)的神經(jīng)元里要植入“思無邪”和“己所不欲,勿施于人”的節(jié)點(diǎn),協(xié)同過濾,最后將更優(yōu)質(zhì)的信息反饋給用戶。
打個(gè)比方,當(dāng)用戶在某視頻網(wǎng)站上無意見看到了通過鉆空子進(jìn)入流量池的“虐貓視頻”,那么沒有人文社科作為新參數(shù)的算法推薦則會在流量池中繼續(xù)挖掘虐待小動(dòng)物的視頻,所以除在點(diǎn)擊率、內(nèi)容標(biāo)簽、收藏等數(shù)學(xué)參數(shù)外,還因加入人文社科參數(shù)。
其實(shí)無論算法推薦如何發(fā)展,都只是輔助人類獲取信息的調(diào)味品,切不要迷信與神話算法推薦,我可不想30年自己成為機(jī)器的附庸。
本文為作者獨(dú)立觀點(diǎn),不代表鳥哥筆記立場,未經(jīng)允許不得轉(zhuǎn)載。
《鳥哥筆記版權(quán)及免責(zé)申明》 如對文章、圖片、字體等版權(quán)有疑問,請點(diǎn)擊 反饋舉報(bào)
我們致力于提供一個(gè)高質(zhì)量內(nèi)容的交流平臺。為落實(shí)國家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評論自律管理,為了保護(hù)用戶創(chuàng)造的內(nèi)容、維護(hù)開放、真實(shí)、專業(yè)的平臺氛圍,我們團(tuán)隊(duì)將依據(jù)本公約中的條款對注冊用戶和發(fā)布在本平臺的內(nèi)容進(jìn)行管理。平臺鼓勵(lì)用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時(shí)也將采取必要措施管理違法、侵權(quán)或有其他不良影響的網(wǎng)絡(luò)信息。
一、根據(jù)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國未成年人保護(hù)法》等法律法規(guī),對以下違法、不良信息或存在危害的行為進(jìn)行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
1)反對憲法所確定的基本原則;
2)危害國家安全,泄露國家秘密,顛覆國家政權(quán),破壞國家統(tǒng)一,損害國家榮譽(yù)和利益;
3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽(yù)、榮譽(yù);
4)宣揚(yáng)恐怖主義、極端主義或者煽動(dòng)實(shí)施恐怖活動(dòng)、極端主義活動(dòng);
5)煽動(dòng)民族仇恨、民族歧視,破壞民族團(tuán)結(jié);
6)破壞國家宗教政策,宣揚(yáng)邪教和封建迷信;
7)散布謠言,擾亂社會秩序,破壞社會穩(wěn)定;
8)宣揚(yáng)淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
9)煽動(dòng)非法集會、結(jié)社、游行、示威、聚眾擾亂社會秩序;
10)侮辱或者誹謗他人,侵害他人名譽(yù)、隱私和其他合法權(quán)益;
11)通過網(wǎng)絡(luò)以文字、圖片、音視頻等形式,對未成年人實(shí)施侮辱、誹謗、威脅或者惡意損害未成年人形象進(jìn)行網(wǎng)絡(luò)欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法規(guī)禁止的其他內(nèi)容;
2. 不友善:不尊重用戶及其所貢獻(xiàn)內(nèi)容的信息或行為。主要表現(xiàn)為:
1)輕蔑:貶低、輕視他人及其勞動(dòng)成果;
2)誹謗:捏造、散布虛假事實(shí),損害他人名譽(yù);
3)嘲諷:以比喻、夸張、侮辱性的手法對他人或其行為進(jìn)行揭露或描述,以此來激怒他人;
4)挑釁:以不友好的方式激怒他人,意圖使對方對自己的言論作出回應(yīng),蓄意制造事端;
5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對方難堪;
6)謾罵:以不文明的語言對他人進(jìn)行負(fù)面評價(jià);
7)歧視:煽動(dòng)人群歧視、地域歧視等,針對他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
8)威脅:許諾以不良的后果來迫使他人服從自己的意志;
3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗(yàn)、擾亂本網(wǎng)站秩序的內(nèi)容,或進(jìn)行相關(guān)行為。主要表現(xiàn)為:
1)多次發(fā)布包含售賣產(chǎn)品、提供服務(wù)、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
2)單個(gè)帳號多次發(fā)布包含垃圾廣告的內(nèi)容;
3)多個(gè)廣告帳號互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點(diǎn)擊鏈接
5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當(dāng)曝光;
6)購買或出售帳號之間虛假地互動(dòng),發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關(guān)交易。
7)發(fā)布包含欺騙性的惡意營銷內(nèi)容,如通過偽造經(jīng)歷、冒充他人等方式進(jìn)行惡意營銷;
8)使用特殊符號、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。
4. 色情低俗信息,主要表現(xiàn)為:
1)包含自己或他人性經(jīng)驗(yàn)的細(xì)節(jié)描述或露骨的感受描述;
2)涉及色情段子、兩性笑話的低俗內(nèi)容;
3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
6)炒作緋聞、丑聞、劣跡等;
7)宣揚(yáng)低俗、庸俗、媚俗內(nèi)容。
5. 不實(shí)信息,主要表現(xiàn)為:
1)可能存在事實(shí)性錯(cuò)誤或者造謠等內(nèi)容;
2)存在事實(shí)夸大、偽造虛假經(jīng)歷等誤導(dǎo)他人的內(nèi)容;
3)偽造身份、冒充他人,通過頭像、用戶名等個(gè)人信息暗示自己具有特定身份,或與特定機(jī)構(gòu)或個(gè)人存在關(guān)聯(lián)。
6. 傳播封建迷信,主要表現(xiàn)為:
1)找人算命、測字、占卜、解夢、化解厄運(yùn)、使用迷信方式治病;
2)求推薦算命看相大師;
3)針對具體風(fēng)水等問題進(jìn)行求助或咨詢;
4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運(yùn)勢,東西寵物丟了能不能找回、取名改名等;
7. 文章標(biāo)題黨,主要表現(xiàn)為:
1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導(dǎo)用戶;
2)內(nèi)容與標(biāo)題之間存在嚴(yán)重不實(shí)或者原意扭曲;
3)使用夸張標(biāo)題,內(nèi)容與標(biāo)題嚴(yán)重不符的。
8.「飯圈」亂象行為,主要表現(xiàn)為:
1)誘導(dǎo)未成年人應(yīng)援集資、高額消費(fèi)、投票打榜
2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
3)鼓動(dòng)「飯圈」粉絲攀比炫富、奢靡享樂等行為
4)以號召粉絲、雇用網(wǎng)絡(luò)水軍、「養(yǎng)號」形式刷量控評等行為
5)通過「蹭熱點(diǎn)」、制造話題等形式干擾輿論,影響傳播秩序
9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
1)可能引發(fā)未成年人模仿不安全行為和違反社會公德行為、誘導(dǎo)未成年人不良嗜好影響未成年人身心健康的;
2)不當(dāng)評述自然災(zāi)害、重大事故等災(zāi)難的;
3)美化、粉飾侵略戰(zhàn)爭行為的;
4)法律、行政法規(guī)禁止,或可能對網(wǎng)絡(luò)生態(tài)造成不良影響的其他內(nèi)容。
二、違規(guī)處罰
本網(wǎng)站通過主動(dòng)發(fā)現(xiàn)和接受用戶舉報(bào)兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當(dāng)一個(gè)用戶發(fā)布違規(guī)內(nèi)容時(shí),本網(wǎng)站將依據(jù)相關(guān)用戶違規(guī)情節(jié)嚴(yán)重程度,對帳號進(jìn)行禁言 1 天、7 天、15 天直至永久禁言或封停賬號的處罰。當(dāng)涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊、使用帳號,或者濫用多個(gè)帳號發(fā)布違規(guī)內(nèi)容時(shí),本網(wǎng)站將加重處罰。
三、申訴
隨著平臺管理經(jīng)驗(yàn)的不斷豐富,本網(wǎng)站出于維護(hù)本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網(wǎng)站進(jìn)行反饋。
(規(guī)則的最終解釋權(quán)歸屬本網(wǎng)站所有)