chinesefreesexvideos高潮,欧美极品少妇性运交,久久久国产一区二区三区,99久久婷婷国产综合精品,成人国产一区二区三区

APP推廣合作
聯(lián)系“鳥哥筆記小喬”
【漲姿勢(shì)】網(wǎng)易云音樂的精準(zhǔn)個(gè)性化推薦是怎么做到的?
2016-02-04 11:23:22
用過蝦米、酷狗、QQ音樂、網(wǎng)易云音樂,個(gè)人感受網(wǎng)易云音樂在音樂推薦這塊做的真心不錯(cuò),特別是以“人”為角度的推薦,沒有像蝦米、酷狗推的那么亂。蝦米還可以,但更多的是以歌搜歌的形式。剛注冊(cè)了一個(gè)新的賬號(hào),避免有歷史數(shù)據(jù)的干擾,聽了一首周杰倫的《一路向北》和陳奕迅的《淘汰》,然后去個(gè)性化推薦里看到了蔡健雅的《紅色高跟鞋》和曲婉婷的《承認(rèn)》,給我的感覺還是比較驚喜,像蔡健雅一般聽的人比較少,還能推薦到體驗(yàn)不錯(cuò)。當(dāng)然也有很多不一定特別準(zhǔn),當(dāng)然聽歌這東西就不需要完全準(zhǔn)確。

網(wǎng)易云音樂關(guān)于個(gè)性化推薦這塊在公司外部介紹的比較少,但應(yīng)該推薦的算法和機(jī)制和大部分的音樂素材的公司做的類似。以item為核心的協(xié)同過濾(CF),通過打分機(jī)制來推薦最適合的歌曲。

印象中早期網(wǎng)易云音樂還可以將自己聽的歌曲分享到微信朋友圈等,通過跳轉(zhuǎn)關(guān)聯(lián)到的賬戶ID識(shí)別出朋友關(guān)系。這個(gè)想法的確很贊,包括我第一次聽《一路向北》的時(shí)候也是一個(gè)朋友推薦給我的,這首歌不僅是個(gè)人喜歡的風(fēng)格,再加上有朋友推薦所以留下很好的印象。但是很可惜,現(xiàn)在朋友圈不能分享了。微博還可以分享,只是現(xiàn)在微博的數(shù)據(jù)很多水分。

現(xiàn)在主流的方式都是人工+智能推薦,人工的方式就不過多介紹,費(fèi)時(shí)費(fèi)力。出不了幾張有限的專輯?,F(xiàn)在主流都是通過機(jī)器學(xué)習(xí)的方式,通過同類人類的偏好給相似的人群推薦他們都喜歡的歌曲。也有根據(jù)以歌的item推薦相似的歌曲,但體驗(yàn)就是聽來聽去就是那個(gè)風(fēng)格,很快就乏味了。

算法部分:

1.相似人群的推薦

引用:著作權(quán)歸作者所有。
作者:邰原朗
鏈接:網(wǎng)易云音樂的歌單推薦算法是怎樣的? - 邰原朗的回答
來源:知乎

有3首歌放在那里,《最炫民族風(fēng)》,《晴天》,《Hero》。
A君,收藏了《最炫民族風(fēng)》,而遇到《晴天》,《Hero》則總是跳過;
B君,經(jīng)常單曲循環(huán)《最炫民族風(fēng)》,《晴天》會(huì)播放完,《Hero》則拉黑了
C君,拉黑了《最炫民族風(fēng)》,而《晴天》《Hero》都收藏了。

我們都看出來了,A,B二位品味接近,C和他們很不一樣。
那么問題來了,說A,B相似,到底有多相似,如何量化?

我們把三首歌想象成三維空間的三個(gè)維度,《最炫民族風(fēng)》是x軸,《晴天》是y軸,《Hero》是z軸,對(duì)每首歌的喜歡程度即該維度上的坐標(biāo),
并且對(duì)喜歡程度做量化(比如: 單曲循環(huán)=5, 分享=4, 收藏=3, 主動(dòng)播放=2 , 聽完=1, 跳過=-1 , 拉黑=-5 )。
那么每個(gè)人的總體口味就是一個(gè)向量,A君是 (3,-1,-1),B君是(5,1,-5),C君是(-5,3,3)。 (抱歉我不會(huì)畫立體圖)
我們可以用向量夾角的余弦值來表示兩個(gè)向量的相似程度, 0度角(表示兩人完全一致)的余弦是1, 180%角(表示兩人截然相反)的余弦是-1。

根據(jù)余弦公式, 夾角余弦 = 向量點(diǎn)積/ (向量長(zhǎng)度的叉積) = ( x1x2 + y1y2 + z1z2) / ( 跟號(hào)(x1平方+y1平方+z1平方 ) x 跟號(hào)(x2平方+y2平方+z2平方 ) )
可見 A君B君夾角的余弦是0.81 , A君C君夾角的余弦是 -0.97 ,公式誠(chéng)不欺我也。
以上是三維(三首歌)的情況,如法炮制N維N首歌的情況都是一樣的。
假設(shè)我們選取一百首種子歌曲,算出了各君之間的相似值,那么當(dāng)我們發(fā)現(xiàn)A君還喜歡聽的《小蘋果》B君居然沒聽過,相信大家都知道該怎么和B君推薦了吧。

第一類以人為本推薦算法的好處我想已經(jīng)很清楚了,那就是精準(zhǔn)!
代價(jià)是運(yùn)算量很大,而且對(duì)于新來的人(聽得少,動(dòng)作少),也不太好使,
所以人們又發(fā)明了第二類算法。

假設(shè)我們對(duì)新來的D君,只知道她喜歡最炫民族風(fēng),那么問題來了,給她推薦啥好咯?

如圖,推薦《晴天》!

以及nick lee分享的一種矩陣計(jì)算得分的方式:

這里我想給大家介紹另外一種推薦系統(tǒng),這種算法叫做潛在因子(Latent Factor)算法。這種算法是在NetFlix(沒錯(cuò),就是用大數(shù)據(jù)捧火《紙牌屋》的那家公司)的推薦算法競(jìng)賽中獲獎(jiǎng)的算法,最早被應(yīng)用于電影推薦中。這種算法在實(shí)際應(yīng)用中比現(xiàn)在排名第一的 @邰原朗 所介紹的算法誤差(RMSE)會(huì)小不少,效率更高。我下面僅利用基礎(chǔ)的矩陣知識(shí)來介紹下這種算法。

這種算法的思想是這樣:每個(gè)用戶(user)都有自己的偏好,比如A喜歡帶有小清新的、吉他伴奏的、王菲等元素(latent factor),如果一首歌(item)帶有這些元素,那么就將這首歌推薦給該用戶,也就是用元素去連接用戶和音樂。每個(gè)人對(duì)不同的元素偏好不同,而每首歌包含的元素也不一樣。我們希望能找到這樣兩個(gè)矩陣:

一,用戶-潛在因子矩陣Q,表示不同的用戶對(duì)于不用元素的偏好程度,1代表很喜歡,0代表不喜歡。比如下面這樣:

二,潛在因子-音樂矩陣P,表示每種音樂含有各種元素的成分,比如下表中,音樂A是一個(gè)偏小清新的音樂,含有小清新這個(gè)Latent Factor的成分是0.9,重口味的成分是0.1,優(yōu)雅的成分是0.2……

利用這兩個(gè)矩陣,我們能得出張三對(duì)音樂A的喜歡程度是:張三對(duì)小清新的偏好*音樂A含有小清新的成分+對(duì)重口味的偏好*音樂A含有重口味的成分+對(duì)優(yōu)雅的偏好*音樂A含有優(yōu)雅的成分+……

即:0.6*0.9+0.8*0.1+0.1*0.2+0.1*0.4+0.7*0=0.69
每個(gè)用戶對(duì)每首歌都這樣計(jì)算可以得到不同用戶對(duì)不同歌曲的評(píng)分矩陣
。(注,這里的破浪線表示的是估計(jì)的評(píng)分,接下來我們還會(huì)用到不帶波浪線的R表示實(shí)際的評(píng)分):

因此我們隊(duì)張三推薦四首歌中得分最高的B,對(duì)李四推薦得分最高的C,王五推薦B。
如果用矩陣表示即為:

下面問題來了,這個(gè)潛在因子(latent factor)是怎么得到的呢?

由于面對(duì)海量的讓用戶自己給音樂分類并告訴我們自己的偏好系數(shù)顯然是不現(xiàn)實(shí)的,事實(shí)上我們能獲得的數(shù)據(jù)只有用戶行為數(shù)據(jù)。我們沿用 @邰原朗的量化標(biāo)準(zhǔn):?jiǎn)吻h(huán)=5, 分享=4, 收藏=3, 主動(dòng)播放=2 , 聽完=1, 跳過=-2 , 拉黑=-5,在分析時(shí)能獲得的實(shí)際評(píng)分矩陣R,也就是輸入矩陣大概是這個(gè)樣子:

事實(shí)上這是個(gè)非常非常稀疏的矩陣,因?yàn)榇蟛糠钟脩糁宦犨^全部音樂中很少一部分。如何利用這個(gè)矩陣去找潛在因子呢?這里主要應(yīng)用到的是矩陣的UV分解。也就是將上面的評(píng)分矩陣分解為兩個(gè)低維度的矩陣,用Q和P兩個(gè)矩陣的乘積去估計(jì)實(shí)際的評(píng)分矩陣,而且我們希望估計(jì)的評(píng)分矩陣事實(shí)上這是個(gè)非常非常稀疏的矩陣,因?yàn)榇蟛糠钟脩糁宦犨^全部音樂中很少一部分。如何利用這個(gè)矩陣去找潛在因子呢?這里主要應(yīng)用到的是矩陣的UV分解。也就是將上面的評(píng)分矩陣分解為兩個(gè)低維度的矩陣,用Q和P兩個(gè)矩陣的乘積去估計(jì)實(shí)際的評(píng)分矩陣,而且我們希望估計(jì)的評(píng)分矩陣

和實(shí)際的評(píng)分矩陣不要相差太多,也就是求解下面的目標(biāo)函數(shù):

這里涉及到最優(yōu)化理論,在實(shí)際應(yīng)用中,往往還要在后面加上2范數(shù)的罰項(xiàng),然后利用梯度下降法就可以求得這P,Q兩個(gè)矩陣的估計(jì)值。這里我們就不展開說了。例如我們上面給出的那個(gè)例子可以分解成為這樣兩個(gè)矩陣:

這兩個(gè)矩陣相乘就可以得到估計(jì)的得分矩陣:這兩個(gè)矩陣相乘就可以得到估計(jì)的得分矩陣:

將用戶已經(jīng)聽過的音樂剔除后,選擇分?jǐn)?shù)最高音樂的推薦給用戶即可(紅體字)。將用戶已經(jīng)聽過的音樂剔除后,選擇分?jǐn)?shù)最高音樂的推薦給用戶即可(紅體字)。

在這個(gè)例子里面用戶7和用戶8有強(qiáng)的相似性:
從推薦的結(jié)果來看,正好推薦的是對(duì)方評(píng)分較高的音樂:

從推薦的結(jié)果來看,正好推薦的是對(duì)方評(píng)分較高的音樂:


本質(zhì)上應(yīng)該都類似,都是從Amazon那條路子下來的。但是這種方式也會(huì)遇到問題:

A)冷啟動(dòng)的問題,在沒有用戶數(shù)據(jù)的情況下要推哪些歌曲,目前網(wǎng)易云音樂搞了個(gè)比較Q的調(diào)查問卷,還是挺有趣的。

B)同質(zhì)化嚴(yán)重問題,怎么加入新的元素,比如熱門+新歌來補(bǔ)充這塊;

C)人群變化問題,光靠推薦很明顯不代表每個(gè)個(gè)體的情況,特別是一些小眾群體,數(shù)據(jù)比較稀疏。這些就需要用戶自己主動(dòng)搜索和添加、喜歡、下載的方式。

2.相似歌的推薦

蝦米、酷狗上都是這樣的歌曲漫游推薦的形式,個(gè)人不太提倡這樣的方式,簡(jiǎn)單認(rèn)為聽過A歌的人也可能喜歡B,這個(gè)差異還是比較大的。而且還是要維護(hù)一堆歌曲的tag標(biāo)簽。

整體來說,網(wǎng)易云音樂在個(gè)性化推薦這塊算法還是花了不少真功夫,所以要給個(gè)贊。看到他們?cè)谒惴ㄕ衅?、并發(fā)計(jì)算這些實(shí)時(shí)場(chǎng)景的介紹比較少,還是希望能夠有機(jī)會(huì)在線下能夠有這塊的交流。

文章來源:知乎    作者:宿痕
原文鏈接:http://zhuanlan.zhihu.com/dataman/20510761
運(yùn)營(yíng)那些事兒
分享到朋友圈
收藏
收藏
評(píng)分

綜合評(píng)分:

我的評(píng)分
Xinstall 15天會(huì)員特權(quán)
Xinstall是專業(yè)的數(shù)據(jù)分析服務(wù)商,幫企業(yè)追蹤渠道安裝來源、裂變拉新統(tǒng)計(jì)、廣告流量指導(dǎo)等,廣泛應(yīng)用于廣告效果統(tǒng)計(jì)、APP地推與CPS/CPA歸屬統(tǒng)計(jì)等方面。
20羽毛
立即兌換
一書一課30天會(huì)員體驗(yàn)卡
領(lǐng)30天VIP會(huì)員,110+門職場(chǎng)大課,250+本精讀好書免費(fèi)學(xué)!助你提升職場(chǎng)力!
20羽毛
立即兌換
順豐同城急送全國(guó)通用20元優(yōu)惠券
順豐同城急送是順豐推出的平均1小時(shí)送全城的即時(shí)快送服務(wù),專業(yè)安全,準(zhǔn)時(shí)送達(dá)!
30羽毛
立即兌換
運(yùn)營(yíng)那些事兒
運(yùn)營(yíng)那些事兒
發(fā)表文章43451
確認(rèn)要消耗 羽毛購(gòu)買
【漲姿勢(shì)】網(wǎng)易云音樂的精準(zhǔn)個(gè)性化推薦是怎么做到的?嗎?
考慮一下
很遺憾,羽毛不足
我知道了

我們致力于提供一個(gè)高質(zhì)量?jī)?nèi)容的交流平臺(tái)。為落實(shí)國(guó)家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評(píng)論自律管理,為了保護(hù)用戶創(chuàng)造的內(nèi)容、維護(hù)開放、真實(shí)、專業(yè)的平臺(tái)氛圍,我們團(tuán)隊(duì)將依據(jù)本公約中的條款對(duì)注冊(cè)用戶和發(fā)布在本平臺(tái)的內(nèi)容進(jìn)行管理。平臺(tái)鼓勵(lì)用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時(shí)也將采取必要措施管理違法、侵權(quán)或有其他不良影響的網(wǎng)絡(luò)信息。


一、根據(jù)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國(guó)未成年人保護(hù)法》等法律法規(guī),對(duì)以下違法、不良信息或存在危害的行為進(jìn)行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
    1)反對(duì)憲法所確定的基本原則;
    2)危害國(guó)家安全,泄露國(guó)家秘密,顛覆國(guó)家政權(quán),破壞國(guó)家統(tǒng)一,損害國(guó)家榮譽(yù)和利益;
    3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽(yù)、榮譽(yù);
    4)宣揚(yáng)恐怖主義、極端主義或者煽動(dòng)實(shí)施恐怖活動(dòng)、極端主義活動(dòng);
    5)煽動(dòng)民族仇恨、民族歧視,破壞民族團(tuán)結(jié);
    6)破壞國(guó)家宗教政策,宣揚(yáng)邪教和封建迷信;
    7)散布謠言,擾亂社會(huì)秩序,破壞社會(huì)穩(wěn)定;
    8)宣揚(yáng)淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
    9)煽動(dòng)非法集會(huì)、結(jié)社、游行、示威、聚眾擾亂社會(huì)秩序;
    10)侮辱或者誹謗他人,侵害他人名譽(yù)、隱私和其他合法權(quán)益;
    11)通過網(wǎng)絡(luò)以文字、圖片、音視頻等形式,對(duì)未成年人實(shí)施侮辱、誹謗、威脅或者惡意損害未成年人形象進(jìn)行網(wǎng)絡(luò)欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法規(guī)禁止的其他內(nèi)容;


2. 不友善:不尊重用戶及其所貢獻(xiàn)內(nèi)容的信息或行為。主要表現(xiàn)為:
    1)輕蔑:貶低、輕視他人及其勞動(dòng)成果;
    2)誹謗:捏造、散布虛假事實(shí),損害他人名譽(yù);
    3)嘲諷:以比喻、夸張、侮辱性的手法對(duì)他人或其行為進(jìn)行揭露或描述,以此來激怒他人;
    4)挑釁:以不友好的方式激怒他人,意圖使對(duì)方對(duì)自己的言論作出回應(yīng),蓄意制造事端;
    5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對(duì)方難堪;
    6)謾罵:以不文明的語(yǔ)言對(duì)他人進(jìn)行負(fù)面評(píng)價(jià);
    7)歧視:煽動(dòng)人群歧視、地域歧視等,針對(duì)他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類的攻擊;
    8)威脅:許諾以不良的后果來迫使他人服從自己的意志;


3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗(yàn)、擾亂本網(wǎng)站秩序的內(nèi)容,或進(jìn)行相關(guān)行為。主要表現(xiàn)為:
    1)多次發(fā)布包含售賣產(chǎn)品、提供服務(wù)、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
    2)單個(gè)帳號(hào)多次發(fā)布包含垃圾廣告的內(nèi)容;
    3)多個(gè)廣告帳號(hào)互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
    4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點(diǎn)擊鏈接
    5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當(dāng)曝光;
    6)購(gòu)買或出售帳號(hào)之間虛假地互動(dòng),發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關(guān)交易。
    7)發(fā)布包含欺騙性的惡意營(yíng)銷內(nèi)容,如通過偽造經(jīng)歷、冒充他人等方式進(jìn)行惡意營(yíng)銷;
    8)使用特殊符號(hào)、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。


4. 色情低俗信息,主要表現(xiàn)為:
    1)包含自己或他人性經(jīng)驗(yàn)的細(xì)節(jié)描述或露骨的感受描述;
    2)涉及色情段子、兩性笑話的低俗內(nèi)容;
    3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
    4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
    5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
    6)炒作緋聞、丑聞、劣跡等;
    7)宣揚(yáng)低俗、庸俗、媚俗內(nèi)容。


5. 不實(shí)信息,主要表現(xiàn)為:
    1)可能存在事實(shí)性錯(cuò)誤或者造謠等內(nèi)容;
    2)存在事實(shí)夸大、偽造虛假經(jīng)歷等誤導(dǎo)他人的內(nèi)容;
    3)偽造身份、冒充他人,通過頭像、用戶名等個(gè)人信息暗示自己具有特定身份,或與特定機(jī)構(gòu)或個(gè)人存在關(guān)聯(lián)。


6. 傳播封建迷信,主要表現(xiàn)為:
    1)找人算命、測(cè)字、占卜、解夢(mèng)、化解厄運(yùn)、使用迷信方式治??;
    2)求推薦算命看相大師;
    3)針對(duì)具體風(fēng)水等問題進(jìn)行求助或咨詢;
    4)問自己或他人的八字、六爻、星盤、手相、面相、五行缺失,包括通過占卜方法問婚姻、前程、運(yùn)勢(shì),東西寵物丟了能不能找回、取名改名等;


7. 文章標(biāo)題黨,主要表現(xiàn)為:
    1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來誘導(dǎo)用戶;
    2)內(nèi)容與標(biāo)題之間存在嚴(yán)重不實(shí)或者原意扭曲;
    3)使用夸張標(biāo)題,內(nèi)容與標(biāo)題嚴(yán)重不符的。


8.「飯圈」亂象行為,主要表現(xiàn)為:
    1)誘導(dǎo)未成年人應(yīng)援集資、高額消費(fèi)、投票打榜
    2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
    3)鼓動(dòng)「飯圈」粉絲攀比炫富、奢靡享樂等行為
    4)以號(hào)召粉絲、雇用網(wǎng)絡(luò)水軍、「養(yǎng)號(hào)」形式刷量控評(píng)等行為
    5)通過「蹭熱點(diǎn)」、制造話題等形式干擾輿論,影響傳播秩序


9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
    1)可能引發(fā)未成年人模仿不安全行為和違反社會(huì)公德行為、誘導(dǎo)未成年人不良嗜好影響未成年人身心健康的;
    2)不當(dāng)評(píng)述自然災(zāi)害、重大事故等災(zāi)難的;
    3)美化、粉飾侵略戰(zhàn)爭(zhēng)行為的;
    4)法律、行政法規(guī)禁止,或可能對(duì)網(wǎng)絡(luò)生態(tài)造成不良影響的其他內(nèi)容。


二、違規(guī)處罰
本網(wǎng)站通過主動(dòng)發(fā)現(xiàn)和接受用戶舉報(bào)兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺(tái)氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當(dāng)一個(gè)用戶發(fā)布違規(guī)內(nèi)容時(shí),本網(wǎng)站將依據(jù)相關(guān)用戶違規(guī)情節(jié)嚴(yán)重程度,對(duì)帳號(hào)進(jìn)行禁言 1 天、7 天、15 天直至永久禁言或封停賬號(hào)的處罰。當(dāng)涉及欺凌未成年人、危害未成年人身心健康、通過作弊手段注冊(cè)、使用帳號(hào),或者濫用多個(gè)帳號(hào)發(fā)布違規(guī)內(nèi)容時(shí),本網(wǎng)站將加重處罰。


三、申訴
隨著平臺(tái)管理經(jīng)驗(yàn)的不斷豐富,本網(wǎng)站出于維護(hù)本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對(duì)本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過「建議反饋」功能向本網(wǎng)站進(jìn)行反饋。
(規(guī)則的最終解釋權(quán)歸屬本網(wǎng)站所有)

我知道了
恭喜你~答對(duì)了
+5羽毛
下一次認(rèn)真讀哦
成功推薦給其他人
+ 10羽毛
評(píng)論成功且進(jìn)入審核!審核通過后,您將獲得10羽毛的獎(jiǎng)勵(lì)。分享本文章給好友閱讀最高再得15羽毛~
(羽毛可至 "羽毛精選" 兌換禮品)
好友微信掃一掃
復(fù)制鏈接