chinesefreesexvideos高潮,欧美极品少妇性运交,久久久国产一区二区三区,99久久婷婷国产综合精品,成人国产一区二区三区

APP推廣合作
聯(lián)系“鳥(niǎo)哥筆記小喬”
數(shù)據(jù)分析—因子分析怎么用?
2021-05-27 17:28:54

數(shù)據(jù)分析中,主成分分析(PCA)是被大家熟知的數(shù)據(jù)降維方法。而因子分析和主成分分析是非常相似的兩種方法,他們都屬于多元統(tǒng)計(jì)分析里的降維方法。但因子分析最大的優(yōu)點(diǎn)就是:對(duì)新的因子能夠進(jìn)行命名和解釋?zhuān)挂蜃泳哂锌山忉屝?/strong>。因此,因子分析可以作為「需要滿足可解釋性數(shù)據(jù)建?!沟那捌跀?shù)據(jù)降維的方法。下文會(huì)介紹因子分析的原理邏輯、用途以及Python代碼的實(shí)現(xiàn)過(guò)程。

0什么是因子分析?

因子分析的起源是這樣的,1904年英國(guó)的一個(gè)心理學(xué)家發(fā)現(xiàn)學(xué)生的英語(yǔ)、法語(yǔ)和古典語(yǔ)成績(jī)非常有相關(guān)性,他認(rèn)為這三門(mén)課程背后有一個(gè)共同的因素驅(qū)動(dòng),最后將這個(gè)因素定義為“語(yǔ)言能力”?;谶@個(gè)想法,發(fā)現(xiàn)很多相關(guān)性很高的因素背后有共同的因子驅(qū)動(dòng),從而定義了因子分析。


因子分析在經(jīng)濟(jì)學(xué)、心理學(xué)、語(yǔ)言學(xué)和社會(huì)學(xué)等領(lǐng)域經(jīng)常被用到,一般會(huì)探索出背后的影響因素如:語(yǔ)言能力、智力、理解力等。這些因素都是無(wú)法直接計(jì)算,而是基于背后的調(diào)研數(shù)據(jù)所推算出的公共因子。


因此概括下,因子分析就是將存在某些相關(guān)性的變量提煉為較少的幾個(gè)因子,用這幾個(gè)因子去表示原本的變量,也可以根據(jù)因子對(duì)變量進(jìn)行分類(lèi)


【舉個(gè)例子】:學(xué)生有語(yǔ)文、英語(yǔ)、歷史、數(shù)學(xué)、物理、化學(xué)六門(mén)成績(jī),通過(guò)因子分析會(huì)發(fā)現(xiàn)這六門(mén)課由兩個(gè)公共因子驅(qū)動(dòng),前三門(mén)是由“文科”因子,后三門(mén)是“理科”因子;從而可以計(jì)算每個(gè)學(xué)生的文科得分和理科得分來(lái)評(píng)估他在兩個(gè)方面的表現(xiàn)。

0因子分析可以解決什么問(wèn)題?

1、在多變量場(chǎng)景下,挖掘背后影響因子

比如在企業(yè)和品牌調(diào)研中,消費(fèi)者會(huì)調(diào)查很多問(wèn)題來(lái)評(píng)估企業(yè)品牌;對(duì)這些問(wèn)題通過(guò)因子分析可以刻畫(huà)出背后少量的潛在影響因素。比如:服務(wù)質(zhì)量、商品質(zhì)量等等。

2、用于數(shù)學(xué)建模前的降維

因子分析和主成分分析都可用于降維;但因子分析的優(yōu)點(diǎn)是:因子作為新的解釋變量去建模,有更好的解釋性。

因此對(duì)于有些需要業(yè)務(wù)解釋的數(shù)據(jù)建模,可以在建模前通過(guò)因子分析提取關(guān)鍵因子,再用因子得分為解釋變量,通過(guò)回歸或者決策樹(shù)等分類(lèi)模型去建模。

0算法實(shí)現(xiàn)步驟

首先需要注意的是,和主成分分析一樣,兩種方法的目的都是降維,所以兩種方法的前提假設(shè)都是:特征之間不是完全互相交互。


因子分析是尋找不線性相關(guān)的“變量”的線性組合來(lái)表示原始變量,這些“變量”稱為因子,如下圖中的F就是因子,X是原始變量,eps是原始變量不可被公共因子表示的部分。


以上的公式還需要滿足:


要求因子的數(shù)據(jù)小于原始變量的數(shù)量,即m≤p


因子F之間是相互獨(dú)立且方差為1


因子F和eps之間的相關(guān)性為0,eps之間相關(guān)性為0


因此,因子分析的過(guò)程就是實(shí)現(xiàn)以下幾個(gè)目的的過(guò)程:


1)求解方程中的因子F的系數(shù)


2)給予因子F實(shí)際的解釋


3)展示原始特征和公共因子之間的關(guān)系,從而實(shí)現(xiàn)降維和特征分類(lèi)等目的


求解方程的過(guò)程,就是分析變量的相關(guān)系數(shù)矩陣,從而找到少數(shù)幾個(gè)隨機(jī)變量去描述所有變量;又因?yàn)榍蠼獾牟晃ㄒ恍?,最后通常?huì)對(duì)因子的載荷矩陣做一次正交旋轉(zhuǎn),目的是為了:方便理解每個(gè)因子的意義。


匯總一下:對(duì)于因子分析的實(shí)操可以提煉為以下幾個(gè)步驟:

1)充分性檢驗(yàn)

目的:檢驗(yàn)變量之間是否存在相關(guān)性,從而判斷是否適合做因子分析


方法:抽樣適合性檢驗(yàn)(KMO檢驗(yàn))或者 巴特利特檢驗(yàn)(Bartlett’s Test)


2)選擇因子個(gè)數(shù)

目的:通過(guò)數(shù)據(jù)定義最合適的潛在公共因子個(gè)數(shù),這個(gè)決定后面的因子分析效果


方法:Kaiser"s準(zhǔn)則 或者 累積貢獻(xiàn)率原則


3)提取公共因子并做因子旋轉(zhuǎn)

提取公共因子就是上面提到的求解函數(shù)的過(guò)程,一般求解方法有:主成分法、最大似然法、殘差最小法等等;

因子旋轉(zhuǎn)的原因是提取公共因子的解有很多,而因子旋轉(zhuǎn)后因子載荷矩陣將得到重新分配,可以使得旋轉(zhuǎn)后的因子更容易解釋。常用的方法是:方差最大法。

4)對(duì)因子做解釋和命名

目的:解釋和命名其實(shí)是對(duì)潛在因子理解的過(guò)程;這一步非常關(guān)鍵,需要非常了解業(yè)務(wù)才可。這也是我們使用因子分析的主要原因。


方法:根據(jù)因子載荷矩陣發(fā)現(xiàn)因子的特點(diǎn)。

5)計(jì)算因子得分

對(duì)每一樣本數(shù)據(jù),得到它們?cè)诓煌蜃由系木唧w數(shù)據(jù)值,這些數(shù)值就是因子得分。

0案例講解

數(shù)據(jù)集介紹:


美國(guó)洛杉磯2000年街區(qū)普查數(shù)據(jù),共有110個(gè)街區(qū),15個(gè)變量,變量具體情況見(jiàn)下表;想分析影響不同街區(qū)下人口分布的潛在因子。


第一步:數(shù)據(jù)預(yù)處理和分析:

新增“人口密度”特征,刪除特征人口量、面積、經(jīng)度和維度。

import pandas as pd 

import numpy as np

LA_data = pd.read_csv('LA.Nei**orhoods.csv')

# 新增人口密度,去掉人口量、面積、經(jīng)度和維度

LA_data['density'] = LA_data['Population']/LA_data['Area']

LA_data_final = LA_data.drop(['Population','Area','Longitude','Latitude'],axis=1)

LA_data_final_feat = LA_data_final.drop(['LA_Nbhd'],axis=1)


第二步:因子分析——充分性檢驗(yàn)

巴特利特P值小于0.01,KMO值大于0.6;說(shuō)明此數(shù)據(jù)適合做因子分析。

# 計(jì)算巴特利特P值from factor_analyzer.factor_analyzer import calculate_bartlett_sphericitychi_square_value,p_value=calculate_bartlett_sphericity(LA_data_final_feat)chi_square_value, p_value  

# 計(jì)算KMO值 

from factor_analyzer.factor_analyzer import calculate_kmokmo_all,kmo_model=calculate_kmo(LA_data_final_feat)print(kmo_model)

第三步:因子個(gè)數(shù)確定

特征值大于1的因子數(shù)有2個(gè),且兩個(gè)因子的累計(jì)方差有68%;因此確定因子個(gè)數(shù)為2個(gè)。


# Create factor analysis object and perform factor analysis

from factor_analyzer import FactorAnalyzer

fa = FactorAnalyzer(LA_data_final_feat.shape[1]+1, rotation=None)

fa.fit(LA_data_final_feat)ev, v = fa.get_eigenvalues() 

# 計(jì)算特征值和特征向量

var = fa.get_factor_variance()

#給出方差貢獻(xiàn)率


第四步:做因子分析

調(diào)用因子分析函數(shù),并得到因子載荷矩陣;從載荷矩陣可以看到,第一個(gè)因子和收入、有房家庭比例、復(fù)員軍人比例及歐裔比例成正相關(guān);第二個(gè)因子和非裔比例成正相關(guān),反而和收入及有房比例等成負(fù)相關(guān)。


fa = FactorAnalyzer(2, rotation="varimax")

fa.fit(LA_data_final_feat)

# 輸出載荷矩陣

df_loading = pd.DataFrame(fa.loadings_,index=LA_data_final_feat.columns.tolist())

df_loading


第五步:計(jì)算因子得分

其中因子1得分越大表示:收入、有房家庭比例、復(fù)員軍人比例及歐裔比例更高;因子2得分高表示:非裔人群比例更高。

#計(jì)算因子得分

LA_data_trans = pd.DataFrame(fa.transform(LA_data_final_feat),index=LA_data_final['LA_Nbhd'])

#以散點(diǎn)圖的形式呈現(xiàn)

plt.figure(figsize=(10,4), dpi= 80)

plt.subplot(1,2,1)

plt.scatter(LA_data_trans.loc[:,0],LA_data_trans.loc[:,1])

plt.title('Scree Plot')

plt.xlabel('Factor1')

plt.ylabel('Factor2')plt.grid()


  • 圖片


綜上,以上就是本文要介紹的全部?jī)?nèi)容;因子分析在互聯(lián)網(wǎng)數(shù)據(jù)分析場(chǎng)景下用到的比較少,主要原因就是很多人不知道怎么用?不知道用到哪里?希望看完文章的你能初步了解因子分析,能知道下面幾個(gè)問(wèn)題的答案(不記得就回頭看上面的介紹分享哦)。

1、什么是因子分析?

2、因子分析可以解決什么問(wèn)題?

3、因子分析的算法邏輯和分析流程是什么?

4、Python代碼如何實(shí)現(xiàn)?

-END-

運(yùn)營(yíng)那些事兒
分享到朋友圈
收藏
收藏
評(píng)分

綜合評(píng)分:

我的評(píng)分
Xinstall 15天會(huì)員特權(quán)
Xinstall是專(zhuān)業(yè)的數(shù)據(jù)分析服務(wù)商,幫企業(yè)追蹤渠道安裝來(lái)源、裂變拉新統(tǒng)計(jì)、廣告流量指導(dǎo)等,廣泛應(yīng)用于廣告效果統(tǒng)計(jì)、APP地推與CPS/CPA歸屬統(tǒng)計(jì)等方面。
20羽毛
立即兌換
一書(shū)一課30天會(huì)員體驗(yàn)卡
領(lǐng)30天VIP會(huì)員,110+門(mén)職場(chǎng)大課,250+本精讀好書(shū)免費(fèi)學(xué)!助你提升職場(chǎng)力!
20羽毛
立即兌換
順豐同城急送全國(guó)通用20元優(yōu)惠券
順豐同城急送是順豐推出的平均1小時(shí)送全城的即時(shí)快送服務(wù),專(zhuān)業(yè)安全,準(zhǔn)時(shí)送達(dá)!
30羽毛
立即兌換
運(yùn)營(yíng)那些事兒
運(yùn)營(yíng)那些事兒
發(fā)表文章43451
確認(rèn)要消耗 0羽毛購(gòu)買(mǎi)
數(shù)據(jù)分析—因子分析怎么用?嗎?
考慮一下
很遺憾,羽毛不足
我知道了

我們致力于提供一個(gè)高質(zhì)量?jī)?nèi)容的交流平臺(tái)。為落實(shí)國(guó)家互聯(lián)網(wǎng)信息辦公室“依法管網(wǎng)、依法辦網(wǎng)、依法上網(wǎng)”的要求,為完善跟帖評(píng)論自律管理,為了保護(hù)用戶創(chuàng)造的內(nèi)容、維護(hù)開(kāi)放、真實(shí)、專(zhuān)業(yè)的平臺(tái)氛圍,我們團(tuán)隊(duì)將依據(jù)本公約中的條款對(duì)注冊(cè)用戶和發(fā)布在本平臺(tái)的內(nèi)容進(jìn)行管理。平臺(tái)鼓勵(lì)用戶創(chuàng)作、發(fā)布優(yōu)質(zhì)內(nèi)容,同時(shí)也將采取必要措施管理違法、侵權(quán)或有其他不良影響的網(wǎng)絡(luò)信息。


一、根據(jù)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》《中華人民共和國(guó)未成年人保護(hù)法》等法律法規(guī),對(duì)以下違法、不良信息或存在危害的行為進(jìn)行處理。
1. 違反法律法規(guī)的信息,主要表現(xiàn)為:
    1)反對(duì)憲法所確定的基本原則;
    2)危害國(guó)家安全,泄露國(guó)家秘密,顛覆國(guó)家政權(quán),破壞國(guó)家統(tǒng)一,損害國(guó)家榮譽(yù)和利益;
    3)侮辱、濫用英烈形象,歪曲、丑化、褻瀆、否定英雄烈士事跡和精神,以侮辱、誹謗或者其他方式侵害英雄烈士的姓名、肖像、名譽(yù)、榮譽(yù);
    4)宣揚(yáng)恐怖主義、極端主義或者煽動(dòng)實(shí)施恐怖活動(dòng)、極端主義活動(dòng);
    5)煽動(dòng)民族仇恨、民族歧視,破壞民族團(tuán)結(jié);
    6)破壞國(guó)家宗教政策,宣揚(yáng)邪教和封建迷信;
    7)散布謠言,擾亂社會(huì)秩序,破壞社會(huì)穩(wěn)定;
    8)宣揚(yáng)淫穢、色情、賭博、暴力、兇殺、恐怖或者教唆犯罪;
    9)煽動(dòng)非法集會(huì)、結(jié)社、游行、示威、聚眾擾亂社會(huì)秩序;
    10)侮辱或者誹謗他人,侵害他人名譽(yù)、隱私和其他合法權(quán)益;
    11)通過(guò)網(wǎng)絡(luò)以文字、圖片、音視頻等形式,對(duì)未成年人實(shí)施侮辱、誹謗、威脅或者惡意損害未成年人形象進(jìn)行網(wǎng)絡(luò)欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法規(guī)禁止的其他內(nèi)容;


2. 不友善:不尊重用戶及其所貢獻(xiàn)內(nèi)容的信息或行為。主要表現(xiàn)為:
    1)輕蔑:貶低、輕視他人及其勞動(dòng)成果;
    2)誹謗:捏造、散布虛假事實(shí),損害他人名譽(yù);
    3)嘲諷:以比喻、夸張、侮辱性的手法對(duì)他人或其行為進(jìn)行揭露或描述,以此來(lái)激怒他人;
    4)挑釁:以不友好的方式激怒他人,意圖使對(duì)方對(duì)自己的言論作出回應(yīng),蓄意制造事端;
    5)羞辱:貶低他人的能力、行為、生理或身份特征,讓對(duì)方難堪;
    6)謾罵:以不文明的語(yǔ)言對(duì)他人進(jìn)行負(fù)面評(píng)價(jià);
    7)歧視:煽動(dòng)人群歧視、地域歧視等,針對(duì)他人的民族、種族、宗教、性取向、性別、年齡、地域、生理特征等身份或者歸類(lèi)的攻擊;
    8)威脅:許諾以不良的后果來(lái)迫使他人服從自己的意志;


3. 發(fā)布垃圾廣告信息:以推廣曝光為目的,發(fā)布影響用戶體驗(yàn)、擾亂本網(wǎng)站秩序的內(nèi)容,或進(jìn)行相關(guān)行為。主要表現(xiàn)為:
    1)多次發(fā)布包含售賣(mài)產(chǎn)品、提供服務(wù)、宣傳推廣內(nèi)容的垃圾廣告。包括但不限于以下幾種形式:
    2)單個(gè)帳號(hào)多次發(fā)布包含垃圾廣告的內(nèi)容;
    3)多個(gè)廣告帳號(hào)互相配合發(fā)布、傳播包含垃圾廣告的內(nèi)容;
    4)多次發(fā)布包含欺騙性外鏈的內(nèi)容,如未注明的淘寶客鏈接、跳轉(zhuǎn)網(wǎng)站等,誘騙用戶點(diǎn)擊鏈接
    5)發(fā)布大量包含推廣鏈接、產(chǎn)品、品牌等內(nèi)容獲取搜索引擎中的不正當(dāng)曝光;
    6)購(gòu)買(mǎi)或出售帳號(hào)之間虛假地互動(dòng),發(fā)布干擾網(wǎng)站秩序的推廣內(nèi)容及相關(guān)交易。
    7)發(fā)布包含欺騙性的惡意營(yíng)銷(xiāo)內(nèi)容,如通過(guò)偽造經(jīng)歷、冒充他人等方式進(jìn)行惡意營(yíng)銷(xiāo);
    8)使用特殊符號(hào)、圖片等方式規(guī)避垃圾廣告內(nèi)容審核的廣告內(nèi)容。


4. 色情低俗信息,主要表現(xiàn)為:
    1)包含自己或他人性經(jīng)驗(yàn)的細(xì)節(jié)描述或露骨的感受描述;
    2)涉及色情段子、兩性笑話的低俗內(nèi)容;
    3)配圖、頭圖中包含庸俗或挑逗性圖片的內(nèi)容;
    4)帶有性暗示、性挑逗等易使人產(chǎn)生性聯(lián)想;
    5)展現(xiàn)血腥、驚悚、殘忍等致人身心不適;
    6)炒作緋聞、丑聞、劣跡等;
    7)宣揚(yáng)低俗、庸俗、媚俗內(nèi)容。


5. 不實(shí)信息,主要表現(xiàn)為:
    1)可能存在事實(shí)性錯(cuò)誤或者造謠等內(nèi)容;
    2)存在事實(shí)夸大、偽造虛假經(jīng)歷等誤導(dǎo)他人的內(nèi)容;
    3)偽造身份、冒充他人,通過(guò)頭像、用戶名等個(gè)人信息暗示自己具有特定身份,或與特定機(jī)構(gòu)或個(gè)人存在關(guān)聯(lián)。


6. 傳播封建迷信,主要表現(xiàn)為:
    1)找人算命、測(cè)字、占卜、解夢(mèng)、化解厄運(yùn)、使用迷信方式治病;
    2)求推薦算命看相大師;
    3)針對(duì)具體風(fēng)水等問(wèn)題進(jìn)行求助或咨詢;
    4)問(wèn)自己或他人的八字、六爻、星盤(pán)、手相、面相、五行缺失,包括通過(guò)占卜方法問(wèn)婚姻、前程、運(yùn)勢(shì),東西寵物丟了能不能找回、取名改名等;


7. 文章標(biāo)題黨,主要表現(xiàn)為:
    1)以各種夸張、獵奇、不合常理的表現(xiàn)手法等行為來(lái)誘導(dǎo)用戶;
    2)內(nèi)容與標(biāo)題之間存在嚴(yán)重不實(shí)或者原意扭曲;
    3)使用夸張標(biāo)題,內(nèi)容與標(biāo)題嚴(yán)重不符的。


8.「飯圈」亂象行為,主要表現(xiàn)為:
    1)誘導(dǎo)未成年人應(yīng)援集資、高額消費(fèi)、投票打榜
    2)粉絲互撕謾罵、拉踩引戰(zhàn)、造謠攻擊、人肉搜索、侵犯隱私
    3)鼓動(dòng)「飯圈」粉絲攀比炫富、奢靡享樂(lè)等行為
    4)以號(hào)召粉絲、雇用網(wǎng)絡(luò)水軍、「養(yǎng)號(hào)」形式刷量控評(píng)等行為
    5)通過(guò)「蹭熱點(diǎn)」、制造話題等形式干擾輿論,影響傳播秩序


9. 其他危害行為或內(nèi)容,主要表現(xiàn)為:
    1)可能引發(fā)未成年人模仿不安全行為和違反社會(huì)公德行為、誘導(dǎo)未成年人不良嗜好影響未成年人身心健康的;
    2)不當(dāng)評(píng)述自然災(zāi)害、重大事故等災(zāi)難的;
    3)美化、粉飾侵略戰(zhàn)爭(zhēng)行為的;
    4)法律、行政法規(guī)禁止,或可能對(duì)網(wǎng)絡(luò)生態(tài)造成不良影響的其他內(nèi)容。


二、違規(guī)處罰
本網(wǎng)站通過(guò)主動(dòng)發(fā)現(xiàn)和接受用戶舉報(bào)兩種方式收集違規(guī)行為信息。所有有意的降低內(nèi)容質(zhì)量、傷害平臺(tái)氛圍及欺凌未成年人或危害未成年人身心健康的行為都是不能容忍的。
當(dāng)一個(gè)用戶發(fā)布違規(guī)內(nèi)容時(shí),本網(wǎng)站將依據(jù)相關(guān)用戶違規(guī)情節(jié)嚴(yán)重程度,對(duì)帳號(hào)進(jìn)行禁言 1 天、7 天、15 天直至永久禁言或封停賬號(hào)的處罰。當(dāng)涉及欺凌未成年人、危害未成年人身心健康、通過(guò)作弊手段注冊(cè)、使用帳號(hào),或者濫用多個(gè)帳號(hào)發(fā)布違規(guī)內(nèi)容時(shí),本網(wǎng)站將加重處罰。


三、申訴
隨著平臺(tái)管理經(jīng)驗(yàn)的不斷豐富,本網(wǎng)站出于維護(hù)本網(wǎng)站氛圍和秩序的目的,將不斷完善本公約。
如果本網(wǎng)站用戶對(duì)本網(wǎng)站基于本公約規(guī)定做出的處理有異議,可以通過(guò)「建議反饋」功能向本網(wǎng)站進(jìn)行反饋。
(規(guī)則的最終解釋權(quán)歸屬本網(wǎng)站所有)

我知道了
恭喜你~答對(duì)了
+5羽毛
下一次認(rèn)真讀哦
成功推薦給其他人
+ 10羽毛
評(píng)論成功且進(jìn)入審核!審核通過(guò)后,您將獲得10羽毛的獎(jiǎng)勵(lì)。分享本文章給好友閱讀最高再得15羽毛~
(羽毛可至 "羽毛精選" 兌換禮品)
好友微信掃一掃
復(fù)制鏈接