- 相關(guān)推薦
聚類分析在用戶分類中的應(yīng)用
什么是聚類分析?
聚類分析屬于探索性的數(shù)據(jù)分析方法。通常,我們利用聚類分析將看似無(wú)序的對(duì)象進(jìn)行分組、歸類,以達(dá)到更好地理解研究對(duì)象的目的。聚類結(jié)果要求組內(nèi)對(duì)象相似性較高,組間對(duì)象相似性較低。在用戶研究中,很多問(wèn)題可以借助聚類分析來(lái)解決,比如,網(wǎng)站的信息分類問(wèn)題、網(wǎng)頁(yè)的點(diǎn)擊行為關(guān)聯(lián)性問(wèn)題以及用戶分類問(wèn)題等等。其中,用戶分類是最常見的情況。
聚類分析的基本過(guò)程是怎樣的?
選擇聚類變量
聚類分析
找出各類用戶的重要特征
聚類解釋&命名選擇聚類變量
在設(shè)計(jì)問(wèn)卷的時(shí)候,我們會(huì)根據(jù)一定的假設(shè),盡可能選取對(duì)產(chǎn)品使用行為有影響的變量,這些變量一般包含與產(chǎn)品密切相關(guān)的用戶態(tài)度、觀點(diǎn)、行為。但是,聚類分析過(guò)程對(duì)用于聚類的變量還有一定的要求:
這些變量在不同研究對(duì)象上的值具有明顯差異;
這些變量之間不能存在高度相關(guān)。因?yàn)椋紫,用于聚類的變量?shù)目不是越多越好,沒(méi)有明顯差異的變量對(duì)聚類沒(méi)有起到實(shí)質(zhì)意義,而且可能使結(jié)果產(chǎn)生偏差;其次,高度相關(guān)的變量相當(dāng)于給這些變量進(jìn)行了加權(quán),等于放大了某方面因素對(duì)用戶分類的作用。
識(shí)別合適的聚類變量的方法:
對(duì)變量做聚類分析,從聚得的各類中挑選出一個(gè)有代表性的變量;
做主成份分析或因子分析,產(chǎn)生新的變量作為聚類變量。聚類分析
相對(duì)于聚類前的準(zhǔn)備工作,真正的執(zhí)行過(guò)程顯得異常簡(jiǎn)單。數(shù)據(jù)準(zhǔn)備好后,丟到統(tǒng)計(jì)軟件(通常是spss)里面跑一下,結(jié)果就出來(lái)了。
這里面遇到的一個(gè)問(wèn)題是,把用戶分成多少類合適?通常,可以結(jié)合幾個(gè)標(biāo)準(zhǔn)綜合判斷:
看拐點(diǎn)(層次聚類會(huì)出來(lái)聚合系數(shù)圖,如右圖,一般選擇拐點(diǎn)附近的幾個(gè)類別)
憑經(jīng)驗(yàn)或產(chǎn)品特性判斷(不同產(chǎn)品的用戶差異性也不同)
在邏輯上能夠清楚地解釋找出各類用戶的重要特征
確定一種分類方案之后,接下來(lái),我們需要返回觀察各類別用戶在各個(gè)變量上的表現(xiàn)。根據(jù)差異檢驗(yàn)的結(jié)果,我們以顏色區(qū)分出不同類用戶在這項(xiàng)指標(biāo)上的水平高低。如下圖,紅色代表“遠(yuǎn)遠(yuǎn)高于平均水平”,黃色代表“平均水平”,藍(lán)色代表“遠(yuǎn)遠(yuǎn)低于平均水平”。其他變量以此類推。最后,我們會(huì)發(fā)現(xiàn)不同類別用戶有別于其他類別用戶的重要特征。
聚類解釋&命名
在理解和解釋用戶分類時(shí),最好可以結(jié)合更多的數(shù)據(jù),例如,人口統(tǒng)計(jì)學(xué)數(shù)據(jù)、功能偏好數(shù)據(jù)等等(如下圖)……最后,選取每一類別最明顯的幾個(gè)特征為其命名,就大功告成啦!
[聚類分析在用戶分類中的應(yīng)用]相關(guān)文章:
【聚類分析在用戶分類中的應(yīng)用】相關(guān)文章:
用戶在每個(gè)情景中的角色感07-14
網(wǎng)站的用戶體驗(yàn)是建設(shè)中的關(guān)鍵環(huán)節(jié)07-14
手機(jī)應(yīng)用實(shí)例講述用戶體驗(yàn)設(shè)計(jì)給創(chuàng)業(yè)企業(yè)的一課07-03
盤點(diǎn)教育培訓(xùn)網(wǎng)站中那些不好的用戶體驗(yàn)(二)07-14
網(wǎng)站優(yōu)化中如何寫出滿足用戶需求的文章07-14
網(wǎng)站設(shè)計(jì)中自以為“加強(qiáng)”用戶體驗(yàn)的那點(diǎn)事07-14
文字在平面設(shè)計(jì)中的應(yīng)用07-14
《微表情在面試中的應(yīng)用》淺談07-11