聚類分析翻譯多少錢-什么是聚類分析?
日期:2023-03-11 12:39:36 / 人氣: 1001 / 發(fā)布者:成都翻譯公司
聚類分析翻譯了多少:什么是聚類分析?類將目標(biāo)數(shù)據(jù)放入少數(shù)相對(duì)同源的組或“集群”中。分析表達(dá)數(shù)據(jù),(1)通過一系列檢驗(yàn)將一組待測(cè)基因的變異標(biāo)準(zhǔn)化,然后成對(duì)比較線性協(xié)方差。 (2) 樣本聚類,將譜系*密切的基因放在一起,例如,使用簡單的層次聚類方法。這種聚類也可以擴(kuò)展到每個(gè)實(shí)驗(yàn)樣本,使用一組基因的總線性相關(guān)性聚類分析翻譯了多少:什么是聚類分析?
類將目標(biāo)數(shù)據(jù)放入少數(shù)相對(duì)同源的組或“集群”中。分析表達(dá)數(shù)據(jù),(1)通過一系列檢驗(yàn)將一組待測(cè)基因的變異標(biāo)準(zhǔn)化,然后成對(duì)比較線性協(xié)方差。 (2) 樣本聚類,將譜系*密切的基因放在一起,例如,使用簡單的層次聚類方法。這種聚類也可以擴(kuò)展到每個(gè)實(shí)驗(yàn)樣本,使用一組基因的總線性相關(guān)性進(jìn)行聚類。 (3)多維尺度分析(MDS)是一個(gè)二維歐氏“距離”,表示實(shí)驗(yàn)樣本的近似相關(guān)程度。 (4) K-means method clustering,一種通過重復(fù)重新分配類成員來*小化一個(gè)“類”內(nèi)分散程度的方法。
聚類方法有兩個(gè)明顯的局限性:第一、為了使聚類結(jié)果清晰,需要分離良好的數(shù)據(jù)。幾乎所有現(xiàn)有算法都從不同的非重疊類數(shù)據(jù)生成相同的集群。但是,如果類是分散的和相互滲透的,則每種算法的結(jié)果都會(huì)有些不同。因此,每個(gè)算法定義的邊界不明確,每個(gè)聚類算法都有自己的*優(yōu)結(jié)果,每個(gè)數(shù)據(jù)部分都會(huì)產(chǎn)生一條信息。為了說明相同的數(shù)據(jù)由于不同的算法產(chǎn)生不同的結(jié)果,需要注意不同的判斷方式。遺傳學(xué)家很難從任何算法(尤其是邊界)中正確解釋聚類內(nèi)容的實(shí)際結(jié)果。*終,需要經(jīng)驗(yàn)可信度來通過序列比較來指導(dǎo)聚類解釋。
第二個(gè)限制是由線性相關(guān)引起的。以上所有聚類方法都只分析了簡單的一對(duì)一關(guān)系。由于只是成對(duì)的線性比較,大大減少了發(fā)現(xiàn)表達(dá)類型關(guān)系的計(jì)算量,卻忽略了生物系統(tǒng)的多因素和非線性特性。
從統(tǒng)計(jì)學(xué)的角度來看,聚類分析是一種通過數(shù)據(jù)建模來簡化數(shù)據(jù)的方法。傳統(tǒng)的統(tǒng)計(jì)聚類分析方法包括系統(tǒng)聚類、分解、加法、動(dòng)態(tài)聚類、有序樣本聚類、重疊聚類和模糊聚類。許多著名的統(tǒng)計(jì)分析軟件包,如SPSS、SAS等,都加入了使用k-means、k-center point等算法的聚類分析工具。
從機(jī)器學(xué)習(xí)的角度來看,聚類等價(jià)于隱藏模式。聚類是搜索聚類的無監(jiān)督學(xué)習(xí)過程。與分類不同,無監(jiān)督學(xué)習(xí)不依賴于預(yù)定義的類或帶有類標(biāo)簽的訓(xùn)練示例。它需要由聚類學(xué)習(xí)算法自動(dòng)確定,而分類學(xué)習(xí)的實(shí)例或數(shù)據(jù)對(duì)象有類標(biāo)簽。聚類是觀察學(xué)習(xí),而不是示范學(xué)習(xí)。
從實(shí)際應(yīng)用的角度來看,聚類分析是數(shù)據(jù)挖掘的主要任務(wù)之一、就數(shù)據(jù)挖掘功能而言,聚類可以作為一個(gè)獨(dú)立的工具來獲取數(shù)據(jù)的分布,觀察每個(gè)數(shù)據(jù)簇的特征,并針對(duì)特定的簇進(jìn)行進(jìn)一步分析。
聚類分析也可以作為其他數(shù)據(jù)挖掘任務(wù)(如分類和關(guān)聯(lián)規(guī)則)的預(yù)處理步驟。
數(shù)據(jù)挖掘領(lǐng)域主要研究高效實(shí)用的大型數(shù)據(jù)庫和數(shù)據(jù)倉庫聚類分析算法。
聚類分析是數(shù)據(jù)挖掘中一個(gè)非?;钴S的研究領(lǐng)域,已經(jīng)提出了很多聚類算法。
這些算法可以分為劃分方法、層次方法、基于密度的方法、基于網(wǎng)格的方法和基于模型的方法。
1 分區(qū)方法(PAM:PARTitioningmethod)先創(chuàng)建k個(gè)分區(qū),k是要?jiǎng)?chuàng)建的分區(qū)數(shù);然后使用循環(huán)
定位技術(shù)通過將對(duì)象從一個(gè)分區(qū)移動(dòng)到另一種質(zhì)量來幫助改進(jìn)分區(qū)。典型的劃分方法包括:
k-means、k-medoids、CLARA(ClusteringLARgeApplication)、
CLARANS(ClusteringLargeApplicationbaseduponRANdomizedSearch)。 2 分層方法(hierarchicalmethod)創(chuàng)建層次結(jié)構(gòu)來分解給定的數(shù)據(jù)集。這種方法可以分為自頂向下(分解)和自底向上(合并)兩種操作模式。為了彌補(bǔ)分解和合并的缺點(diǎn),層次整合往往與其他聚類方法相結(jié)合,例如循環(huán)定位。典型的此類方法包括:
第一種是; BIRCH(BalancedIterativeRecingandClusteringusingHierarchies)方法,它首先利用樹的結(jié)構(gòu)來劃分對(duì)象集;然后使用其他聚類方法來優(yōu)化這些聚類。
第二種是CURE(ClusteringUsingREprisentatives)方法,用固定數(shù)量的代表對(duì)象來表示對(duì)應(yīng)的簇;然后每個(gè)集群按照指定的數(shù)量(向集群中心)收縮。
第三種是ROCK方法,利用簇之間的連接來合并簇。
*后一個(gè)CHEMALOEN是在層次聚類過程中構(gòu)建一個(gè)動(dòng)態(tài)模型。
3 基于密度方法,根據(jù)密度完成對(duì)象的聚類。它根據(jù)對(duì)象周圍的密度不斷增長簇(例如
DBSCAN)。典型的基于密度的方法包括:
DBSCAN(Densit-basedSpatialClusteringofApplicationwithNoise):該算法通過不斷增長的具有足夠高密度的區(qū)域來執(zhí)行聚類
;它可以從包含噪聲的空間數(shù)據(jù)庫中找到任意形狀的簇。該方法將簇定義為一組“密度連接”點(diǎn)。
OPTICS (OrderingPointsToIdentifytheClusteringStructure):不顯式生成
簇,而是計(jì)算增強(qiáng)的聚類順序以進(jìn)行自動(dòng)交互式聚類分析。 .
4 基于網(wǎng)格法,首先將物體空間劃分為有限單元,形成網(wǎng)格結(jié)構(gòu);然后使用網(wǎng)格結(jié)構(gòu)完成聚類。
STING (STatisticalINformationGrid) 是一種使用存儲(chǔ)在網(wǎng)格單元中的統(tǒng)計(jì)信息以
為基礎(chǔ)的網(wǎng)格聚類方法。
CLIQUE (ClusteringInQUEst) 和Wave-Cluster 是一種基于網(wǎng)格和基于密度的基于平方5 的模型方法的組合,它假設(shè)每個(gè)簇的模型并找到適合相應(yīng)模型的數(shù)據(jù)。典型的
基于模型的方法包括:
統(tǒng)計(jì)方法COBWEB:是一種常用且簡單的增量概念聚類方法。它的輸入對(duì)象由符號(hào)量(屬性-值)對(duì)描述。使用分類樹的形式創(chuàng)建層次聚類。
CLASSIT 是 COBWEB 的另一個(gè)版本。它可以執(zhí)行連續(xù)值屬性的增量聚合。它為每個(gè)節(jié)點(diǎn)中的每個(gè)屬性保存了相應(yīng)的連續(xù)正態(tài)分布(均值和方差);并且采用了改進(jìn)的分類能力描述方法,即不像COBWEB那樣計(jì)算離散屬性(值)
Sum是對(duì)連續(xù)屬性的積分。但是CLASSIT方法也有與COBWEB類似的問題。
所以它們不適合集群大型數(shù)據(jù)庫。
- 上一條翻譯一篇1500字英文要多少錢
- 下一條公證處翻譯英文多少錢
相關(guān)閱讀Relate
|
|
|
|
|
熱門文章 Recent
- 聚類分析翻譯多少錢-什么是聚類分析?2023-03-11
- 意大利語筆譯翻譯一千字多少錢2023-03-11
- 日語翻譯報(bào)價(jià)與什么有關(guān)2023-03-11
- 成都翻譯公司經(jīng)濟(jì)合同報(bào)價(jià)2023-03-11
- APP本地化翻譯,(應(yīng)用軟件本地化翻譯)2023-03-11
- 翻譯的價(jià)格與什么有關(guān)系2023-03-11
- 德語翻譯的價(jià)格2023-03-11
- 影響文件翻譯收費(fèi)的因素有哪些2023-03-11
- 化工翻譯如何報(bào)價(jià)?報(bào)價(jià)一般是多少2023-03-11
- 成都翻譯公司德語翻譯價(jià)格2023-03-11