欧美日韩在线免费,蜜桃视频在线观看免费,成人激情在线

網(wǎng)站首頁 > 學(xué)術(shù)探索 > 科技前沿 > 閱讀信息

十大必須掌握的機(jī)器學(xué)習(xí)算法，竟然都如此有趣

點擊：作者：錢塘號來源：諸葛智庫發(fā)布時間:2018-10-22 11:41:45

導(dǎo)讀：通過本篇文章可以對ML的常用算法有個常識性的認(rèn)識，沒有代碼，沒有復(fù)雜的理論推導(dǎo)，就是圖解一下，知道這些算法是什么，它們是怎么應(yīng)用的，例子主要是分類問題。

今天的算法如下：

1 決策樹

2 隨機(jī)森林算法

3 邏輯回歸

4 SVM

5 樸素貝葉斯

6 K最近鄰算法

7 K均值算法

8 Adaboost算法

9 神經(jīng)網(wǎng)絡(luò)

10 馬爾可夫

1. 決策樹

根據(jù)一些 feature 進(jìn)行分類，每個節(jié)點提一個問題，通過判斷，將數(shù)據(jù)分為兩類，再繼續(xù)提問。這些問題是根據(jù)已有數(shù)據(jù)學(xué)習(xí)出來的，再投入新數(shù)據(jù)的時候，就可以根據(jù)這棵樹上的問題，將數(shù)據(jù)劃分到合適的葉子上。

2、隨機(jī)森林

在源數(shù)據(jù)中隨機(jī)選取數(shù)據(jù)，組成幾個子集：

S矩陣是源數(shù)據(jù)，有1-N條數(shù)據(jù)，A、B、C 是feature，最后一列C是類別：

由S隨機(jī)生成M個子矩陣：

這M個子集得到 M 個決策樹：

將新數(shù)據(jù)投入到這M個樹中，得到M個分類結(jié)果，計數(shù)看預(yù)測成哪一類的數(shù)目最多，就將此類別作為最后的預(yù)測結(jié)果。

3、邏輯回歸

當(dāng)預(yù)測目標(biāo)是概率這樣的，值域需要滿足大于等于0，小于等于1的，這個時候單純的線性模型是做不到的，因為在定義域不在某個范圍之內(nèi)時，值域也超出了規(guī)定區(qū)間。

所以此時需要這樣的形狀的模型會比較好：

那么怎么得到這樣的模型呢？

這個模型需要滿足兩個條件 “大于等于0”，“小于等于1”

大于等于0 的模型可以選擇絕對值，平方值，這里用指數(shù)函數(shù)，一定大于0；

小于等于1 用除法，分子是自己，分母是自身加上1，那一定是小于1的了。

再做一下變形，就得到了 logistic regressions 模型：

通過源數(shù)據(jù)計算可以得到相應(yīng)的系數(shù)了：

最后得到 logistic 的圖形：

4、SVM

要將兩類分開，想要得到一個超平面，最優(yōu)的超平面是到兩類的 margin 達(dá)到最大，margin就是超平面與離它最近一點的距離，如下圖，Z2>Z1，所以綠色的超平面比較好。

將這個超平面表示成一個線性方程，在線上方的一類，都大于等于1，另一類小于等于－1：

點到面的距離根據(jù)圖中的公式計算：

所以得到total margin的表達(dá)式如下，目標(biāo)是最大化這個margin，就需要最小化分母，于是變成了一個優(yōu)化問題：

舉個例子，三個點，找到最優(yōu)的超平面，定義了 weight vector＝（2，3）－（1，1）：

得到weight vector為（a，2a），將兩個點代入方程，代入（2，3）另其值＝1，代入（1，1）另其值＝-1，求解出 a 和截矩 w0 的值，進(jìn)而得到超平面的表達(dá)式。

a求出來后，代入（a，2a）得到的就是support vector，

a和w0代入超平面的方程就是support vector machine。

5、樸素貝葉斯

舉個在 NLP 的應(yīng)用：

給一段文字，返回情感分類，這段文字的態(tài)度是positive，還是negative：

為了解決這個問題，可以只看其中的一些單詞：

這段文字，將僅由一些單詞和它們的計數(shù)代表：

原始問題是：給你一句話，它屬于哪一類？

通過bayes rules變成一個比較簡單容易求得的問題：

問題變成，這一類中這句話出現(xiàn)的概率是多少，當(dāng)然，別忘了公式里的另外兩個概率。

例子：單詞“love”在positive的情況下出現(xiàn)的概率是 0.1，在negative的情況下出現(xiàn)的概率是0.001。

6、K最近臨算法

給一個新的數(shù)據(jù)時，離它最近的 k 個點中，哪個類別多，這個數(shù)據(jù)就屬于哪一類。

例子：要區(qū)分“貓”和“狗”，通過“claws”和“sound”兩個feature來判斷的話，圓形和三角形是已知分類的了，那么這個“star”代表的是哪一類呢？

k＝3時，這三條線鏈接的點就是最近的三個點，那么圓形多一些，所以這個star就是屬于貓。

7、K均值算法

先要將一組數(shù)據(jù)，分為三類，粉色數(shù)值大，黃色數(shù)值小。

最開始先初始化，這里面選了最簡單的 3，2，1 作為各類的初始值。

剩下的數(shù)據(jù)里，每個都與三個初始值計算距離，然后歸類到離它最近的初始值所在類別。

分好類后，計算每一類的平均值，作為新一輪的中心點：

幾輪之后，分組不再變化了，就可以停止了：

8、Adaboost

adaboost 是 bosting 的方法之一。

bosting就是把若干個分類效果并不好的分類器綜合起來考慮，會得到一個效果比較好的分類器。

下圖，左右兩個決策樹，單個看是效果不怎么好的，但是把同樣的數(shù)據(jù)投入進(jìn)去，把兩個結(jié)果加起來考慮，就會增加可信度。

adaboost 的例子，手寫識別中，在畫板上可以抓取到很多 features，例如始點的方向，始點和終點的距離等等。

training的時候，會得到每個feature的weight，例如2和3的開頭部分很像，這個feature對分類起到的作用很小，它的權(quán)重也就會較小。

而這個alpha角就具有很強(qiáng)的識別性，這個feature的權(quán)重就會較大，最后的預(yù)測結(jié)果是綜合考慮這些feature的結(jié)果。

9、網(wǎng)絡(luò)神經(jīng)

Neural Networks適合一個input可能落入至少兩個類別里：

NN由若干層神經(jīng)元，和它們之間的聯(lián)系組成。

第一層是input層，最后一層是output層。

在hidden層和output層都有自己的classifier。

input輸入到網(wǎng)絡(luò)中，被激活，計算的分?jǐn)?shù)被傳遞到下一層，激活后面的神經(jīng)層，最后output層的節(jié)點上的分?jǐn)?shù)代表屬于各類的分?jǐn)?shù)，下圖例子得到分類結(jié)果為class 1；

同樣的input被傳輸?shù)讲煌墓?jié)點上，之所以會得到不同的結(jié)果是因為各自節(jié)點有不同的weights 和bias，這也就是forward propagation。

10、馬爾可夫

Markov Chains 由state和transitions組成。

例子，根據(jù)這一句話 ‘the quick brown fox jumps over the lazy dog’，要得到markov chains。

步驟，先給每一個單詞設(shè)定成一個狀態(tài)，然后計算狀態(tài)間轉(zhuǎn)換的概率。

這是一句話計算出來的概率，當(dāng)你用大量文本去做統(tǒng)計的時候，會得到更大的狀態(tài)轉(zhuǎn)移矩陣，例如the后面可以連接的單詞，及相應(yīng)的概率。

生活中，鍵盤輸入法的備選結(jié)果也是一樣的原理，模型會更高級。

來源：錢塘號

責(zé)任編輯：向太陽

特別申明：

1、本文只代表作者個人觀點，不代表本站觀點，僅供大家學(xué)習(xí)參考；

2、本站屬于非營利性網(wǎng)站，如涉及版權(quán)和名譽(yù)問題，請及時與本站聯(lián)系，我們將及時做相應(yīng)處理；

3、歡迎各位網(wǎng)友光臨閱覽，文明上網(wǎng)，依法守規(guī)，IP可查。

作者相關(guān)信息

十大必須掌握的機(jī)器學(xué)習(xí)算法，竟然都如此有趣

2018-10-22

錢塘號：還原真實的中國教育：底層選擇放棄，中產(chǎn)

2018-10-16

內(nèi)容相關(guān)信息

十大必須掌握的機(jī)器學(xué)習(xí)算法，竟然都如此有趣

2018-10-22

智能的本質(zhì) ：人工智能與機(jī)器人領(lǐng)域的64個大問題

2018-05-31

首只無線飛行機(jī)器昆蟲問世

2018-05-22

軍事機(jī)器人將帶來空前革命：自動武器是一個規(guī)則改變者

2018-02-16

殺手機(jī)器人，未來無人戰(zhàn)爭新武器

2017-11-29

? 昆侖專題 ?

? 十九大報告深度談 ?

朱佳木：習(xí)近平新時代中國特色社會主義思想的鮮明特色——黨的十九大報告學(xué)習(xí)體會

李慎明：正確認(rèn)識和科學(xué)把握中國特色社會主義新時代社會主要矛盾——學(xué)習(xí)黨的十九大報告的體會

翟建國：淺談我及我身邊的人如何貫徹學(xué)習(xí)十九大精神

蔡長運(yùn)：正本清源，不忘初心——學(xué)習(xí)十九大報告心得

翟建國：十九大精神滋養(yǎng)我們的生命

? 新征程新任務(wù) 新前景 ?

不忘初心，繼續(xù)前進(jìn)——北大教授韓毓海 2018年北京延安兒女團(tuán)拜會上的發(fā)言

十九屆二中全會公報透露“修改憲法部分內(nèi)容”12條新信息

十九屆二中全會公報：更好發(fā)揮憲法在新時代堅持和發(fā)展中國特色社會主義中的重大作用

2018年，習(xí)主席推動一場革命、繼續(xù)革命、自我革命

習(xí)近平向全軍發(fā)布訓(xùn)令（附現(xiàn)場視頻）

? 習(xí)近平治國理政理論與實踐 ?

習(xí)近平：惡竹應(yīng)須斬萬竿

陳小林：習(xí)近平加強(qiáng)中央軍委作風(fēng)建設(shè)的五大看點

侯立虹：習(xí)近平譜寫改革開放最輝煌篇章

習(xí)近平倡導(dǎo)的五種思維方式

深刻領(lǐng)會和把握習(xí)近平總書記參觀撫順雷鋒紀(jì)念館重大意義

? 我為中國夢獻(xiàn)一策 ?

張顯良：深入貫徹十九大精神，加快推進(jìn)漁業(yè)信息化的戰(zhàn)略思考

顧士剛：農(nóng)村宣傳十九大精神之我見

侍旭：高校思想政治工作要直面問題有作為

石中英：“雙一流”建設(shè)不能片面以西方標(biāo)準(zhǔn)評判

郭宗華：多年來能源改革大旗高揚(yáng)，到底改革了什么？

? 國資國企改革 ?

肖斌：國企改革發(fā)展是振興實體經(jīng)濟(jì)的壓艙石

堅持問題導(dǎo)向鼓勵探索創(chuàng)新深入推進(jìn)國企改革“雙百行動”

李曉鵬：理解國企民企之爭，需真正理解前三十年和后四十年關(guān)系

國資委：“混改”雙向雙贏，不存在誰進(jìn)誰退的問題

張喜亮：一位研究員的離職對國有企業(yè)深化改革的啟示

? 雄安新區(qū)建設(shè) ?

張宏良：雄安——社會主義共享經(jīng)濟(jì)試驗區(qū)

首個由雄安制定的智慧城市國際標(biāo)準(zhǔn)提案獲通過

清華教授尹稚：一年多過去了，雄安為啥還沒啟動大規(guī)模建設(shè)？

雄安形象宣傳片震撼發(fā)布，新時代中國的詩和遠(yuǎn)方

千年雄安：新時代中國的詩與遠(yuǎn)方

? 黨要管黨從嚴(yán)治黨 ?

黨員發(fā)表堅持資產(chǎn)階級自由化立場言論將被開除黨籍

中央編辦：準(zhǔn)確把握機(jī)構(gòu)編制工作政治方向

黨紀(jì)處分條例全文+修訂對照+解讀來了！這些“高壓線”不能碰

中共時隔近三年再修黨紀(jì)條例這些“高壓線”不能碰！

熱點排行

一周

一月

半年

郭松民：為什么說崔永元捅破了天?

歷史留給美國的時間不多了？前商務(wù)部副部長深度分析中美貿(mào)易戰(zhàn)

一身冷汗！華為重磅炸彈，16800元！

中美博弈的終極時間表（好文，強(qiáng)烈推薦）

一場精心謀劃的滅國行動：“抗戰(zhàn)老兵”的故事沒一個是真的！

再也不罵中國鐵路了！中美背后的交鋒驚心動魄

王今朝：應(yīng)把美國對華貿(mào)易戰(zhàn)看作旨在掩蓋中國一些人試圖最終完成私有化圖謀

披露：蘇聯(lián)解體前400多名高層領(lǐng)導(dǎo)已被共濟(jì)會收買！

張文木：戰(zhàn)略研究最忌大而無當(dāng)

戴旭：警惕特朗“掏槍”——“中國殺開關(guān)”及臺海局勢突變

熊蕾：到底是誰在篡改我們的歷史？

胡澄：從范冰冰被“無罪”看法律的階級性

郭松民：為什么說崔永元捅破了天?

歷史留給美國的時間不多了？前商務(wù)部副部長深度分析中美貿(mào)易戰(zhàn)

一身冷汗！華為重磅炸彈，16800元！

崔永元隔空回應(yīng)上海警方，那么彭明達(dá)是誰？

最新重磅：剛剛，崔永元再次冒死實名舉報的竟然是他！

何干強(qiáng)：決不允許某論壇的重要成員打著“改革”幌子發(fā)表違憲主張

張宏良：“不沖突不對抗”政策將會帶來全面戰(zhàn)爭

尹帥軍：從偷稅涉案8億不用坐牢再到謀反也有免死金牌

崔永元：因遭十次死亡威脅，資料已藏多處，陰陽合同只是他們洗錢手法之一

范冰冰案揭示的法理要害

胡澄：從范冰冰被“無罪”看法律的階級性

王立華：這次修憲有“五個好”

林彪的早年文章，現(xiàn)在讀來依然一身冷汗！

郭松民：為什么說崔永元捅破了天?

歷史留給美國的時間不多了？前商務(wù)部副部長深度分析中美貿(mào)易戰(zhàn)

中科院調(diào)查：中國農(nóng)村現(xiàn)狀令人觸目驚心

俄羅斯披露的朝鮮戰(zhàn)爭的真相，令你大吃一驚

緊急呼吁：請重視海南等地在引進(jìn)外國人口方面的大躍進(jìn)！

一身冷汗！華為重磅炸彈，16800元！

警惕：留學(xué)生政策漏洞將中國推進(jìn)恐襲深淵

小崔，忘掉范冰冰吧，今天，這張圖片再次讓國人怒不可言！

建言點贊

一周

一月

半年

孟廣竹：重要的問題，是確保在社會主義市場經(jīng)濟(jì)條件下的價值理念與黨的理想信念宗旨意識在同一軌道

張文木：戰(zhàn)略研究最忌大而無當(dāng)

張文木：中國地緣政治研究要為國家利益服務(wù)（上）

改革開放的社會主義方向不容動搖——新時代改革方向問題學(xué)術(shù)研討會紀(jì)要

張維為哈佛演講：驅(qū)散中美關(guān)系上空的烏云

金民卿：為堅定正確的政治方向提供紀(jì)律保證

趙可銘：必須排除新自由主義對我國經(jīng)濟(jì)改革的干擾

檀有志：特朗普政府網(wǎng)絡(luò)安全政策走勢及中國應(yīng)對方略

趙可銘：必須排除新自由主義對我國經(jīng)濟(jì)改革的干擾

李萬：正視科技“雙刃劍”的疊加效應(yīng)

楊平：社會科學(xué)，需認(rèn)真審視自己的落伍狀態(tài)

魏傳光：警惕理論研究中的“西方中心主義”

周新城：必須牢記美國的帝國主義本質(zhì)——學(xué)習(xí)毛澤東有關(guān)帝國主義本質(zhì)的論述

王東：以革命文化涵養(yǎng)黨內(nèi)政治文化

張文木：振興東北老工業(yè)基地意義深遠(yuǎn)——基于地緣政治的視角

貿(mào)易戰(zhàn)：優(yōu)勢輸美商品應(yīng)該借機(jī)提價

政霖：警惕！關(guān)于中美貿(mào)易戰(zhàn)，別讓“合作共贏”的論調(diào)影響了判斷！

國資委黨委書記郝鵬：新時代國有企業(yè)黨的建設(shè)的根本指南

余云輝、于中寅：治金融若烹小鮮，不可瞎折騰——當(dāng)前資本市場流動性危機(jī)的成因及其救市對策

牢記共產(chǎn)黨人的“特權(quán)”是吃苦

朱炳元：警惕馬克思主義空心化

邱霞：警惕將馬克思主義“虛名化”的現(xiàn)象

黃樹東：中國決不能丟掉土地公有這個制度紅利

攻克核心技術(shù)需建立“試用生態(tài)”

胡新民：紀(jì)念改革開放，應(yīng)與黨中央保持一致，切忌搞“憶苦思甜”

中醫(yī)藥發(fā)展急需前沿技術(shù)支撐

江涌：美元、美諜、美軍三位一體——中國要警惕美元陷阱

閆巖：黨員干部要爭做忠誠干凈擔(dān)當(dāng)?shù)臉?biāo)桿

熊丙奇：“學(xué)術(shù)包工頭”現(xiàn)象該治治了

倪光南：要想不受制于人、知識產(chǎn)權(quán)，技術(shù)以及供應(yīng)鏈都要自主

? 社會調(diào)查 ?

王洪昌：當(dāng)前鄉(xiāng)鎮(zhèn)和社區(qū)基層存在的十大問題

中國的水污染有多嚴(yán)重？后果將由全體中國人共同承擔(dān)

財寶寶：實地考察工業(yè)園，民企到底怎么了

房租爆漲50%的真相：資本壟斷房源牟利后患無窮

國資報告獨家解讀：央企上市公司市值管理現(xiàn)狀調(diào)查

中日美三國制造業(yè)數(shù)據(jù)對比分析，結(jié)果讓人不得不深思！

中國芯片產(chǎn)業(yè)深度調(diào)查｜IC設(shè)計篇：只有華為敢對高通說不

中科院調(diào)查：中國農(nóng)村現(xiàn)狀令人觸目驚心

中國獨角獸報告

顧士剛：一米距離決定鄉(xiāng)村振興的成敗——農(nóng)村發(fā)展調(diào)研報告

圖片新聞

十大必須掌握的機(jī)器學(xué)

反毛者應(yīng)學(xué)學(xué)梁漱溟

楊振寧：美在科學(xué)與藝術(shù)

久久99国产精品尤物-国产高清色播视频免费看-男生肌肌往女人桶爽视频-精品国产-91PORNY九色|www.jqdstudio.net