免费又刺激又黄的视频网站,20岁禁止入内1000步,乱码丰满人妻一二三区AV

機(jī)器是如何學(xué)習(xí)的？

科普中國創(chuàng)作培育計(jì)劃上傳時(shí)間：2023-10-11

計(jì)算機(jī) 機(jī)器神經(jīng)網(wǎng)絡(luò) 黑盒子

圖文簡(jiǎn)介：經(jīng)過了半個(gè)多世紀(jì)的發(fā)展，今天的計(jì)算機(jī)能以驚人的速度計(jì)算。目前，市場(chǎng)上的英特爾酷睿i7-2600每秒可以完成1124億次運(yùn)算。假如一個(gè)人每秒能計(jì)算一次，那么酷睿處理器每秒的計(jì)算量要讓一個(gè)人計(jì)算8萬多年。

一、超越人類的計(jì)算能力

經(jīng)過了半個(gè)多世紀(jì)的發(fā)展，今天的計(jì)算機(jī)能以驚人的速度計(jì)算。目前，市場(chǎng)上的英特爾酷睿i7-2600每秒可以完成1124億次運(yùn)算。假如一個(gè)人每秒能計(jì)算一次，那么酷睿處理器每秒的計(jì)算量要讓一個(gè)人計(jì)算8萬多年。

然而，計(jì)算機(jī)雖然算得快，但需要人類給出極為具體的指示，比如“比較兩個(gè)數(shù)的大小”或者“給一個(gè)數(shù)加上一”。無論多么復(fù)雜的程序，都是由這些簡(jiǎn)單的運(yùn)算堆積而來。

圖片來源：pixabay

舉個(gè)例子，在很多應(yīng)用場(chǎng)景中，我們需要對(duì)一組數(shù)字進(jìn)行排序。這時(shí)候我們可以通過比較數(shù)字之間的大小和對(duì)換數(shù)字之間的位置完成非常復(fù)雜的排序任務(wù)。如果我們改變比較和對(duì)換的組合策略，還能獲得提升排序算法的效率，減少程序運(yùn)行的時(shí)間。

這些簡(jiǎn)單的運(yùn)算組合起來，可以完成很多驚人的任務(wù)，我們用這種辦法建造了復(fù)雜的網(wǎng)站，模擬各種自然現(xiàn)象，讓我們可以在手機(jī)上看視頻，還能處理各種各樣的辦公軟件。

二、除了算力，還需要規(guī)則

然而，無論怎么組合，簡(jiǎn)單的運(yùn)算卻無法產(chǎn)生復(fù)雜的智能。因?yàn)槿说恼J(rèn)知能力是從上而下產(chǎn)生的。我們大腦可以通過仍然不太清楚的機(jī)制，迅速“捕捉”到語言或圖片的高層特征和含義。

我們幾乎不需要學(xué)習(xí)任何語言規(guī)則，就能開始熟練掌握語言，并在年幼的時(shí)候就能開始理解對(duì)計(jì)算機(jī)來說極為復(fù)雜的語言現(xiàn)象，例如幽默、多義、暗示、雙關(guān)和諷刺等等。同樣，我們也只需要看到幾只貓和狗，就能分辨這兩種動(dòng)物的區(qū)別。

與人不同的是，計(jì)算機(jī)采用的是自下而上的方式運(yùn)行，必須從最底層的基本規(guī)則開始定義。但很多對(duì)人類來說很簡(jiǎn)單的工作，卻很難提出非常具體的規(guī)則。

從底層的像素角度來看，這些圖片沒有任何相似之處；但我們卻一眼能發(fā)現(xiàn)圖片里的動(dòng)物都是貓。也就是說，我們就很難設(shè)置一套規(guī)則，讓計(jì)算機(jī)判斷一張照片里的動(dòng)物是貓還是狗。

筆者供圖

在作出了大量失敗的嘗試之后，人工智能的研究者們決定從另一個(gè)方向解決問題。既然沒法從底層構(gòu)建規(guī)則來完成復(fù)雜的任務(wù)，我們從另一個(gè)角度來攻破它。

三、黑盒子的介入

我們承認(rèn)某些問題的復(fù)雜性，所以根本不嘗試從內(nèi)部破解它，而是把它當(dāng)成一個(gè)黑盒子，可以根據(jù)不同的輸入，做出合理的輸出。

數(shù)學(xué)上，我們把這樣的黑盒子叫做“函數(shù)”。函數(shù)就像一個(gè)怪獸，可以吞進(jìn)去輸入數(shù)據(jù)，然后根據(jù)規(guī)則生成輸出數(shù)據(jù)。

如果我們想識(shí)別圖片，我們會(huì)把圖片，而把圖片中的物體類別作為輸出。如果我們想要讓程序自己開汽車，我們會(huì)把攝像頭拍到的圖片作為輸入，而把油門或剎車的強(qiáng)度和方向盤轉(zhuǎn)動(dòng)的角度作為輸出。如果我們想讓程序下圍棋，我們會(huì)把當(dāng)前的棋局作為輸入，而把最能提升獲勝概率的落棋位置作為輸出。

現(xiàn)在，我們可以合理地假定大自然確實(shí)存在復(fù)雜的函數(shù)，但這個(gè)函數(shù)我們的大腦只能模擬，卻不能給出清晰的定義。如何在不給出清晰定義的情況下，讓人工智能模型也學(xué)會(huì)模擬這些函數(shù)呢？

第一步，我們需要找一個(gè)非常靈活的“通用”函數(shù)，可以通過改變自己，適配不同的場(chǎng)景。第二步，我們給這個(gè)函數(shù)看大量帶有正確答案的數(shù)據(jù)，讓它根據(jù)這些數(shù)據(jù)不斷地改變自己，從而使自己的輸出越來越符合真實(shí)答案，或者說，讓自己的預(yù)測(cè)與真實(shí)答案的差異最小。

如果我們把模型的預(yù)測(cè)與真實(shí)結(jié)果之間的差異畫成一個(gè)曲面，模型的學(xué)習(xí)過程，就可以看作是它不停地改變自己，最終找到曲面上最低點(diǎn)的過程。

舉個(gè)例子，如果我們要預(yù)測(cè)房?jī)r(jià)和房屋面積的關(guān)系。我們可以簡(jiǎn)單的找一條直線作為函數(shù)。這個(gè)函數(shù)雖然不算太靈活，但至少可以改變方向和位置。一開始，我們會(huì)隨機(jī)擺放這條直線，可以看到，這樣的模型性能很差。但隨后，我們可以根據(jù)訓(xùn)練數(shù)據(jù)，一點(diǎn)點(diǎn)調(diào)整直線的位置，讓模型能符合大部分訓(xùn)練數(shù)據(jù)的答案。這樣，我們也就有理由相信它可以預(yù)測(cè)未來不知道答案的新數(shù)據(jù)。

當(dāng)然，如果需要預(yù)測(cè)的比較復(fù)雜，一條直線已經(jīng)不夠了，我們就需要更復(fù)雜的模型。過去幾十年，機(jī)器學(xué)習(xí)和統(tǒng)計(jì)學(xué)習(xí)領(lǐng)域的學(xué)者陸續(xù)提出了很多不同的模型，可以比直線要靈活得多，例如邏輯回歸和支持向量機(jī)等等。

日趨復(fù)雜的模型

20世紀(jì)40年代，神經(jīng)生物學(xué)家提出了一些模擬動(dòng)物神經(jīng)元連接的數(shù)學(xué)模型。50年代，人工智能的先驅(qū)之一弗蘭克·羅森布拉特（Frank Rosenblatt)提出了一個(gè)兩層的神經(jīng)網(wǎng)絡(luò)，將其稱為感知機(jī)。這是最早的人工神經(jīng)網(wǎng)絡(luò)。可是到了60年代，人們發(fā)現(xiàn)感知機(jī)的結(jié)構(gòu)過于原始，連基本的任務(wù)都完成不了。自此之后，人工神經(jīng)網(wǎng)絡(luò)陷入了沉寂。

直到20世紀(jì)80年代。約翰·霍普菲爾德（John Hopfield）和杰弗里·辛頓（Geoffrey Hinton）改進(jìn)了神經(jīng)網(wǎng)絡(luò)，他們發(fā)現(xiàn)只需要在感知機(jī)里加一層神經(jīng)元，就能讓函數(shù)變得非常靈活，可以解決復(fù)雜得多的問題。

到了1989年，數(shù)學(xué)家甚至在數(shù)學(xué)上嚴(yán)格證明，只要3層神經(jīng)網(wǎng)絡(luò)和一個(gè)非線性的激活函數(shù)，就能以極高的精度模擬自然界的任何函數(shù)。

所以理論上，不管我們是要讓AI學(xué)會(huì)下圍棋，還是回答問題，還是寫代碼，都可以讓多層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)實(shí)現(xiàn)。

不過理論上能實(shí)現(xiàn)是一回事，實(shí)際上神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程要復(fù)雜得多。我們之前看到的誤差曲面都非常簡(jiǎn)單，但實(shí)際遇到的誤差曲面可能是一個(gè)幾億維度的復(fù)雜形狀。

在這種情況下，學(xué)習(xí)的過程可能需要很多年。所以，研究人員又通過不同方法，對(duì)學(xué)習(xí)速度進(jìn)行改進(jìn)。在視頻中，我們能看到不同的學(xué)習(xí)方法速度差異很大。

在優(yōu)化了學(xué)習(xí)技術(shù)后，我們可以堆疊出遠(yuǎn)比三層神經(jīng)網(wǎng)絡(luò)更復(fù)雜的模型，也讓模型有了更強(qiáng)的表達(dá)能力。隨著神經(jīng)元的層數(shù)越來越多，革命性的深度學(xué)習(xí)也因此出現(xiàn)。

為了適應(yīng)不同的場(chǎng)景，模型的結(jié)構(gòu)也在不斷進(jìn)化，從最早解決計(jì)算機(jī)視覺問題的卷積神經(jīng)網(wǎng)絡(luò)，到處理自然語言的循環(huán)神經(jīng)網(wǎng)絡(luò)，再到更全面地考慮了上下文信息的Transformer。今天我們熟悉的GPT4和chatGPT等大規(guī)模語言模型都基于Transformer架構(gòu)。

所以，從某種意義上來說，那些讓我們驚嘆的對(duì)話能力，的確是通過一個(gè)幾千億參數(shù)的模型，在人類的語言上完成的自我學(xué)習(xí)。

參考：

The Evolution Of CPU Processing Power Part 1: The Mechanics Of A CPU - New Mind

Intro to Gradient Descent – KevinBinz

The Illustrated Transformer - Jay Alammar

文章由科普中國-星空計(jì)劃（創(chuàng)作培育）出品，轉(zhuǎn)載請(qǐng)注明來源。

作者：管心宇科普作者

審核：于旸騰訊玄武實(shí)驗(yàn)室負(fù)責(zé)人

來源: 星空計(jì)劃

內(nèi)容資源由項(xiàng)目單位提供

亚洲激情小说另类欧美,无码在线播放一区,99 久久国产欧美,污视频网站在线观看二区

機(jī)器是如何學(xué)習(xí)的？

科普中國系列品牌網(wǎng)站

入駐科普號(hào)

合作機(jī)構(gòu)

亚洲 激情 小说 另类 欧美,无码在线播放一区,99 久久 国产 欧美,污视频网站在线观看二区

機(jī)器是如何學(xué)習(xí)的？

科普中國系列品牌網(wǎng)站

入駐科普號(hào)

合作機(jī)構(gòu)

亚洲激情小说另类欧美,无码在线播放一区,99 久久国产欧美,污视频网站在线观看二区