“概率”這兩個(gè)字,除了課本以外,最常出現(xiàn)的地方也許就是天氣預(yù)報(bào)中的“降水概率”,也就是未來(lái)幾天下雨的可能性有多大。在數(shù)學(xué)中,概率論是專(zhuān)門(mén)研究“可能性”的一門(mén)分支。它涉及的問(wèn)題非常廣泛,內(nèi)容遠(yuǎn)遠(yuǎn)超出了中學(xué)課本里那些刻板的習(xí)題。一切隨機(jī)或者不確定的事件,都是概率論研究的范疇。上至氣象下至金融,甚至連“磁鐵的磁性怎么來(lái)的”這種物理問(wèn)題,都可以用概率的方法來(lái)研究。
但這門(mén)學(xué)科的誕生卻有些“不太光彩”。
來(lái)自賭博的問(wèn)題
在1654年的一天早上,法國(guó)數(shù)學(xué)家布萊茲·帕斯卡收到了他的朋友貢博的一封來(lái)信。這位朋友自稱(chēng)“來(lái)自梅雷的騎士”,也算是一位業(yè)余數(shù)學(xué)家。他向帕斯卡提出了類(lèi)似如下的問(wèn)題:
兩位貴族A與B正在進(jìn)行一場(chǎng)賭局,賭注是每人500法郎,兩人輪流擲硬幣,得到正面則A得一分,反面則B得一分,每一局兩人得分的機(jī)會(huì)相等,誰(shuí)先得到6分誰(shuí)就得到1000法郎。兩人激戰(zhàn)正酣,比分達(dá)到2比4之際,B突然有事需要終止賭局。賭注應(yīng)該如何分配才最公平。
這一類(lèi)問(wèn)題被稱(chēng)為點(diǎn)數(shù)分配問(wèn)題,早在16世紀(jì)就被研究過(guò),但數(shù)學(xué)家當(dāng)時(shí)的答案并不令人滿(mǎn)意,在一些極端情況下會(huì)給出非常不合理的分配方案。也許這位“梅雷騎士”也見(jiàn)識(shí)過(guò)現(xiàn)實(shí)中這種賭局引起的矛盾,他希望帕斯卡能夠解決這個(gè)問(wèn)題。
帕斯卡對(duì)這個(gè)問(wèn)題也很感興趣。他向另一位業(yè)余數(shù)學(xué)家皮埃爾·德·費(fèi)馬發(fā)去一封信討論這個(gè)問(wèn)題。作為“業(yè)余數(shù)學(xué)家之王”,費(fèi)馬很快就給出了一個(gè)答案。他認(rèn)為,不能單靠賭局停止時(shí)的比分或者各自獲勝需要的分?jǐn)?shù)來(lái)決定賭注的分配,而是應(yīng)該考慮所有比賽的可能性中,雙方獲勝的比例。但列舉所有的可能性的計(jì)算量非常大,帕斯卡繼而提出了一個(gè)簡(jiǎn)化算法,完美地解決了點(diǎn)數(shù)分配問(wèn)題。
實(shí)際上,他們的解答相當(dāng)于計(jì)算兩位玩家勝利概率的大小。在研究中,帕斯卡提出了“數(shù)學(xué)期望”的概念和著名的“帕斯卡三角形”(楊輝三角)。某個(gè)結(jié)果為實(shí)數(shù)的隨機(jī)事件的數(shù)學(xué)期望,也就是所有結(jié)果按照發(fā)生概率加權(quán)之后的平均值。數(shù)學(xué)期望這個(gè)概念,掀開(kāi)了概率論研究的序幕。
什么是概率?
很多概率問(wèn)題有著特別的結(jié)構(gòu)。對(duì)于某個(gè)非常簡(jiǎn)單的隨機(jī)事件,比如說(shuō)擲硬幣,我們知道每種結(jié)果出現(xiàn)可能性的大小,這樣的事件被稱(chēng)為“基本事件”。我們可以多次重復(fù)這些基本事件,假定它們發(fā)生的可能性不會(huì)改變,而且這些重復(fù)沒(méi)有相互影響。如果我們將這些基本事件以合適的形式組合起來(lái),就能得到一個(gè)更為復(fù)雜而有趣的系統(tǒng)。許多概率問(wèn)題實(shí)際上就是對(duì)這些隨機(jī)系統(tǒng)的各種性質(zhì)的研究。比如說(shuō),在點(diǎn)數(shù)分配問(wèn)題中,基本事件就是硬幣的投擲,而系統(tǒng)則是賭局的具體規(guī)則,最后我們希望知道的則是每一方勝利的可能性大小。
在概率論發(fā)展的早期,數(shù)學(xué)家研究的問(wèn)題大多比較簡(jiǎn)單,基本事件只有有限幾種結(jié)果,組合的方式也相對(duì)簡(jiǎn)單。這樣構(gòu)成的隨機(jī)系統(tǒng)又叫古典概型。隨著數(shù)學(xué)的發(fā)展,數(shù)學(xué)家開(kāi)始考慮更復(fù)雜的模型。18世紀(jì)的法國(guó)數(shù)學(xué)家布豐提出了這樣一個(gè)問(wèn)題:在數(shù)條間隔相等的平行線(xiàn)之間,隨機(jī)投下長(zhǎng)度與間距相等的一根針,它與這些平行線(xiàn)相交的概率是多少?在這里,因?yàn)榻嵌扰c距離都是連續(xù)的值,基本事件有無(wú)數(shù)不同的結(jié)果,這樣的隨機(jī)系統(tǒng)被稱(chēng)為幾何概型。
早在19世紀(jì),概率論已經(jīng)成為了一門(mén)枝繁葉茂的數(shù)學(xué)分支。有趣的是,“概率”這個(gè)概念的嚴(yán)格定義要等到20世紀(jì)才出現(xiàn)。對(duì)于古典概型,因?yàn)榻Y(jié)果數(shù)量有限,概率的定義并沒(méi)有含糊之處,但幾何概型的情況更為復(fù)雜??紤]這樣的一個(gè)問(wèn)題:圓中的一條隨機(jī)的弦,它的長(zhǎng)度比圓內(nèi)接正三角形的邊長(zhǎng)更長(zhǎng)的概率是多少?這個(gè)問(wèn)題又叫貝特朗悖論,它奇怪的地方在于,對(duì)于不同的選取“隨機(jī)的弦”的方法,得到的概率也不相同,到底誰(shuí)是誰(shuí)非?要等到1933年,俄國(guó)數(shù)學(xué)家柯?tīng)柲缏宸驗(yàn)楦怕收摻⒐眢w系之后,這個(gè)問(wèn)題的解答才變得昭然若揭。柯?tīng)柲缏宸驅(qū)⒏怕誓P徒⒃谀骋活?lèi)所謂的“σ代數(shù)上的測(cè)度”上,這樣的測(cè)度可以有很多種,不同的測(cè)度對(duì)應(yīng)著不同的“隨機(jī)”。而在貝特朗悖論中,選取隨機(jī)弦的方法實(shí)際上對(duì)應(yīng)著不同測(cè)度的選取,也就是不同的“隨機(jī)”概念,那自然會(huì)得到不同的結(jié)果。
而到了現(xiàn)在,概率模型的種類(lèi)越來(lái)越多也越來(lái)越復(fù)雜,系統(tǒng)可以包含無(wú)限個(gè)基本事件,而具體的組織方式也更復(fù)雜更有趣。隨機(jī)圖、滲流模型、自回避行走,這些概率模型早已不能用古典概型和幾何概型來(lái)概括。也正因?yàn)橛辛诉@些復(fù)雜的模型,我們才能用概率論解決現(xiàn)實(shí)世界的種種難題。
無(wú)處不在的分布
如果讓數(shù)學(xué)家評(píng)選概率論中最重要的定理,桂冠可能非中心極限定理莫屬。它不僅是概率論中許多重要結(jié)果的基石,在別的學(xué)科中,尤其是計(jì)算機(jī)科學(xué),它也有重要的應(yīng)用,而在現(xiàn)實(shí)生活中,它是整整一個(gè)行業(yè)賴(lài)以生存的理論基礎(chǔ)。
中心極限定理其實(shí)不止一個(gè),可以說(shuō)它是一連串定理的總稱(chēng)。它可以看作所謂“大數(shù)定理”的細(xì)化與推廣。假設(shè)我們有一枚硬幣,它擲出正反面的概率相等。那么,如果我們連續(xù)拋擲這枚硬幣一萬(wàn)次,常識(shí)告訴我們其中大概有五千次是正面。這就是大數(shù)定理:對(duì)于某個(gè)基本事件獨(dú)立地重復(fù)多次的話(huà),某個(gè)可能性發(fā)生的次數(shù)占總數(shù)的比例會(huì)趨近于這個(gè)可能性發(fā)生的概率。
與大數(shù)定理不同的是,中心極限定理處理的是那些結(jié)果是實(shí)數(shù)的隨機(jī)基本事件。它告訴我們,如果將許多相同而又獨(dú)立的基本事件的結(jié)果取平均的話(huà),這個(gè)平均值會(huì)趨向某個(gè)概率分布。根據(jù)大數(shù)定理,這個(gè)分布的數(shù)學(xué)期望就是基本事件的數(shù)學(xué)期望。而中心極限定理額外告訴我們的,就是這個(gè)概率分布必定是一個(gè)所謂的“正態(tài)分布”,而它的方差,也就是概率分布的“分散”程度,是基本事件的方差除以事件數(shù)目的平方根。也就是說(shuō),基本事件越多,平均值的不確定性就越小。將這個(gè)正態(tài)分布畫(huà)成曲線(xiàn)的話(huà),它就像一個(gè)大鐘,中間高,但兩頭呈指數(shù)衰減,這也為它贏得了“鐘形曲線(xiàn)”這個(gè)形象的名字。中心極限定理可以推廣到取值范圍是高維空間中一點(diǎn)的情況,“相同的基本事件”這個(gè)要求也可以被更弱的條件代替,只需要基本事件滿(mǎn)足某些要求,而不需要完全相同。
正態(tài)分布在自然界中隨處可見(jiàn),比如說(shuō)人的身高和智力都服從正態(tài)分布。這是因?yàn)樽匀唤缰械暮芏喱F(xiàn)象都由各種因素千絲萬(wàn)縷的聯(lián)系而決定,其中沒(méi)有特別突出的因素。比如說(shuō)人的身高,除了由許多不同的基因調(diào)控以外,后天的營(yíng)養(yǎng)、環(huán)境、健康,甚至偶然的意外,都有著各自的影響。在這種情況下,如果將每個(gè)因素看成一個(gè)基本事件,并且假定這些因素各自的影響都差不多,將這些因素綜合考慮,根據(jù)中心極限定理,得到的結(jié)果就非常接近正態(tài)分布。
中心極限定理也是保險(xiǎn)這一整個(gè)行業(yè)的基礎(chǔ)。每個(gè)人都會(huì)遇到各種各樣的風(fēng)險(xiǎn),比如事故、疾病等等,這些風(fēng)險(xiǎn)發(fā)生的概率都很低,但一旦發(fā)生,后果非常嚴(yán)重,并非每個(gè)人都能承受。而保險(xiǎn)業(yè),實(shí)際上就是通過(guò)保費(fèi)與保險(xiǎn)賠付的方式,將上千萬(wàn)人連結(jié)起來(lái),每人付出相對(duì)小的代價(jià),在萬(wàn)一不幸襲來(lái)時(shí),就能獲得一定的保障。由中心極限定理,這樣由數(shù)量龐大的個(gè)案相加而成的保險(xiǎn)業(yè)務(wù),由于偶然因素導(dǎo)致無(wú)法賠付的概率非常小,而且參與的人數(shù)越多,風(fēng)險(xiǎn)就越小。為了確定保費(fèi)與賠付,保險(xiǎn)公司要做的就是根據(jù)大量統(tǒng)計(jì)數(shù)據(jù)精確地確定意外發(fā)生的概率,然后根據(jù)意外概率與收益確定保費(fèi)與賠付的金額。這也是為什么現(xiàn)代的保險(xiǎn)公司越來(lái)越重視概率與統(tǒng)計(jì)。
理解復(fù)雜世界
除了與不確定性相關(guān)的問(wèn)題之外,概率論也與物理息息相關(guān)。法國(guó)物理學(xué)家皮埃爾·居里在攻讀博士學(xué)位時(shí),就發(fā)現(xiàn)了磁鐵的一個(gè)有趣的性質(zhì):無(wú)論磁力多強(qiáng)的鐵制磁鐵,在加熱到770攝氏度時(shí),都會(huì)突然失去磁性。這個(gè)溫度后來(lái)被稱(chēng)為鐵的居里點(diǎn)。為什么磁鐵會(huì)突然失去磁性?通過(guò)概率論與統(tǒng)計(jì)物理,我們現(xiàn)在明白,這種現(xiàn)象與冰雪消融、開(kāi)水沸騰相似,都屬于相變的范疇。
我們可以將磁鐵里的鐵原子想象成一個(gè)一個(gè)的小磁針。在磁鐵還有磁性時(shí),這些小磁針齊刷刷地指向同一個(gè)方向,但因?yàn)榉肿訜徇\(yùn)動(dòng)的關(guān)系,每個(gè)小磁針都會(huì)時(shí)不時(shí)地動(dòng)一下,但很快會(huì)被旁邊的小磁針重新同化。物理學(xué)家將這個(gè)場(chǎng)景抽象成所謂的伊辛模型,通過(guò)對(duì)伊辛模型的研究,概率學(xué)家發(fā)現(xiàn),當(dāng)溫度達(dá)到某個(gè)臨界值時(shí),整個(gè)體系就會(huì)由于熱運(yùn)動(dòng)而不能保持統(tǒng)一的指向,也就是失去磁性。這個(gè)臨界值就是居里點(diǎn),而這樣的對(duì)伊辛模型的研究也部分揭示了磁鐵的一些微觀(guān)結(jié)構(gòu)的成因。
相變不僅僅局限于物理現(xiàn)象。流言的傳播,傳染病的爆發(fā),還有微博的轉(zhuǎn)發(fā),都是一種相變過(guò)程,都存在某種臨界值。比如說(shuō)傳染病,在適當(dāng)?shù)哪P拖?,如果每個(gè)病人傳染人數(shù)的平均值低于某個(gè)臨界值,那么疾病就能被控制;如果高于臨界值,就很可能導(dǎo)致疫病的全面爆發(fā)。對(duì)于疾病傳播的研究,屬于流行病學(xué)研究的范疇,而在概率論被引入流行病學(xué)研究之后,我們對(duì)如何防止與控制疫病爆發(fā)有了更深入的了解,這是能挽救成千上萬(wàn)人的知識(shí)。
概率論的應(yīng)用遠(yuǎn)遠(yuǎn)不止這些,大至飛機(jī)失事搜救,小至垃圾郵件過(guò)濾,都能在其中找到概率論的身影。這個(gè)復(fù)雜的世界充滿(mǎn)了不確定性,有些無(wú)傷大雅,有些卻能致命。要駕馭這些不確定性,就要從了解它們開(kāi)始。這就是概率論的意義。概率論不能為我們帶來(lái)一個(gè)沒(méi)有風(fēng)險(xiǎn)的世界,但它卻能教會(huì)我們?nèi)绾闻c風(fēng)險(xiǎn)和平共處。它帶來(lái)的僅僅是關(guān)于不確定性的知識(shí)。
但知識(shí),往往就是力量。


概率:了解不確定性

圖文簡(jiǎn)介