“用望遠鏡觀測太空已經過時”,這話雖然略有夸張,但不無道理——對許多天文學家來說,現在研究的第一步不是“看到”,而是“計算”。如今,天文學家已經更多利用網絡來調度觀測,遠程控制位于沙漠或偏遠地區的望遠鏡,下載相關的觀察結果,然后利用計算機進行分析。
不僅僅是天文學,生物信息學、計算語言學以及粒子物理學等學科,從某種程度上,都依賴于通過計算模擬對世界進行建模,并對觀測數據進行探索分析——今天的科學正在發生以數據為驅動的深刻轉變。
17世紀的科學是經驗主義科學。其時,大家普遍認為人類可以用感官來收集盡可能多的數據,通過這些數據最終了解整個世界。基于此,科學發現具有偶然性也被大家廣泛接受。但科學發展、新科學儀器的使用,讓科研數據量呈幾何級數增長。這種情況讓以往的經驗變得不再適用——僅靠感官,人類已經無法處理和掌握這些數據,必須利用計算機進行分析;同時,探索和挖掘數據的方式甚至能夠讓科學家們“計劃偶然性”。以天文學為例,在尋找新的天文現象上,大數據極可能會產生意想不到的結果:天文學家鄧肯·洛里默發現了快速無線電脈沖、本科生克萊·奧法發現了地球電離層中的等離子管。
當今的科學研究形式是:許多科學家一起合作,設計能夠一次服務于多種項目的實驗,并測試不同的假設。因此,編程、計算、統計等與計算機相關的關鍵技術在科學研究中變得極為重要,例如,為了設計合理的實驗,選擇可靠的樣本,科學家需要優秀的統計學技能。為了確保數據驅動的實驗和探索是嚴格的,科學家們需要掌握足夠的統計學內容。
不僅如此,科學家還需要開發計算思維。這不僅僅是編碼,科學家需要創造性地思考和編寫新的算法,并且使用復雜的技術來挖掘和收集數據。即使擁有10000個核心超級計算機的強大功能,將簡單的算法應用于海量數據集仍然是無效的。面對一個科研目標,從計算機科學到更復雜的技術,軟件的運行速度需要提高幾個數量級。
但與現實不相符的是,目前許多高中和大學的科學、技術和工程學科仍然把這些必要的技能作為次要科目。因此,我們或許應該考慮如何設計新的教學方法,將數據驅動和計算方法視為當代研究的重要工具。
目前,國外許多大學已經開設數據科學課程和學位,將統計學和計算機科學與科學或商業相結合。例如,悉尼大學副教授塔拉·墨菲推出了一個關于數據驅動的天文學在線課程,在天文學的背景下教授學生數據管理和計算機學習等技能。新的澳大利亞數字技術課程將編碼和計算思維作為第二年教學大綱的一部分。這將開發學生的重要技能,下一步是將現代方法直接融入科學課堂。
半個多世紀以來,計算一直是科學的重要組成部分,數據爆炸正在使其變得更為重要。只有認真地將計算思維作為科學的一部分,才可以確保未來的創新能力,做出更多偉大的科學發現。
(本文由科學媒介中心提供 王雷編譯)
更多精彩!歡迎關注“科普中國-科技前沿大師談”官方微信(kjqydst)。