導讀: 于是,在開普勒K2階段任務的一項最新研究中,德克薩斯大學奧斯汀分校科學家與谷歌公司合作開發了一種人工智能算法,這種算法可以追尋到被普通方法遺漏的行星。
在不間斷探索廣袤太空的過程中,美國國家航空航天局(NASA)越來越意識到:獲得的數據實在太多了!
這是人類技術越來越強的體現。發射出去的大小探測器,一個個野心勃勃,劍指前輩望遠鏡們不敢想象的每一處深空,同時,返回的數據夜以繼日地累積著。
可這些數據都是要分析的啊……科學家們扶著額頭想。
這不是雇幾個實習生就能幫助解決的問題,幸好,有人工智能(AI)在。
數據如山倒,分析如抽絲
分析海量數據,究竟要面對多大壓力?
以開普勒太空望遠鏡為例,其在2009年發射升空,是世界首個用于探測太陽系外類地行星的飛行器。僅在起初3年半的任務期內,開普勒望遠鏡就對超過15萬個恒星系統展開不斷監控,從而產生了龐大的數據集。這些數據首先要經由計算機處理,但當計算機識別出一定的信號時,又必須依靠人工分析,判斷其是否為行星軌道所產生,這項巨大的篩查工作單靠NASA的科學家甚至科學小組,都沒有非常有效的方法完成。
曾經,NASA嘗試了將所有數據公之于眾的做法。該機構成立了名為“系外行星探索者”的新項目,讓成千上萬的公民科學家在注冊后訪問開普勒任務所記錄的信息,并有效地進行數據挖掘。
這個辦法相當不錯。很快加州理工學院就宣布一組公民科學家找到了新的“太陽系”,一個多行星系統,是NASA科學家此前沒有發現的。
公民科學家其實很適合參與到數據收集與分析活動中來,這就是所謂“聚沙成塔”。不過,面對源源不斷襲來的海量數據,人力終究不是長遠之計。
AI:我來試試?
一方面是數據如山倒;另一方面,像開普勒望遠鏡這樣的設備,獲得的數據背景其實非常繁雜,人類科學家往往無法準確定位到數據集里的所有行星。
于是,在開普勒K2階段任務的一項最新研究中,德克薩斯大學奧斯汀分校科學家與谷歌公司合作開發了一種人工智能算法,這種算法可以追尋到被普通方法遺漏的行星。
目前,研究團隊使用該方法在開普勒望遠鏡的龐大數據集中,找到了兩顆新的系外行星。這兩顆行星都位于水瓶星座,宿主恒星距離地球分別有1300光年和1230光年。
這已經不是人工智能第一次出手幫助人們“找星星”。2017年底,谷歌的機器學習技術就成為了發現系外行星的功臣,其過程涉及讓計算機學會從開普勒收集的3.5萬個可能的行星信號中搜尋“凌星”的跡象。
隨著技術更迭,科學家很欣慰地發現,新算法已可以幫助人類找到更多傳統方法找不到的行星,當然,更將有助于其他行星探測任務的數據分析,從而最終追蹤到與我們地球最像的行星。
TESS:我資金不多,但數據也不少
1995年,日內瓦大學天文學家宣布發現了太陽系外的第一顆行星。從那以后,人們一直在致力尋找更多系外行星,因為那有“另一個世界”的希望。
現在,地基射電望遠鏡、軌道太空望遠鏡和其他強大的高科技工具,正以驚人的速度發現著新的星球。截至2018年3月8日的數據,經天文學家分析確認后的太陽系外行星共有3743顆,其中2649顆由開普勒望遠鏡發現。
這不過是已獲得數據集里的九牛一毛。
開普勒望遠鏡之后,NASA的“凌日系外行星勘測衛星”(TESS,“苔絲”)已于2018年4月18日升空。按NASA的描述,這個探測器是中等任務級別,預算遠不及開普勒任務,甚至一度被嘲是個“半吊子”繼任者。
但TESS有自己步調。即便任務級別略遜,TESS也將帶來全天候、全天空的“狩獵”——掃描至少20萬顆恒星,觀測太空區域比開普勒大350倍。從它的數據中,科學家將調查行星的密度、大氣以及分析是否有液態水,一旦有出現“地球2.0”的希望,資金也將相應升級。
無論是開普勒還是TESS,數據已經到了科學家不可能全部進行人工分析的階段。而谷歌的AI工程師早已看到這一幕——
他們曾說:當人工“大海撈針”難以招架,正是機器學習技術上陣的時候。