2018年的高斯獎(jiǎng)(Carl Friedrich Gauss Prize )授予了統(tǒng)計(jì)學(xué)教授David Donoho(大衛(wèi)·多諾霍),以表彰他“在信號(hào)處理的數(shù)學(xué)、統(tǒng)計(jì)和計(jì)算分析方面做出的基本貢獻(xiàn)。”
○ 斯坦福大學(xué)統(tǒng)計(jì)學(xué)教授David Donoho。| 圖片來(lái)源:Stanford University
對(duì)高科技醫(yī)療護(hù)理來(lái)說(shuō),核磁共振成像掃描(MRI)是至關(guān)重要的一部分:它所呈現(xiàn)出的人體內(nèi)部的三維視圖,讓醫(yī)生得以發(fā)現(xiàn)處于破裂邊緣的動(dòng)脈瘤,能掠過大腦從而布局手術(shù)計(jì)劃,或者精確地找到骨頭上出現(xiàn)的微小裂縫——所有的這一切都無(wú)需動(dòng)用到一把手術(shù)刀或一絲的輻射。而且對(duì)于接受掃描的病人來(lái)說(shuō),配合完成MRI掃描所需的技術(shù)要求則很低:病人只需靜靜地在一個(gè)狹窄的、嗡嗡作響的管子里,持續(xù)地躺約一小時(shí)的時(shí)間。
○ MRI。| 圖片來(lái)源:IMU
但現(xiàn)在,冗長(zhǎng)的掃描過程被加快了十倍之多,這都多虧了正進(jìn)入臨床使用中的一代新的MRI掃描儀。新的技術(shù)可為全球每年進(jìn)行的8000萬(wàn)次MRI掃描節(jié)省大量時(shí)間和金錢,而且讓那些無(wú)法長(zhǎng)時(shí)間保持靜止的孩子也能接受MRI掃描。掃描速度的加快還能幫助實(shí)現(xiàn)雄心勃勃的3D掃描和心臟跳動(dòng)的MRI“影像”。
啟發(fā)了將這些新設(shè)備推向市場(chǎng)的工程師和醫(yī)生的,是發(fā)表于2006年的數(shù)學(xué)期刊上的一些見解。如今,這種見解被稱為“壓縮感知”(Compressed Sensing),這個(gè)詞是由2018年高斯獎(jiǎng)得主David Donoho所創(chuàng)造的術(shù)語(yǔ)。而高斯獎(jiǎng)表彰的正是這些具有超越數(shù)學(xué)影響的數(shù)學(xué)研究。
Donoho與Emmanuel Candè、陶哲軒(Terence Tao)以及其他數(shù)學(xué)家一起,在21世紀(jì)00年代中期發(fā)表了數(shù)學(xué)分析,以顯示壓縮感知或許具有實(shí)際應(yīng)用,并成功地提出了足以激發(fā)進(jìn)一步研究的算法。隨之而來(lái)的是大量的數(shù)學(xué)和實(shí)驗(yàn)工作,這一理論在應(yīng)用數(shù)學(xué)家、諧波分析學(xué)家和信息理論家的推動(dòng)得到了長(zhǎng)足的發(fā)展;為了讓計(jì)算稱為可能,數(shù)值分析師和計(jì)算機(jī)科學(xué)家創(chuàng)造出快速地算法;MRI研究人員也提供了許多他們自己對(duì)核磁共振物理學(xué)的深刻理解和更多的開創(chuàng)性見解。
FDA(美國(guó)食品及藥物管理局)對(duì)新醫(yī)療設(shè)備的任何潛在創(chuàng)新都設(shè)置了很高的標(biāo)準(zhǔn)。然而FDA在2017年批準(zhǔn)了壓縮感知設(shè)備,這距離壓縮感知的論文首次出現(xiàn)在數(shù)學(xué)期刊上僅僅十年。這就是影響力!
I. 稀疏性
Donoho是最早發(fā)展用數(shù)學(xué)來(lái)描述稀疏信號(hào)的研究者之一。稀疏信號(hào)是指在多數(shù)情況下為零,只會(huì)偶爾出現(xiàn)非零波動(dòng)的信號(hào)。這樣的例子比比皆是:例如夜空,偶有一顆星星點(diǎn)綴著廣袤的黑暗——那么少數(shù)出現(xiàn)的星星用孤獨(dú)的“1”來(lái)代表,而無(wú)邊的黑暗則可用“0”來(lái)表示。再例如人類的基因組,對(duì)兩個(gè)不同的人來(lái)說(shuō),每300個(gè)核苷酸才會(huì)出現(xiàn)一次不同。
Donoho第一次接觸到“稀疏性”(sparsity),是在大學(xué)畢業(yè)后從事石油勘探工作的過程中。為了尋找深藏于地底的石油,地球物理學(xué)家會(huì)引燃爆炸,讓地震波傳入地層。每當(dāng)?shù)卣鸩ㄓ|碰到一個(gè)新的巖層時(shí),它就會(huì)傳回一個(gè)回聲;從回波信號(hào)中,科學(xué)家可以重建地下巖層的圖像。由于巖層的變化相對(duì)較少,因此地震波的回波是稀疏的。
II. L1范數(shù)
21歲時(shí),Donoho在無(wú)意中遇到了一個(gè)標(biāo)志了他職業(yè)生涯的謎題。那時(shí),原始的地震測(cè)量只能提供大致、模糊的巖層位置。但當(dāng)時(shí)的地球物理學(xué)家已經(jīng)開發(fā)出了一種能夠有效地對(duì)信號(hào)進(jìn)行“去模糊”化、并對(duì)地層變化進(jìn)行精確識(shí)別的方法。這些測(cè)量距離的方法都是不同于傳統(tǒng)方式的。
自數(shù)學(xué)巨人高斯奠定了基礎(chǔ)性的工作以來(lái),科學(xué)家就一直將所謂的L?距離運(yùn)用于數(shù)據(jù)處理中,這個(gè)距離也被稱為“烏鴉的飛行”或歐幾里德距離,它測(cè)量的是兩點(diǎn)之間的直線路徑的長(zhǎng)度,就像我們?cè)诟咧袔缀沃兴鶎W(xué)到的一樣。然而,令人驚喜的新方法使用的是“L?范數(shù)”,也被稱為曼哈頓距離,因?yàn)?strong>它測(cè)量的是如果你必須在矩形網(wǎng)格般的城市中行走,需要穿過多少街區(qū)才能從一個(gè)點(diǎn)走到另一個(gè)點(diǎn)(對(duì)角線走法是不被允許的)。(關(guān)于距離,可進(jìn)一步閱讀《如何找到距離最近的TA》)
稀疏信號(hào)與L?范數(shù)的結(jié)合的有效性存在著一些神秘之處,但沒人知道這是為什么。當(dāng)Donoho回到研究生院攻讀博士學(xué)位時(shí),他決心要解開這個(gè)難題。在接下來(lái)的幾年里,他發(fā)展了證明L?范數(shù)與稀疏信號(hào)間的不合理的有效性的數(shù)學(xué)理論。
其中,有些現(xiàn)象看上去似乎不可思議。他首先使用“L?+稀疏性”技術(shù)來(lái)恢復(fù)一個(gè)以某種未知、任意的方式模糊(現(xiàn)稱為“盲反褶積”)的稀疏信號(hào)。接下來(lái),他再用它們來(lái)恢復(fù)完全丟失的數(shù)據(jù)。在信號(hào)處理中,部分信號(hào)的缺失是常有出現(xiàn)的情況,就好比一臺(tái)陳舊的錄音機(jī),它可能無(wú)法收錄高頻音和低頻音。而Donoho、Philip Stark和Ben Logan則證明了,對(duì)于某些特殊信號(hào),即稀疏信號(hào),“L?+稀疏性”技術(shù)可以很好地恢復(fù)缺失的低頻信號(hào)。在其他的研究中,Donoho和他的合作者Jeffrey Hoch和Alan Stern開發(fā)了“L?+稀疏性”技術(shù)來(lái)恢復(fù)缺失的高頻信號(hào)(即聲學(xué)角度的“高音”部分)。
“L?+稀疏性”也能對(duì)信號(hào)“去噪”:如果我們?cè)谙∈栊盘?hào)中加入噪聲,然后再看它的繪圖,就會(huì)看到許多的“雛菊”(信號(hào))出現(xiàn)在“雜草”(噪音)之上;L?最小化提供了一種去除“雜草”但又同時(shí)保留“雛菊”的方法。Donoho和Iain Johnstone證明了對(duì)稀疏信號(hào)來(lái)說(shuō),這是最優(yōu)的方法。
III. 諧波分析
上世紀(jì)八九十年代,應(yīng)用數(shù)學(xué)出現(xiàn)的“小波革命”(詳見:《神通廣大的小波理論》)進(jìn)一步改變了Donoho的思維。當(dāng)時(shí)的計(jì)算諧波分析專家——如2014年高斯獎(jiǎng)得主Yves Meyer和與他合作的Ronald Coifman、Ingrid Daubechies和Stephane Mallat——正在構(gòu)建許多新的工具,以將數(shù)字信號(hào)轉(zhuǎn)變成更加有用的形式。他們發(fā)展的新的小波變換讓Donoho大開眼界。他在用這些新的工具對(duì)數(shù)字?jǐn)?shù)據(jù)進(jìn)行轉(zhuǎn)換之后發(fā)現(xiàn),稀疏性無(wú)處不在——它出現(xiàn)在我們每天使用的圖像以及其他媒體中。在Donoho看來(lái),這大大擴(kuò)展了“L?+稀疏性”的應(yīng)用平臺(tái)。
Donoho的數(shù)學(xué)結(jié)果誘發(fā)了最大限度的稀疏化。這些結(jié)果能讓他比使用小波來(lái)進(jìn)行稀疏化要做得更好。他尋找那些能“超越小波”的系統(tǒng),以揭示如圖像中的邊緣、薄片和細(xì)絲等幾何現(xiàn)象的隱藏稀疏性。他的合作者Emmanuel Candè和Jean-Luc Starck也很快就瞄準(zhǔn)了超越小波,想要達(dá)到“曲波”、“束波”,以及其他的某種波。
通過結(jié)合幾種不同系統(tǒng)的諧波分析,Donoho更進(jìn)一步地加深了對(duì)信號(hào)的稀疏化。例如,被幾個(gè)尖刺污染的正弦波在傳統(tǒng)的傅里葉分析法中就不是稀疏的,但可以同時(shí)使用傅里葉分析和小波對(duì)它進(jìn)行稀疏地綜合。與合作者Michael Saunders和Scott Chen一起,他開發(fā)了一種名為“基追蹤”(Basis Pursuit)的算法,通過最小化L?范數(shù)來(lái)解決綜合問題。
這取得了令人難以置信的成功,因?yàn)榻鉀Q一個(gè)待定方程的系統(tǒng),并通過算法得到盡可能稀疏的答案,是一項(xiàng)復(fù)雜到令人生畏的任務(wù)。Donoho與Xiaoming Huo、Michael Elad和Vladimir Temlyakov等人合作,給出了一系列的基礎(chǔ)數(shù)學(xué)結(jié)果,證明了L?范數(shù)能夠真正找到最稀疏的這種綜合。
IV. 壓縮感知
到了21世紀(jì)00年代中期,在I~III中所描述的三條研究路線聚合到了一起,產(chǎn)生了壓縮感知。這是一種啟發(fā)了那些正要遍布市場(chǎng)的快速MRI的數(shù)學(xué)理論。如前文所提到的,Donoho與Candès、Romberg以及陶哲軒一起,將在小波基視角下的圖像的稀疏性、L?范數(shù)的使用、待定方程的使用,這三個(gè)成分放在一起運(yùn)作。他們的數(shù)學(xué)分析清楚地闡明了,為什么必須這三種成分都同時(shí)存在才能讓速度加快,以及在某些假設(shè)下,這種組合是如何確保起作用的。如此清晰的數(shù)學(xué)理解是具有轉(zhuǎn)換性的,并激發(fā)了MRI研究和其他領(lǐng)域的快速發(fā)展。
V. 不合理的有效性
從大學(xué)時(shí)代起,Donoho就相信數(shù)學(xué)家將通過為數(shù)據(jù)提供新的模型,提供新的處理算法,以及微妙且強(qiáng)大的理論見解,為信息時(shí)代做出貢獻(xiàn)。這三件事情,他都做到了。
而當(dāng)時(shí)年輕的Donoho不知道、也不可能知道的是,純數(shù)學(xué)的持續(xù)發(fā)展會(huì)是如此的重要。例如,在他自己的研究工作壓縮感知中,Donoho發(fā)現(xiàn)扮演重要角色的是隨機(jī)矩陣?yán)碚摗⒏呔S的巴拿赫空間理論、隨機(jī)凸多胞形理論以及數(shù)學(xué)自旋玻璃的理論——在所有的這些情況下,純數(shù)學(xué)都與信號(hào)處理無(wú)關(guān),而且比Donoho本身都要年輕得多!
50年前,Eugene Wigner(尤金·維格納)就提出“數(shù)學(xué)的不合理有效性”,他指的是純數(shù)學(xué)激發(fā)實(shí)際應(yīng)用的驚人趨勢(shì)。
如果有一天,你也得益于快速的MRI掃描,或許你會(huì)記起維格納的這句格言!