近年來,日新月異的人工智能技術不斷推動著社會進步和產業變革,其中卷積神經網絡(CNN)以其卓越的圖像識別能力,在人工智能技術領域,特別在ChatGPT中表現極為出色。近期,一項突破性的科研成果將卷積神經網絡的概念引入光學領域,為人工智能成像技術帶來了革命性的進展。
由上海理工大學智能科技學院張啟明教授,智能科技學院、張江實驗室光計算所顧敏院士領銜的研究團隊,開發了一種超快速的卷積光學神經網絡(ONN),這一技術在無需依賴光學記憶效應的情況下,實現了對散射介質后的物體進行高效、清晰的成像。這不僅是對傳統光學成像技術的一次顛覆,更是卷積網絡在人工智能中應用潛力的一次深刻展示。該成果于6月14日以 “基于超快卷積光學神經網絡的非記憶效應散射成像(Memory-less scattering imaging with ultrafast convolutional optical neural networks)”為題發表于《科學》(Science)子刊《科學進展》(Science Advances)上,智能科技學院張雨超特聘研究員為第一作者,顧敏院士和張啟明教授為共同通訊作者。
卷積神經網絡作為目前為止應用最為廣泛的指一種人工智能神經網絡架構,它由生物的視覺皮層系統發展而來,視覺皮層結構由Hubel和Wiesel于1981年所提出,并獲得了諾貝爾獎。卷積操作作為卷積神經網絡中的核心,通過提取圖像的局部特征并逐層構建更為復雜和抽象的特征表示,極大地推動了圖像處理和模式識別領域的發展。然而,將這一概念應用于光學領域,面臨著將電子信號轉換為光學信號的挑戰。研究團隊巧妙地設計了一種全光學的解決方案,通過在光域中直接進行卷積網絡操作,省去了繁瑣的信號轉換過程,實現了真正的光速計算。
這項技術的關鍵在于構建了一個多階段的卷積網絡,它由多個并行核心組成,能夠以光速進行操作,直接從散射光中提取特征,實現圖像的快速重建。這一過程不僅極大地提高了成像速度,還顯著增強了成像質量,使得在復雜散射環境中的成像成為可能。同時,卷積光學神經網絡的計算速度達到了每秒1570萬億次操作(1.57 Peta operations per second, POPS),為實時動態成像提供了強大的支持。
此技術另一大亮點是其多任務處理能力。通過簡單地調整網絡結構,同一卷積光學神經網絡能夠同時執行多種不同的圖像處理任務,如分類、重建等,在光學人工智能領域尚屬首次。張啟明教授提到:“這種靈活性和效率的結合,不僅展示了卷積網絡在人工智能中的重要性,也為光學成像技術開辟了新的道路。”
這項技術的問世,不僅是對卷積神經網絡在光學領域的一次成功移植,更是對人工智能成像技術的一次重大推動。顧敏院士指出:“隨著技術的不斷發展和完善,我們有理由相信,卷積光學神經網絡將在自動駕駛、機器人視覺、醫學成像等多個領域將發揮更加重要的作用,為人類的生活帶來更多便利,為科學研究提供更強大的工具。這是卷積網絡的力量,也是人工智能的魅力。”

研究原理圖
論文鏈接:https://www.science.org/doi/10.1126/sciadv.adn2205
供稿:智能科技學院








