美國加州大學洛杉磯分校研究團隊在新一期《自然》雜志刊發論文稱,他們研制出一種新型圖像生成器,其利用光束而非傳統計算硬件來生成圖像。與標準人工智能(AI)工具相比,該設備生成一幅圖像的能耗可降低至十萬分之一,僅幾毫焦耳。
目前大多數AI模型基于文本生成圖像時,通常采用所謂“擴散”方法:AI先學習大量圖像,掌握如何用統計噪聲逐步破壞它們,再將這類變化模式編碼為一套規則。當接收到新的含噪聲圖像時,AI可依據這些規則反向操作,經過多步處理,最終生成與文本指令相匹配的連貫圖像。
然而,生成高分辨率逼真圖像需要執行大量擴散步驟,對算力要求極高,能耗巨大。以美國開放人工智能研究中心(OpenAI)為例,其新型圖像生成器在運行第一周內生成了超過7億張圖像。為滿足這一需求,需要消耗大量能源和水,用于供電和冷卻運行模型的機器。新型光學AI圖像生成器或能緩解能耗巨大這一難題。
研究團隊表示,傳統數字擴散模型需經歷數百至數千次迭代,才能生成圖像,而新系統除初始編碼外,無需任何額外計算。該系統首先使用基于公開圖像數據集訓練的數字編碼器,生成可轉化為圖像的靜態編碼。隨后,借助名為“空間光調制器(SLM)”的液晶屏幕,將該編碼以物理方式印刻在激光束中。當激光穿過第二個用作解碼的SLM時,便會在相機記錄的屏幕上瞬間呈現目標圖像。
在測試中,團隊利用新系統生成了黑白數字(1至9)、基礎服裝等簡單圖像,以及梵高風格的全彩畫作。結果顯示,生成效果與傳統圖像生成器大致相當。在繪制梵高風格圖像時,新系統每幅僅消耗約幾毫焦耳能量,而傳統擴散模型則需耗費數百甚至數千焦耳。
團隊稱,盡管這一系統仍需進一步優化才能替代當前廣泛使用的圖像生成工具,但其低功耗特性尤其適合可穿戴設備(如AI眼鏡)等應用場景。
美國加州大學洛杉磯分校研究團隊在新一期《自然》雜志刊發論文稱,他們研制出一種新型圖像生成器,其利用光束而非傳統計算硬件來生成圖像。與標準人工智能(AI)工具相比,該設備生成一幅圖像的能耗可降低至十萬分之一,僅幾毫焦耳。
目前大多數AI模型基于文本生成圖像時,通常采用所謂“擴散”方法:AI先學習大量圖像,掌握如何用統計噪聲逐步破壞它們,再將這類變化模式編碼為一套規則。當接收到新的含噪聲圖像時,AI可依據這些規則反向操作,經過多步處理,最終生成與文本指令相匹配的連貫圖像。
然而,生成高分辨率逼真圖像需要執行大量擴散步驟,對算力要求極高,能耗巨大。以美國開放人工智能研究中心(OpenAI)為例,其新型圖像生成器在運行第一周內生成了超過7億張圖像。為滿足這一需求,需要消耗大量能源和水,用于供電和冷卻運行模型的機器。新型光學AI圖像生成器或能緩解能耗巨大這一難題。
研究團隊表示,傳統數字擴散模型需經歷數百至數千次迭代,才能生成圖像,而新系統除初始編碼外,無需任何額外計算。該系統首先使用基于公開圖像數據集訓練的數字編碼器,生成可轉化為圖像的靜態編碼。隨后,借助名為“空間光調制器(SLM)”的液晶屏幕,將該編碼以物理方式印刻在激光束中。當激光穿過第二個用作解碼的SLM時,便會在相機記錄的屏幕上瞬間呈現目標圖像。
在測試中,團隊利用新系統生成了黑白數字(1至9)、基礎服裝等簡單圖像,以及梵高風格的全彩畫作。結果顯示,生成效果與傳統圖像生成器大致相當。在繪制梵高風格圖像時,新系統每幅僅消耗約幾毫焦耳能量,而傳統擴散模型則需耗費數百甚至數千焦耳。
團隊稱,盡管這一系統仍需進一步優化才能替代當前廣泛使用的圖像生成工具,但其低功耗特性尤其適合可穿戴設備(如AI眼鏡)等應用場景。
本文鏈接:http://m.9105763.cn/v-146-5360.html光學AI圖像生成器能耗降至毫焦級
相關文章:
鴻蒙旗艦王者歸來!華為Pura 80系列前瞻:影像殺手06-04
世界機器人大會永久會址開展全維度升級改造05-23
化驗員試用期轉正工作總結12-23
2024年服裝銷售試用期工作總結(十篇)09-23
德育方面工作總結(二十三篇)09-02
幼兒園普惠督導匯08-17
工程施工承諾書10-29
工地工人安全承諾書08-10
紅樓夢心得和感悟03-03
讀平凡的世界有感01-12
萬歷十五年讀后感01-12
辦理護照的邀請函11-26
體育活動作文11-22
小學英語作文:How to keep healthy10-08
描寫軍訓的作文09-10
《三體》讀書筆記08-31
2025年4月證券從業資格考試時間及科目:4月19日04-18
2024年吉林執業醫師醫學綜合考試二試考試時間及科目(11月9日至10日)10-18
單列二本分數線 山西高考分數線2023一本,二本,專科分數線09-07
詩歌《致母親》05-15
語文文言文社鼠習題及答案10-18
《龍標野宴》翻譯及賞析09-13
重度抑郁的文案10-19
公務用車的自查報告08-31