極客號(Daydx.com)9月13日 消息:DiffBIR是一個利用生成對抗網(wǎng)絡進行盲圖像復原的開源項目。它能夠在不需要對應的高質(zhì)量圖片的情況下,對低質(zhì)量的圖片進行去噪、超分辨率以及顏色校正等復原。
項目地址:https://github.com/XPixelGroup/DiffBIR
DiffBIR由清華大學和上海人工智能實驗室的研究人員共同開發(fā)。它采用了兩階段網(wǎng)絡結(jié)構(gòu),第一階段使用SwinIR等模型去除圖像中的編碼模糊、JPEG壓縮噪聲等低級退化。第二階段使用類似Stable Diffusion的預訓練模型,作為圖像先驗,引導網(wǎng)絡生成高質(zhì)量的圖像。
核心功能:
1. 采用端到端的網(wǎng)絡,可以對包括高頻和低頻在內(nèi)的各種圖像退化進行復原
2. 利用生成模型作為先驗,無需匹配的高質(zhì)量圖像即可實現(xiàn)盲復原
3. 支持人臉圖像和普通場景圖像的復原,效果明顯優(yōu)于傳統(tǒng)算法
4. 模型小巧高效,可以部署到各類設備中,滿足實際應用需求
5. 提供易用的命令行接口、Web Demo等,可以輕松體驗強大的復原效果
6. 模型和代碼全部開源,支持用戶自定義訓練和開發(fā)
DiffBIR開創(chuàng)了盲圖像復原的新方向,在保證效果的同時,免除了匹配高質(zhì)量圖像的要求。它可以廣泛應用于舊照片修復、攝像頭圖像增強等應用場景,為圖像處理任務帶來新的可能??傮w來說,這是一個高質(zhì)量、高實用價值的開源項目。