摘要
●技術簡介:
影像及視訊壓縮為在維持視覺品質下盡可能將儲存大小/傳輸量降低,近年漸趨成熟的學習式壓縮受到各方高度關注。本技術針對影像與視訊壓縮提出為三種不同的創新方法,前兩項分別為基於深度學習的端到端學習式圖像壓縮系統(ANFIC)以及視訊壓縮系統(CANF-VC),第三項則為運用深度增強式學習輔助傳統壓縮系統。
●技術之科學突破性:
ANFIC基於增強高斯化流,能擴展現有的學習式圖像壓縮系統,並增進其效能。CANF-VC將其延伸至視訊壓縮,跳脫常見作法,使用條件式編碼並拓展至整個壓縮架構。最後我們改良增強式學習演算法DDPG,在維持目標位元率下,調整編碼器參數以達到更佳的重建品質。以上工作的壓縮效率皆領先傳統以及學習式壓縮方法。
●技術之產業應用性:
近年來視訊相關應用之需求日益漸增,影像/視訊壓縮系統的潛在經濟影響非常巨大,業界以及ISO/IEC與ITU-T國際標準組織也對學習式影像/視訊壓縮技術展現高度關注,本技術提出的兩項現今最佳學習式影像及視訊壓縮系統,以及較容易移植到市場的增強式學習AI輔助壓縮技術,都有潛力能在產業應用中創造商業利益。