| |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| -> 人工智能 -> 【图像压缩】棋盘格上下文模型 -> 正文阅读 |
|
|
[人工智能]【图像压缩】棋盘格上下文模型 |
标题:Checkerboard Context Model for Efficient Learned Image Compression (CVPR 2021) 作者:Dailan He(商汤) 论文简介在之前的端到端图像压缩框架中,为了达到SOTA的性能,都使用了mbt2018中的Joint Autogressive的上下文自回归模型。然而,该上下文模型的编解码需要串行实现,使得计算效率显著降低。本文提出的棋盘格上下文模型,有效克服了这个缺点,在几乎不损失编码性能的前提下,将编解码速度提升了四十倍。 文章首先设计了一个random mask实验,分析了不同位置的空间上下文对码率节省的情况,发现在待编码上下左右位置的空间相关性最大。
随后,提出了一种棋盘格上下文模型,将待编码的潜在表示y,按棋盘格的方式划分为anchor和non-anchor。anchor仅仅使用Hyper Prior的先验信息进行编解码;而non-anchor不仅可以使用Hyper Prior信息,而且可以将已解码的anchor作为上下文先验信息进行编码。
?该上下文模型,只需要一次编码、两次解码,极大提高了计算并行度,并且得到了不错的性能。
论文复现博主复现了文中的“mbt2018 + checkerboard”模型,该模型仅仅改变了上下文模型,将串行上下文替换为棋盘格上下文。总体流程图如下,其中蓝色是编码过程,红色是解码过程,黄色是编解码共用的过程。
?在编码时,论文只需要一次编码。而使用Compress AI复现时,y_anchor的量化必须先减去均值,而均值的获得必须通过gep网络,因此在复现时需要增加这样一个步骤。 而解码时,可以按照文章中的两步解码来完成。
关于anchor和non_anchor的复用与解复用,可以参考文章在Supplementary Material中的描述,使用切片、转置等来实现。博主参考了Space2Depth的实现方式。 至于论文复现的其他细节,可以参考博主的github链接:https://github.com/leelitian/Checkerboard-Context-Model-Pytorch 如果文章对你有帮助,记得点个赞噢~? |
|
|
|
|
| 上一篇文章 下一篇文章 查看所有文章 |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| 360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年12日历 | -2025/12/18 4:46:15- |
|
| 网站联系: qq:121756557 email:121756557@qq.com IT数码 |