中国多媒体大会2018
本次竞赛的数据集(含测试集)、评测代码、获得一等奖的方案将全部公开发布,请留意页面更新。获得一等奖的方案将推荐给 AVS 工作组智能编码小组。
请注意,每人仅限参加一支队伍,不可重复参加。
请将下列信息发送邮件至:ppchallenge2018@163.com,数据下载及使用方式将邮件回复告知。
队伍名称、队员(每位队员的真实姓名、单位、电子邮箱)、联系手机号。
基线方案1:下载caffe模型
基线方案2:下载caffe模型
现有图像压缩方案一般会造成图像信息损失、图像质量下降,产生人工痕迹 (artifacts)。图像压缩后处理是指针对压缩图像设计质量增强和人工痕迹消除的方法,改善图像的视觉效果。类似地,后处理在视频压缩中也被广泛采用。近年来,深度学习在计算机视觉和图像处理中得到了广泛应用,也有一些研究工作将深度学习用于图像或视频压缩后处理,并得到了一定的效果。然而,现有工作的一个主要问题是用于后处理的深度网络较为复杂,计算速度慢,不满足实际应用的需求。如何在处理效果和处理速度之间取得一个折中,是压缩后处理的一个主要挑战。
此项竞赛旨在吸引国内多媒体领域的研究人员特别是青年学生对图像视频压缩的研究兴趣,提升国内相关研究水平。竞赛中优胜的方案将推荐给我国自主知识产权的音视频编解码技术标准 AVS 工作组。
1. 训练: 训练集包含 1541 张高质量图像,参赛方也可自主选用其他图像。
2. 验证: 验证集包含 45 张高质量图像。
3. 测试: 测试集不公开,但与验证集数量、性质相似。
4. 测试环境: 将提供测试环境的描述和测试代码的框架。
5. 评测过程: 参赛方需提交代码,由竞赛组委会在特定测试环境中测试代码的处理效果和处理速度,两者排名均靠前者为优胜,所有评测结果均在网上及时发布。
6. 基线方案: 竞赛组委会提供两套基线方案供参赛方熟悉流程并作为参考。
感谢腾讯音视频实验室提供 TPG 压缩格式技术支持。
TPG (Tiny Portable Graphics) 是由腾讯音视频实验室推出的新一代互联网图像标准格式,在同等质量下,TPG 图片格式的文件大小明显小于 JPG/JPEG, PNG, GIF, WEBP 等业界主流图片格式。现已提供转换工具,可以方便快速的将这些格式转换到 TPG 格式,实现无缝接入。
腾讯音视频实验室,专注于音视频通信技术的前瞻性研究,包括全球实时音视频网络优化、音视频编解码前沿算法研究、计算机视觉图像处理、基于 AI 的音频语音增强、声音美化及音视频质量评测等。在服务于腾讯社交体系下的海量用户同时,在实时音视频通信、图像处理和音视频处理等技术领域积累了十几年的研究经验,拥有行业领先的技术水平。团队网页:http://medialab.qq.com/,微信公众号:腾讯音视频实验室,邮箱:medialab@tencent.com。