内容

未来媒体技术与计算研究所在2018年取得的重要科研进展

阅读数:317    发布:2018-09-26 15:18    更新:2018-09-28 11:29    

未来媒体技术与计算研究所由江健民教授领队,12名近年从英国,美国,澳大利亚,爱尔兰,新加坡及香港引进的海外高层次青年人才组成。 经过过去四年多的发展及学院的大力支持,目前已经形成极具竞争力的研究团队并多次在国家层面参加重大计划项目的评审,包括国家优青,国家杰青,长江学者,万人计划及科技部重大计划等,以及受邀在国家层面的学术活动中作主题报告和嘉宾演讲,如中国计算机学会CCF多媒体技术专委会人工智能高端论坛,第五届中国研究生智慧城市技术与创意设计大赛及澳大利亚国际图像计算技术与应用会议等,在国内外产生了较大的学术影响。

image.png

仅2018年媒体所在计算机应用技术领域取得了一系列领先国际的科研成果。具体包括:(i)对矩阵秩进行半监督学习与优化的大规模图像的高效分类[1];(ii)基于深度学习的视频内容显著性检测[2];(iii)HMM及bi-weighting相结合的聚类模型的初始优化等[3]。

展望未来,研究所将紧密配合学院及学校对高水平大学建设的要求,在接下来的两年时间内重点突破以下四个方面的科学研究,并力争取得国际领先的科研成果。具体包括:(i)结合人工智能与深度学习开展智能媒体技术及其应用的研究,提出让计算机能够像人那样理解和分析多媒体内容的新目标,并在具体的算法与理论研究中取得一定的突破,完成开创性的研究;(ii)结合虚拟现实和视频处理提出能够让观众获得身临其境视觉享受的沉浸式多媒体技术研究目标。在全景3D多视点视频内容分析,重构,及再生等方向上取得国际领先的科研成果。(iii)结合计算机图形学及模式识别等多领域的协同创新,开展互动多媒体技术的科学研究及开发。提出让观众能够走进电影与其中的人物进行互动的多媒体新概念和新目标,并在具体的算法设计和理论创新中取得国际认可的科研成果;(iv) 结合人脑认知科学,多媒体可视化等领域的协同创新研究,提出能够看出心中所想并创建脑臆想媒体新概念的科学研究目标。争取在国际上开创出未来媒体技术和研究的一个崭新领域,从而取得源头上的科研优势。截止目前为止,媒体所于2018年发表或接受发表的代表性论文包括:

  • 1.Zhang J., Jiang J.* and Han Y. (2018) 'Semi-supervised regression with optimized rank for matrix data classification, Accepted for publication in: IEEE Transactions on Cybernetics, IEEE. (*通讯作者,中科院一区)

  • 2.Sun M. Zhou Z.Q., Hu Q., Wang Z. and Jiang J.* (2018) ‘SG-FCN: A Motion and Memory-Based Deep Learning Model For Video Saliency Detection’, Accepted for publication in IEEE Transactions on Cybernetics, IEEE (*通讯作者,中科院一区);

  • 3.Yang Y. and Jiang J.* (2018) ‘Adaptive Bi-weighting towards Automatic Initialization and Model Selection for HMM-based Hybrid Meta-Clustering Ensembles’, Accepted for publication in IEEE Transactions on Cybernetics, IEEE (*通讯作者,中科院一区);

  • 4.Yingying Zhu, Jiong Wang, Linxi Xie, Liang Zheng (2018). ‘Attention-based Pyramid Aggregation Network for Visual Place Recognition’, Accepted for publication in ACM Multimedia 2018. (第一作者,CCF A类会议);

  • 5.A. Covaci, Longhao Zou*, I. Tal, G-M Muntean, and G. Ghinea. "Is Multimedia Multisensorial? - A Review of Mulsemedia Systems." ACM Computig Survey. 51, 5, Article 91 (September 2018) (通讯作者,中科院一区)

  • 6.Zhou. Y, Guo, H. (2018) ‘Collaborative Block Compressed Sensing Reconstruction with Dual-Domain Sparse Representation’,Accepted for publication in Information Sciences, (第一作者,中科院一区)

  • 7.Xiaoyan Zhang, Zhuopeng Li, Martin Constable, Kap Luk Chan, Zhenhua Tang,and Gaoyang Tang,“Pose-based Composition Improvement for Portrait Photographs”,IEEE Transactions on Circuits and Systems for Video Technology, DOI 10.1109/TCSVT.2018.2817231,2018(第一作者,中科院二区).

  • 8.Longhao Zou, R. Trestian and G. Muntean, "E3DOAS: Balancing QoE and Energy-Saving for Multi-Device Adaptation in Future Mobile Wireless Video Delivery," in IEEE Transactions on Broadcasting, vol. 64, no. 1, pp. 26-40, March 2018 (第一作者,JCR一区).

  • 9.Wang J., Wang G. ‘Hierarchical spatial sum-product networks for action recognition in still images’, IEEE Transactions on Circuits & Systems for Video Technology, Vol 28, No 1, pp90-100, 2018 (第一作者,中科院二区);

  • 10.Yang Y. and Jiang J. ‘Bi-weighted ensemble via HMM-based approaches for temporal data clustering’, Pattern Recognition, Vol 76, April 2018, Pages 391-403, ELSEVIER (通讯作者,中科院二区);

  • 11.Gao W., Kwong S., Jiang Q. et al ‘Data-driven rate control for rate-distortion optimization in HEVC based on simplified effective initial OP learning’, Accepted for publication in IEEE Transactions on Broadcasting (第一作者,JCR一区);

  • 12.J. Korhonen ‘Study of the subjective visibility of packet loss artifacts in decoded video sequences’, Accepted for publication in IEEE Transactions on Broadcasting, IEEE, USA (第一作者,JCR一区).

  • 13.Zhang J and Jiang J. ‘Rank-optimized Logistic Matrix Regression towards Improved Matrix Data Classification’, Neural Computation, MIT Press, 2018, Feb; 30(2), pp505-525. ISSN 0899-7667(通讯作者,中科院二区);


深圳大学计算机与软件学院 2009-2016