我校计算机学院罗丹老师的项目《图像大数据分类算法研究》(立项编号:GTKY-10)在2021-2022学年获得国腾创投基金科研项目立项,该项目有序推进,成果突出,科技处特开展本次专访,邀请罗丹老师分享有关经验。
随着现代科学技术和互联网信息技术的高速发展,人类已经进入大数据时代,大数据的载体类型丰富,包括文本、视频、音频、图像等。其中图像因规模大、增长速度快、内容丰富等特点成为大数据时代信息传递的主要载体。图像处理技术在安防、图像信息检索、人工智能等领域的应用不断拓展,其研究价值也在快速提升。然而,图像信息的非结构化问题随着图像数据的爆炸式增长日益突出。如何利用人工智能技术自动、快速、有效地在海量的图像中挖掘出隐含的信息和潜在规律,进行图像识别、检索和分类,已成为当前计算机视觉识别领域的研究热点。
在项目研发的过程中确实遇到了一些困难,首先国内对图像大数据分类的算法研究较少,为了获取更前沿的信息,我花了许多时间去查阅、翻译外文资料,学习先进的图像大数据分类有关知识。
另外CapsNet的网络结构专门为 MNIST 构建,在 CIFAR-10 等更复杂的图像分类数据集上表现较差,为了提升算法的准确性,需要对算法的参数进行不断地调整,整个过程也是难度比较大,通过反复的尝试,最终完成了验证。
图像是人们获取和交换信息的重要来源,图像分类处理的算法应用领域也涉及到工作和生活的各个方面。例如安防领域的人脸识别、行人检测、智能视频分析、行人跟踪等,交通领域的交通场景物体识别、车辆计数、逆行检测、车牌检测与识别,以及互联网领域的基于内容的图像检索、相册自动归类等。
教师参与教育科研,可以提高自身的研究能力和教学业务水平。在课题研究的过程,实际上是一种学习理论进行研究实践的过程,在这个过程当中,可以提高分析问题和发现问题的能力,收集文献资料和筛选信息整理资料的能力,归纳和概括研究资料的能力等。这些能力,对于教师备课、讲课是十分必要的。同时,开展教育科研也是我们教师提升自身专业化水平所必须的。教师参与教育科学研究,既可以提高自身的专业素养和研究能力,也能够让自己始终保持在行业领域的专业性,适应社会发展对教师的专业要求。
以教学促进科研,以科研反哺教学是提高教学质量和科研水平的重要手段。本次国腾创投科研项目前期的一些图像特征库的数据清洗和处理,是学生在课题组老师的指导下共同完成的。在这个过程中,学生对之前课堂上学习的数据处理知识有了更深刻的理解,对工具的使用更加熟练,并形成了良好的团队协作能力。科研反哺教学有效提高了学生的学习热情和学术水平,拓展学生的视野范围,促进学生科研能力的发展,培养学生创新思维习惯。
本次科研项目能够顺利推进,我认为离不开学校和科研团队中老师们的支持。首先学校科研制度完善,对科研的支持力度是非常大的,这大大提升了我做科研的信心。科研是一个团队性的工作,单靠我一个人是无法完成的,团队中的黄曼绮老师在项目遇到困难时提供了很多宝贵的意见,夏钰红和姚红两位老师在调整参数的过程中不断尝试,教师、学生协作也是项目能够顺利推进的重要原因。