安徽省光学学会

2025年01月11日 星期六

会员单位动态

安工大屈喜文博士发表空中手写轨迹生成及识别最新研究成果

文章来源:安徽工业大学作者:屈喜文发布时间:2024-06-13


       近日,安徽工业大学计算机科学与技术学院屈喜文博士在人工智能领域权威期刊《Applied Soft Computing》(中科院一区Top期刊,影响因子8.7)和《Expert Systems with Applications》(中科院一区Top期刊,影响因子8.5)发表空中手写轨迹生成及识别最新研究成果。安徽工业大学为论文第一单位,屈喜文博士为论文第一作者和通讯作者,硕士研究生叶明红等为课题的顺利完成做出了积极贡献。研究工作得到国家自然科学基金、安徽省信息材料与智能感知实验室开放基金等项目的支持。

多尺度通道注意力网络

空中手写样本示例

       基于单目视觉的空中手写是一种新颖且有前景的人机交互方式,具有广泛的潜在应用价值。由于指尖的尺寸非常小并且具有非常少的辨别特征,现有的基于单目视觉的空中手写系统在使用单目摄像头获取的二维图像中确定指尖的位置方面遇到挑战。课题组提出了一种多尺度通道注意力网络,通过对多尺度通道进行加权,促进了目标检测模型在高分辨率、小尺度通道上的集中,从而有效提高了指尖检测精度。实验结果表明所完成的空中手写系统允许用户自由流畅地书写。

基于非负表达分类的判别字典学习算法流程

训练样本与学习得到的原子分布示例

       为有效识别空中手写字符/文本,课题组结合现有识别模型的优缺点,展开了广泛的研究。基于表达的分类模型算法原理简单、可解释性强,然而现有的基于表达的分类模型对训练样本中噪声不具有鲁棒,且直接使用训练样本作为字典原子,忽略了学习更具鉴别性的字典原子。此外,为了提高表达能力和识别精度,现有的基于表达的分类模型往往需要扩展字典原子的数量,导致存储和计算成本激增。为了获得更具鉴别性和紧凑的字典,课题组提出了基于非负表达分类的判别字典学习算法,利用非负约束来获得字典上每个训练样本的非负表示。在字典学习阶段,对于训练样本,课题组提出的算法最小化训练样本的类内重构误差,同时扩大训练样本与对类间重建误差影响最大的原子之间的距离,在空中手写字符识别、人脸识别等多种模式识别应用领域以更小的存储消耗,更快的识别速度,获得更高的识别精度。上述研究将推进空中手写人机交互技术走向实用。

       论文链接:

https://doi.org/10.1016/j.asoc.2024.111801

https://doi.org/10.1016/j.eswa.2024.123998




新闻链接:https://www.ahut.edu.cn/info/1226/24615.htm

网站内容来源于互联网,由网络编辑负责审查,目的在于传递信息,提供专业服务,不代表本网站平台赞同其观点和对其真实性负责。如因内容、版权问题存在异议的,请与我们取得联系,我们将协调给予处理(按照法规支付稿费或删除),联系方式:ahos@aiofm.ac.cn 。网站平台将加强监控与审核,一旦发现违反规定的内容,按国家法规处理,处理时间不超过24小时。