讲座报告主题:文档智能模型的进展与趋势
专家姓名:白翔
日期:2025-11-08 时间:11:20
地点:江苏镇江明都大饭店商务楼华怡厅
主办单位:计算机科学与通信工程学院
主讲简介:白翔,华中科技大学教授、博导,国际期刊Pattern Recognition副主编(A-EIC)。在Nature Machine Intell.、IEEE TPAMI、CVPR等国际一流期刊和国际会议发表论文150余篇。担任国际顶级期刊IEEE TPAMI编委,顶级会议CVPR、ICCV、ECCV、AAAI、IJCAI、NeurIPS的领域主席,国际文档分析与识别会议ICDAR 2025大会主席。曾获ACL 2024最佳论文奖(Best Paper Award)、2024年湖北省青年科技创新奖、2023年湖北省自然科学一等奖(排1)、2021年全国科技系统抗击新冠疫情先进个人、2021年中国图象图形学学会自然科学一等奖(排1)、2019年国际模式识别协会青年学者奖(IAPR/ICDAR Young Investigator Award)。他是视觉与学习青年研讨会(VALSE)的指导委员会成员,VALSE在线学术报告会(VALSE Webinar)活动的共同发起人。研究专长:主要从事计算机视觉与模式识别、多模态大模型等方面研究。
主讲内容简介:在大模型时代,文字识别技术已经取得了显著的进步,展示了实现通用OCR的潜力。在本次报告中,首先我将全面分析大模型在OCR识别方面的表现;接着,我将介绍团队在多任务统一的文字识别方法,面向文档智能理解的多模态大模型,大模型智能文档推理等技术进展;最后,我将对文档智能的发展趋势进行展望。
欢迎师生参加!