南开新闻网讯(通讯员 周宇)3月30日,中国图象图形学学会(CSIG)文档图像分析与识别专委会多模态大模型与可视文本智能(OCR)学术论坛在南开大学津南校区举办。本次学术论坛由中国图象图形学学会主办,由该学会文档图像分析与识别专委会联合南开大学计算机学院共同承办。
本次论坛聚焦于大模型时代的文档图像分析领域所面临的新挑战、新问题和新机遇,致力于展示OCR及多模态大模型领域的最新进展与研究成果。出席论坛开幕式的嘉宾包括:中国科学院自动化研究所刘成林研究员、华南理工大学金连文教授、中国科学技术大学谢洪涛教授、清华大学彭良瑞副研究员、华中科技大学刘禹良研究员、北京科技大学杨春副教授、北京元石科技有限公司方山城算法技术专家等业内知名学者。
论坛设置了两场主旨演讲、三场特邀报告以及一场圆桌讨论。主旨演讲环节,刘成林研究员做题为“几何题目自动求解方法探索”的演讲,金连文教授做题为“古籍文档的视觉-语言理解:从OCR到大模型”的演讲。特邀报告环节,刘禹良研究员做题为“浅析DeepSeek-R1及其在文档图像智能中的应用”的报告,杨春副教授做题为“开放环境下的文档图像理解及多模态大模型技术”的报告,方山城博士做题为“大模型驱动的智能设计:指令式图形文本图像生成”的报告。
论坛学术议程丰富多元,主旨演讲呈现基础研究突破,特邀报告分享技术创新成果,圆桌讨论则碰撞出产学研融合的新思路,吸引了众多国内顶尖高校以及华为、字节跳动、联想、金山等知名企业的150余名专家学者现场参与,充分展现了该领域的学术热度与产业关注。本次论坛为青年学者与领域内资深专家搭建了一个开放而广阔的交流平台,与会者围绕OCR技术革新、多模态大模型应用、行业技术瓶颈等核心议题展开了深入研讨。
本次论坛的成功举办,不仅为文档图像分析与识别领域的研究者提供了思想交流的宝贵机会,更通过促进学术界与产业界的深度对话,为未来技术突破和实际应用奠定了坚实基础。
|