讲座报告主题:会议智能底座:高可用多模态说话人日志的系统化实践
专家姓名:刘涛
日期:2025-11-08 时间:16:30
地点:江苏镇江明都大饭店研发楼308
主办单位:计算机科学与通信工程学院
主讲简介:刘涛,思必驰技术专家,上海交通大学计算机系博士。以多模态智能交互为主要研究方向,聚焦多模态说话人日志技术的持续优化,重点探索跨模态信息融合及精准说话人识别等核心问题,推动语音与视觉模态的深度协同与融合。目前已在AAAI、ACM MM、ICASSP等国际会议及期刊发表相关成果,并担任多个国际会议及期刊的审稿人。研究专长:多模态智能交互。
主讲内容简介:本报告以现代会议场景中的智能需求为切入点,介绍以多模态说话人日志(Speaker Diarization)为核心能力的“会议智能底座”系统框架,致力于实现高效稳定、可度量、可运维的会议智能服务。报告以端—边—云协同的视角,阐述音频处理、说话人定位与画面追踪、会议内容理解与语义提取等多模态技术的融合应用,强调系统在复杂真实环境(如噪声干扰、多人同时发言、快速切换等)下的鲁棒性提升策略。通过明确延时、准确性和多媒体同步等关键指标,结合实际工程中的容错、热更新、降级策略以及在线优化的方法论,推动会议智能技术从实验室到真实场景的落地应用。最终,本系统旨在将会议内容转化为组织内可管理、可检索的知识资产,实现会议场景下智能化与知识化的持续运营。
欢迎师生参加!