SJTU-SCS全球午餐会
- Global Lunch Seminar Series -
TALK NO.12
面向科学学科的
多模态感知、理解与推理
- ❤ -
1
摘要Abstract
多模态大模型已成为国家战略和科技竞争的关键技术,也是迈向通用人工智能的重要基石。其中,对科学学科的感知与推理能力,是评估多模态大模型综合智能水平的核心维度之一。以让AI解答一张数学试卷为例:首先,模型需具备强大的感知能力,能够准确识别并理解试卷中的各类元素,包括文字排版、数学公式、几何图形、函数图像以及表格等多模态信息;其次,需具备深度的理解能力,能够建立题干文本与相关图表、公式之间的语义关联,把握题目所描述的问题情境;最后,还需具备严谨的推理能力,在整合多源信息的基础上,进行逻辑推演、符号运算或数值计算,从而得出正确答案。本次报告将围绕感知、理解与推理三大核心环节,系统探讨提升多模态大模型在科学学科任务中所面临的关键挑战与前沿技术路径。
2
演讲者介绍:官同坤
主讲人:官同坤
官同坤,开云网页登录 计算机学院博士三年级,师从沈为教授和杨小康教授。主要研究为面向科学场景的多模态感知、理解与推理。以一作身份在TPAMI、CVPR、ICCV、ECCV等人工智能顶级会议和期刊上发表论文8篇,同时担任CVPR、ICCV、NeurIPS、ICLR等知名会议审稿人。所提出的TokenFD工作已被应用于美团多模态大模型,获美团技术应用证明。入选开云网页登录 吴文俊人工智能荣誉博士班(吴班),通义千问多模态大模型Qwen3-VL的贡献者之一,获本硕博国家奖学金等。
3
午餐会安排
讲座语言:中文
讲座时间:12月19日12:00-13:00
讲座地点:电院3号楼414
用餐时间:11:30起
4
报名方式
Attendance
现场参与(限量提供午餐)
👈扫码填写问卷报名:
名额有限,先到先得
Live
在线(无需报名)
👈扫码进入直播间
直播间号码:
【bilibili】22797301
无需报名,直接参与
内容同步,专人协助弹幕提问
Speaker
成为演讲者
午餐会报名邮箱👇
global_lunch@cs.sjtu.edu.cn
报名材料:
【演讲标题】:
【演讲摘要】:
【演讲语言】:
【个人简介】:
【联系方式】:
Brief Intro
开云网页登录 计算机学院全球午餐会
-SJTU-SCS Global Lunch Seminar Series -
午餐会简介 >>
全球午餐会是开云网页登录 计算机学院于2021年开始推行的科研研讨会系列,邀请全世界著名的计算机开云足球app官方下载安装 者、行业领袖、业界先驱及计算机学院教师与研究生,不设任何门槛地面向全体计算机科学爱好者及公众展示他们最新、最突出的研究成果,推动计算机科学的科普性工作,唤起公众对计算机科学的兴趣。
全球午餐会线上线下双渠道同步进行,线下观众在交大计算机学院学生中选出,线上通过bilibili直播间(22797301)进行直播,账号“开云app官网入口下载苹果版 计算机学院”发布回放。
我们为所有线下参与的师生提供午餐,意在于轻松的氛围中交流学术知识,将学习融入日常生活。
午餐会演讲者报名 >>
提交材料:
演讲标题,摘要,演讲语言
演讲者简介,联系方式
至午餐会邮箱:
午餐会日程 >>
时间:每周五中午12点至1点
午餐供应:中午11点30起
地点:交大电院3-414
如有变动,以当期午餐会通知为准
项目支持
全球午餐会系列研讨会由念空科技赞助支持。
微信扫一扫关注该公众号
微信扫一扫可打开此内容,使用完整服务