《王金桥-多模态大模型驱动新一代技术变革.pdf》由会员分享,可在线阅读,更多相关《王金桥-多模态大模型驱动新一代技术变革.pdf(41页珍藏版)》请在三个皮匠报告上搜索。
1、多模态大模型驱动新一代技术变革演讲人 王金桥演讲嘉宾王金桥 中科院自动化研究所紫东太初多模态中心常务副主任中国科学院自动化研究所副总工程师,紫东太初多模态中心常务副主任,研究员,博导,武汉人工智能研究院院长,中国科学院大学人工智能学院岗位教授,多模态人工智能产业联盟秘书长,中国技术创业协会技术创新工作委员会副理事长,获北京市高聚领军人才、广州市创新团队领军人才、山东省泰山领军人才等称号。共发表包括IEEE国际权威期刊和顶级会议论文300余篇,国际期刊50余篇,国际会议220余篇。完成国家标准提案3项,发明专利36项,10项国际视觉算法竞赛冠军,北京市科技进步一等奖,吴文俊人工智能科技进步奖,中
2、国发明创新银奖,世界人工智能大会SAIL(卓越引领者)奖等。大模型开启人工智能新一代技术革命“大算力+大数据+大模型”标志着通用人工智能技术产品化的来临,成为产业化分水岭,将实现对劳动力、资本等生产要素的智能替代和功能倍增,促进全要素生产率的提高。增长速度最快重塑办公模式全程自动设计AIGC机器替人.开放环境、复杂场景、不同应用技术功能需求不断增多计算智能感知智能认知智能?智能形态水平持续深入二进制图像用户界面意图解析人机交互越来越智能国内外大模型井喷式爆发(语言模型为主)通过自监督+学习条件下实现“大数据+大模型”方式,引发人工智能发展新浪潮。悟道文源-参数26亿悟道文汇-参数113亿文本:
3、2TBBAAI 2021.03悟道2.0参数:1.75万亿文本:3TB图文:90TBBAAI 2021.06Switch Transformer参数:1.6万亿Google Brain 2021.01BERT参数:3.4亿文本:13GGoogleAI20004000数据量(GB)GPT参数:1.1亿文本:5.7GOpenAI2018.07GPT-2参数:15亿文本:40GOpenAI 2019.02MT-DNN参数:3.3亿微软2019.03GPT-3参数:1750亿文本:45TB-570GOpenAI2020.06XLNet参数:140GCMU2020.01盘古参数:2000亿文本:1.1T
4、B华为云2021.041TB =1024GB1GB =1024MB1MB=1024KB1KB =1024B300010000知识增强文心大模型参数:2600亿数据:海量无监督文本鹏城/百度 2021.12源1.0模型参数:2457亿文本:约5T浪潮 2021.10紫东太初1.0参数:1000亿图文音:50TB中科院自动化所,2021.07Florence模型参数:6.37亿图文:9亿对微软 2021.11产业界:Google、微软、OpenAI、阿里、百度、华为等学术界:智源、中科院自动化所、上海人工智能实验室、清华大学等DALLE-参数120亿图文:4亿对OpenAI 2021.01Stab
5、leDiffusion模型参数:14.5亿图文:58.5亿对StabilityAI 2022.4GPT-4模型参数:1估计00亿数据:未知StabilityAI 2023.3ChatGPT资源投入资料来源:OpenAI官网,N ChatGPT在数据、算力、资金、人才投入巨大。由OpenAI主导,微软Azure云、Johns Hopkins University深度参与,其他单位部分参与或员工跳槽带来的技术外溢。资源名称投入情况数据来自互联网、书籍或维基百科的45TB文本数据(近1万亿个单词来训练它,即大约1,351 万本牛津词典)和179GB的代码算力GPT-3训练一次需要460万美元,Cha
6、tGPT增加了代码数据,训练成本更高人员375名员工,大部分是世界级顶尖人才。另有数据外包人员几千人和40人专家级标注人员。资金OpenAI成立时投入10亿美元,2019年微软又投入了10亿美元,2023年后微软继续投入几百亿美元。根据美国财富报道,OpenAI 2022年净亏损5.45亿美元。ChatGPT生成一条问答成本为1.3美分左右,按照月活用户1亿,每个平均20条,算力运营费将达到1千万美元左右/月合作单位由OpenAI主导,微软深度参与,其他单位辅助或部分人员跳槽到其他单位,包括Johns Hopkins University、Anthropic、Alignment Researc
7、h Center、github、ZiplineGPT-3论文标注单位InstructGPT论文标注单位OpenAI Codex论文标注单位算力:数字经济时代的新生产力39.2万亿元2020年中国数字经济总规模6.3万亿元间接带动经济总产出2万亿元以计算机为代表 的算力产业规模数据、算力和算法是数字经济时代的关键资源数据是新的生产资料,算力是新生产力,算法是新的生产关系在算力中每投入1元,带动3-4元经济产出;算力发展指数每提高1点,GDP增长约1293亿元。来源:中国算力发展指数白皮书,信通院生产要素生产力生产关系土地劳动力资本技术数据数字产业化产业数字化算力生产算力聚合算力调度算力释放生产方
8、式算法创新生活方式算法创新治理方式算法创新科研范式算法创新业界普遍乐观看待算力增长前景AlphaFold 预测蛋白质结构1 亿原子分子动力学模拟算力算法数据协同发展n 芯片与异构计算架构创新n HPC算法精度提升n AI算法模型规模提升n 算网存智等新技术融合应用科技创新范式变革经济社会数字化、智能化转型人工智能算力约390倍41 EFLOPS16206 EFLOPS2018年2030年约110倍76 EFLOPS8512 EFLOPS2018年2030年5G/物联网算力约2000倍2.5 EFLOPS区块链算力5506 EFLOPS2018年2030年13 EFLOPS3928 EFLOPS
9、约300倍2018年2030年AR/VR算力信通院2020年全球算力规模达到429EFlops,增速达39%,预估未来5年全球算力 规模将以超过50%的速度增长,到 2025年整体规模达到3300EFlops。IDC罗兰贝格乐 观 预 测需 求 驱 动大算力、大模型发展涌现了一批新场景、新机遇北京市人工智能算力布局方案(2021-2023年)数据中心 集群算力 中心全国一体化 大数据中心数 网数 纽数 链数 脑数 盾新型数 据中心算力经济智能计 算中心边缘数据中心液冷数据中心东数 西算全国一体化 算力网络算力 网络基础 算力超算 算力智能 算力算力发展 指数算效数据中心水资 源利用效率(WUE
10、)存算 分离算网 融合E级/10E级 超算中心中国算力发展指数白皮书新型数据中心发展三年行动计划(2021-2023年)关于加快构建全国一体化大数据中心协同创新体系的指导意见全国一体化大数据中心协同创新体系算力枢纽实施方案中国移动算力网络白皮书中国联通算力网络白皮书新一代人工智能算力基础设施发展研究报告计算20302020全球计算力指数评估报告泛在算力:智能社会的基石智能计算中心建设规划指南2020-2021中国人工智能计算力发展评估报告超算互联 网人类的学习和交互过程充满了多模态信息婴儿阶段的早期概念习得过程(from Emmanuel Dupoux)感知习得各类模态的示例:自然语言(说/写
11、)视觉(图像/视频)听觉(声音/语音/音乐等)触觉 嗅觉/味觉 生理信号(心电图ECG,皮肤电传导等)其他(红外图像,深度图,核磁共振图像)应用和行为方面:心理学医学声学视觉语言多媒体机器人学习紫东太初大模型攻关历程不同场景对应不同小模型多模态大模型吸收海量知识算力中心(北京-武汉)一个场景一个模型 模型参数量小,泛化性差参数海量弱关联数据图像语音在照片的前半部分,我们可以看到一个干草区,那里有一个女人站着,穿着浅蓝色牛仔裤和灰白色长袖衬衫。文本多个场景一个模型 模型参数大,泛化性强1000亿预训练微调0020000参数从0开始独立调优艰难迭代推倒重来紫东太初2.021年
12、9月集团式攻关21年1月百亿模型21年7月完成千亿参数模型调试全球HC大会发布“紫东太初”20年1月22年10月23年6月“紫东太初”服务平台图文音单独攻关08年-20年紫东太初”大模型1.0:一个模型支撑多个任务“紫东太初”可以一个模型实现图像识别、语言翻译、图像描述、语音合成等50余种功能,并初步具备了人机交互、认知推理、艺术创作等创新能力。例如我们可以以音生图、可以理解图像含义。语言语音视觉领域应用多样化数据模态多样化摘要、续写、问答.声纹识别端点检测语种识别.图像识别目标检测语义分割.视频分类视频生成跨模态检索.语音合成语音识别.图像描述图像生成视觉问答.语言翻译一个模型实现5050余
13、种功能以图生音以音生图以文搜图输入:桌子上的蓝色小碗里盛着水果和坚果紫东太初2.0:从三模态到全模态三模态:利用文本、图片、音频等三种模态数据进行跨模态的统一表征和学习,是更接近人类的学习方式。视觉文本语音文本视觉语音文本视觉语音机器翻译以文生图语音合成视觉描述图像搜索以图生音语音识别以音生图多语翻译全模态:利用文本、图片、音频、视频、3D等所有模态数据进行跨模态的统一表征和学习。.语音模态数据语言模态数据图像模态数据视频模态数据3D模态数据多通道模态数据全模态AI大模型单模态分离:分别对文本、图片、音频和视频等不同模态数据单模型建模。语音模态数据AI模型1训练AI模型2训练语言模态数据图像模
14、态数据AI模型3训练AI模型4训练视频模态数据AI模型N训练N模态数据.紫东太初2.0:面向数字物联时代的全模态认知大模型 首次提出全模态多任务统一生成式学习框架:全模态分组对齐、分组解码和联合解码的学习方式。全模态低成本协同关联优化学习,融合多任务全模态能力,更具拓展性。全模态认知增强:面向物联世界多源输入的认知,具有全模态能力涌现,认知效率更高。图像文本视频3D信号音频物联数据音乐生成图像生成文本生成视频生成3D生成信号生成全模态生成全模态分组编码全模态认知关联融合全模态认知解码全模态认知增强紫东太初2.0:具备理解能力、对齐能力和生成能力对齐能力生成能力理解能力3D分析音乐描述信号分析视
15、频对话图像对话音频事件音频鉴伪以文生图以图生图音乐生成文本创作语言生成古诗生成中文问答视频检索图像检索3D文本对齐信号文本对齐音乐文本对齐图像文本对齐音频文本对齐目标检测文字识别机器翻译代码编写数学计算逻辑推理标题生成视频文本对齐 图文音对齐开源开放:紫东太初2.0,开源3.8B模型 基于昇腾昇思的紫东太初2.0-3.8B模型,开源图像-文本多模态部分 相比紫东太初1.0,支持更细粒度的图像识别、更具知识的视觉问答、更丰富的图像描述华为昇思华为昇思Mindspore平台开源平台开源模型参数量Flickr30k-CNA(CIDEr)fm-iqa(CIDEr)OK-VQA(ACC)紫东太初1.00
16、.2B56980.31紫东太初2.03.8B771060.41BLIP(ViT/G)12.1B/0.45BLIP(ViT/L)3.4B/0.39开源模型扫码下载模型开源开放全栈自主可控基础软硬件建 立 多 模 态 产 业 生 态CVNLPAudio服务大模型服务扫码下载紫东太初2.0:三维理解和内容生成各种健康的水果放在桌子上红烧狮子头托盘上各种食品与调味品唯美浪漫的故宫春色穿着旗袍的美丽中国女孩月球上的飞船 赛博朋克水墨画的竹子夕阳下的树和湖烟雨江南的山间村落办公室有四张桌子,五张椅子,桌子上三台电脑,墙上有一面黑板,一扇窗户,上面三盏灯,桌子下面四个柜子,一扇门,上面三盏灯,墙上一面黑板,
17、一扇窗户。这是一个办公室。有8个房间,包括1间客厅,1间厨房,2间卧室,2间浴室,1个阳台,1个未定义的房间,有8个门。卧室和浴室有门连通。客厅和浴室有门连通。客厅和卧室有门连通。通用能力的拓展:大模型与人形机器人交互大模型无法与真实环境进行交互大模型为机器人生成执行指令Ahn et al.,2023.Do As I Can,Not As I Say:Grounding Language in Robotic Affordances.arXiv:2204.0169.(Google)机器人领域具身视觉多模态大模型(Google)谷歌和柏林工业大学的团队重磅推出了史上最大的视觉语言模型PaLM-E
18、,参数量高达5620亿(GPT-3的参数量为1750亿)。作为一种多模态具身视觉语言模型(VLM),PaLM-E不仅可以理解图像,还能理解、生成语言,可以执行各种复杂的机器人指令而无需重新训练。资料来源:PaLM-E:An Embodied Multimodal Language Model,arxiv2023 紫东太初开放服务平台2.0内置多任务模板开箱即用,一键微调,低参数调优内置“紫东太初”等大模型指导下游多领域、多行业小样本一键微调低门槛一站式开发高效率开发依托昇腾AI基础软硬件平台、昇思MindSpore计算框架,可实现全栈国产化,可控可信全栈国产化公有云开箱即用,无需依赖本地算力及
19、环境;私有化部署功能灵活可配,支持场景定制。支持公有云/私有化部署平台优势全模态智能化标注,支持未知目标和关系发现预置全模态模型智能标注和未知目标发现待确认数据未标注数据全自动预标注人工确认已标注数据 雷达、红外和信令检测_目标检测多边形 物品产地归属国_实体关系抽取 语音情感识别_语音分类内置图、文、音等不同数据类型标注任务的标注模板,支持通过修改配置文件,快速拓展和自定义标注模板图像和视频描述目标检测_分割实体关系抽取文本分类支持全模态物联数据音频文本图片 多模态图片描述 视觉目标检测_矩形框/多边形 文本分类、实体关系抽取 音频分类 标签模板管理雷达三维一站式开发工具链:无代码快速生产场
20、景化任务和部署模型1423创建大模型微调任务,可上传本地指令集,也可使用线上回流数据在线编写指令集、文本或图文问答对一键部署为在线服务启动微调训练任务开箱开箱即用即用开箱开箱即用即用快速快速定制定制快速快速定制定制一键一键部署部署一键一键部署部署多种多种交付交付多种多种交付交付内置紫东太初2.0预训练基础大模型,开箱即用提供完整大模型微调工具链,快速定制用户专属行业模型支持微调后一键部署服务,在线评估体验大模型多模态对话支持多种公有云SaaS API服务、云上专属资源池、私有集群部署、超融合训推一体机等多种交付部署方案江城洛神个性化创作平台23基于紫东太初大模型的数据自动构建基于紫东太初大模型
21、的数据自动构建融合多模态大模型的图文理解能力融合多模态大模型的图文理解能力支持多任务扩展编辑支持多任务扩展编辑支持细粒度可控生成支持细粒度可控生成通过紫东太初的图像描述能力、跨模态检索能力,自动构建AIGC的训练数据在作品制作过程中,可上传元素轮廓图,在生成作品时会根据这些轮廓生成类似的效果可通过文本对于生成图片的细粒度信息进行控制,例如头发的颜色、人物的表情、背景的效果、风格的定义等利用多模态的语义理解,使生成图片和描述文字更加贴近生成器判别器人工集生成数据筛选数据一只大毛绒熊坐在椅子上江城洛神AIGC 智能生成平台原画CG建模BlendShape细节渲染表情动画灯光与合成面捕须发模拟CG低
22、模传统CG AIGC 属性信息紫东太初+diffusion NeRF用户偏好大模型+Diffusion+NeRF为技术支撑,替代传统CG技术,实现数字人快速批量生成、驱动与互动,帮助用户完成数字人自动化 AIGC。全身可控虚拟人生成文生图大模型生成静态人像Talk-show动作参数序列生成3D-GAN隐空间反演,动作参数植入,再渲染promptInversion3D-GAN3D-GAN隐空间动作参数生成特征编辑文生图“紫东太初”荣获2022世界人工智能大会SAIL奖世界人工智能大会最高奖项-SAIL奖,旨在从全球范围发掘在人工智能领域中具有高度认可的项目。2022年全球800余个项目参与角逐。
23、最终,“紫东太初”大模型凭借其技术创新性及产业影响力获得SAIL大奖。Superior:超越,表明行业内卓越引领地位Applicative:赋能,彰显赋能经济社会的极高期许Innovative:创新,突显项目技术的创新要求Leading:引领,展现项目是全球AI领域的开路先锋解放大脑的“智能型”生产工具ChatGPT应用场景广泛27 有新闻称89%的美国大学生用ChatGPT写作业。ChatGPT通过了美国医学执照考试、沃顿商学院MBA考试和4门法学院的考试,所撰写的学术论文即使是资深专家也很难分辨。亚马逊等公司的员工使用ChatGPT完成编程、制作PPT、客服等工作。1月26日,“美版今日头
24、条”BuzzFeed宣布使用ChatGPT帮助创作内容。2月6日,招商银行使用ChatGPT撰写品牌稿件。ChatGPT帮助BuzzFeed的“Quizzes”栏目批量生成各种小测试,然后再根据用户的回答,制作他们的专属报告。基于ChatGPT作为自然语言交互接口,可以调用多达万种人工智能模型应用。-成为重要的生产力工具ChatGPT+Office 重塑办公和写作模式 ChatGPT+插件大幅提升办公效率,普通人员也可以做出专业的演讲PPT将GPT接入办公软件,实现一句话就能生成PPT、Excel、文案、邮件,大大提高了办公效率。1.快速启动创作过程,无需再从一张白纸开始。2.Copilot为
25、你提供了一个编辑和迭代的初稿,节省了写作、采购和编辑的时间。3.作为作者,你可以让Copilot 缩短、改写文档或提供反馈。微软把GPT-4模型装进了Office套件,推出了全新的AI功能Copilot(副驾驶)比如输入“基于昨天OneNote中的笔记”,首先他会列出来昨天的所有笔记文件、当你选择了其中一个文件,Copilot就可以开始创作了。1分钟word转ppt,一键浓缩冗长的PPT,并使用自然语言命令去调整布局、重新编排文本、甚至卡点完美的动画时间。网友使用AutoGPT开发一个网站。不到3分钟,AI自己就用React和Tailwind CSS实现了。ChatGPT+插件+递归地调用自己
26、(行动观察结果思考产生下一步行动)ChatGPT+GitHub Copilot全自动设计程序产品AutoGPT是一个新的基于GPT-4的开源应用项目,它拥有完全自主实现目标的能力类似的项目有:HugginGPTAutoGPTAgentGPTAutoGPT的架构基于GPT-4和GPT-3.5,靠API连接;AutoGPT可以进行自主迭代,即通过自我批判性审查来改进输出、在先前工作的基础上进行构建,并为了获得更准确的结果集成prompt历史记录;AutoGPT具有内存管理,集成了Pinecone数据库,因此它可进行长期内存存储,保存上下文并基于此进行决策改进。技术原理多模态产业联盟打造健全的AI产
27、业生态整合产学研用各方资源打造多模态人工智能行业应用探索通用人工智能产业化路径多模态人工智能产业联盟紫东.太初66家成员理事长单位中科院自动化所成员单位武汉大千智能汽车:车载软件代码自动生成与安全检测基于国产化大模型基础软硬件,构建知识驱动的AI大模型,提升多模态大模型的分布式训练与知识迁移能力,建立基于大模型的软件智能化体系,基于大模型构建智能网联汽车车载软件代码自动生成与安全检测平台,赋能智能网联汽车等行业。多模态数据智能网联汽车行业应用部署跨模态编码与关联跨模态编码与关联跨模态转化与生成跨模态转化与生成国产化超算平台国产化超算平台文本文本预训练预训练模型模型文本文本预训练预训练模型模型代
28、码代码预训练预训练模型模型代码代码预训练预训练模型模型多语言预训多语言预训练模型练模型多语言预训多语言预训练模型练模型跨模态语义关联跨模态语义关联跨模态语义关联跨模态语义关联多模态大模型文本视频图片语音代码下游任务微调人类反馈学习提示和指令学习思维链学习模型轻量化部署领域知识嵌入代码安全检测模型代码自动生成模型代码漏洞修复模型多模态感知模型智能座舱软件开发自动驾驶算法研发车载底层软件开发构建支撑车载雷达信号.法律行业:法律案件分析效率提升百倍针对中国律师整体资源匮乏、服务成本高的问题,采用紫东太初2.0大模型对法律案件进行拆解,提取关键事件,实现案件分析速度提升百倍,大幅降低人力成本。对被侵权
29、人承担赔偿责任我昨天上午十点车祸高新大道时间原因地点肇事者角色2承担承担人角色1违约责任对出租车公司承担违约责任驾驶宝马认定责任全部责任动作对象结果程度交通肇事责任纠纷交通事故案件类型租赁租车公司动作对象角色1承租人车辆租赁存在过错承担赔偿责任不承担赔偿责任汽车租赁合同纠纷0.546秒紫东 太初用时智慧路口:道路通行率有效提升30%构建面向公路路网孪生仿真、调度、养护、节能、服务等全周期、全天候、安全安心的数智平台,提升出行体验解决问题 感知弱:缺乏全覆盖、全天候、全时空、低成本感知 调度难:交通流量缺乏主动预警和及时防控,易导致事故频发 管理难:资产定检依赖人工,无法感受AI便利产品特色 全
30、天候、全要素、全时空,车辆及车道级别精准感知 实时孪生仿真,路网-路口-车道多层级精细化监控 路口、干线信控优化以全局最优为目标,兼顾行人通行,流量控制策略动态调整孪生世界物理世界融合感知中微观一体化全场景全要素感知AI行为检测、分析和预警实景还原,虚实结合预测推演,孪生验证机理模型+数据驱动模型模型实时决策自主进化道路全场景精准感知孪生仿真精细化模拟及推演预测式主动分析、管理及优化反馈激励智能座舱:千人千面个性化虚拟助手长安欧尚Z6的虚拟数字人”YYDS”基于“紫东太初”多模态大模型携手长安欧尚,共同引入了元宇宙的概念,创造出YYDS虚拟数字人,可以通过复刻自己或者亲人的形象和声音,捏出专属
31、的语音助手。办事助理:政务服务智能化,满意度98%交互能力通过将计算机视觉、语音、NLP等AI技术深度融合,充分模拟人与人之间真实的对话交互方式,达到“听得懂,看得见,说得出“的效果。可视化的真实形象赋予了数字人独特的情感属性,有助于建立人性化的情感纽带。展现能力感知能力从感知能力来看,借助屏幕载体,不仅能实现传统虚拟人的对话功能,还能高效一体化完成身份识别、图像识别、情感识别、知识问答等多种交互任务。智能生成-个性化虚拟人像生成输入一个真实图像,根据面部五官及发型饰物等特征,由“紫东太初”大模型生成个性化的多样化2D-3D的多种形象。“千人千面”个性化卡通形象生成编码编码编辑器多模态大模型引
32、导“迪士尼风格”(输入文字)生成器塑造后塑造前超真实超写实卡通超真实超写实卡通行业应用:千博多模态手语教考一体机基于“紫东太初”开发手语多模态模型,开创性地实现手语动作与示意图片和文字的联动,解决手语师资短缺,推动手语标准的推广。多模态手语教考一体机可以实现文本到图像的自动生成,具备实时手语手势识别、表情及唇语生成等能力,还可实现新事物词汇的及时学习与更新,现已在湖南湘潭特校等数十个学校陆续上线。手语识别手语生成手语具象化教学示例智慧医疗:神经外科手术助手Surgical Concept Alignment NetworkFine-tuningSurgical videosZidongtaic
33、hu Foundation ModelVisual modalityLanguage modalitySpeech modality大算力+大模型形成AI开发与服务模式大模型催生新的AI开发与服务模式大模型研发与AI应用服务分离AI应用服务公司研发成本降低可以重点发展落地应用场景1有标注数据模型1训练模型1部署“算法+数据+算力”AI“手工作坊”式开发模式场景N有标注数据模型N训练模型N部署模型研发占据AI公司大部分科研工作AI企业在场景化落地时的研发成本较高“大模型+微调+模型服务”AI工业化开发模式模型部署模型微调适配大规模任务无关无标注数据基础大模型提供方少量行业或场景数据模型部署模型微
34、调适配低 资 源 适 配少数据量大规模预训练模型少量行业或场景数据应用场景1应用场景N智能应用开发方,重点关注应用创新文本补全、代码补全、文本搜索、内容审核GPT-3开放的API未来趋势:从语言智能走向现实世界多模态具身智能感知(客观)问题边界清晰智能能力分离机制较清晰如何生成、归纳新概念?如何积累常识?如何跨领域泛化问题求解?方法与范式?如何理解、定义意识?问题边界开放智能能力混合机制不明确智能本质跨越感认知鸿沟认知(客观+主观心理活动)虽然人工智能感知能力很强,但是其认知泛化能力不足,需要重点探索类人多模态感认知、人机混合智能理论与方法,实现动态、开放环境下的更通用认知能力。人工智能应用场景的技术难度越来越高 以大数据、跨媒体为代表的信息智能在单源信息场景得到广泛应用,达到实用成熟阶段,正向多源信息复杂场景及自主无人系统等决策/行为智能方向发展,实现从认知世界向融入环境的跨越。感 谢 聆 听