DoNews7月7日消息,7日,商汤科技在上海2023世界人工智能大会(WAIC2023)召开的“大爱无疆·日日新”人工智能论坛上,推出 “商汤日日新SenseNova”大模型体系的多方位全面升级,以及在该体系下的一系列大模型产品更新和落地成果。
此外,商汤也着重介绍并展示了其大模型技术自正式发布以来与产业各方的应用实践,包括商汤绝影最新打造的智能座舱产品和车路云协同交通体系等,以及在金融、医疗、电商、移动终端、产业园区等行业生产实践中的落地应用。
【资料图】
寓意“模型迭代速度和处理问题的能力可以日日更新”,商汤大模型体系在其“大模型+大装置”的AGI战略布局下,正进行着高速迭代。
作为千亿级参数的自然语言处理模型,商汤商量SenseChat 2.0版本突破了大语言模型输入长度的限制,并推出不同参数量级的模型版本,可完美适配移动端、云端等不同终端及场景的应用需求,降低部署成本。商汤的自研生成式大模型商汤秒画SenseMirage 3.0的模型参数从4月首次发布以来的10亿提升至70亿量级,能够实现专业摄影级的图片细节刻画。
不仅如此,商汤如影SenseAvatar 2.0数字人生成平台相较1.0版本的语音和口型流畅度提升30%以上,实现4K高清视频效果,并带来AIGC生成形象及数字人歌唱功能。
此外,商汤琼宇SenseSpace 2.0的空间重建效率提升20%,渲染性能提升50%,每100平方公里场景的建图时间仅需38小时即可完成(1200 TFLOPS/秒算力支持);而商汤格物SenseThings 2.0对小物体的纹理及材质还原达到毫米级精细度,并突破对高反光和镜面物体的采集难题。
依托 “商汤日日新SenseNova”大模型体系在底层技术领域的快速迭代,商汤正积极通过大模型的多模态能力组合赋能产业升级,并带来诸多引领行业的全新突破。
在金融领域,商汤与银行、保险、券商等客户展开合作,利用数字人进行智能客服、智慧营销等工作,并通过接入大语言模型能力,提供投研分析、研报撰写等新功能,实现降本增效。此外,挂载金融知识库后,还能100%基于客户的产品说明进行内容问答输出,并实现信息及时更新。
在医疗场景,商汤基于海量医学知识和临床数据打造了中文医疗语言大模型“大医”,提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力,未来也即将支持医学图像、文本、结构化数据等多模态综合分析,并可不断提升医疗语言理解和推理能力,持续赋能医院诊疗效率及患者服务提升。
结合商量2.0和秒画3.0的综合能力,商汤还为移动终端客户带来多种智能交互解决方案,包括针对信息获取的问答交互,针对生活场景的知识交互,针对语言和图像生成的内容交互等,依托商汤大模型的轻量化版本,可轻松实现在移动终端的部署和运行。
此外,在由商汤以刘慈欣获奖小说《三体》为故事蓝本打造的《三体·引力之外》沉浸式科幻体验空间,商汤通过大模型的能力突破想象力的边界,创作并展现极具未来感的科幻航程。
面向线下场景,商汤通过大模型能力为电网巡检带来长尾故障识别、复杂缺陷判断等智能解决方案。基于琼宇2.0的空间重建,商汤为济南马山镇区域开发、合肥中国视界园区、上海瑞金医院等打造实景空间的数字孪生,提升运营管理效率。在珠宝行业,依托格物2.0商汤为珠宝品牌进行珠宝首饰复刻,细致展现商品工艺特点,提升顾客购物体验。
在线上短视频、直播平台,商汤如影2.0生成的数字人正得到广泛应用,商汤还与多个头部企业达成渠道战略合作,共建“云+AIGC+短视频直播”生态,为行业带来更高效、低成本、便捷易用的AI视频和营销工具。
在智能汽车领域,商汤绝影智能座舱、智能驾驶、车路协同等行业应用也已在大模型的加持下突破创新边界。在智能座舱里,商汤通过视觉、听觉等多模态融合,全方位感知用户需求,通过标签化数据记录用户习惯和偏好,提供专属个性服务。
同时,商汤还通过大模型强大的环境理解、逻辑思维和内容生成能力,带来更懂用户的“车舱大脑”,以及可支持形象、语音快速定制的数字人进行拟人化交互,带来集安全、娱乐、教育及效率于一体的智能座舱体验。
车舱外,依托 “大模型+大装置”的强大能力,商汤绝影部署端云协同,统一流量入口,支持私有化部署及千万量级的应用需求。在近期的CVPR 2023中,商汤及联合实验室还首个提出感知决策一体化的自动驾驶通用大模型UniAD,开创了以全局任务为目标的自动驾驶大模型架构,并斩获最佳论文奖,为自动驾驶技术与产业的发展提出了新的方向。
基于此,商汤打造车路云协同的交通体系,凭借多模态多任务通用大模型开发路侧视觉感知大模型,结合琼宇2.0及格物2.0构建智能交通孪生与仿真,并利用商量2.0的感知推理和人机交互能力推动车路云共同向大模型对话式交互的演进。
关键词: