商汤科技推出“日日新”大模型体系 其中语言大模型叫:“商量”_应用_训练_的能力

图说:商汤展示语言大模型“商量”的能力 新民晚报记者 郜阳 摄 新民晚报讯(记者郜阳)今天下午,在上海临港AIDC举行的商汤技术交流日上,商汤科技发布了“日日新”大模型体系,并推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多

图说:商汤展示语言大模型“商量”的能力 新民晚报记者 郜阳 摄

新民晚报讯(记者郜阳)今天下午,在上海临港AIDC举行的商汤技术交流日上,商汤科技发布了“日日新”大模型体系,并推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。

当前业界训练大模型对大算力的需求非常旺盛,并且真正好用的基础设施十分稀缺。商汤历时5年,建设了业界领先的AI大装置,大装置上总共有27000块的GPU芯片卡,可以输出5.0 exaFLOPS的总算力,是亚洲目前最大的智能计算平台之一。基于大装置的能力,商汤目前已构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型,持续演进能力并广泛支持各种应用。

图说:商汤科技董事长兼CEO徐立 采访对象供图(下同)

“在AI大模型时代,数据、算法和算力这三要素也在经历新的演变,大模型参数量将以指数级的速率提升,而数据量随着多模态的引入也将大规模增长,因此就必然会导致对算力需求的剧增。”商汤科技董事长兼CEO徐立表示,“我们以AI大装置打造通用人工智能(AGI)时代的基础设施,并基于此将大模型体系命名为‘日日新’,寓意‘苟日新、日日新、又日新’,希望在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI的更多可能。”

记者注意到,“日日新”为政企客户提供了多种灵活的API接口和服务,包括图片生成,自然语言生成,视觉感知通用任务与标注服务。客户可根据实际应用需求,调用“日日新”大模型的各项AI技术能力,低门槛、低成本、高效率地实现各类AI应用。

自然语言是人机沟通的关键手段,“日日新”也推出了商汤最新研发的语言大模型“商量”,作为千亿级参数的自然语言处理模型,“商量”使用大量数据训练,并充分考虑了中文语境,能够更好地理解和处理中文文本。活动现场,“商量”展示了出色的多轮对话和超长文本的理解能力。例如需要为“商量”语言大模型写一条广告语,它给出的回答是“与商量携手,让语言成为你的优势,开启无限可能。”

商汤还展示了语言大模型支持的几项创新应用,包括:编程助手,可帮助开发者更高效地编写和调试代码;健康咨询助手,为用户提供个性化的医疗建议;PDF文件阅读助手,能轻松从复杂文档中提取和概括信息。

“‘商量’拥有1800亿参数,且知识能自动及时更新。目前已经有合作伙伴开展了内测,未来主要面向B端业务。”商汤科技联合创始人、首席科学家王晓刚介绍。

图说:商汤自研生成式AI应用系列

此外,扩散模型引爆了AIGC应用的流行,商汤展示了“日日新”的各种AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用,其中——

“秒画”文生图创作平台,展现了光影真实、细节丰富、风格多变的强大的文生图能力,可支持6K高清图的生成;客户还可根据自身需求训练生成模型。

“如影”AI数字人视频生成平台,仅需一段5分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。

“琼宇”和“格物”3D内容生成平台,可以高效低成本生成大规模三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间。

“AGI催生了新的研究范式,即基于一个强大的多模态基模型,通过强化学习和人类反馈不断解锁基模型新的能力,从而更高效地解决海量的开放式任务。AGI将实现从‘数据飞轮’到‘智慧飞轮’的演进,最终迈向人机共智。”王晓刚表示,商汤已建立了全栈的大模型研发体系,并已在多个行业场景中落地。

记者了解到,商汤面向行业伙伴提供涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署、开发效率提升等多种大模型即服务。

本文来自投稿,不代表长河网立场,转载请注明出处: http://www.changhe99.com/a/WArpEpjYwX.html

(0)

相关推荐