网站首页    新闻动态    行业资讯    润(RUN)机器人   案例展示    联系我们  
 
   
   详细信息 位置: 首页 >> 行业资讯  
 

言犀基础大模型将推理速度提升 6.2 倍,部署成本降低了 90%

编辑:润(RUN)机器人      来源:京东云      时间:2024/1/16
 

需 求 分 析

目前基础大模型正处于蓬勃发展阶段,各行业、各领域以构建数字化、线上化、搭建虚 拟仿真场景为主要应用。在当前阶段下,基础大模型面临着以下问题:

一 、 由于基础技术的限制以及大部分企业在大模型应用和硬件设备开发能力的不足, 从而导致无法自主生产原生Al 模型。

二 、 除了用户单点大模型开发技术能力的不足,在各行业链条中的软硬件互通、数据 标准化和应用功能融合等问题中都存在着无法克服的壁垒。

三 、 大模型训练硬件的能源消耗问题,在当前全球绿色经济的背景下,平稳运行离不 开大规模的数据中心和云计算中心等基础设施的支撑,而大部分企业则无法满足以上的 要求,从而无法实现大模型的应用。

针对以上情况,开发言犀基础大模型,以实现低门槛构建基于人工智能技术的解决方案, 是本项目需要解决的问题。

案 例 介 绍

京东推出的言犀基础大模型,将着力围绕内容生成、人机对话、用户意图理解、信息抽 取、情感分类等几大类任务,围绕零售、物流、金融、健康、政务场景进行落地应用。

1)优质的场景和数据让模型产业属性更强 京东的言犀大模型,是扎根产业的原生大模型。凭借着从基础设施、模型层、MaaS 层 、 SaaS 层全栈的技术布局,打造多款端到端的大模型技术产品。

言犀大模型拥有三个差异化的特性:

第一 ,它是产业原生的,有更强的产业属性。

第二,它是价值驱动的,有更高的应用价值。

第三,它是开放协同的,有更快的迭代效率。

另 一 方面,京东连接着产业互联网和消费互联网,在对内实践和对外产业数智化过程中积累了众多优质的 数据,区别于 一 些通用域数据的静态数据,京东的数据是“鲜活的”,凭借每年产生数百亿的交互数据, 保证了模型的持续迭代和优化。

京东的大模型是在预训练阶段就接了70%通用域数据和接近30%京东特有的产业数据相结合去做训练, 这就保证了模型拥有大模型的“常识”,并拥有产业模型的“专业”。

2)京东言犀大模型技术架构

京东言犀大模型是基于京东云的高性能计算集群,采用 Megatron+DeepSpeed 的分布式训练框架,训练 的 Decoder-Only 架构模型。在通用知识获取方面,言犀大模型添加了约30%的京东域自身的产业数据, 并通过构建高质量的指令数据,帮助模型具备更强的产业属性。除了模型训练本身,京东言犀大模型还在 模型的转换层和服务层进行了自研算法的深耕,提升了大模型本身的推理速度和部署性能,让大模型的能 力能够充分的下沉到业务端,并通过集成平台能力打造真正的模型及服务。

3)前沿的算法能力保证模型具备高应用价值

· 预 训 练 层 面 源于业务应用需求,京东在2020年就提出了 K-PLUG 模型,将领域知识注入大模型中,以提高大模型的专 业性和忠实度,并在2021年对该项工作进行了发表。K-PLUG 方 法 是 基 于Transformer 模型架构 X 京 东 的 产业知识进行的预 训练 。

该算法帮助模型在实体属性抽取准确率为96%;在生成式多轮对话 ROUGE-L (指标主要是对比机器生成的 内 容 与 人 类 的 标 准 内 容 的 匹 配 度 ) , 以 2 7 % 领 先 于 斯 坦 福 经 典 的 Pointer-Generator; 在 上 下 文 多 轮 问 答 知识检索率以74%准确率领先于行业。

· 推理部署层面

除了在大模型的预训练阶段,言犀大模型通过上述算法增强了产业领域知识,在模型的推理层面,京东言 犀采用量化矩阵算子融合、自适应参数矩阵量化、自动算子切分与卡间并行、内存优化与缓存等多种策略, 将推理速度提升6.2倍,且在“首字”推理速度的大模型推理难点上,京东言犀大模型采用自研的算法, 极大程度的提升了大模型在推理方面的性能。在部署方向,依靠流式推理有效解码传输机制、动态批处理、 异构集群部署等方法,将部署成本降低了90%。

此外,京东言犀大模型还拥有配套的Al开发计算平台,用于快速的模型迭代,效率提升10倍以上,让模 型能够不断的学习新的知识。

4)澎湃算力打造开放协同的大模型生态

为了训练大模型,京东早在2021年就在重庆建成了大模型集群,也是全国首个基于 DGX SuperPOD 架构 的超大规模计算集群一天琴α,该集群在保障京东自身大模型训练的同时,还将集群的每秒浮点运算次数提 升40%,多卡线性加速比提升90%,为后续大模型的持续发展打下良好的基础。

另一方面,为了更好的应对大模型背景下的海量数据存储问题,京东还自研了向量数据库Vearch, 支 持百亿级向量监检索,召回实现毫秒级延迟,智能储存分层实现成本降低60%,大幅提升了模型推理泛化能力 与推理效率。

效益分析

该解决方案以京东全产业链为核心优势,从产业场景、软件平台、安全合规等多个方面 为用户带来价值。

· 产业场景方面:用户将借助京东积累的历史行业知识,低成本快速构建该用户所在 细分领域大模型应用,使用户快速取得局部市场的先发优势(量化标准为缩短开发周期 及成本降低)。

· 软件应用方面:为了让模型有更好的能力和应用,京东将开发言犀大模型过程中积 累下来的能力解耦整合出来,以大模型开发平台的形式开放给京东的合作伙伴。该平台 以京东云的私有云、公有云和混合云等高性能计算集群为底座,内置了包括数据、模型 训练和部署推理等工具能力,不仅支持京东自身的言犀框架,也同时会支持各个主流的 开源模型框架,促进大模型生态的发展。

· 安全合规方面: 言犀Al 大模型具备数据隐私和内容安全可控的价值:

5)数据隐私安全

我司在人机交互研究中进行训练数据处理、人工智能模型的训练时,严格遵守使用深度 合成技术中的个人隐私保护要求,确保训练数据数据来源合法性,并使用脱敏数据进行 模型训练。

6)内容生成可控性

恶意代码、插件和网络钓鱼电子邮件有可能被 ChatGPT 生成。为了杜绝此安全隐患, 京东云言犀团队会在模型 训练时引入人工反馈机制降低和杜绝模型生成有害信息的回 复。同时引入审核 API 来阻止某些有害内容的输出,例如,当收到要求编写用于从被黑 客攻击的设备窃取数据的代码或制作网络钓鱼电子邮件时,模型会拒绝该要求并指出此 类内容是“非法、不道德且有害的”。


 
【声明:转载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,文章内容仅供参考,如有侵权,请联系删除。】
 
推荐信息
高济神农智能患者管理体系三大落地应用,专为药师打造的高济 HealthMate 智能助手,智能随访系统,数字人用药指导解读,具备很强的可复制性,市场潜力很大
川数中心发〔2024〕1号;数据要素价值体系基本形成,数据要素市场主体规模持续壮大、质量稳步提升,数据要素服务经济社会发展能力显著增强
海南省数据要素基础制度体系建立完善,达到国内领先水平的数据要素市场培育基础设施基本建成;数据要素市场高效规范有序发展,跨境数据安全保障体系、分级分类管理机制和监管机制形成
私域的知识问答系统具有强大的知识管理能力,允许用户创建、编辑和组织知识文档、 常见问题解答 (FAQ)、 操作手册和培训材料等
研究团队创造性地将基于三维视觉的 GAPart 引入了机器人的物体操控系统 SAGE,将通过可泛化的三维零件检测 (part detection),精确的位姿估计 (pose estimation) 为 VLM 和 LLM 提供信息
AI将在机器人和自动化领域迈出新的发展步伐;机器人软件的发展将实现更多的共享和重复使用;物流将是机器人的一个重点领域
平台提供130亿参数通用大模型,130亿参数代码专用大模型,130亿参数 SQL 专用大模型以及130亿参数10K 上下文专用大模型,实现了200+个大型模型应用的开发
AI Agents 在机器人领域的应用也十分显著,智能机器人能够感知环境,理解语音指令,执行任务,并与人类进行交互,AI Agents 在不同领域的广泛应用已经在改变我们的日常生活
 

案例展示

 

格菲酒店(大兴区五福堂地铁站中科电商谷店)提供智能机器人送取物服务

秋果酒店(会展中心店)使用智能机器人「润」做服务员
 
最新动态
 
 
公司总部:北京云迹科技股份有限公司       电话:19863338289       联系人:郭先生       鲁ICP备18039973号-4