一键部署!京东云全面上线DeepSeek-R1&V3

2025-02-06 15:13 来源:钱江晚报

  潮新闻客户端 记者 鲁佳

  2月5日,潮新闻记者了解到,京东云已正式上线 DeepSeek-R1和 DeepSeek-V3模型,支持公有云在线部署、专混私有化实例部署两种模式,供用户按需部署,快速调用。

  模式一:公有云在线部署

  开发者和企业可以在京东云官网,进入言犀AI开发计算平台的“AI资产市场”中,选用该模型进行一键部署。

  言犀AI开发计算平台已经支持 DeepSeek-V3、DeepSeek-R1 以及所有蒸馏小参数模型(DeepSeek-R1-Distill)的一键部署,具体步骤如下:

  1、选择基础模型

  在“AI资产市场/模型” 中,提供DeepSeek开源的多个版本,如DeepSeek-R1-Distill-Qwen-1.5B,点击进入卡片页可了解模型结构和预训练数据等关键信息,并查看模型文件结构。

   

  2、准备资源节点

  在部署时,LLM模型因为模型较大,资源性能要求较高,需要独占计算卡进行部署,建议提前准备好专属资源节点。

  功能路径:专属资源组-创建资源组-创建节点。

  节点规格:部署DeepSeek-R1-Distill,推荐使用 cap.p.n3a30.4xlarge;部署DeepSeek-V3,推荐使用 cap.hc.p5h20.46xlarge

   

  3、模型部署使用

  将模型部署到相应的服务资源上提供推理调用服务,在部署时平台将自动适配预置推理框架,实现一键部署,仅需指定使用的专属资源组和对应的节点规格。部署完成后,状态将会变为运行中,运行中的模型可被调用,提供推理服务。

  功能路径:专属资源组-创建资源组-创建节点在线服务-部署;在线服务-服务列表 | 服务名称-在线调试

   

  模式二:专混模式数据不出域,私有化算力实例部署

  专混私有化算力实例部署模式,已经同步上线京东云vGPU AI算力平台,为金融、企业、政府等客户提供数据不出域的私有化模型推理服务。

  以DeepSeek R1版本为例,具体的使用步骤如下:

  1、进入算力管理页面,点击租用新实例按钮

   

  2、选择资源规格以及对应带有deepseek模型的镜像

   

  3、资源创建成功后进入实例,启动即可与之对话

   

  据了解,京东云言犀AI开发计算平台还支持私有化部署及API快速集成,通过自研高性能资源管理与弹性调度系统,可提供大模型的全生命周期服务及部署,涵盖模型开发、推理及多场景应用扩展。

  针对资源紧缺的场景,京东云支持通过蒸馏技术训练企业自己的大模型,减少模型部署所需资源的同时具备较好的性能。使用京东云vGPU AI算力平台,可以将多个蒸馏过的企业自有模型部署在同一张卡上,有效提升资源利用率70%。

查看余下全文
(责任编辑:徐自立)
手机看中经经济日报微信中经网微信
当前位置      首页 > 公司观察  > 正文
中经搜索

一键部署!京东云全面上线DeepSeek-R1&V3

2025年02月06日 15:13    来源: 钱江晚报    

  潮新闻客户端 记者 鲁佳

  2月5日,潮新闻记者了解到,京东云已正式上线 DeepSeek-R1和 DeepSeek-V3模型,支持公有云在线部署、专混私有化实例部署两种模式,供用户按需部署,快速调用。

  模式一:公有云在线部署

  开发者和企业可以在京东云官网,进入言犀AI开发计算平台的“AI资产市场”中,选用该模型进行一键部署。

  言犀AI开发计算平台已经支持 DeepSeek-V3、DeepSeek-R1 以及所有蒸馏小参数模型(DeepSeek-R1-Distill)的一键部署,具体步骤如下:

  1、选择基础模型

  在“AI资产市场/模型” 中,提供DeepSeek开源的多个版本,如DeepSeek-R1-Distill-Qwen-1.5B,点击进入卡片页可了解模型结构和预训练数据等关键信息,并查看模型文件结构。

   

  2、准备资源节点

  在部署时,LLM模型因为模型较大,资源性能要求较高,需要独占计算卡进行部署,建议提前准备好专属资源节点。

  功能路径:专属资源组-创建资源组-创建节点。

  节点规格:部署DeepSeek-R1-Distill,推荐使用 cap.p.n3a30.4xlarge;部署DeepSeek-V3,推荐使用 cap.hc.p5h20.46xlarge

   

  3、模型部署使用

  将模型部署到相应的服务资源上提供推理调用服务,在部署时平台将自动适配预置推理框架,实现一键部署,仅需指定使用的专属资源组和对应的节点规格。部署完成后,状态将会变为运行中,运行中的模型可被调用,提供推理服务。

  功能路径:专属资源组-创建资源组-创建节点在线服务-部署;在线服务-服务列表 | 服务名称-在线调试

   

  模式二:专混模式数据不出域,私有化算力实例部署

  专混私有化算力实例部署模式,已经同步上线京东云vGPU AI算力平台,为金融、企业、政府等客户提供数据不出域的私有化模型推理服务。

  以DeepSeek R1版本为例,具体的使用步骤如下:

  1、进入算力管理页面,点击租用新实例按钮

   

  2、选择资源规格以及对应带有deepseek模型的镜像

   

  3、资源创建成功后进入实例,启动即可与之对话

   

  据了解,京东云言犀AI开发计算平台还支持私有化部署及API快速集成,通过自研高性能资源管理与弹性调度系统,可提供大模型的全生命周期服务及部署,涵盖模型开发、推理及多场景应用扩展。

  针对资源紧缺的场景,京东云支持通过蒸馏技术训练企业自己的大模型,减少模型部署所需资源的同时具备较好的性能。使用京东云vGPU AI算力平台,可以将多个蒸馏过的企业自有模型部署在同一张卡上,有效提升资源利用率70%。

(责任编辑:徐自立)


分享到:
    中国经济网声明:股市资讯来源于合作媒体及机构,属作者个人观点,仅供投资者参考,并不构成投资建议。投资者据此操作,风险自担。
中国经济网版权及免责声明:
1、凡本网注明“来源:中国经济网” 或“来源:经济日报-中国经济网”的所有作品,版权均属于
  中国经济网(本网另有声明的除外);未经本网授权,任何单位及个人不得转载、摘编或以其它
  方式使用上述作品;已经与本网签署相关授权使用协议的单位及个人,应注意该等作品中是否有
  相应的授权使用限制声明,不得违反该等限制声明,且在授权范围内使用时应注明“来源:中国
  经济网”或“来源:经济日报-中国经济网”。违反前述声明者,本网将追究其相关法律责任。
2、本网所有的图片作品中,即使注明“来源:中国经济网”及/或标有“中国经济网(www.ce.cn)”
  水印,但并不代表本网对该等图片作品享有许可他人使用的权利;已经与本网签署相关授权使用
  协议的单位及个人,仅有权在授权范围内使用该等图片中明确注明“中国经济网记者XXX摄”或
  “经济日报社-中国经济网记者XXX摄”的图片作品,否则,一切不利后果自行承担。
3、凡本网注明 “来源:XXX(非中国经济网)” 的作品,均转载自其它媒体,转载目的在于传递更
  多信息,并不代表本网赞同其观点和对其真实性负责。
4、如因作品内容、版权和其它问题需要同本网联系的,请在30日内进行。

※ 网站总机:010-81025111 有关作品版权事宜请联系:010-81025135 邮箱:

关于经济日报社关于中国经济网网站大事记网站诚聘版权声明互联网视听节目服务自律公约广告服务友情链接纠错邮箱
经济日报报业集团法律顾问:北京市鑫诺律师事务所    中国经济网法律顾问:北京刚平律师事务所
中国经济网 版权所有  互联网新闻信息服务许可证(10120170008)   网络传播视听节目许可证(0107190)  京ICP备18036557号

京公网安备 11010202009785号