潮新闻客户端 记者 鲁佳
2月5日,潮新闻记者了解到,京东云已正式上线 DeepSeek-R1和 DeepSeek-V3模型,支持公有云在线部署、专混私有化实例部署两种模式,供用户按需部署,快速调用。
模式一:公有云在线部署
开发者和企业可以在京东云官网,进入言犀AI开发计算平台的“AI资产市场”中,选用该模型进行一键部署。
言犀AI开发计算平台已经支持 DeepSeek-V3、DeepSeek-R1 以及所有蒸馏小参数模型(DeepSeek-R1-Distill)的一键部署,具体步骤如下:
1、选择基础模型
在“AI资产市场/模型” 中,提供DeepSeek开源的多个版本,如DeepSeek-R1-Distill-Qwen-1.5B,点击进入卡片页可了解模型结构和预训练数据等关键信息,并查看模型文件结构。
2、准备资源节点
在部署时,LLM模型因为模型较大,资源性能要求较高,需要独占计算卡进行部署,建议提前准备好专属资源节点。
功能路径:专属资源组-创建资源组-创建节点。
节点规格:部署DeepSeek-R1-Distill,推荐使用 cap.p.n3a30.4xlarge;部署DeepSeek-V3,推荐使用 cap.hc.p5h20.46xlarge
3、模型部署使用
将模型部署到相应的服务资源上提供推理调用服务,在部署时平台将自动适配预置推理框架,实现一键部署,仅需指定使用的专属资源组和对应的节点规格。部署完成后,状态将会变为运行中,运行中的模型可被调用,提供推理服务。