华为云Flexus+DeepSeek征文|DeepSeek-V3/R1 免费服务开通全流程与Rest API和OpenAI SDK调用详解

前言

本文将详细介绍DeepSeek-V3/R1 免费服务开通全流程,并且详细讲解通过本地方式Rest API和OpenAI SDK两种方式调用DeepSeek-V3/R1

前提准备

1、访问 ModelArts Studio_MaaS大模型即服务平台华为云

官网地址:ModelArts Studio大模型即服务平台

官方教程文档:官网文档
2、进入ModelArts Studio控制台在这里插入图片描述

3、接受服务服务声明

在这里插入图片描述

4、点击在线推理,授权委托

在这里插入图片描述

5、勾选委托并且创建

在这里插入图片描述

6、服务授权

在这里插入图片描述

7、确认授权

在这里插入图片描述

免费服务开通

1、免费服务:仅适合用于体验模型,且受严格的速率限制。平台可能会不定时调整其适用模型、免费额度、有效期等内容。(免费服务中单个模型提供200万token推理额度,额度消耗完后可开通使用商用级别的推理API服务(仅限贵阳一),或前往我的服务部署为我的服务后付费使用)

在这里插入图片描述

2、领取额度

在这里插入图片描述

3、领取成功

在这里插入图片描述

免费服务在线体验

1、点击在线体验

在这里插入图片描述

2、这里可以进行提问体验感受DeepSeek-V3/R1的能力

在这里插入图片描述

3、参数调配(可以根据需求调配不同的参数,让大模型更加智能)

参数说明
温度/Temperature设置推理温度。 - 数值较高,输出结果更加随机。 - 数值较低,输出结果更加集中和确定。 取值范围:0-2 默认值:不同模型的默认值不同,请以实际环境为准。
核采样/top_p设置推理核采样。调整输出文本的多样性,数值越大,生成文本的多样性就越高。 取值范围:0.1~1 默认值:不同模型的默认值不同,请以实际环境为准。
top_k选择在模型的输出结果中选择概率最高的前K个结果。 取值范围:1~1000 默认值:20

在这里插入图片描述

4、体验感受

  • 我的提问
DeepSeek-V3-32K是什么,能做什么
  • DeepSeek-V3/R1的回答
DeepSeek-V3-32K 是什么?
DeepSeek-V3-32K 是深度求索(DeepSeek)公司开发的一款先进的大型语言模型(LLM)。它基于最新的深度学习技术,具备强大的自然语言处理(NLP)能力,能够理解和生成人类语言。以下是其核心特点:32K 上下文长度:
模型支持高达 32,000 token 的上下文长度,这意味着它可以处理更长的文本输入,保持对上下文的理解和连贯性,适合长文档、复杂对话和多轮交互场景。多模态能力:
除了文本处理,DeepSeek-V3-32K 可能还支持图像、音频等多模态数据的处理,能够实现跨模态的理解和生成。高精度和高效性:
模型经过大规模数据训练高精度的语言理解和生成能力,同时优化了计算效率,适用于多种应用场景。可定制化:
支持针对特定行业或任务的微调和定制,以满足用户的个性化需求。DeepSeek-V3-32K 能做什么?
DeepSeek-V3-32K 的应用场景非常广泛,以下是一些主要功能:文本生成:撰写文章、报告、故事、。
生成营销文案、社交媒体内容。
自动摘要长篇文章或文档。
对话与问答:构建智能客服系统,提供即时、准确的回答。
实现多轮对话,支持复杂问题的解答。
作为虚拟助手,协助用户完成日常任务。
翻译与多语言支持:支持多种语言之间的高质量翻译。
跨语言沟通和文档处理。
代码生成与编程辅助:自动生成代码片段或完整程序。
提供编程问题解答和调试建议。
辅助开发人员进行代码优化。
数据分析与洞察:从大量文本数据中提取关键信息。
生成数据报告和可视化图表。
帮助用户发现数据中的模式和趋势。
教育与:提供个性化学习建议和知识讲解。
自动生成练习题和考试题目。
辅助教师进行课程设计和内容开发。
创意与设计:生成创意文案、广告语、品牌名称等。
辅助设计工作,如生成图像描述或设计灵感。
多模态应用:结合图像和音频数据进行跨模态生成如生成图像描述或语音转文字。
支持多模态内容的创作和编辑。
适用场景
企业应用:智能客服、自动化文档处理、市场分析、员工培训等。
教育领域:在线教学、学习辅助、课程开发等。
创意产业:内容创作、广告设计、媒体制作等。
科研与技术:数据分析、代码开发、学术研究等。
--- 总结DeepSeek-V3-32K 是一款功能强大、灵活多变的大型语言模型,能够满足多种场景下的自然语言处理需求。其超长的上下文支持和多模态能力使其在复杂任务中表现出色,同时其可定制化特性也为企业和个人用户提供了高度适配的解决方案。

在这里插入图片描述

免费服务API调用

API KEY获取

1、点击调用说明可以查看API调用 方法

在这里插入图片描述

2、按照调用说明的步骤进行操作

  • Rest API调用和OpenAI SKD调用两种方式

在这里插入图片描述

3、步骤一: 获取API Key

  • 点击API KEY管理-创建API KEY

在这里插入图片描述

  • 创建API KEY(输入标签和描述)

在这里插入图片描述

  • 保存密钥(请将此密钥保存在安全且可访问的地方。这是唯一一次可以查看密钥的机会。您以后将无法查看它。但您可以随时创建新的访问密钥)

在这里插入图片描述

  • 密钥创建获取成功即完成了步骤一

在这里插入图片描述

Rest API调用

1、步骤二: 复制调用示例并替换接口信息、API Key

打开pycharm平台,将调用示例代码复制并替换对应的参数信息

  • 复制下方调用示例代码
  • 替换其中的接口信息(API地址、模型名称)为上方接口信息
  • 替换其中的API Key为已获取的API Key

在这里插入图片描述

2、pychram粘贴代码

在这里插入图片描述

3、运行代码(如下显示则为调用成功)

如下报错信息不影响知识一种警告(这个警告信息是由 urllib3 库发出的,提示你正在向 api.modelarts-maas.com 发送未经验证的 HTTPS 请求)

在这里插入图片描述

OpenAI SDK调用

1、点击OpenAI SDK

在这里插入图片描述

2、pycharm安装环境(pycharm终端进行环境安装)

pip install --upgrade "openai>=1.0"

在这里插入图片描述

3、如果出校网络超时,或者报错预计是国外镜像源太慢了更换国内镜像源进行下载

pip install --upgrade "openai>=1.0" -i https://pypi.tuna.tsinghua.edu.cn/simple

在这里插入图片描述

4、复制调用代码

在这里插入图片描述

5、粘贴入pycharm命令行

此处有三个地方需要根据自己的修改

  • API地址
  • API Key
  • 模型名称

在这里插入图片描述

6、运行代码,如果出现如下报错代表问题出在处理流式响应的方式上,设置stream=True时,OpenAI API 返回的是一个生成器对象,需要迭代它来获取完整内容,而不是直接访问choices属性

在这里插入图片描述

  • 修改代码如下
# coding=utf-8from openai import OpenAIbase_url = "API地址" # API地址
api_key = "API Key" # 替换为实际API Keyclient = OpenAI(api_key=api_key, base_url=base_url)response = client.chat.completions.create(model = "DeepSeek-V3", # 模型名称messages = [{"role": "system", "content": "You are a helpful assistant"},{"role": "user", "content": "你好"},],temperature = 1,stream = True
)# 处理流式响应
full_response = ""
for chunk in response:# 先确认choices列表长度大于0if len(chunk.choices) > 0 and chunk.choices[0].delta.content is not None:full_response += chunk.choices[0].delta.contentprint(full_response)

官方实例代码可能会报错所以此处我对代码做了一定的修改,主要修改了

  1. 流式响应处理:使用for chunk in response遍历生成器,获取每个数据块
  2. 增量内容提取:通过chunk.choices[0].delta.content获取每个数据块中的实际文本内容
  3. 内容拼接:将所有数据块的内容累积到full_response
  4. 访问choices[0]之前,添加了len(chunk.choices) > 0的检查,以此保证列表不为空

7、成功运行(如下则表示调用成功)

在这里插入图片描述

8、官方实例不能够实现持续对话,如果要实现终端中的持续对话,你需要在现有代码基础上添加一个循环结构,让用户可以不断输入问题,并持续接收 AI 的回答。以下是修改后的代码:

此处有三个地方需要根据自己的修改

  • API地址
  • API Key
  • 模型名称
# coding=utf-8from openai import OpenAIbase_url = "API地址"  # API地址
api_key = "替换为实际API Key"  # 替换为实际API Keyclient = OpenAI(api_key=api_key, base_url=base_url)# 初始化对话历史
messages = [{"role": "system", "content": "You are a helpful assistant"}]print("开始对话 (输入'退出'结束)")while True:# 获取用户输入user_input = input("\n你: ")# 检查退出条件if user_input.lower() == "退出":print("对话已结束")break# 添加用户消息到对话历史messages.append({"role": "user", "content": user_input})# 调用APIresponse = client.chat.completions.create(model="DeepSeek-V3", # 模型名称messages=messages,temperature=1,stream=True)# 处理流式响应print("AI:", end="", flush=True)full_response = ""for chunk in response:if len(chunk.choices) > 0 and chunk.choices[0].delta.content is not None:content = chunk.choices[0].delta.contentfull_response += contentprint(content, end="", flush=True)# 添加AI回复到对话历史messages.append({"role": "assistant", "content": full_response})

在这里插入图片描述

本地部署免费服务DeepSeek-V3

使用这个改进后的代码,可以与 DeepSeek-V3 模型进行多轮对话,模型会根据完整的对话历史生成回复,就像在聊天应用中一样

这段代码通过调用 DeepSeek-V3 API 实现持续对话功能:

  • 初始化消息历史并循环获取用户输入
  • 将用户消息添加到历史中发送请求
  • 处理流式响应实时显示回复内容
  • 将完整回复追加到历史以保持对话上下文
  • 支持输入 “exit” 终止对话并处理可能的异常

此处也有三个地方需要根据自己的修改

  • API地址
  • API Key
  • 模型名称
# coding=utf-8import requests
import json
import urllib3# 禁用不安全请求警告(仅用于测试环境)
urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)def main():url = "https://api.modelarts-maas.com/v1/chat/completions" # API地址api_key = "yourApiKey"  # 把yourApiKey替换成已获取的API Key # 初始化消息历史,包含系统提示messages = [{"role": "system", "content": "You are a helpful assistant."}]headers = {'Content-Type': 'application/json','Authorization': f'Bearer {api_key}'}print("==== 开始对话 ====")print("输入 'exit' 结束对话")while True:# 获取用户输入user_input = input("\n你: ")if user_input.lower() == "exit":break# 添加用户消息到历史messages.append({"role": "user", "content": user_input})# 准备请求数据data = {"model": "DeepSeek-V3",	# 模型名称"messages": messages,"stream": True,"temperature": 0.6}try:# 发送请求response = requests.post(url, headers=headers, data=json.dumps(data), verify=False, stream=True)if response.status_code == 200:print("助手: ", end='', flush=True)full_response = ""# 处理流式响应for line in response.iter_lines():if line:line = line.decode('utf-8')if line.startswith('data: '):data = line[6:]if data != '[DONE]':try:json_data = json.loads(data)if 'choices' in json_data and len(json_data['choices']) > 0:delta = json_data['choices'][0].get('delta', {})content = delta.get('content', '')if content:print(content, end='', flush=True)full_response += contentexcept json.JSONDecodeError as e:print(f"\n解析响应时出错: {e}")# 添加助手回复到消息历史if full_response:messages.append({"role": "assistant", "content": full_response})print()  # 换行else:print(f"\n请求失败,状态码: {response.status_code}")print(response.text)except requests.exceptions.RequestException as e:print(f"\n请求异常: {e}")breakif __name__ == '__main__':main()

在这里插入图片描述

免费服务模型体验-文本对话

1、进入模型体验中心

在这里插入图片描述

2、免费服务模型体验

在这里插入图片描述

3、体验成功

在这里插入图片描述

总结

华为云Flexus整合DeepSeek-V3/R1提供低成本高效开发路径:通过ModelArts Studio快速开通免费服务,基于Rest API和OpenAI SDK兼容调用实现V3对话生成与R1逻辑推理,结合MoE架构灵活适配轻量/复杂场景,显著缩短开发周期并降低资源成本。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/910189.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/910189.shtml
英文地址,请注明出处:http://en.pswp.cn/news/910189.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Qt 连接信号使用lambda表达式和槽函数的区别

1. 语法与代码结构 成员函数 需在类中显式声明槽函数(public slots: 或 Qt 5 后的任意成员函数),并在连接时指定接收对象。 class Receiver : public QObject {Q_OBJECT public slots:void handleSignal(int value) { /* ... */ } };// 连接…

学习笔记丨AR≠VR:透视沉浸式技术的“虚实象限”法则

AR(增强现实)和VR(虚拟现实)是沉浸式技术的两大分支,核心区别在于虚拟与现实的融合程度。以下是两者的详细对比: 对比维度 AR(增强现实) VR(虚拟现实) 技术…

本地使用 modelscope 大模型 来进行文本生成视频(Text-to-Video)

1. ✅ 创建并激活 Conda 环境(Python 3.8) conda create -n modelscope python3.8 -yconda activate modelscope 2.✅ 安装了 PyTorch(CPU 版本) 如果你是 CPU-only 用户(没有 NVIDIA 显卡 或不想用 GPU&#xff0…

文生视频(Text-to-Video)

🕒 生成时间:每张图大概 10–60 秒(取决于设备) ✅ 二、文生视频(Text-to-Video) 以下项目中,很多都基于 SD 模型扩展,但视频生成复杂度高,生成时间一般 超过 30 秒&am…

CLion + STM32环境配置,亲测有效(2025.06.19记)

CLion STM32环境配置 遇到的问题描述: > "moniton" command not supported by this target. > You cant do that when your target is exec > 上传完成,但存在问题 > monitor reset > "monitor" command not …

借助ChatGPT快速开发图片转PDF的Python工具

一、开发背景与适用场景 随着数字文档处理需求的激增,图片转PDF的需求日益广泛。从学生提交图像化作业,到教师整合扫描试卷等资料,再到行政人员归档证件照片,工作中的方方面面都离不开图片的处理。如何高效、批量地将多个图片文件…

SuGAR代码精简解读

目录 一、全流程训练脚本 train_full_pipeline.py 二、核心训练逻辑 train.py 粗优化 (coarse_density_and_dn_consistency.py) 网格提取 (extract_mesh_from_coarse_sugar) 精优化 (refined_training) 两次优化(粗优化和精优化)中使用的损失函数及…

大模型安全关键技术研究

​ 引言 随着人工智能技术的迅猛发展,大模型已成为推动各行业变革的核心力量。从智能客服、医疗影像识别到金融风险预测,大模型的应用场景不断拓展,深刻改变着人们的生产生活方式。大模型已经转变为AI领域的基础设施,为解决各种…

java面试题04成员变量和局部变量的区别

成员变量(Member Variable)和局部变量(Local Variable)是面向对象编程中两种作用域和生命周期不同的变量,主要区别体现在以下几个方面: 1. 声明位置 成员变量: 声明在类内部、方法/构造器/代码块外部。 例如: public class Person {// 成员变量(实例变量)private Str…

升级到 .NET 9 分步指南

随着激动人心的 .Net 9 更新正式发布,漫长的等待终于结束了。它带来了一些令人惊叹的特性,例如改进的 LINQ 功能、HybridCache 等等。此外,凭借其卓越的性能提升、更佳的安全性、更完善的协议和更易维护的特性,它必将吸引开发者和…

day30打卡

# 导入模块 import math print("方式1:使用 import math") print(f"圆周率π的值:{math.pi}") print(f"2的平方根:{math.sqrt(2)}\n") # 导入特定项 from math import pi, sqrt print("方式2&#…

优化数据库查询

优化数据库查询 在实际开发中,数据库查询的性能直接关系到系统响应速度和用户体验。尤其在高并发环境下,低效的SQL语句会成为瓶颈,导致系统负载升高,甚至引发宕机。因此,查询优化是数据库性能优化中最为关键的一环。 为了系统性地理解数据库查询优化策略,本节将从SQL语…

【LeetCode#第198题】打家劫舍(一维dp)

198. 打家劫舍 - 力扣(LeetCode) 你是一个专业的小偷,计划偷窃沿街的房屋。每间房内都藏有一定的现金,影响你偷窃的唯一制约因素就是相邻的房屋装有相互连通的防盗系统,如果两间相邻的房屋在同一晚上被小偷闯入&#…

微前端MFE:(React 与 Angular)框架之间的通信方式

在 微前端&#xff08;MFE, Micro Frontends&#xff09; 中使用 CustomEvent 是非常常见的&#xff0c;尤其是在不同子应用&#xff08;Micro Apps&#xff09;之间通信的时候。今天将以React 主应用 ↔ Angular 子应用 之间的通信进行示例 React 主应用 <-> Angular 子…

408考研逐题详解:2010年第1题——理解栈的基本操作

2010年第1题 若元素 a&#xff0c;b&#xff0c;c&#xff0c;d&#xff0c;e&#xff0c;f 依次进栈&#xff0c;允许进栈、退栈操作交替进行&#xff0c;但不允许连续三次进行退栈操作&#xff0c;则不可能得到的出栈序列是&#xff08; &#xff09; A. dcebfa \qquad B.…

python追加合并excel效率记录

第一种合并方法&#xff1a; 在sheet的第一行&#xff0c;追加新表concat旧表 read_excel读取旧表全部 to_excel新表追加写入旧表 需要的时间&#xff1a; 第二种合并方法&#xff1a; 在sheet的最后一行&#xff0c;直接追加新表 load_book只读用来获取旧表sheet行数 read_ex…

公钥加密与签名算法计算详解(含计算题例子)

一、RSA 加密算法 密钥生成&#xff1a; 选两个大素数 p 和 q计算 n p q计算 φ(n) (p-1)(q-1)选整数 e 满足 1 < e < φ(n) 且 gcd(e, φ(n)) 1计算 d 满足 d e ≡ 1 mod φ(n) 公钥&#xff1a;(e, n) 私钥&#xff1a;(d, n) 加密&#xff1a; c ≡ mᵉ mod…

63 网络交互的过程中目标设备的选择

前言 这里主要是 调研一下 发送网络数据包的过程中 选择网络设备 比如 向本机发送信息, 走的是 lo 向局域网其他主机发送信息, 走无线网卡 或者 有线网卡 基于 linux 的调试 这里主要是基于 ping 192.168.1.2 的调试 skb->dev 的初始化是在 skb->_skb_refdst 初…

DE2-115板子上用 Verilog编程实现一个分秒计数器

一、实验目的 掌握 Verilog 语言在硬件描述中的应用&#xff0c;通过编程实现分秒计数器的逻辑功能。 学习并实践按键消抖的原理与实现方法&#xff0c;提升对硬件电路中信号处理的理解。 熟悉在 DE2-115 开发板上进行 Verilog 程序的开发、调试及下载验证流程&#xff0c;将…

R4 LSTM-火灾温度预测

import tensorflow as tf import pandas as pd import numpy as npgpus tf.config.list_physical_devices("GPU") if gpus:tf.config.experimental.set_memory_growth(gpus[0], True) #设置GPU显存用量按需使用tf.config.set_visible_devices([gpus[0]],&…