OpenAI 最近发布了其首个开源的开放权重模型gpt-oss,这在AI圈引起了巨大的轰动。对于广大开发者和AI爱好者来说,这意味着我们终于可以在自己的机器上,完全本地化地运行和探索这款强大的模型了。

本教程将一步一步指导你如何在Windows系统上,借助极其便捷的本地大模型运行框架Ollama,轻松部署和使用 gpt-oss 模型。

作者:IvanCodes
日期:2025年8月8日
专栏:开源模型

一、准备工作:系统配置与性能预期

在开始之前,了解运行环境非常重要。本次部署将在我个人电脑上进行,下面是推荐配置:

  • CPU: 现代多核 CPU,如 Intel Core i7 或 AMD Ryzen 7 系列
  • 内存 (RAM): 32 GB 或更多
  • 显卡 (GPU): 强烈推荐 NVIDIA GeForce RTX 4090 (24 GB 显存)。这是确保大型模型流畅运行与高效微调的理想选择。
  • 操作系统: Linux 或 Windows 11
  • Python 版本: 推荐 3.12

性能预期
在这套配置下,运行 gpt-oss-20b 这样中等规模的模型,响应速度比较慢生成一段较长文本可能需要几十秒甚至更久。但这完全可用功能测试、学习和轻度使用。如果你的显卡性能更强 (如RTX 5090, 4090),体验会流畅很多。当然我自己电脑的性能要差点

在这里插入图片描述

二、了解 gpt-oss 模型

gpt-oss 是 OpenAI 发布的开放权重语言模型,截止到2025年8月8日,提供了 gpt-oss-120bgpt-oss-20b 两个版本。它旨在支持开发者在各种硬件上进行研究和创新

官方 GitHub 仓库: https://github.com/openai/gpt-oss

在这里插入图片描述

三、安装 Ollama:本地部署的神器

Ollama 是一个开源框架,它极大地简化了在本地运行 Llama, Mistral, Gemma 以及现在 gpt-oss大模型过程

1. 访问 Ollama 官网并下载

打开浏览器,访问 Ollama 官网。你会看到一个简洁的界面,邀请你与开源模型一起对话和构建

在这里插入图片描述

点击 “Download” 按钮后,页面会自动跳转下载选择页面。

2. 选择操作系统

Ollama 支持 macOS, Linux 和 Windows。我们选择 Windows

在这里插入图片描述

3. 安装 Ollama

下载完成后,运行安装程序。安装过程非常简单,基本就是一路“下一步”

在这里插入图片描述
安装完成后,Ollama 会在你的系统托盘以后台服务的形式运行。

四、拉取并运行 gpt-oss 模型

Ollama 的命令行操作与 Docker 非常相似,主要使用 pullrun 命令。

1. 打开终端

打开你的Windows PowerShell命令提示符 (CMD)

2. 拉取 (Pull) 模型

gpt-oss 有多个版本,我们这里以对硬件要求稍低20b 版本为例。执行以下命令:

ollama pull gpt-oss:20b

这个过程会下载模型文件,根据你的网络速度,可能需要一些时间

3. 运行 (Run) 模型

下载完成后,运行模型进行交互:

ollama run gpt-oss:20b

在这里插入图片描述

五、与 gpt-oss 模型交互

1. 基础对话

运行 ollama run 命令后,你就可以直接在终端输入问题并与模型对话了。我们来问一个经典问题:“你是谁?”
在这里插入图片描述

注意:模型的回答中提到了 “ChatGPT”,这可能是因为 gpt-oss训练数据基础架构与ChatGPT有很深的渊源。

2.使用 Ollama 桌面应用 GUI

除了命令行,Ollama 也提供了一个简洁的桌面应用

  • 安装Ollama后,它通常会自动启动
  • 你可以在主界面下拉菜单中,选择你已经 pull 下来的模型 (如 gpt-oss:20b),然后直接开始对话。

在这里插入图片描述
在这里插入图片描述

3.创建你的 Ollama Hub 个人资料

登录 Ollama 官网后,你可以创建并编辑你的个人资料。这是分享自定义的模型 (Modelfiles) 和参与社区第一步

在这里插入图片描述

4. 代码生成
gpt-oss代码能力还可以。我们可以让它尝试写一个pygame游戏。

在这里插入图片描述
在这里插入图片描述

3. 联网搜索功能
一个令人惊喜的功能是,gpt-oss 在 Ollama 中可以联网!但这需要你先在 Ollama Hub 上创建并登录你的账户。

登录后,当你提出一个需要实时信息的问题时,模型会自动触发搜索功能。

在这里插入图片描述

六、在 Ubuntu上部署及使用 Web 客户端

对于Linux用户,特别是作为服务器使用时,命令行是基础,但搭建一个功能强大的Web界面能提供更好的体验

1. 在 Ubuntu 上安装 Ollama

在Ubuntu上安装Ollama极其简单,官方提供了一键安装脚本。打开你的终端,执行以下命令:

curl -fsSL https://ollama.com/install.sh | sh

脚本会自动下载Ollama二进制文件,并将其设置为一个 systemd 后台服务。安装完成后,Ollama服务会自动启动。你可以通过 systemctl status ollama 验证其运行状态。

2. 拉取并运行模型 (命令行)

与Windows完全相同,在Ubuntu终端中执行:

ollama pull gpt-oss:20b
ollama run gpt-oss:20b

3. 搭建Web客户端:Open WebUI

Open WebUI 是一个非常流行的、与Ollama完美兼容开源Web客户端

a. 安装 Docker
Open WebUI 最简单的部署方式是使用Docker。如果你的系统尚未安装Docker,请执行:

apt-get update
apt-get install -y docker.io
# 启动并设置开机自启
systemctl start docker
systemctl enable docker

b. 运行 Open WebUI 容器
执行以下命令来下载并运行 Open WebUI 容器:

docker run -d --network=host -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

命令解析:

  • -d: 后台运行容器。
  • --network=host: 让容器共享主机的网络,这样WebUI可以轻松访问在本机 11434 端口运行的Ollama服务。
  • -v open-webui:/app/backend/data: 挂载一个数据卷,用于持久化WebUI的用户数据和配置。
  • --name open-webui: 给容器命名
  • --restart always: 确保Docker服务重启时,该容器也会自动启动

c. 访问并使用 Open WebUI

  • 在你的浏览器中,访问 http://<你的Ubuntu服务器IP>:8080 (Open WebUI 默认使用8080端口)。
  • 首次访问时,你需要注册一个管理员账户。
  • 登录后,你就可以在界面上选择已经拉取到本地的 gpt-oss:20b 模型,并开始对话了!

总结

通过本教程,我们成功地一台普通的Windows电脑上,使用 Ollama 轻松部署了OpenAI的gpt-oss模型。同时,我们也学习了如何在Ubuntu环境下完成同样的部署,并额外搭建了一个功能强大Open WebUI 客户端。我们体验了它的基础对话代码生成乃至联网搜索强大功能。虽然在中端硬件性能有限,但这无疑为广大AI爱好者和开发者打开了一扇探索前沿大模型的大门


Q&A 问答环节

1. 问:为什么模型在我电脑上运行这么慢?
答: 模型运行速度主要取决GPU性能和显存gpt-oss-20b 是一个有200亿参数的模型,对资源要求较高。在RTX 3050这样的入门级/中端显卡上,推理速度自然会比较慢。Ollama会自动利用你的GPU,但如果显存不足,部分模型层会加载到CPU和内存中,进一步拖慢速度。

2. 问:除了gpt-oss,我还能用Ollama运行哪些模型?
答: 非常多!Ollama支持目前几乎所有主流的开源模型,例如 Google 的 Gemma,Meta 的 Llama 3,Mistral AI 的 Mistral 等。你可以在Ollama官网的 “Models” 页面查看完整的模型库。

3. 问:联网搜索功能是如何实现的?需要额外配置吗?
答: 这是 gpt-oss 模型本身在Ollama框架下集成的功能,可能利用了类似工具调用 (Tool Calling)函数调用 (Function Calling) 的机制。当你提出需要外部信息的问题时,模型会自动调用一个内置的搜索工具。除了登录Ollama Hub账户外,通常不需要你进行额外配置

4. 问:如果我没有NVIDIA显卡,还能运行吗?
答: 可以。Ollama支持纯CPU运行。它会自动检测你是否有兼容的GPU,如果没有,它会完全使用你的CPU和系统内存来运行模型。当然,纯CPU运行的速度会比GPU慢得多

5. 问:我可以微调或定制 gpt-oss 模型吗?
答: 可以。这正是开放权重模型魅力所在。你可以使用自己的数据集对模型进行微调 (fine-tuning)。在Ollama中,你还可以通过编写 Modelfile定制模型的系统提示词 (System Prompt)参数等,然后构建一个属于你自己的新模型版本

6. 问:如何查看我的 Open WebUI 容器的日志 (Ubuntu)?
答: 如果Open WebUI无法启动出现问题,你可以使用Docker命令查看其日志排查错误。在终端中执行:

docker logs open-webui

如果你想实时跟踪日志,可以加上 -f 选项:docker logs -f open-webui

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/918090.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/918090.shtml
英文地址,请注明出处:http://en.pswp.cn/news/918090.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在X86架构Linux中创建虚拟根目录并下载指定架构(如aarch64)的软件包(含依赖)

在X86架构Linux中创建虚拟根目录并下载指定架构(如aarch64)的软件包(含依赖) 在Linux系统中&#xff0c;有时候我们需要在特定的环境或架构下安装软件包&#xff0c;而不影响主系统。一种常见的方法是创建一个虚拟的根目录&#xff0c;并在此环境中操作。本文将介绍如何通过创建…

scratch笔记和练习-第9课:一起来绘画

位图也称为点阵图&#xff0c;它是由许许多多的点组成的&#xff0c;这些点被称为像素。位图图像可以表现丰富的多彩变化 并产生逼真的效果&#xff0c;很容易在不同软件之间交换使用&#xff0c; 但它在保存图像时需要记录每一个像素的色彩信息&#xff0c;所以占用的存储空间…

[linux] Linux:一条指令更新DDNS

Linux&#xff1a;一条指令更新DDNS 在动态IP环境下&#xff0c;如何确保我们的域名始终指向正确的公网IP地址&#xff1f;动态DNS&#xff08;DDNS&#xff09;服务为我们提供了完美的解决方案。今天&#xff0c;我将分享一个简洁高效的Linux命令行指令&#xff0c;用于自动更…

[激光原理与应用-182]:测量仪器 - 光束型 - 光束质量分析仪

光束质量分析仪是用于精确评估激光光束特性的核心设备&#xff0c;通过测量光束的强度分布、相位分布、发散角等参数&#xff0c;为激光系统的优化、加工工艺控制及科研实验提供关键数据支持。以下是光束质量分析仪的详细解析&#xff1a;一、核心功能 - 光束强度分布分析测量内…

Linux 限制 root 登录 IP 地址的方法

Linux 限制 root 登录 IP 地址的方法Linux 限制 root 登录 IP 地址的方法方法一&#xff1a;修改 SSH 配置文件方法二&#xff1a;使用 hosts.allow 和 hosts.deny 文件方法三&#xff1a;使用防火墙规则方法四&#xff1a;使用 access.conf 文件注意事项Linux 限制 root 登录 …

Word中怎样插入特殊符号

使用 “插入” 菜单&#xff1a;插入常用符号&#xff1a;将光标置于要插入符号的位置&#xff0c;点击 “插入” 选项卡&#xff0c;在 “符号” 组中点击 “符号” 按钮&#xff0c;会弹出一个符号库&#xff0c;里面包含了常见的标点符号、特殊字符等&#xff0c;找到所需符…

Linux 内核发包流程与路由控制实战

Linux 内核发包流程与路由控制实战 在网络调优、性能优化、SDN、NFV、容器网络等场景下&#xff0c;理解 Linux 内核发包路径和路由控制机制是必修课。 本文将从内核网络栈的原理入手&#xff0c;再结合 iproute2 命令和 策略路由给出实战案例。一、Linux 内核发包流程&#xf…

点播服务器

早期的时候&#xff0c;用 live555 作为 rtsp 点播服务器&#xff1b;现在比较常用的 流媒体服务器比较多&#xff1b;这里比较简单的&#xff0c;可以用 ZLMediakit&#xff1b;可以支持 ffmeg 退流 到ZLMediakit&#xff0c;然后别的客户端从 ZLMediakit 服务器拉流&#xff…

分享超图提供的、很不错的WebGIS学习资源

最近在学习了解Supermap iclient&#xff0c;发现官方提供的帮助文档、GIS学堂真的不错&#xff0c;解释了很多的内容。 官方modern-web-gis-in-action文档的网址如下&#xff1a;https://iclient.supermap.io/web/books/modern-web-gis-in-action/&#xff0c;在其中介绍了现代…

通信算法之298: verilog语法generate和for介绍

在 Verilog 中&#xff0c;generate和for是实现参数化设计和模块实例化复用的重要工具&#xff0c;尤其在需要根据参数动态生成逻辑时非常有用。以下是它们的使用方法和区别&#xff1a;1. for循环&#xff08;过程块内&#xff09;for循环主要用于过程块&#xff08;always/in…

laravel在cli模式下输出格式漂亮一些

在 Laravel 的 CLI 模式下&#xff0c;可以通过以下方式让命令行输出更加美观和专业&#xff1a; 1. 使用 Artisan 输出助手方法 Laravel 提供了多种输出样式方法&#xff1a; public function handle() {// 基础样式$this->info(成功信息 - 绿色); // 绿色$this->err…

大数据管理与应用学什么?就业前景怎么样?

前言在数字经济蓬勃发展的今天&#xff0c;大数据已经成为推动社会进步的核心生产要素。大数据管理与应用作为新兴交叉学科&#xff0c;正受到越来越多学生和企业的关注。本文将全面剖析该专业的课程体系、核心技能要求&#xff0c;详细介绍CDA数据分析师认证的备考策略&#x…

mac笔记本如何重新设置ssh key

要在Mac上重新生成SSH密钥并将其添加到平台&#xff0c;可以按照以下步骤操作&#xff1a; 打开终端 在Mac上&#xff0c;你可以通过Spotlight搜索&#xff08;按Command Space&#xff09;输入Terminal来打开终端或者直接搜索终端检查现有SSH密钥 首先&#xff0c;检查是否已…

Godot ------ 通过鼠标对节点进行操作

Godot ------ 通过鼠标对节点进行操作 引言 正文 引言 对于一个游戏,通过鼠标对游戏对象进行操作是非常普遍的行为,本文我们将以 Control 节点进行举例,说明如何通过鼠标对 Control 节点进行移动操作。 正文 首先,我们创建一个 Contorl 节点,并将它的 Layout->Trans…

k8s 网络插件 flannel calico

一、k8s 网络概述 Kubernetes网络是指在Kubernetes集群中不同组件之间进行通信和交互的网络架构&#xff0c;每个容器都有自己的IP地址&#xff0c;这些容器组成了Pod&#xff0c;Pod是Kubernetes调度的最小单元。 Pod是Kubernetes中最小的部署单元&#xff0c;每个Pod都有一个…

易美教育荣膺“腾讯年度影响力国际教育品牌”双奖加冕,见证中国国际教育力量的崛起

【腾讯新闻&#xff0c;北京讯】在刚刚圆满落幕的“回响中国”腾讯新闻教育频道年度论坛上&#xff0c;国际教育领域迎来了高光时刻&#xff1a;以美国华尔街为总部、深耕国际教育十余年的易美教育&#xff08;Easymay&#xff09;&#xff0c;凭借其持续创新的教育模式、国际化…

Chrome与Firefox浏览器安全运维配置命令大全:从攻防到优化的专业实践

Chrome与Firefox浏览器安全运维配置命令大全&#xff1a;从攻防到优化的专业实践 作者&#xff1a;高级网络安全工程师 吉林•镇赉融媒 刘晓伟 最后更新&#xff1a;2025年8月 适用对象&#xff1a;网络安全、运维从业者 浏览器作为访问互联网资源的主要入口&#xff0c;其配置…

用 “故事 + 价值观” 快速建立 IP 信任感

在知识变现、流量变现与粉丝变现的实践中&#xff0c;IP 的核心竞争力在于用户信任。“故事 价值观” 的组合&#xff0c;能快速缩短与用户的距离 —— 故事让 IP 从抽象符号变为可感知的存在&#xff0c;价值观则推动用户从被动关注转为主动认同&#xff0c;二者共同为变现筑…

PDF处理控件Aspose.PDF教程:使用 C#、Java 和 Python 代码调整 PDF 页面大小

使用 Aspose.PDF 调整 PDF 大小 Aspose.PDF 是一个功能强大且灵活的库&#xff0c;旨在跨多个平台&#xff08;包括 .NET、Java 和 Python&#xff09;处理 PDF 文件。在调整 PDF 大小方面&#xff0c;它提供了对页面尺寸和内容缩放的完全控制。无论您是想缩小 PDF 大小、将页…

Django 表单:深度解析与最佳实践

Django 表单:深度解析与最佳实践 引言 Django 是一个强大的 Python Web 框架,它提供了丰富的功能,包括表单处理。表单是 Web 应用中不可或缺的一部分,用于收集用户输入的数据。本文将深入探讨 Django 表单的使用,包括其结构、功能以及最佳实践。 Django 表单概述 Djan…