开源项目推荐

kaito

kaito 是由微软开源并托管于 GitHub 的项目,旨在自动化在 K8s(主目前支持 Azure AKS)中部署与管理大型语言模型(如 Falcon、Phi‑3、Llama)推理及微调工作负载。它通过定义 CRD(Workspace),自动完成 GPU 节点调度、容器化模型管理、预设硬件配置和多种推理运行时(如 vLLM、transformers)的支持,并新增基于 LlamaIndex + FAISS 的 Retrieval‑Augmented Generation(RAG)功能以实现知识检索能力。

Cleaner

Cleaner 是一个 K8s 控制器(Controller),用于自动识别并删除无效、孤立或不健康的 K8s 资源(包括标准资源和自定义 CRD),通过自定义调度(Cron)、标签筛选和 Lua 脚本规则灵活定义清理策略;项目提供丰富的默认政策(检测旧 Job、未使用的 ConfigMap/Secret、过期 PVC、过时证书、无效 Ingress 等),支持 Dry‑Run 安全测试,并能通过 Slack、Teams、Discord、Telegram、SMTP 或 K8s 事件报告发送清理通知,帮助保持集群高效、整洁和稳定。

Katib

Katib 是 Kubeflow 项目中的 K8s 原生 AutoML 组件,专注于自动化 超参数调优(Hyperparameter Tuning)、早期停止(Early Stopping)及 神经架构搜索。它支持包括 TensorFlow、PyTorch、XGBoost、scikit‑learn 等多种 ML 框架,以及 Kubeflow Training Operator、Argo 和 Tekton 等 K8s 工作负载,通过 CRD(Experiment、Trial、Suggestion)定义实验流程,并提供 Python SDK 和 UI 监控界面,极大简化模型优化任务。

kubedog

kubedog 是一个为 K8s CI/CD 部署流程设计的开源追踪库,用于实时监控 Deployment、StatefulSet、DaemonSet、Job、Canary(来自 Flagger)等资源的状态与日志输出,支持 multitracker 模式将多资源组合成统一事件流并生成周期性状态报告。项目自带简洁 CLI(主要为调试用途),但核心功能作为库被 werf 内部调用,用于实现高级资源部署追踪,例如自动输出容器日志、事件消息等,帮助部署过程中快速定位失败并反馈异常情况。

文章推荐

2025 年的服务网格:从工具到云原生神经中枢

服务网格(Service Mesh ) 作为微服务架构的基础设施层,通过在每个服务旁边部署 Sidecar 代理并由控制平面统一下发策略,无需修改应用代码,就能实现流量管理(如蓝绿部署、金丝雀发布、重试与限流)、安全加密(mTLS、身份认证与授权)以及可观测性(监控、日志与分布式追踪)。文章指出,到了 2025 年,Service Mesh 正朝着轻量化(如 Istio 的 Ambient Mesh、Linkerd)、跨云与多集群兼容、无代理架构演进以及高性能低资源开销的方向发展,依然是实现微服务弹性治理、可观测与零信任安全的关键支撑。

观点:K8s 承诺的可移植性,为何最终让企业反而被锁定?

本文讨论了 K8s 曾被赋予“云上可移植性”的承诺,然而现实中许多企业却依赖具体厂商的托管服务、CI/CD 管道、监控、安全策略及数据密集型依赖,反而深度绑定在某个云环境或平台之中,而真正具备可移植性的应用往往仅为现代化、容器化、运行松耦合的少数项目。文章指出,与其追逐普遍性的“随处迁移”幻想,更应进行有意图的锁定选择,识别关键 workloads、评估退出成本,并为部分关键应用建立可退出架构,而非将可移植性当成盲目目标。

Docker Compose 进入智能代理时代,新增云 GPU Offload 支持

本文介绍了 Docker 在 2025 年 7 月推出的新特性:Docker Compose 支持在 compose.yaml 中声明智能代理(agents)、模型(models)和 MCP 工具,开发者只需运行 docker compose up 即可构建并运行多代理系统,支持与多种代理框架(如 LangGraph、Embabel、CrewAI、Vercel AI SDK、Spring AI、Google ADK、Agno 等)集成,同时 Docker 推出云端 GPU 执行服务 Docker Offload(Beta),允许开发者将大型语言模型和复杂代理任务无缝卸载至云端 GPU,简化部署流程、缓解本地计算资源瓶颈。

云原生动态

Telepresence 2.23 版本发布

Telepresence 是一个开源工具,旨在帮助开发者在本地开发环境中高效调试和测试运行在远程 Kubernetes 集群上的微服务。它的核心目标是在不破坏实际运行环境的前提下,让开发者可以将本地代码、IDE、调试器与远程服务集群无缝对接,极大提高开发效率与协作能力。

Telepresence 2.23 近日成功发布,带来两项核心创新:新增 wiretap 命令,可将容器接收的流量镜像到客户端进行调试而不影响原容器,并支持多个客户端并发查看;其次引入名为 Teleroute 的 Docker 网络插件,让通过 telepresence connect --docker 创建的虚拟网络可被其他容器直接复用,无需复杂的 --network container:… 设置,简化了本地 Docker 容器与远程 Kubernetes 集群的连接流程。

Open Cluster Management v1.0.0 发布

Open Cluster Management(OCM) 是一个开源项目,旨在为 Kubernetes 多集群环境 提供集中式的统一管理能力。它支持跨多个 Kubernetes 集群的生命周期管理、策略控制、应用分发与运行状态监控,是构建企业级混合云和多云基础设施的重要组成部分。

Open Cluster Management(OCM)于 近期正式发布了 v1.0.0 ,标志着项目进入生产可用阶段。此版本带来多个关键改进,包括增强的集群选择能力(支持 CEL Selector)、新增 About-API 提供集群元数据、引入 Workload Conditions 实现应用状态更清晰可视化,以及 ManifestWorkReplicaSets 增加 deletionPolicy 实现资源删除策略控制。同时,核心 API 升级至 v1,支持更多配置选项,如 ClusterClaimConfiguration 等,整体提升了平台的灵活性、稳定性和可扩展性。

关于KubeSphere

KubeSphere (https://kubesphere.io)是在 Kubernetes 之上构建的开源容器平台,提供全栈的 IT 自动化运维的能力,简化企业的 DevOps 工作流。

KubeSphere 已被 Aqara 智能家居、本来生活、东方通信、微宏科技、东软、新浪、三一重工、华夏银行、四川航空、国药集团、微众银行、紫金保险、去哪儿网、中通、中国人民银行、中国银行、中国人保寿险、中国太平保险、中国移动、中国联通、中国电信、天翼云、中移金科、Radore、ZaloPay 等海内外数万家企业采用。KubeSphere 提供了开发者友好的向导式操作界面和丰富的企业级功能,包括 Kubernetes 多云与多集群管理、DevOps (CI/CD)、应用生命周期管理、边缘计算、微服务治理 (Service Mesh)、多租户管理、可观测性、存储与网络管理、GPU support 等功能,帮助企业快速构建一个强大和功能丰富的容器云平台。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/91654.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/91654.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/91654.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

国产开源大模型崛起:使用Kimi K2/Qwen2/GLM-4.5搭建编程助手

近期,国产大模型领域的发展令人瞩目,多款高性能开源模型的涌现,为我们开发者带来了前所未有的机遇。这些模型不仅在各大基准测试中名列前茅,其强大的代码能力也为我们打造个性化的编程助手提供了坚实的基础。HuggingFace的开源大模…

浅析责任链模式在视频审核场景中的应用

本文字数:3161字预计阅读时间:20分钟01设计模式设计模式的概念出自《Design Patterns - Elements of Reusable Object-Oriented Software》中文名是《设计模式 - 可复用的面向对象软件元素》,该书是在1994 年由 Erich Gamma、Richard Helm、R…

洛谷 P3372 【模板】线段树 1-普及+/提高

题目描述 如题,已知一个数列 {ai}\{a_i\}{ai​},你需要进行下面两种操作: 将某区间每一个数加上 kkk。求出某区间每一个数的和。 输入格式 第一行包含两个整数 n,mn, mn,m,分别表示该数列数字的个数和操作的总个数。 第二行包含 n…

flink写paimon表的过程解析

背景 apache paimon是构建湖仓一体的重要组成部分,由于paimon的写入速度很快,通过flink进行数据写入是很自然的选择,本文就介绍下使用flink写入paimon的两阶段协议的大概逻辑 技术实现 flink通过两阶段协议写入paimon表,分成三个步…

迅为RK3568开发板OpeHarmony学习开发手册-点亮 HDMI 屏幕

OpenHarmony 源码中默认支持 HDMI 屏幕,但是默认的分辨率是采用 mipi 的分辨率,我们修改代码,关闭 MIPI 就可以正常显示了。在之前视频修改的基础上,修改/home/topeet/OH4.1/OpenHarmony-v4.1-Release/OpenHarmony/out/kernel/src…

北京理工大学医工交叉教学实践分享(1)|如何以实践破解数据挖掘教学痛点

如何有效提升医工交叉领域数据挖掘课程的教学效果?近日,北京理工大学医学技术学院辛怡副教授在和鲸组织的分享会上,系统介绍了其团队在《数据挖掘在生物医学中的应用》课程中的创新实践,为解决普遍教学痛点提供了可借鉴的“平台化…

Vue 3 入门教程 8 - 路由管理 Vue Router

一、Vue Router 简介Vue Router 是 Vue.js 官方的路由管理器,它与 Vue.js 核心深度集成,用于构建单页面应用(SPA)。单页面应用是指整个应用只有一个 HTML 页面,通过动态切换页面内容来模拟多页面跳转的效果&#xff0c…

django的数据库原生操作sql

from django.db import connection from django.db import transaction from django.db.utils import (IntegrityError,OperationalError,ProgrammingError,DataError ) from django.utils import timezoneclass Db(object):"""数据库操作工具类,封装…

FreeRTOS---基础知识2

1. FreeRTOS 调度机制概述FreeRTOS 是一个实时操作系统(RTOS),其核心功能是通过 调度器(Scheduler) 管理多个任务的执行。调度机制决定了 何时切换任务 以及 如何选择下一个运行的任务,以满足实时性、优先级…

Docker安装(精简述版)

1. 安装:Docker 环境(Docker desktop) #Windows架构版本查看,Win R‌ 输入 ‌cmd‌ 打开命令提示符;输入命令‌: bash echo %PROCESSOR_ARCHITECTURE%#安装Docker desktop(安装时勾选 WSL2&am…

Postman-win64-7.3.5-Setup.exe安装教程(附详细步骤+桌面快捷方式设置)​

Postman 是一款超常用的接口调试工具,程序员和测试人员用它来发送网络请求、测试API接口、调试数据交互​ 1. 双击安装包​ 安装包下载地址:https://pan.quark.cn/s/4b2960d60ae9,找到你下的 Postman-win64-7.3.5-Setup.exe 文件&#xff08…

149. Java Lambda 表达式 - Lambda 表达式的序列化

文章目录149. Java Lambda 表达式 - Lambda 表达式的序列化为什么要序列化 Lambda 表达式?Lambda 表达式的序列化规则示例代码:序列化 Lambda 表达式代码解析:Lambda 序列化的限制总结:149. Java Lambda 表达式 - Lambda 表达式的…

颐顿机电携手观远BI数据:以数据驱动决策,领跑先进制造智能化升级

颐顿机电签约观远数据,聚焦财务分析、销售管理等场景,以 BI 数据解决方案推进数据驱动决策,助力先进制造企业提效与竞争力升级。一、合作官宣:颐顿机电 观远数据,开启数据应用新征程浙江颐顿机电有限公司(…

【PHP】几种免费的通过IP获取IP所在地理位置的接口(部分免费部分收费)

目录 一、获取客户端IP地址 二、获取IP所在地理位置接口 1、IP域名归属地查询 2、腾讯地图 - IP定位 3、聚合数据 - IP地址(推荐) 4、高德地图 - IP定位(推荐) 5、360分享计划 - IP查询 6、天聚ip地址查询 7、百度IP地址…

【Excel】制作双重饼图

一、效果话不多说,直接上数据和效果图!(示例软件:WPS Office)类别现金刷卡小计苹果10.005.0015.00荔枝20.0015.0035.00西瓜30.0025.0055.00总计60.0045.00105.00二、步骤(一)制作底图插入饼图&a…

gcc-arm-none-eabi安装后,找不到libgcc.a的拉置

位置在:/usr/lib/gcc/arm-none-eabi/6.3.1/libgcc.a查找方法:arm-none-eabi-gcc --print-libgcc-file-name以前没找到,是因为进错目录:/usr/lib/arm-none-eabi/lib

上证50期权2400是什么意思?

本文主要介绍上证50期权2400是什么意思?“上证50期权2400”通常指上证50ETF期权的某个具体合约代码,其中“2400”是合约代码的一部分,需结合完整代码格式理解其含义。上证50期权2400是什么意思?一、上证50期权合约代码的组成上证5…

发那科机器人P点位置号码自动变更功能为禁用状态

通过改变变量的状态,发那科机器人可以实现,当在程序中进行记录、修改、插入、删除、复制/粘贴包含有P点位置号码的行时,P点位置号码会自动从小到大自动排列,可以实现自动排列,或者点击编辑变更编号也可以下图所示女变量…

什么叫湖仓一体

文章目录概念一、理解湖仓一体:先搞懂“数据湖”和“数据仓库”1. 数据仓库(Data Warehouse)2. 数据湖(Data Lake)3. 传统架构的痛点:“湖”与“仓”的割裂二、湖仓一体的核心特点:融合“湖”与…

网络安全突发事件应急预案方案

最近有要求需要出一个网络安全突发事件应急预案方案,本文仅就应急预案问题提出一点初步思考,意在抛砖引玉,盼各位读者不吝赐教,共同完善对这一领域的认识。一、总则 (一)目的 为有效应对规划建筑设计院企业…