AI Repos
1、LLM-RL-Visualized
提供100余张原创架构图,全面涵盖了 LLM (大语言模型)、VLM (视觉语言模型) 等大模型技术。内容深度解析了训练算法(如 RL、RLHF、GRPO、DPO、SFT、CoT 蒸馏等)、效果优化策略(如 RAG、CoT)以及强化学习基础理论。所有图表均提供高清晰度 SVG 矢量格式,并附有详尽的文字解释。项目旨在为学习者和开发者提供清晰、直观的指引,帮助其深入理解大模型的核心算法与机制,并鼓励社区成员参与共建,持续完善内容。
2、PosterCraft
PosterCraft 是一个统一框架,专注于生成高质量美学海报,尤其擅长精确文本渲染、抽象艺术无缝集成、引人注目的布局和风格和谐。该框架通过四个关键优化阶段(文本渲染优化、高质量海报微调、美学文本强化学习和视觉语言反馈)在训练工作流中实现卓越性能。项目开源了核心模型权重和四个专门数据集,并提供了易于上手的安装和生成指南及 Gradio Web UI。PosterCraft 在量化评估中表现出色,旨在推动高质量海报生成技术的发展,并已成功集成至 ComfyUI。
3、acp
Agent Communication Protocol (ACP) 是一个开放协议,旨在解决当前 AI 智能体开发中普遍存在的碎片化问题,实现不同框架、团队和基础设施之间智能体、应用和人类的无缝多模态通信与协作。ACP 支持发送和接收富文本、代码、文件和媒体等多种消息类型,提供实时、后台及流式响应,并支持智能体发现、长期任务协作和状态共享。该协议是 BeeAI 平台的核心技术,并通过 DeepLearning.AI 提供入门课程,同时提供 Python 和 TypeScript SDK,便于开发者快速构建和部署兼容 ACP 的智能体及客户端。
4、Context-Engineering
Context Engineering 是一个开源项目和实践手册,旨在超越传统的“提示工程”,深入探索如何精妙地填充和优化大型语言模型 (LLM) 的整个上下文窗口。项目将上下文设计视为一门“艺术与科学”,借鉴生物学隐喻(从原子到器官再到神经系统),详细阐述了少样本学习、记忆系统、检索增强生成 (RAG)、控制流以及认知工具与提示编程等核心概念。它强调Token 预算优化、信息持久化与共振,并引入了神经网络场论和符号机制等前沿研究,提供丰富的代码示例、指南和可复用模板,旨在帮助开发者构建更健壮、高效和智能的 AI 系统。
AI News
1、南京大学研究突破:大语言模型内源性奖励机制的理论证明与应用
南京大学周志华教授团队近日发布重要研究,首次理论证明大语言模型中存在内源性奖励模型,并可通过强化学习有效提升模型表现。这一发现为奖励模型的构建提供了新思路,减少了对人类标注数据的依赖,有望降低开发成本并推动AI技术的更广泛应用。
2、Step-Audio-AQAA开源:端到端语音大模型引领人机交互
Step-Audio团队开源了Step-Audio-AQAA,这是一款能够直接从原始音频输入生成自然流畅语音输出的端到端语音大模型。该模型由双码本音频标记器、骨干LLM和神经声码器三大核心模块组成,显著提升了人机音频交互的流畅性和自然度。这一技术的推出,不仅为研究者提供了强大的工具,也为未来智能语音应用的发展奠定了坚实的基础。
3、Cloudflare推出’按爬虫付费’市场,重塑AI与出版者关系
Cloudflare近日宣布推出’按爬虫付费’市场,旨在帮助内容出版者更好地控制其内容,并为AI公司提供公平的内容抓取方式。这一创新模式允许网站拥有者设定抓取费率或完全阻止爬虫,为出版者提供了新的收入来源。此举响应了新闻出版行业面临的挑战,特别是在AI爬虫抓取频率激增的背景下。Cloudflare还宣布新建网站默认阻止AI爬虫,需单独授权,得到了多家大型出版商的支持。
4、百度AIDAY重磅发布:自研视频生成模型MuseSteamer与平台“绘想”
在百度AIDAY科技开放日上,百度商业研发团队推出了自研视频生成模型MuseSteamer和视频产品平台“绘想”,标志着百度在AIGC领域特别是视频创作方面的重要进展。这两项创新成果旨在降低视频创作门槛,提升内容生产效率,展现了百度在AI技术赋能商业应用方面的持续投入与布局。
5、智谱获10亿元战略投资,发布GLM-4.1V-Thinking模型及MaaS Agent聚合平台
浦东创投集团和张江集团联合向智谱进行10亿元战略投资,首笔交割已完成。智谱CEO张鹏在大会上宣布了两项新成果:开源发布新一代通用视觉语言模型GLM-4.1V-Thinking,以及上线MaaS Agent聚合平台’应用空间’。此外,智谱还启动了数亿元的Agent开拓者专项扶持计划,以促进Agent生态的发展。
6、X平台革新社交网络:AI聊天机器人将生成社区笔记,提升信息透明度
社交平台X(原Twitter)宣布试点新功能,允许AI聊天机器人生成社区笔记,旨在提升信息的准确性与透明度。这一功能源自Twitter的社区笔记系统,经过优化后,AI生成的内容将接受与用户提交内容相同的审核程序。尽管AI在事实核查中存在争议,但X平台计划利用Grok技术和其他API接口,结合人类审核,以确保内容质量。此功能已引起Meta、TikTok和YouTube等平台的关注,并可能引领行业新趋势。
文章内容引用自:jungleBlog