文章中代码仓库

gemini

谷歌推出的 AI 只能模型

  • Gemini官网
  • Gemini Chat
  • Gemini开发者文档
  • Gemini SDK

所有模型

模型变体输入输出优化目标
Gemini 2.5 Pro gemini-2.5-pro音频、图片、视频、文本和 PDF文本增强的思考和推理能力、多模态理解能力、高级编码能力等
Gemini 2.5 Flash gemini-2.5-flash音频、图片、视频和文本文本适应性思维,成本效益
Gemini 2.5 Flash-Lite 预览版 gemini-2.5-flash-lite-preview-06-17文本、图片、视频、音频文本最具成本效益且支持高吞吐量的模型
Gemini 2.5 Flash 原生音频 gemini-2.5-flash-preview-native-audio-dialog & gemini-2.5-flash-exp-native-audio-thinking-dialog音频、视频和文本文本和音频,交错显示高质量、自然的对话式音频输出,无论是否经过思考
Gemini 2.5 Flash 预览版 TTS gemini-2.5-flash-preview-tts文本音频低延迟、可控的单语音和多语音文字转语音音频生成
Gemini 2.5 Pro 预览版 TTS gemini-2.5-pro-preview-tts文本音频低延迟、可控的单语音和多语音文字转语音音频生成
Gemini 2.0 Flash gemini-2.0-flash音频、图片、视频和文本文本新一代功能、速度和实时流式传输。
Gemini 2.0 Flash 预览版图片生成 gemini-2.0-flash-preview-image-generation音频、图片、视频和文本文字、图片对话式图片生成和编辑
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite音频、图片、视频和文本文本成本效益和低延迟
Gemini 1.5 Flash gemini-1.5-flash音频、图片、视频和文本文本在各种任务中提供快速而多样的性能 已弃用
Gemini 1.5 Flash-8B gemini-1.5-flash-8b音频、图片、视频和文本文本量大且智能程度较低的任务 已弃用
Gemini 1.5 Pro gemini-1.5-pro音频、图片、视频和文本文本需要更高智能的复杂推理任务 已弃用
Gemini Embedding gemini-embedding-001文本文本嵌入衡量文本字符串的相关性
Imagen 4 imagen-4.0-generate-preview-06-06 imagen-4.0-ultra-generate-preview-06-06文本图片我们最新的图片生成模型
Imagen 3 imagen-3.0-generate-002文本图片高质量图片生成模型
Veo 3 预览版 veo-3.0-generate-preview文本带音频的视频生成包含音效、环境噪音和对话的高品质视频
Veo 2 veo-2.0-generate-001文字、图片视频高质量视频生成
Gemini 2.5 Flash Live gemini-live-2.5-flash-preview音频、视频和文本文字、音频低延迟的双向语音和视频互动
Gemini 2.0 Flash Live gemini-2.0-flash-live-001音频、视频和文本文字、音频低延迟的双向语音和视频互动

引入SDK

go get google.golang.org/genai

设置GEMINI API KEY 环境变量

export GEMINI_API_KEY="your-api-key"

示例

文本生成

  1. 单个文本输入
  2. 思考功能
  3. 系统指令来引导 Gemini 模型的行为
  4. 借助 GenerateContentConfig 对象, 替换默认生成参数
  5. 多模态输入,将文本与媒体文件组合使用
  6. 流式响应
  7. 多轮对话
  8. 流式响应多轮对话

图片生成

  1. 文本生成图片
  2. 图片编辑
  3. 使用 Imagen 模型生成图片 (需要付费)

生成视频

  1. 使用 Veo 3 生成视频 (要使用此模式,请确保您的帐户具有活动的GCP计费)
  2. 根据图片生成视频 (需要付费)

结构化输出

  1. 结构化输出

文档理解

  1. 传递内嵌 PDF 数据
  2. 使用 File API 上传 PDF

图片理解

  1. 传递内嵌图片数据
  2. 使用 File API 上传图片

视频理解

  1. YouTuBe

代码执行

  1. 生成代码, 并执行代码
  2. 在对话中使用代码执行
func main() {// 文本生成text.TexGen()text.TexGenThinking()text.TexGenCli()text.TexGenDefaultConfig()text.TexGenMultiModal()text.TexGenStream()text.TexMultipleRoundsOfDialogue()text.TexGenStreamMultipleRoundsOfDialogue()// 图片生成photo.PhoGen()photo.PhoEdit()photo.ImaGen40GeneratePreview0606()// 生成视频voe3.VeoGen()voe3.ImageGenVideo()// 结构化输出format.FormatToJson()// 代码执行coding.EnableCodingExec()coding.DialogCodingExec()// 文档理解docs.InnerDoc()docs.UploadFileApi()// 图片理解photo.PhoInnerRead()photo.PhoFileApi()// 视频理解video.YouTuBe()
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/90127.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/90127.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/90127.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Trae安装指定版本的插件

前情 Trae是属于国产的跟 Cursor类似的AI编程IDE,我也是第一时间体验Trae的,虽然相比Cursor弱了一些,但是也绝对胜任了,前端因为排队问题我转战了Cursor,等到Trae出收费模式前,我已经办了Cursor会员了&…

【技术追踪】用于医学图像合成和分割的噪声一致孪生扩散模型(CVPR-2025)

孪生扩散模型,生成息肉图像用于提升分割性能! 论文:Noise-Consistent Siamese-Diffusion for Medical Image Synthesis and Segmentation 代码:https://github.com/Qiukunpeng/Siamese-Diffusion 0、摘要 深度学习已彻底革新医学影…

Crontab详解

crontab是Unix/Linux系统中用于设置周期性任务的工具,通过编辑配置文件实现定时执行命令或脚本。以下是其语法规则和核心要点: 一、基本格式 * * * * * command - - - - - | | | | | | | | | ----…

中国1km逐月潜在蒸散发数据集 - matlab按shp批量裁剪

中国1km逐月潜在蒸散发数据集 - matlab按shp批量裁剪 1. 数据概述 2 利用掩膜文件对数据进行裁剪 3 完整代码 4 结语 本篇继续处理气象数据,中国1km逐月潜在蒸散发数据集同前节介绍的中国1km降水数据集一样,都可以从国家青藏高原科学数据中心获得,数据具有同样的空间分辨率(…

Node.js链接MySql

前言: 在现代 Web 开发和后端服务中,Node.js 因其高性能和异步特性被广泛使用。MySQL 作为流行的关系型数据库之一,提供了稳定高效的数据存储和管理能力。将 Node.js 与 MySQL 结合,可以构建强大的数据驱动型应用。 一、环境准备…

Charles 的 Windows proxy 对爬取瑞数6 网站接口数据的作用分析

其实本文还是源于上个月的这篇文章 ➡️▼ 耗时两天半,利用 DrissionPage绕过瑞数6,爬取某药*局数据经历~ 不同点是,当时爬取的是列表页(已爬完),后面爬取的是详情页!懂的都懂,差别还…

PHP 测验

PHP 测验 引言 PHP 作为一种流行的开源服务器端脚本语言,被广泛应用于网页开发、服务器端编程等领域。为了帮助大家更好地理解和掌握 PHP,我们特此推出本 PHP 测验。通过以下问题,您可以检验自己的 PHP 知识水平,同时也能了解自己在哪些方面需要加强。 测验内容 问题一…

阶段1--Linux中的文件服务器(FTP、NAS、SSH)

目录 一、FTP Server 1.1.简介 1.2.FTP基础 1.2.1.控制端口 1.2.2.数据端口 1.3.FTP Server默认配置 1.3.1.安装vsftp 1.3.2.准备分发的文件 1.3.3.启动服务 1.3.4.关闭防火墙 1.4.FTP Client(默认仅能下载文件) 1.4.1.LinuxFTP客户端程序1:l…

SpringBoot与Vue实战:高效开发秘籍

Spring Boot 是什么? Spring Boot 简介 Spring Boot 是基于 Spring 框架的快速开发工具,旨在简化 Spring 应用的初始搭建和开发过程。它通过约定大于配置的原则,提供自动配置、内嵌服务器和依赖管理等功能,使开发者能够快速构建独立运行的、生产级别的应用。 核心特点 …

基于 fastapi 的 YOLO 批量目标检测 API:支持单图 / 文件夹自适应处理

项目背景 在计算机视觉任务中,我们经常需要对大量图片进行目标检测和标注。YOLO 系列模型凭借其高效性成为目标检测的首选工具之一,但批量处理图片时往往需要编写繁琐的脚本。本文将介绍一个基于 Flask 和 YOLOv11 的 API 服务,支持单张图片…

周志华《机器学习导论》第13章 半监督学习

目录 1. 未标记样本 2. 生成式方法 高斯混合EM 3. 半监督SVM 存在未标记样本的SVM变形 4. 图半监督学习 对图权值迭代矩阵计算 5. 基于分歧的方法 多视图协同训练 6. 半监督聚类 k-means的条件变形 6.1 Constrained k-means 利用“必连”与 “勿连”约束 6.2 Constra…

消息推送功能设计指南:精准触达与用户体验的平衡之道

消息推送功能设计指南:精准触达与用户体验的平衡之道消息推送是平台与用户保持连接的重要桥梁,既能及时传递重要资讯,又能唤醒沉睡用户、提升活跃度。然而,推送功能若设计不当,可能变成 “信息骚扰”,导致用…

CanOpen--SDO 数据帧分析

CanOpen--SDO 数据帧分析1 介绍1.1 概述1.2 主站与从站2 数据帧详细分析2.1 主站发送的请求帧 (Client → Server)2.2 从站响应的确认帧 (Server → Client)成功数据帧内容示例错误帧2.3 命令字2.4 小端格式:低字节在前3 其他示例60FF index 发送 数值 1000 数据帧分…

Day20-二叉树基础知识

二叉树(Binary Tree)是一种每个节点最多有两个子节点的树形数据结构,这两个子节点分别称为左子节点和右子节点。二叉树是计算机科学中最基础、最常用的树结构之一,广泛应用于搜索、排序、表达式解析等领域! 核心特点 …

示波器探头接口类型与PINTECH品致探头选型指南

一、示波器探头接口类型及技术特点1. BNC接口:通用型主流标准- 优势:75%以上示波器标配接口,具备阻抗匹配灵活(50Ω/1MΩ)、插拔稳定、抗干扰性强等特点。 - 应用场景:适用于大多数示波器(如Le…

Spring之【Bean工厂后置处理器】

目录 BeanFactoryPostProcessor BeanDefinitionRegistryPostProcessor 使用一下Bean工厂后置处理器 定义包扫描范围 定义一个组件Bean 定义一个普通的类 自定义一个组件类实现Bean工厂后处理器 测试类 BeanFactoryPostProcessor 该接口是Spring提供的扩展点之一是一个…

【C++】第十八节—一文万字详解 | map和set的使用

嗨,我是云边有个稻草人,与你分享C领域专业知识(*^▽^*) 《C》本篇文章所属专栏—持续更新中—欢迎订阅— 目录 一、序列式容器和关联式容器 二、set系列的使用 2.1 set和multiset参考⽂档 2.2 set类的介绍 2.3 set的构造和迭代器 2.4 set的增删查…

Java 大视界 -- Java 大数据在智能交通自动驾驶车辆与周边环境信息融合与决策中的应用(357)

Java 大视界 -- Java 大数据在智能交通自动驾驶车辆与周边环境信息融合与决策中的应用(357)引言:正文:一、Java 构建的环境信息融合架构1.1 多传感器数据实时关联1.2 动态障碍物轨迹预测二、Java 驱动的决策系统设计2.1 紧急决策与…

单细胞转录组学+空间转录组的整合及思路

一、概念 首先还是老规矩,处理一下概念问题,好将之后的问题进行分类和区分 单细胞转录组:指在单个细胞水平上对转录组(即细胞内所有转录出来的 RNA,主要是 mRNA)进行研究的学科或技术方向,核心…

用Python实现神经网络(五)

这一节告诉你如何用TensorFlow实现全连接网络。安装 DeepChem这一节,你将使用DeepChem 机器学习工具链进行实验在网上可以找到 DeepChem详细安装指导。Tox21 Dataset作为我们的建模案例研究,我们使用化学数据库。毒理学家很感兴趣于用机器学习来预测化学…