文章目录

  • 前言
  • 接口简介
  • 前置条件
  • 实战
    • 添加 Maven 依赖
    • 核心代码示例
  • 参数说明
  • 个人简介

前言

  • 本文介绍如何基于腾讯云语音识别 快速识别接口,实现通过 HTTPS POST 方式上传音频并快速识别同步返回识别结果的实战流程。

接口简介

  • 腾讯云语音识别 快速识别接口 支持上传音频文件并同步返回识别结果,适合以下场景:
- 视频字幕自动生成
- 呼叫中心/质检实时转写
- 会议记录转写

前置条件

  • 开通腾讯云语音识别服务。
  • 在 API 密钥管理 新建密钥,获取:
    • AppID
    • SecretID
    • SecretKey

实战

添加 Maven 依赖

  • 在项目 pom.xml 中引入腾讯云语音识别 SDK:
<dependency><groupId>com.tencentcloudapi</groupId><artifactId>tencentcloud-speech-sdk-java</artifactId><version>1.0.52</version>
</dependency>

核心代码示例

@Component
@Slf4j
public class FlashRecognizerService {private static final String SECRET_KEY = "你的SecretKey";private static final String SECRET_ID = "你的SecretId";private static final String APP_ID = "你的AppId";private final Credential credential = Credential.builder().secretId(SECRET_ID).secretKey(SECRET_KEY).build();public String recognizer(File file) {log.info("开始解析音频文件:{}", file);FlashRecognizer recognizer = SpeechClient.newFlashRecognizer(APP_ID, credential);byte[] data = ByteUtils.inputStream2ByteArray(file);// 初始化识别请求FlashRecognitionRequest recognitionRequest = FlashRecognitionRequest.initialize();recognitionRequest.setEngineType("16k_zh"); // 中文普通话recognitionRequest.setFirstChannelOnly(1);  // 仅识别第一声道recognitionRequest.setVoiceFormat(getFileExtension(file));recognitionRequest.setSpeakerDiarization(0); // 不做说话人分离recognitionRequest.setFilterDirty(0); // 不过滤脏词recognitionRequest.setFilterModal(0); // 不过滤语气词recognitionRequest.setFilterPunc(0);  // 保留标点recognitionRequest.setConvertNumMode(1); // 开启数字转换recognitionRequest.setWordInfo(1); // 返回词级信息// 同步识别FlashRecognitionResponse response = recognizer.recognize(recognitionRequest, data);log.info("音频文件解析完成:{} {}", file, JSONObject.toJSONString(response));return response.getFlashResult().get(0).getText();}/*** 获取文件扩展名*/public static String getFileExtension(File file) {String name = file.getName();int lastIndex = name.lastIndexOf(".");if (lastIndex == -1 || lastIndex == name.length() - 1) {return "";}return name.substring(lastIndex + 1);}
}

参数说明

参数说明默认值
EngineType引擎类型(如 16k_zh 中文普通话)
FirstChannelOnly是否仅识别第一个声道(1 是,0 否)1
VoiceFormat音频格式,如 mp3、wav、m4a
SpeakerDiarization是否进行说话人分离(0 否,1 是)0
FilterDirty过滤脏词(0 不过滤,1 过滤)0
FilterModal过滤语气词(0 不过滤,1 过滤)0
FilterPunc过滤标点(0 不过滤,1 过滤)0
ConvertNumMode数字转换(0 关闭,1 开启)1
WordInfo是否返回词级信息(0 否,1 是)1

个人简介

👋 你好,我是 Lorin 洛林,一位 Java 后端技术开发者!座右铭:Technology has the power to make the world a better place.

🚀 我对技术的热情是我不断学习和分享的动力。我的博客是一个关于Java生态系统、后端开发和最新技术趋势的地方。

🧠 作为一个 Java 后端技术爱好者,我不仅热衷于探索语言的新特性和技术的深度,还热衷于分享我的见解和最佳实践。我相信知识的分享和社区合作可以帮助我们共同成长。

💡 在我的博客上,你将找到关于Java核心概念、JVM 底层技术、常用框架如Spring和Mybatis 、MySQL等数据库管理、RabbitMQ、Rocketmq等消息中间件、性能优化等内容的深入文章。我也将分享一些编程技巧和解决问题的方法,以帮助你更好地掌握Java编程。

🌐 我鼓励互动和建立社区,因此请留下你的问题、建议或主题请求,让我知道你感兴趣的内容。此外,我将分享最新的互联网和技术资讯,以确保你与技术世界的最新发展保持联系。我期待与你一起在技术之路上前进,一起探讨技术世界的无限可能性。

📖 保持关注我的博客,让我们共同追求技术卓越。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/913857.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/913857.shtml
英文地址,请注明出处:http://en.pswp.cn/news/913857.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

.NET Framework 安装失败及异常情况 常用处理方法

在使用.NET Framework 的过程中&#xff0c;安装失败或出现异常是比较常见的问题。这些问题可能由系统环境、文件损坏、权限不足等多种原因引起。以下是一些常见的安装失败及异常情况&#xff0c;以及对应的处理方法&#xff1a; 首先&#xff0c;下载.net framework 3.5文件。…

​AI赋能的自动驾驶革命:从安全架构到世界模型的系统性突破

​在计算机视觉与机器人技术的交汇处&#xff0c;自动驾驶正经历着从模块化设计向端到端AI系统的范式转移。NVIDIA作为这场变革的核心推动者&#xff0c;其DRIVE平台展现出的技术整合深度令人惊叹——从芯片级的能效优化到城市级数字孪生仿真&#xff0c;构建起覆盖"AI训练…

ACL协议:核心概念与配置要点解析

ACL协议 在H3C网络设备&#xff08;交换机、路由器、防火墙等&#xff09;中&#xff0c;ACL&#xff08;Access Control List&#xff0c;访问控制列表&#xff09; 是一个核心的流量过滤和控制机制。核心目的&#xff1a; 流量过滤&#xff1a;控制哪些流量可以通过接口&…

文件追加模式:编写一个程序,向一个已存在的文件末尾追加内容。

知识点文件打开模式"r"&#xff1a;只读&#xff1b;文件须存在。"w"&#xff1a;写入&#xff1b;清空或新建。"a"&#xff1a;追加&#xff1b;文件末尾写入。"a"&#xff1a;读/写追加。追加&#xff08;Append&#xff09;机制&qu…

OneCode框架事件基础模型架构深度剖析与代码实现

一、整体架构概览 作为OneCode框架的事件核心模块&#xff0c;构建了一套跨浏览器、多终端兼容的事件驱动架构。该架构采用分层设计思想&#xff0c;从底层事件捕获到高层事件模拟&#xff0c;形成了完整的事件生命周期管理体系。整体架构可分为五个核心层次&#xff1a;事件捕…

Spring for Apache Pulsar->Reactive Support->Message Production

好消息&#xff1a;Spring for Apache Pulsar这两天刚刚升到2.0.0版本1. ReactivePulsarTemplate在Pulsar生产者端&#xff0c;Spring Boot自动配置提供了一个ReactivePulsarTemplate用于发布记录。该模板实现了一个名为ReactivePulse Operations的接口&#xff0c;并提供了通过…

AtCoder Beginner Contest 413

比赛链接如下&#xff1a;Denso Create Programming Contest 2025&#xff08;AtCoder Beginner Contest 413&#xff09; - AtCoder A - Content Too Large Problem Statement Takahashi has N items and one bag. The size of the i-th (1≤i≤N) item is Ai​, and the si…

Java学习---JVM(1)

JVM&#xff0c;即Java虚拟机&#xff0c;其是Java程序的运行环境&#xff0c;是Java技术的核心组成部分&#xff0c;本次就JVM的自动内存管理详细展开&#xff1a;JVM的内存区域分为2大类&#xff0c;即线程私有的和线程共享的&#xff0c;前者分为3大块&#xff0c;虚拟机栈、…

Qt去噪面板搭建

建立单选互斥性面板用于选择噪声属性// 创建去噪面板 QWidget* noisePanel new QWidget(); QVBoxLayout* mainLayout new QVBoxLayout(noisePanel); mainLayout->setContentsMargins(10, 10, 10, 10); mainLayout->setSpacing(15);// 去噪方法选择组QGroupBox* methodG…

无需公网IP的文件交互:FileCodeBox容器化部署技术解析

文章目录 前言1.Docker部署2.简单使用演示3. 安装cpolar内网穿透4. 配置公网地址5. 配置固定公网地址 前言 在数字化办公需求日益增长的今天&#xff0c;文件传输已成为职场协作的高频刚需。传统共享方式却饱受诟病&#xff1a;"需要安装哪些臃肿客户端&#xff1f;免费版…

1. http 有哪些版本,你是用的哪个版本,怎么查看

http 有哪些版本&#xff0c;你是用的哪个版本&#xff0c;怎么查看 总结&#xff1a;http 版本有 0.9/1.0/1.1/2.0/3.0&#xff0c;我们常用的是 1.1 和 2.0&#xff0c;使用 window.chrome.loadTimes() 获取 http 版本。 常见的 HTTP 版本 HTTP/0.9&#xff1a;最初的版本&am…

C# IIncrementalGenerator干点啥

生成器项目 得基于.Net Stander 2.0 重要&#xff1a;<IsRoslynComponent>true</IsRoslynComponent>、<IncludeBuildOutput>false</IncludeBuildOutput>、 <PackageReference Include"Microsoft.CodeAnalysis" Version"4.14.0&q…

在徐州网络中服务器租用与托管的优势

一、高性价比&#xff1a;徐州万恒提供多种配置的服务器供租用&#xff0c;满足不同企业和个人的业务需求&#xff0c;无论是初创企业追求低成本高效能&#xff0c;还是对性能有严苛要求的大型项目&#xff0c;都能找到合适的服务器型号&#xff0c;以极具竞争力的价格获取强大…

学习软件测试的第十四天(移动端)

一.常用的abd命令有哪些1.什么是 ADB&#xff1f;通俗解释&#xff1a; ADB 就像一个桥梁&#xff0c;让电脑能控制连接的手机&#xff0c;比如安装APP、抓日志、重启设备等。专业术语总结&#xff1a; ADB&#xff08;Android Debug Bridge&#xff09;是 Android SDK 提供的命…

04-ES6

let和const命令ES6中新增了let命令&#xff0c;用来声明变量&#xff0c;用法类似与varlet和var的不同&#xff1a;1、不存在变量提升 console.log(a); //Cannot access a before initializationlet a 100;2、同一个作用域不能重复定义同一个名称var c 20;let c 30;c…

基于GeographicLib实现测站地平坐标系(东北天)转地心固定坐标系XYZ

一、概述主要内容&#xff1a;本文基于GeographicLib开源库&#xff0c;实现了一个地理空间坐标转换功能&#xff0c;主要用于根据观测站的位置和目标的相对方位信息&#xff0c;计算目标在地球坐标系中的绝对位置。输入&#xff1a;观测站的经纬度坐标(纬度、经度、海拔高度)和…

若依框架去掉Redis

这篇文章全是按照我的实战操作来的&#xff0c;本文一是记录一下这个过程&#xff0c;二是帮助更多的人少走弯路。 接下来我们看实战&#xff1a;第一步毋庸置疑&#xff0c;就是找到配置文件application.yml里面大redis配置部分&#xff0c;直接注释掉 注意这里的data:这是否注…

【会员专享数据】2013-2024年我国省市县三级逐日SO₂数值数据(Shp/Excel格式)

之前我们分享过2013-2024年全国范围逐日SO₂栅格数据&#xff08;可查看之前的文章获悉详情&#xff09;!该数据来源于韦晶博士、李占清教授团队发布在国家青藏高原科学数据中心网站上的中国高分辨率高质量近地表空气污染物数据集。很多小伙伴拿到数据后反馈栅格数据不太方便使…

TCP SYN、UDP、ICMP之DOS攻击

一、实验背景 Dos攻击是指故意的攻击网络协议实现的缺陷或直接通过野蛮手段残忍地耗尽被攻击对象的资源&#xff0c;目的是让目标计算机或网络无法提供正常的服务或资源访问&#xff0c;使目标系统服务系统停止响应甚至崩溃。 二、实验设备 1.一台靶机Windows主机 2.增加一个网…

Ntfs!LfsUpdateLfcbFromRestart函数分析之根据Ntfs!_LFS_RESTART_AREA初始化Ntfs!_LFCB

第一部分&#xff1a;LfsUpdateLfcbFromRestart( ThisLfcb,FileSize,DiskRestartArea,FirstRestar1: kd> p Ntfs!LfsRestartLogFile0x317: f71fc8dd e820e5ffff call Ntfs!LfsUpdateLfcbFromRestart (f71fae02) 1: kd> t Ntfs!LfsUpdateLfcbFromRestart: f71fae0…