目录

一、目的

二、解决方案

2.1 什么是FFmpeg

2.2 FFmpeg主要功能

2.3 使用Xabe.FFmpeg调用FFmpeg功能

2.4 使用 FFmpeg 的 drawbox 滤镜来绘制 ROI

三、总结


一、目的

当前市场上有很多目标检测智能识别的相关算法,当前调用一个医疗行业的AI识别算法后返回了一堆对应帧上的ROI数据,因此为了展示算法识别效果,把返回的Roi画到对应帧上进行展示,这里使用FFmpeg对视频进行处理,基于FFmpeg 的 drawbox 滤镜来绘制 ROI。
        展示:
处理前:
处理后:

二、解决方案

2.1 什么是FFmpeg

FFmpeg 本身是一个多媒体处理工具,它可以对视频流进行各种处理(如裁剪、滤镜、编码等),以及 视频流推送到 RTMP 服务器或从 RTMP 服务器拉取流。

2.2 FFmpeg主要功能

FFmpeg 主要用于以下几个方面:
  • 推流:将本地视频文件或实时视频流推送到 RTMP 服务器。
  • 拉流:从 RTMP 服务器拉取视频流并进行处理(如转码、转封装等)。
  • 处理流:对视频流进行各种处理(如裁剪、滤镜、编码等)。

2.3 使用Xabe.FFmpeg调用FFmpeg功能

Xabe.FFmpeg 是一个基于 .NET Standard 的 FFmpeg 封装库,旨在简化媒体处理任务。它允许开发者在不了解 FFmpeg 工作原理的情况下,通过 .NET Core 应用程序调用 FFmpeg 功能,并传递自定义参数。Xabe.FFmpeg 提供了丰富的 API,支持视频和音频的转换、剪辑、合并等操作,适用于各种媒体处理需求。
本项目中使用版本为:5.2.6
dotnet add package Xabe.FFmpeg
        简单使用示例:简单展示了获取视频第一帧保存为图像存储在本地(这里也可以获取任何特定帧)。
using AI.Demo.Models;
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using Xabe.FFmpeg;namespace AI.Demo.Common
{public class FFmpegutil{static FFmpegutil(){//获取存放本地ffmpg.exe路径的文件夹路径//如果是使用Nuget包安装的FFmpeg,默认路径是当前应用程序的根目录//如果是手动下载的FFmpeg,需要将ffmpeg.exe放在应用程序的根目录下var ffmpegPath = System.IO.Path.Combine(AppDomain.CurrentDomain.BaseDirectory, "ffmpeg.exe");if(File.Exists(ffmpegPath)){//如果ffmpeg.exe存在,则设置FFmpeg的可执行文件路径FFmpeg.SetExecutablesPath(System.IO.Path.GetDirectoryName(ffmpegPath)); //设置FFmpeg的可执行文件路径}else{throw new Exception("ffmpeg.exe not found in the application directory.");}}/// <summary>  /// 获取视频第一帧  /// </summary>  /// <param name="inputFile">输入文件路径</param>  /// <param name="outputFile">输出文件路径</param>  /// <returns>FFmpeg命令行参数</returns>  public static async Task<string> GetVideoFrame(string inputFile){//根据传入的视频文件地址,获取该视频的第一帧图片,并保存到指定的输出文件路径  if (string.IsNullOrEmpty(inputFile)){throw new ArgumentException("Input and output file paths must be provided.");}if (!File.Exists(inputFile)){throw new ArgumentException("file Not Exist");}//输出文件路径  string outputFile = System.IO.Path.ChangeExtension(inputFile, ".jpg");// 替换为使用 FFmpeg 的截图功能  await FFmpeg.Conversions.New().AddParameter($"-i \"{inputFile}\" -frames:v 1 \"{outputFile}\"").Start();return outputFile;}}
}

2.4 使用 FFmpeg 的 drawbox 滤镜来绘制 ROI

基于drawbox的enable参数来控制在特定帧上绘制,drawbox格式: “drawbox=enable='eq(n,frameIndex)':x:y:w:h:color:thickness”
 /// <summary>/// 使用 FFmpeg 的 drawbox 滤镜来绘制 ROI/// </summary>/// <param name="inputFile"></param>/// <param name="outputFile"></param>/// <param name="locations"></param>/// <returns></returns>/// <exception cref="ArgumentException"></exception>public static async Task<bool> DrawRoiByLocation(string inputFile,ref string analyseVdeofile, List<Location> locations){if (string.IsNullOrEmpty(inputFile)){throw new ArgumentException("Input file paths must be provided.");}if (!File.Exists(inputFile)){throw new ArgumentException("file Not Exist");}//改变输入文件的名字,增加后缀以区分输出文件string outputFile = System.IO.Path.ChangeExtension(inputFile, "_analyse.mp4");analyseVdeofile = outputFile;try{// 构建FFmpeg滤镜命令StringBuilder filterBuilder = new StringBuilder();// 对每个Location(帧)和ROI处理foreach (var location in locations){int frameIndex = location.Index;// 对该帧中的每个ROI进行处理foreach (var roi in location.Rois){// 使用drawbox的enable参数来控制在特定帧上绘制// 格式:drawbox=enable='eq(n,frameIndex)':x:y:w:h:color:thicknessstring boxFilter = $"drawbox=enable='eq(n,{frameIndex})':x={roi.X}:y={roi.Y}:w={roi.W}:h={roi.H}:color=red:thickness=2";if (filterBuilder.Length > 0)filterBuilder.Append(",");filterBuilder.Append(boxFilter);}}// 创建转换命令,直接使用输入文件路径而不是GetMediaInfovar conversion = FFmpeg.Conversions.New().AddParameter($"-i \"{inputFile}\"").SetOutput(outputFile);// 如果有滤镜,添加到命令中if (filterBuilder.Length > 0){conversion.AddParameter($"-vf \"{filterBuilder}\"").AddParameter("-c:v libx264") // 使用H.264编码器.AddParameter("-preset medium") // 编码速度和质量的平衡.AddParameter("-crf 23") // 控制质量,值越低质量越高.AddParameter("-pix_fmt yuv420p") // 设置像素格式,提高兼容性.AddParameter("-c:a aac") // 使用AAC音频编码器.AddParameter("-movflags +faststart"); // 优化网络播放}else{// 即使没有滤镜,也确保使用正确的编解码器conversion.AddParameter("-c:v libx264").AddParameter("-preset medium").AddParameter("-crf 23").AddParameter("-pix_fmt yuv420p").AddParameter("-c:a aac").AddParameter("-movflags +faststart");}// 执行命令并等待完成await conversion.Start();return File.Exists(outputFile);}catch (Exception ex){Console.WriteLine($"Error drawing ROI: {ex.Message}");return false;}}

三、总结

FFmpeg是一个强大的 多媒体处理工具,以上的处理只是它整体功能中的一小部分。结合 Xabe.FFmpeg可以进行视频的格式转换、裁剪、增加滤镜多种功能。同时支持在桌面应用、Web应用、Api服务、云服务多种场景下的处理需求。
        
        把之所学以文载之,欢迎大家多多交流~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/84494.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/84494.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/84494.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

通过关键字批量抓取淘宝商品数据实现方法途径分享--API

item_search 按关键字搜索淘宝商品item_search_tmall 按关键字搜索天猫商品item_search_pro 高级关键字搜索淘宝商品item_search_img 按图搜索淘宝商品&#xff08;拍立淘&#xff09;item_search_shop 获得店铺的所有商品 一、引言 在电商领域&#xff0c;获取淘宝商品数据对…

用 Lazarus IDE 写一个邮件客户端软件,能收发邮件,编写邮件

下面是一个使用Lazarus IDE开发的基本邮件客户端实现方案&#xff0c;包含收发邮件和编写邮件的核心功能。我们将使用Synapse库&#xff08;跨平台的网络通信库&#xff09;来处理邮件协议。 步骤1&#xff1a;安装依赖 安装Synapse库&#xff1a; 下载地址&#xff1a;https:…

第二部分-IP及子网划分

目录 一、什么是IP? 1.1.IP地址的由来 1.2.IP地址的表示 1.3.IP地址的构成 1.4.IP地址的分类 1.5.IP地址类型 1.6.IP地址的计算 1.7.私网IP地址 1.8.特殊IP地址 二、子网划分 2.1.什么是子网划分及为什么要进行子网划分? 2.2.如何进行子网划分&#xff1f; 实例&#xff1a; …

【javascript】泡泡龙游戏中反弹和查找匹配算法

引言 泡泡龙游戏的核心玩法依赖于物理碰撞与颜色匹配的算法实现。反弹效果需要模拟泡泡与边界或障碍物的弹性碰撞&#xff0c;确保轨迹符合物理规律&#xff1b;匹配算法则需快速检测相邻同色泡泡&#xff0c;触发消除逻辑。高效的处理方式直接影响游戏流畅度和玩家体验。 以…

如何使用deepseek满血版

deepseek 访问方式 DeepSeek满血版可通过官方网站或官方应用商店下载安装。确保设备满足最低系统要求&#xff0c;如操作系统版本和硬件配置。 账号注册与登录 访问平台后完成账号注册流程&#xff0c;提供必要信息并验证邮箱或手机号。登录后进入用户中心&#xff0c;查看…

网络管理【Linux/Unix/Windows】命令大全

在跨平台网络运维中&#xff0c;管理员常需快速切换Windows与Linux环境下的命令操作。本文整合了核心网络管理命令的跨平台对照表&#xff0c;涵盖连通性测试、路由追踪、DNS解析、ARP管理、会话监控等高频场景。无论您负责服务器维护、网络排障还是安全审计&#xff0c;此表可…

Gremlin创建schema(包括实体和关系)

1、构建图谱schema&#xff0c;流程包括图创建、实体构建以及关系构建。 创建图时需要指定图库名称以及主键字段。 实体构建时需要指定主键字段&#xff0c;每个属性需要指定数据类型&#xff0c;是否非空以及默认值。关系构建时需要包括关系名称、指向头实体的标签&#xff0c…

[论文阅读]TrustRAG: Enhancing Robustness and Trustworthiness in RAG

TrustRAG: Enhancing Robustness and Trustworthiness in RAG [2501.00879] TrustRAG: Enhancing Robustness and Trustworthiness in Retrieval-Augmented Generation 代码&#xff1a;HuichiZhou/TrustRAG: Code for "TrustRAG: Enhancing Robustness and Trustworthin…

鸿蒙Next仓颉语言开发实战教程:店铺详情页

各位好&#xff0c;幽蓝君又来分享仓颉开发教程了&#xff0c;今天的内容是店铺详情页&#xff1a; 这个页面的内容看似简单&#xff0c;其实有很多小细节需要注意&#xff0c;主要还是让大家熟悉List容器的使用。 整个页面由导航栏和List容器两大部分组成&#xff0c;导航栏我…

FEMFAT许可使用数据分析工具介绍

在高度竞争和快速变化的工程仿真领域&#xff0c;数据驱动的决策变得越来越重要。为了更好地了解FEMFAT许可的使用情况、提高资源利用率、优化工作流程&#xff0c;FEMFAT许可使用数据分析工具应运而生。本文将为您介绍这款强大的工具&#xff0c;助您轻松驾驭FEMFAT许可数据&a…

大模型原理面试题及参考答案

目录 什么是大语言模型(LLM)?它与传统语言模型的本质差异在哪里? 自回归模型(autoregressive)与掩码语言模型(masked LM)的异同是什么?各适合于哪些任务? Transformer 的核心构件——多头自注意力机制如何捕捉长距离依赖? 位置编码(positional encoding)的作用…

Gartner<Reference Architecture Brief: Data Integration>学习心得

数据集成参考架构解析 引言 在当今数字化时代,数据已成为企业最宝贵的资产之一。随着企业规模的不断扩大和业务的日益复杂,数据来源也变得多样化,包括客户关系管理(CRM)、企业资源规划(ERP)、人力资源管理(HR)和市场营销等领域的运营系统。这些系统虽然在其特定功能…

JAVASE:方法

JavaSE 方法详解 一、方法的核心概念 方法&#xff08;Method&#xff09;是一组执行特定任务的语句集合&#xff0c;它将代码逻辑封装为可复用的单元&#xff0c;提高代码的模块化和可维护性。 方法的组成&#xff1a; [修饰符] 返回类型 方法名([参数列表]) {// 方法体[r…

MXNet-cu101 + CUDA 10.1 在 Windows 11 上启用 GPU 的完整指南

一、报错信息 (pytorch) C:\Users\Administrator\Desktop\test>D:/conda/anaconda3/envs/pytorch/python.exe c:/Users/Administrator/Desktop/test/test.py Traceback (most recent call last): File “c:/Users/Administrator/Desktop/test/test.py”, line 1, in import…

Python基础数据类型与运算符全面解析

Python作为一门动态类型语言&#xff0c;拥有丰富的内置数据类型和运算符系统&#xff0c;构成了编程的基础。本文将深入介绍Python核心数据类型的基本概念、特点及使用方法&#xff0c;并系统梳理运算符的分类、优先级和实际应用示例&#xff0c;帮助开发者全面掌握Python的基…

Mysql分区(单服务器应对大数据量方案)

参考资料&#xff1a; 参考视频 参考博客 分区的复杂操作 参考资料 概述&#xff1a; 这里只讲实操&#xff0c;不讲原理&#xff0c;看原理请看参考资料Mysql自5.1后支持分区&#xff0c;在Mysql8之后只有InnoDB支持分区&#xff0c;Mysiam不支持分区本例只是一个简单的说…

[Java恶补day22] 240. 搜索二维矩阵Ⅱ

编写一个高效的算法来搜索 m x n 矩阵 matrix 中的一个目标值 target 。该矩阵具有以下特性&#xff1a; 每行的元素从左到右升序排列。 每列的元素从上到下升序排列。 示例 1&#xff1a; 输入&#xff1a;matrix [[1,4,7,11,15],[2,5,8,12,19],[3,6,9,16,22],[10,13,14,17…

基于Master-Slave主从博弈论的储能与能源协调算法matlab仿真

目录 1.课题概述 2.系统仿真结果 3.核心程序 4.系统仿真参数 5.系统原理简介 6.参考文献 7.完整工程文件 1.课题概述 基于Master-Slave主从博弈论的储能与能源协调算法matlab仿真.主从博弈&#xff08;Stackelberg Game&#xff09;是一种具有层级决策结构的博弈模型&am…

vue-print-nb 打印相关问题

一、背景与解决方案 1、ElementUI表格打印通病&#xff0c;均面临边框丢失、宽度超出问题&#xff1a;相关解决代码有注释&#xff1b; 2、大多数情况下不会打印页眉页脚的日期、网址、未配置popTitle显示的undefined&#xff1a;相关解决代码有注释&#xff1b; 3、打印预览页…

Agent应用案例精选,以及主流Agent框架开源项目推荐

一、Agent技术概述 在人工智能领域,Agent(智能体)是指能够感知环境、自主决策并执行动作以实现特定目标的智能系统。随着大语言模型(LLM)的快速发展,基于LLM的Agent系统已成为当前AI研究的热点方向,为复杂任务解决提供了全新范式。 Agent的核心特征 自主性(Autonomy): 能够…