Grounded-Segment-Anything 环境配置

  • Grounded-Segment-Anything 介绍
  • 环境配置
    • Install osx(非必须):
    • Install RAM & Tag2Text:
      • 报错 module ‘pkgutil‘ has no attribute ‘ImpImporter‘. Did you mean: ‘zipimporter‘?
  • 运行
    • 输出分割+文本提示检测
      • 远程服务器

Grounded-Segment-Anything 介绍

github项目地址
接地分段任何事物
该项目的核心思想是整合不同模型的优势,构建一个极其强大的流程来解决复杂问题。值得一提的是,这是一个组合强大专家模型的工作流程,其中所有部分都可以单独使用或组合使用,并且可以替换为任何相似但不同的模型(例如,用 GLIP 或其他检测器替换 Grounding DINO / 用 ControlNet 或 GLIGEN 替换 Stable-Diffusion / 与 ChatGPT 结合使用)。

环境配置

创建环境等跳过
安装torch等

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

验证

import torch
torch.cuda.is_available()

输出true即证明可以使用gpu

Install without Docker

pip install --upgrade "diffusers[torch]"

Install osx(非必须):

git submodule update --init --recursive
cd grounded-sam-osx && bash install.sh

在这里插入图片描述
这里如果运行不成功的话可以命令行挨个指令再走一遍

pip install mmcv-full==1.7.1

相关文章:1 下载地址
暂时跳过,我总觉得这个好像不是必选的

Install RAM & Tag2Text:

git clone https://github.com/xinyu1205/recognize-anything.git
pip install -r ./recognize-anything/requirements.txt
pip install -e ./recognize-anything/

报错 module ‘pkgutil‘ has no attribute ‘ImpImporter‘. Did you mean: ‘zipimporter‘?

python -m ensurepip --upgrade
python -m pip install --upgrade setuptools

运行

步骤 1:下载预训练权重

cd Grounded-Segment-Anything# download the pretrained groundingdino-swin-tiny model
wget https://github.com/IDEA-Research/GroundingDINO/releases/download/v0.1.0-alpha/groundingdino_swint_ogc.pth

运行演示

python grounding_dino_demo.py

在这里插入图片描述
这一步没有分割结果输出

输出分割+文本提示检测

cd Grounded-Segment-Anythingwget https://dl.fbaipublicfiles.com/segment_anything/sam_vit_h_4b8939.pth
wget https://github.com/IDEA-Research/GroundingDINO/releases/download/v0.1.0-alpha/groundingdino_swint_ogc.pth
python grounded_sam_demo.py \--config GroundingDINO/groundingdino/config/GroundingDINO_SwinT_OGC.py \--grounded_checkpoint groundingdino_swint_ogc.pth \--sam_checkpoint sam_vit_h_4b8939.pth \--input_image assets/demo1.jpg \--output_dir "outputs" \--box_threshold 0.3 \--text_threshold 0.25 \--text_prompt "bear" \--device "cuda"

在这里插入图片描述

基本功能也就是这些了,如果需要更多的需求的话,可以去原始项目探索一下。

远程服务器

Pycharm远程连接服务器并运行代码(详细!)
Pycharm 实现本地与服务器代码同步
conda克隆环境
假设已有环境名为A,需要生成的环境名为B:

conda create -n B --clone A

pycharm 远程运行时,出现报错 can’t open file '/tmp/ ': [Errno 2] No such file or directory
解决pycharm中,远程服务器上文件找不到的问题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/96085.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/96085.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/96085.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ZYNQ 定时器

一、ZYNQ定时器简介 每个Cortex-A9处理器都有自己的专用32位定时器和32位看门狗定时器。两个处理器共享一个全局64位定时器。这些计时器的时钟始终为CPU频率(CPU_3x2x)的1/2。在系统级,有一个24位看门狗定时器和两个16位三重定时器/计数器。系…

Java8 Comparator接口 和 List Steam 排序使用案例

在Java中,Comparator接口主要用于实现自定义排序逻辑,适用于未实现Comparable接口或需要覆盖默认比较规则的场景。以下是核心使用方法和注意事项:一、基础用法‌匿名内部类实现‌传统方式通过匿名内部类重写compare()方法,例如对整…

word2vec模型案例

代码实现:import torch.optim as optim from tqdm import tqdm, trange import numpy as np import torch from torch import nn import torch.nn.functional as FCONTEXT_SIZE 2raw_text """We are about to study the idea of a computational p…

< 自用文 OS 有关 > (续)发现正在被攻击 后的自救 Fail2ban + IPset + UFW 工作流程详解

继上编:< 自用文 主机 USC 记录:> 发现正在被攻击 后的自救-CSDN博客 环境: 改进: 以下是把代码,懒得写,扔给了 AI ,让它出的: Fail2ban IPset UFW 工作…

Linux —— 虚拟进程地址空间

🎁个人主页:工藤新一 🔍系列专栏:C面向对象(类和对象篇) 🌟心中的天空之城,终会照亮我前方的路 🎉欢迎大家点赞👍评论📝收藏⭐文章 文章目录虚…

简单聊一聊js

JavaScript 是一种高级的、解释型的编程语言。它是现代 Web 开发的三大核心基石之一,与 HTML 和 CSS 并列。​HTML​:负责网页的结构和内容​(如标题、段落、图片)。​CSS​:负责网页的样式和布局​(如颜色…

造粒机cad+设计说明书

摘要 随着现代化工业的快速发展,生产出大量的固体废弃物。这些废弃物对环境造成了很大的污染,因此需要采取有效的措施进行处理。机械强压式造粒机就是一种非常有效的处理工具,它可以将废渣、废料、饲料和化肥等材料通过机械强力挤压&#xff…

第五课 C#语言基本元素概览,初始类型,变量与方法,算法简介

熟悉C#语言要求:对构成C#语言的基本元素,随便拿出一个你都认识,对于常见基本元素,都能正确使用它 精通C#语言要求:对于构成C#语言的基本元素,随便拿出一个都会使用,对于常用基本元素&#xff0…

LLM学习:大模型基础——视觉大模型以及autodl使用

1、常见的VLM 在大模型中,VLM 是视觉语言模型(Vision-Language Model)的缩写,是一种多模态、生成式 AI 模型,能够理解和处理视频、图像和文本。 VLM 通过将大语言模型(LLM)与视觉编码器相结合构建而成,使 LLM 具有 “看” 的能力,从而可以处理并提供对提示中的…

Vue—路由配置中设置了meta.title,但页面标题仍然显示为“Vite App“?【让我来看看~】

路由配置中明明设置了meta.title,但是页面标题仍然显示为"Vite App"?这是因为仅仅在路由配置中设置meta.title是不够的,还需要在路由守卫中动态设置页面标题。需要做以下几件事来正确设置页面标题:1.首先更新HTML文件的…

【机器学习】综合实训(二)

项目五 电影评分预测【教学内容】使用 MovieLens 数据集,训练一个模型预测用户对电影的评分。主要有以下几个知识点:(1)数据加载与探索性分析(EDA)。(2)处理稀疏数据(如用…

STM32 UART + DMA + 空闲中断使用中的帧错误(FE)问题及解决方案

STM32 UART + DMA + IDLE中断使用中的帧错误(FE)问题及解决方案 在我调试STM32H7串口空闲中断DMA接受时遇到了一个bug,这个现象发生在系统刚上电时,有个串口由于帧错误FE挂起了中断,之后在HAL_UART_IRQHandler这个全局中断处理函数结束后,所有的中断使能标志位都被清除了,经过…

TDengine 选择函数 BOTTOM() 用户手册

BOTTOM() 函数用户手册 函数定义 BOTTOM(expr, k)功能说明 BOTTOM() 函数统计表/超级表中某列的值最小 k 个非 NULL 值。如果多条数据取值一样,全部取用又会超出 k 条限制时,系统会从相同值中随机选取符合要求的数量返回。 返回值 数据类型: 同应用…

西门子 S7-200 SMART PLC 实现星三角降压启动控制:原理、案例与完整程序

在工业控制场景中,中型异步电机直接启动时会产生远超额定电流的冲击电流(通常为额定电流的 5-7 倍),不仅会影响电网稳定性,还可能对机械设备造成损伤。星三角(Y-Δ)降压启动是解决这一问题的经典…

【Android】View 的基础知识

【Android】View 的基础知识 1. 什么是 View? View 是 Android 中所有UI组件的基础类。它表示屏幕上的一个矩形区域,负责绘制内容和处理用户交互事件。所有的 UI 组件(如按钮、文本框等)都是 View 的子类,而 ViewGroup…

西门子 S7-200 SMART PLC 实现电机点动与连续运行综合控制

在工业生产中,电机控制并非单一模式:调试设备时需要 “按动即转、松开即停” 的点动功能,正常生产时则需要 “一键启动、持续运行” 的连续控制。本文以西门子 S7-200 SMART PLC 为载体,详细讲解电机点动控制原理,并设…

如何解决pip安装报错ModuleNotFoundError: No module named ‘sphinx-rtd-theme’问题

【Python系列Bug修复PyCharm控制台pip install报错】如何解决pip安装报错ModuleNotFoundError: No module named ‘sphinx-rtd-theme’问题 摘要 在使用 PyCharm 开发 Python 项目时,pip install 报错是常见痛点。特别是在构建文档或引入第三方库时,开…

HakcMyVM-Literal

目录信息搜集漏洞利用权限提升信息搜集 主机发现 ┌──(kali㉿kali)-[~] └─$ nmap -sn 192.168.21.0/24 Nmap scan report for 192.168.21.5端口扫描 ┌──(kali㉿kali)-[~] └─$ nmap -sS -sV -O -p- 192.168.21.5 Starting Nmap 7.95 ( https://nmap.org ) a…

0904 类的继承

Part 1.梳理思维导图一.继承中的特殊成员函数1.构造函数父类的构造函数会被继承到子类中&#xff0c;在构造的顺序中&#xff0c;是先构造父类&#xff0c;再构造子类#include <iostream>using namespace std;class Father { public:string name; protected:int *age; pr…

PDF教程|如何把想要的网页保存下来?

前段时间有个小伙伴咨询了小白&#xff1a;领导想要某个网页的整个页面&#xff0c;有没有比较好的方法把它保存下来&#xff1f; 在他找到小白之前&#xff0c;这种事情他已经接到好几次了&#xff0c;每次都是怎么解决的呢&#xff1f;其实很简单&#xff0c;就是打开Word&a…