pingmian/2025/7/20 2:05:54/文章来源:https://blog.csdn.net/Rita_rr/article/details/139128183

目录

1.在BAM文件中根据指定的变异等位基因分数的指定位置或区域随机选择read。

2.筛选变异等位基因分数的reads：

3.装BWA和samtools软件包（samtools在linux系统中下载过，前文有讲过）

4.写py脚本

5.下载pysam库模块

6.下载参考基因组hg38

7.解压gz

8.建立samtools索引

9.建立BWA索引

10.下载picard工具包

11.对hg38.fa建立索引

12.使用BWA的index命令为参考基因组文件创建索引

13.BWA进行比对

14.对bam文件进行标记重复并移除重复的读取

15.使用变体检测工具：运行GATK、FreeBayes、Samtools等变体检测工具，在比对后的数据中检测SNV和Indel，并生成VCF文件。

16.下载transverse colon的wgs的vcf文件

编辑

17.尖峰点突变（SNV 和 InDel）进入 bam 文件。（Illumina平台）

18、变异检测验证（FreeBayes / GATK / samtools)

19、Tips 与建议

浅浅介绍一下VarBen是什么东东吧。

VarBen是用于向bam文件添加变异模拟的工具，包括单核苷酸变异、短的插入和缺失以及结构变异。

VarBen主要在linux系统下使用，无需编译即可运行。但是需要预先配置运行环境。

采用的是比对到参考基因组特定位点的测序reads进行编辑的方式来进行模拟。这种方法可保留测序过程中产生的错误类型分布模式，使生成的模拟数据更接近实际数据。那么我们应该怎么做呢？请听我一本正经的胡说八道吧~

1.在BAM文件中根据指定的变异等位基因分数的指定位置或区域随机选择read。

【概念：等位基因分数是一个用于描述在某个基因座中，某个特定等位基因出现的频率或比例的指标。】

首先，确保你的BAM文件已经被索引。你可以使用samtools index命令为BAM文件创建索引。这个索引文件（.bai）将允许你快速查询BAM文件中的特定区域。

（具体操作在前文有讲过哦~）

利用samtools view命令，你可以提取指定区域或位置的reads（提取染色体chr1上位置10000到20000之间的reads）。

samtools view sorted_ENCFF845HFA.bam chr1:10000-20000 >extracted_reads.bam

查看文件：

 less -n extracted_reads.bam

2.筛选变异等位基因分数的reads：

这一步通常需要使用一些自定义的脚本或工具，因为标准的SAMtools并不直接支持根据等位基因分数筛选reads。你可以使用Python的pysam库或者其他编程语言的相关库来读取BAM文件，并筛选出具有特定等位基因分数的reads。

大家放心，在Linux中使用Python是非常简单的，因为大多数Linux发行版都预装了Python。

#检查python版本
python --version

（我的是python3版本，你的是什么版本呢？）

3.装BWA和samtools软件包（samtools在linux系统中下载过，前文有讲过）

#如果你也是python3版本的话
pip3 install BWA
#如果不是
pip install BWA

下载完成标志：

4.写py脚本

我在linux专栏中有讲到vim文本编辑器，可以用来编辑python脚本的。除此之外，你还可以使用任何文本编辑器（如nano、emacs、gedit等）来编写Python代码，并将其保存为.py文件。然后，你可以使用上述方法在终端中运行它。

vim reads.py

vim命令：

i进入编辑模式

Esc退出编辑

:wq保存并退出

【忘记的话可以回去看看我之前写的文章（linux专栏）哦】

5.下载pysam库模块

pip3 install pysam

我一开始以为我以为python3会自带的，一运行脚本发现报错，原来是我自作多情了，所以如果你也没有安装的话，需要安装一下呢。（以下为报错信息）

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：http://www.pswp.cn/pingmian/89453.shtml
繁体地址，请注明出处：http://hk.pswp.cn/pingmian/89453.shtml
英文地址，请注明出处：http://en.pswp.cn/pingmian/89453.shtml

如若内容造成侵权/违法违规/事实不符，请联系英文站点网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Redis-典型应用-分布式锁

目录 1.什么是分布式锁? 2.分布式锁的实现 3.引入过期时间 4.引入校验ID 5.引入lua脚本: 6.引入看门狗(watch dog) 7.引入redislock算法: 1.什么是分布式锁? 在分布式系统中,会出现多个节点同时访问同一个公共资源, 此时就需要通过锁来作互斥控制,避免出现类似于多线程…

阅读更多...

Dinky (Mac) 本地开发环境搭建指南

目录一、前置条件二、代码准备三、前端环境搭建 1. 安装Node环境 2. 安装PNPM 3. 构建前端四、后端环境搭建 1. 本地编译依赖 2. 添加必要依赖 3. 启动后端服务五、访问系统附录：官方参考一、前置条件确保已安装以下软件： 软件要求…

阅读更多...

Java Set 集合详解：从基础语法到实战应用，彻底掌握去重与唯一性集合

作为一名 Java 开发工程师，你一定在实际开发中遇到过需要去重、唯一性校验、快速查找等场景。这时候，Set 集合就成为你不可或缺的工具。本文将带你全面掌握：Set 接口的定义与核心方法常见实现类（如 HashSet、TreeSet、LinkedHash…

阅读更多...

在分布式系统中，如何保证缓存与数据库的数据一致性？

口诀： 读多写少用旁路，先更库再删缓存； 强一致选写透，缓存代理更库走； 性能优先用写回，异步批量有风险； 高并发加双删，延迟兜底防旧残； 强一致用锁串，并发虽低…

阅读更多...

【洛谷P1417】烹调方案题解

题目大意一共有 nnn 件食材，每件食材有三个属性，aia_iai，bib_ibi 和 cic_ici，如果在 ttt 时刻完成第 iii 样食材则得到 ai−tbia_i-t\times b_iai−tbi 的美味指数，用第 iii 件食材做饭要花去 cic_ici 的…

阅读更多...

vue svg实现一个环形进度条组件

svg实现一个环形进度条设计初衷：本来想直接使用element的进度条组件的，但是好多属性都没有办法控制。 UI设计的图如下，需要控制未完成和已完成的颜色，端点的形状改为普通的butt 所以使用svg实现了一个环形进度条组件element组件设…

阅读更多...

02 51单片机之LED闪烁

文章目录1、单片机1-1、简介1-2、应用场景2、51单片机2-1、背景2-2、主要品牌及其产品2-3、基本组成2-4、命名规则3、单片机内部结构3-1、单片机内部结构图3-2、单片机内部结构3-3、单片机内部管脚图3-4、单片机最小系统3-5、开发板介绍4、点亮LED4-1、新建工程4-1-1、创建工程…

阅读更多...

Typecho博客集成算术验证码防御垃圾评论实战指南

文章目录 Typecho实现算术验证码防御机器人垃圾评论的完整方案背景与问题分析技术方案设计系统架构技术选型核心实现步骤 1. 创建验证码生成函数 2. 修改评论表单模板 3. 添加AJAX刷新功能 4. 创建验证码刷新接口 5. 添加评论提交验证安全增强措施 1. 防止暴力破解 2. 增…

阅读更多...

clonezilla 导出自动化恢复iso

clonezilla 下载及U盘工具下载 clonezilla rufus U盘写入工具ventoy U盘工具downloaddownloaddownload clonezilla 备份，连贯上一篇文章参考 Choose Clonezilla live (VGA 800x600) Wait for it to complete Language selection Keyboard Settings Select Mode …

阅读更多...

深度学习模型开发部署全流程：以YOLOv11目标检测任务为例

深度学习模型开发部署全流程：以YOLOv11目标检测任务为例深度学习模型从开发到部署的完整流程包含需求分析、数据准备、模型训练、模型优化、模型测试和部署运行六大核心环节。YOLOv11作为新一代目标检测模型，不仅延续了YOLO系列的高效实时性能&#xff…

阅读更多...

单片机（STM32-串口通信）

一、串口通信基础概念串口通信（Serial Communication）是一种在计算机和外部设备之间进行数据传输的通信方式。它通过串行方式逐位传输数据，是最基本和常用的通信接口之一。主要特点1. 串行传输(1)数据按位顺序传输，一次只能传输一…

阅读更多...

Redis学习其三（订阅发布，主从复制，哨兵模式）

文章目录9.Redis订阅与发布9.1发布订阅命令9.2示例10.Redis主从复制10.1概念10.2环境配置10.3集群搭建（一主二从配置）10.4使用规则&原理11.哨兵模式11.1基本概念11.2工作原理11.3使用案例12.缓存穿透,雪崩（待拓展）12.1缓存穿透…

阅读更多...

跨平台 App 如何无痛迁移到鸿蒙系统？全流程实战+Demo 教程

摘要目前，随着 HarmonyOS（鸿蒙系统）的快速发展，越来越多开发者和企业希望将已有的 Android、Flutter、React Native 等跨平台应用迁移到鸿蒙生态中。鸿蒙不仅具备分布式能力、原生性能和统一的开发范式，还提供了丰富的…

阅读更多...

智慧后厨检测算法构建智能厨房防护网

智慧后厨检测：构建安全洁净厨房的智能解决方案背景：传统后厨管理的痛点与智慧化需求餐饮行业后厨管理长期面临操作规范难落实、安全隐患难察觉、卫生状况难追溯等痛点。传统人工巡检效率低、覆盖面有限，难以实现24小时无死角监管。例如&#…

阅读更多...

LatentSync: 一键自动生成对嘴型的视频

LatentSync是什么字节跳动与北京交通大学联合推出了全新的唇形同步框架 LatentSync，它基于音频驱动的潜在扩散模型，跳过了传统的3D建模或2D特征点提取，直接生成自然逼真的说话视频。 LatentSync借助Stable Diffusion强大的图像生成能力&am…

阅读更多...

在断网情况下，网线直接连接 Windows 笔记本和 Ubuntu 服务器进行数据传输

在断网情况下，网线直接连接 Windows 笔记本和 Ubuntu 服务器进行数据传输

在断网情况下，通过网线直接连接 Windows 笔记本和 Ubuntu 服务器上的容器进行数据传输，可以按照以下步骤操作：1. 物理连接使用网线直连：用一根普通网线（直通线） 连接 Windows 笔记本和 Ubuntu 服务器的…

阅读更多...

机器学习17-Mamba

深度学习之 Mamba 学习笔记一、Mamba 的背景与意义在深度学习领域，序列建模是一项核心任务，像自然语言处理、语音识别和视频分析等领域，都要求模型能有效捕捉长序列里的依赖关系。之前，Transformer 凭借强大的注意力机制成为序列…

阅读更多...

Java实现word、pdf转html保留格式

一、word转html 依赖： <properties><poi.version>5.2.3</poi.version><xhtml.version>2.0.4</xhtml.version> </properties> <dependency><groupId>org.apache.poi</groupId><a…

阅读更多...

基于51单片机和16X16点阵屏、矩阵按键的小游戏《俄罗斯方块》

目录系列文章目录前言一、效果展示二、原理分析三、各模块代码1、16X16点阵屏（MAX7219驱动）2、矩阵按键3、定时器0四、主函数总结系列文章目录前言《俄罗斯方块》，一款经典的、怀旧的小游戏，单片机入门必写程序。有两个版本&…

阅读更多...

Stable Diffusion Windows本地部署超详细教程(手动+自动+整合包三种方式)

Stable Diffusion Windows本地部署超详细教程(手动+自动+整合包三种方式)

Stable Diffusion Windows 本地部署超详细教程 (手动自动整合包三种方式) 一、引言我们可以通过官方网站 Stability AI，以及 Dream Studio、Replicate、Playground AI 、Baseten 等网站在线体验 Stable Diffusion 的巨大威力。相比于集成在网络平台的 SD 或者…

阅读更多...

最新文章