1. ichorCNA简介

ichorCNA是一种用于估计来自超低测序深度的全基因组测序(ULP-WGS,0.1x覆盖率)的cfDNA中肿瘤分数的工具。ichorCNA使用概率模型,应用隐马尔可夫模型(HMM),以同时分割基因组,预测大范围的拷贝数变化,并估计超低深度全基因组测序样本的肿瘤分数。ichorCNA针对样品的超低深度(~0.1x)测序进行了优化,并且已经使用患者和健康供体cfDNA样品进行了基准测试。

ichorCNA分析工作流包括2个任务:

(1)GC含量偏倚校正(使用HMM copy),从ULP-WGS计算reads覆盖率,数据校正和标准化;

(2)CNA预测和cfDNA的肿瘤分数的估计。

2. 软件安装

########## 推荐安装 #########
# R包安装,软件是否升级,选择3: None
install.packages("devtools")
devtools::install_github("broadinstitute/ichorCNA")########## 手动安装(R≥3.6.0) #########
git clone git@github.com:broadinstitute/ichorCNA.git  install.packages("plyr") # 安装依赖包
BiocManager::install("HMMcopy")  
BiocManager::install("GenomeInfoDb")  
BiocManager::install("GenomicRanges")  # SHELL
R CMD INSTALL ichorCNA   

3. 软件用法

ichorCNA可用于告知肿瘤来源的DNA的存在或不存在,并指导进行全外显子组或更深的全基因组测序的决定。此外,肿瘤分数的定量估计可用于校准期望的测序深度,以达到用于鉴定游离DNA中的突变的统计。

教程: https://github.com/broadinstitute/ichorCNA/wiki

图示

3.1 生成读取计数文件

使用HMMcopy套件中的readCounter生成读取计数覆盖率信息;从ULP-WGS BAM创建WIG文件,使用HMMcopy的readCounter工具。 下面示例将创建跨所有染色体具有1 Mb箱的WIG文件,并且仅包括具有大于20的比对质量的reasd。

# BAM索引
samtools index tumor.bam# raeds计数
/HMMcopy/bin/readCounter --window 1000000 --quality 20 \
--chromosome "1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,X,Y" \
tumor.bam > tumor.wig

3.2 CNV分析和肿瘤分数的预测

使用ichorCNA R软件包的拷贝数分析和肿瘤分数的预测,runIchorCNA.R R脚本位于ichorCNA/scripts/目录中。

Rscript /ichorCNA/scripts/runIchorCNA.R \
--id tumor_sample \
--WIG tumor.wig \
--ploidy "c(2,3)" \
--normal "c(0.5,0.6,0.7,0.8,0.9)" \
--maxCN 5 \
--gcWig /ichorCNA/inst/extdata/gc_hg19_1000kb.wig \  # GC含量wig文件
--mapWig /ichorCNA/inst/extdata/map_hg19_1000kb.wig \  # 比对分苏的wig文件
-centromere /ichorCNA/inst/extdata/GRCh37.p13_centromere_UCSC-gapTable.txt \  # 包含着丝粒位置的文件
--normalPanel /ichorCNA/inst/extdata/HD_ULP_PoN_1Mb_median_normAutosome_mapScoreFiltered_median.rds \   # normal面板的中值矫正深度
--includeHOMD False \
--chrs "c(1:22, \"X\")" \ # 指定分析的染色体
--chrTrain "c(1:22)" \    # 指定用于估计参数的染色体
--estimateNormal True \
--estimatePloidy True \
--estimateScPrevalence True \
--scStates "c(1,3)" \
--txnE 0.9999 \
--txnStrength 10000 \
--outDir ./  # 输出目录

3.3 创建自定义的参考面板(可选)

https://github.com/broadinstitute/ichorCNA/wiki/Create-Panel-of-Normals

ichorCNA 可以在没有任何参考面板的情况下运行。作者提供了一个带有 ichorCNA 的正常组 (PoN),但使用与你的癌症患者 cfDNA 样本类似的处理和测序的样本生成你自己的样本可能会降低噪音并提高准确性。这些数据有助于进一步标准化癌症患者的 cfDNA,以纠正由文库构建、测序平台和 cfDNA 特异性伪影引起的系统性偏差。

3.4 低肿瘤含量样本(早期疾病)的参数优化

对于预期肿瘤分数低于 5% 的样品,修改默认设置以改善参数估计可能会有所帮助。对于这些类型的样品,建议对更高的覆盖度 (> 1-5x) 进行测序。对于预期肿瘤分数低于 ~0.5% 的样本,我们建议使用标准深度的全基因组测序(例如 > 20 倍)。

3.4.1 初始化肿瘤分数参数

将非肿瘤(1 减去肿瘤分数)初始化为预期值,例如 5%、1%、0.5%、0.1%。ichorCNA 仍将估计肿瘤分数,但拥有这些初始起始值可以帮助 EM 步骤找到更好的全局最优值。

--normal "c(0.95, 0.99, 0.995, 0.999)"

3.4.2 将初始倍性设置为二倍体

对于低肿瘤分数病例,很难预测倍性值。

--ploidy "c(2)"

3.4.3 减少拷贝数状态的数量

减少状态空间将有助于降低复杂性。如果您从先前的样本(例如肿瘤活检)中知道存在较大的高水平拷贝数事件,则可以将其设置为 4。

--maxCN 3

3.4.4 不考虑亚克隆拷贝数事件

对于低肿瘤分数,亚克隆事件很难检测到,这些我们可以关闭。

--estimateScPrevalence FALSE --scStates "c()"

3.4.5 仅训练和分析常染色体

在分析和训练中排除 chrX 以降低复杂性。

--chrs "c(1:22)" --chrTrain "c(1:22)"

3.5 snakemake管道

https://github.com/broadinstitute/ichorCNA/wiki/SnakeMake-pipeline-for-ichorCNA

此工作流将从 BAM 文件开始运行 ichorCNA 管道并生成 ichorCNA 输出。

4 主要输出文件

<sampleID>.seg : 由 Viterbi 算法调用的 Segment。格式与 IGV 兼容。<sampleID>.seg.txt: 与 <sampleID>.seg 相同,但还包括节段的亚克隆状态(0 = 克隆,1 = 亚克隆)。格式与 IGV 不兼容。<sampleID>.cna.seg: 每个 bin/窗口的估计拷贝数、日志比率和子克隆状态。<sampleID>.correctedDepth.txt: 校正 GC 和可映射性偏差后每个 bin/window 的 Log2 比率。<sampleID>.RData: ichorCNA 完成后保存的 R 图像。将包括所有解决方案的结果。<sampleID>/<sampleID>_CNA_chr#.pdf: 每条染色体的拷贝数图。<sampleID>/<sampleID>_bias.pdf: 说明 GC 和可映射性偏差校正之前/之后的数据的图表。<sampleID>/<sampleID>_correct.pdf:GC 和可映射性偏差校正之前/之后的全基因组数据图。<sampleID>/<sampleID>_genomeWide_n##-p#.pdf:用 n 和 p 初始化的溶液的估计拷贝数、肿瘤分数和倍性注释的数据全基因组图。p=肿瘤倍性<sampleID>/<sampleID>_genomeWide.pdf:全基因组数据图,注释了估计的拷贝数、肿瘤分数和倍性,以获得最佳解决方案。<sampleID>/<sampleID>_tpdf.pdf:使用来自最优解的收敛参数绘制每个拷贝数状态的 students-t 分布图。Tumor Fraction 肿瘤分数,肿瘤来源的DNA的估计分数。相当于大量肿瘤分析中的纯度。Tumor Ploidy 肿瘤倍性,肿瘤来源基因组的平均拷贝数。总体样本倍性为 2 * (1 - tumor.fraction) + tumor.fraction * tumor.ploidy。

参考文献:
Adalsteinsson, Ha, Freeman, et al. Scalable whole-exome sequencing of cell-free DNA reveals high concordance with metastatic tumors. (2017) Nature Communications Nov 6;8(1):1324. doi: 10.1038/s41467-017-00965-y

生信软件文章推荐

生信软件1 - 测序下机文件比对结果可视化工具 visNano

生信软件2 - 下游比对数据的统计工具 picard

生信软件3 - mapping比对bam文件质量评估工具 qualimap

生信软件4 - 拷贝数变异CNV分析软件 WisecondorX

生信软件5 - RIdeogram包绘制染色体密度图

生信软件6 - bcftools查找指定区域的变异位点信息

生信软件7 - 多线程并行运行Linux效率工具Parallel

生信软件8 - bedtools进行窗口划分、窗口GC含量、窗口测序深度和窗口SNP统计

生信软件9 - 多公共数据库数据下载软件Kingfisher

生信软件10 - DNA/RNA/蛋白多序列比对图R包ggmsa

生信软件11 - 基于ACMG的CNV注释工具ClassifyCNV

生信软件12 - 基于Symbol和ENTREZID查询基因注释的R包(easyConvert )

生信软件13 - 基于sambamba 窗口reads计数和平均覆盖度统计

生信软件14 - bcftools提取和注释VCF文件关键信息

生信软件15 - 生信NGS数据分析强大的工具集ngs-bits

生信软件16 - 常规探针设计软件mrbait

生信软件17 - 基于fasta文件的捕获探针设计工具catch

生信软件18 - 基于docker部署Web版 Visual Studio Code

生信软件19 - vcftools高级用法技巧合辑

生信软件20 - seqkit+awk+sed+grep高级用法技巧合辑

生信软件21 - 多线程拆分NCBI-SRA文件工具pfastq-dump

生信软件22 - 测序数据5‘和3‘端reads修剪工具sickle

生信软件23 - Samtools和GATK去除PCR重复方法汇总

生信软件24 - 查询物种分类学信息和下载基因组TaxonKit和ncbi-genome-download

生信软件25 - 三代测序数据灵敏比对工具ngmlr

生信软件26 - BWA-MEM比对算法性能更好的bwa-mem2

生信软件27 - 基于python的基因注释数据查询/检索库mygene

生信软件28 - fastq与bam的reads数量计算与双端fastq配对检测工具fastq-pair

生信软件29 - 三代数据高效映射精确的长读段比对工具mapquik

生信软件30 - 快速单倍型分析工具merlin

生信软件31 - Bcftools操作VCF/BCF文件高级用法合集

生信软件32 - 变异位点危害性评估预测工具合集

生信软件33 - Wgsim生成双端(PE) fastq模拟数据

生信软件34 - 大幅提升Python程序执行效率的工具Pypy

生信软件35 - AI代码编辑器Cursor

生信软件36 - SAM/BAM/CRAM文件插入SNV/INDEL/SV工具Bamsurgeon

生信软件37 - 基于测序reads变异进行单倍型分型工具WhatsHap

生信软件38 - 基因型填充软件IMPUTE2

生信软件39 - GATK最佳实践流程重构,提高17倍分析速度的LUSH流程

生信软件40 - bedtools经典使用方法合集

生信软件41 - GATK经典使用方法合集

生信软件42 - 科研绘图R包神器tidyplots

生信软件43 - iGenomes批量下载Ensembl、NCBI、GATK和UCSC参考基因组和注释文件资源

生信软件44 - 比PyVCF更高效的VCF解析Python库cyvcf2

生信软件45 - 遗传变异分析工具GEMINI

生信软件46 - 三代测序低深度全基因组测序结构变异SV检测工具NanoVar

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/86531.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/86531.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/86531.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python 解压缩(支持.zip/.rar/.7z格式)

&#x1f91f;致敬读者 &#x1f7e9;感谢阅读&#x1f7e6;笑口常开&#x1f7ea;生日快乐⬛早点睡觉 &#x1f4d8;博主相关 &#x1f7e7;博主信息&#x1f7e8;博客首页&#x1f7eb;专栏推荐&#x1f7e5;活动信息 文章目录 Python 解压缩&#xff08;支持.zip/.rar/.7…

龙虎榜——20250627

上证指数放量收阴线&#xff0c;回踩5天均线&#xff0c;但个股总体涨多跌少。 深证指数缩量收十字星&#xff0c;在前期压力位震荡。 2025年6月27日龙虎榜行业方向分析 1. 金融科技&#xff08;跨境支付数字安全&#xff09; 代表标的&#xff1a;吉大正元&#xff08;跨境认…

三步实现B站缓存视频转MP4格式

本期我们来实现如何将B站缓存的视频转成MP4格式&#xff0c;直接在本地播放。 首先我们在Bilibili客户端缓存一个视频&#xff0c;保存的文件如下&#xff1a; 这里有两个m4s文件&#xff0c;大的哪个是视频文件&#xff0c;小的是音频文件&#xff0c;这里我们用视频播放软件…

MySQL 与 Oracle 事务:深度解析与全面对比

在数据库管理领域&#xff0c;事务是确保数据一致性和完整性的核心机制&#xff0c;它允许用户将一系列操作视为一个不可分割的整体&#xff0c;要么全部成功执行&#xff0c;要么全部回滚。MySQL 和 Oracle 作为两款广泛使用的关系型数据库管理系统&#xff0c;它们在事务处理…

麒麟系统如何输出启动日志到串口

1、台式机系统启动日志输出到串口 &#xff08;1&#xff09;GRUB配置 编辑GRUB配置文件&#xff08;如/etc/default/grub&#xff09;&#xff0c;添加或修改以下参数&#xff1a; GRUB_CMDLINE_LINUX“consoletty0 consolettyS0,115200n8” tty0&#xff1a;表示将日志输出…

JUC:2栈和栈帧的定义

这部分内容虽然是JVM中的定义&#xff0c;但是在juc中属于底层知识&#xff0c;必须要学习 每个线程在创建时&#xff0c;就会将自身的资源存储在栈中&#xff0c;将线程需要运行的方法存放在方法区。 栈中会存储方法的局部变量、方法的参数以及方法返回的地址&#xff0c;这…

阿里云OSS上传文件Utils (@PostConstruct注解配置+Environment )

首先在 application.yaml 配置bucketName, endpoint, accessKeyId, accessKeySecret这里利用的是 spring 的生命周期, 在 bean 实例化后,使用PostConstruct注解 Environment 属性 进行spring上下文环境赋值 package com.shuai.utils;import com.aliyun.oss.*; import com.aliy…

Jetson家族横向对比:如何选择你的边缘计算设备

Jetson家族横向对比&#xff1a;如何选择你的边缘计算设备 一、边缘计算设备选型核心维度 在选择Jetson平台前&#xff0c;需明确以下关键指标&#xff1a; 算力需求&#xff1a;TOPS(INT8) / FP16精度功耗限制&#xff1a;被动散热/主动散热接口扩展&#xff1a;CSI摄像头数…

《聊一聊ZXDoc》之汽车服务导向SOME/IP

ZXDoc支持SOME/IP功能&#xff0c;通过服务导向架构实现跨域通信标准化&#xff0c;降低系统耦合&#xff0c;支持动态服务发现与调用&#xff0c;提升分布式系统扩展性和维护效率。 什么是SOME/IP&#xff1f; SOME/IP&#xff08;Scalable service-Oriented MiddlewarE ov…

Learning Semantic-Aware Knowledge Guidance for Low-Light Image Enhancement 论文阅读

学习语义感知知识引导用于低光照图像增强 摘要 低光图像增强&#xff08;LLIE&#xff09;研究如何改善照明并生成正常光照的图像。大多数现有方法通过全局和均匀的方式改进低光图像&#xff0c;而没有考虑不同区域的语义信息。如果没有语义先验&#xff0c;网络可能会容易偏…

【(Topk问题及其二叉树遍历】

Topk问题及其二叉树遍历 1.Topk问题2.二叉树的前序&#xff0c;中序&#xff0c;后序3.求二叉树的个数&#xff08;TreeSize&#xff09;。4.求二叉树的最大深度&#xff08;maxDepth&#xff09;。5.求二叉树的第K层的节点个数&#xff08;TreeKLevel&#xff09;。6.查找二叉…

AI+实时计算如何赋能金融系统?DolphinDB 在国泰君安期货年度中期策略会的演讲

6月25日&#xff0c;国泰君安期货2025年度中期策略会在上海顺利开幕。本次策略会以“观势明变&#xff0c;本固枝荣”为主题&#xff0c;特邀15位重量级行业嘉宾和52位明星分析师发表精彩观点&#xff0c;DolphinDB 受邀出席会议并作主题演讲。 实时计算如何赋能量化投研交易 …

PHP Protobuf 手写生成器,

✅ 以下是一个纯 PHP 编写的通用 Protobuf 二进制生成器&#xff0c;支持&#xff1a; varint fixed32 fixed64 length-delimited&#xff08;如字符串、嵌套 message&#xff09; 嵌套结构 (nested) 多字段 repeated ✅ 封装器代码&#xff08;可直接用&#xff09; &…

喜讯 | Mediatom斩获2025第十三届TopDigital创新营销奖「年度程序化广告平台」殊荣

6月27日&#xff0c;2025第十三届TopDigital创新营销盛典在上海圆满落幕&#xff0c;TopDigital创新营销奖获奖结果也已正式揭晓。本届TopDigital创新营销奖共有694家参展企业&#xff0c;3326件案例&#xff0c;AdMergeX旗下Mediatom媒体变现SaaS及服务平台在众多作品中脱颖而…

SQL 中 EXISTS 的原理与作用详解

平常也一直在用EXISTS 来进行逻辑判断&#xff0c;但是从来没有正经理解它&#xff0c;只知道找到有就返回True&#xff0c;没有就返回False。那么今天详细的理解一下&#xff08;主要借鉴了CSDN 其他博客文章&#xff0c;以及自己做的一个小例子&#xff09; 一、EXISTS是什么…

【Docker】解决:构建(docker build)或重新运行容器时,丢失apt-get update问题

一、解决&#xff1a;构建&#xff08;docker build&#xff09;或重新运行容器时&#xff0c;丢失apt-get update问题 在 Docker 容器中&#xff0c;每次构建&#xff08;docker build&#xff09;或重新运行容器时&#xff0c;默认情况下所有更改都会丢失&#xff0c;因为容…

流程管理系统方案成本评估报告(第一稿,复盘明确数据不准确,仅供参考哦)

​​一、成本评估框架​​ 所在制造业流程数字化转型的成本需从​​一次性投入​​与​​持续运营成本​​两个维度分析,并量化​​直接收益​​与​​间接收益​​。详细评估模型初稿: ​​二、成本构成与数据支撑​​ ​​1. 一次性投入成本​​ ​​项目​​​​费用范围…

高并发分布式锁解决方案对比与选型指南

高并发分布式锁解决方案对比与选型指南 在大规模分布式系统中&#xff0c;分布式锁是确保资源互斥访问、保证数据一致性的关键组件。针对不同业务场景&#xff0c;分布式锁的实现方案多种多样&#xff0c;各有优缺点。本文将从问题背景出发&#xff0c;对Redis原生锁/RedLock、…

全面掌握Vue 3响应式:ref自动解包、reactive对象替换及响应式丢失问题

Vue 3的响应式系统是其最核心的特性之一&#xff0c;主要通过ref和reactive这两个API来实现。本文将详细介绍这两个API的使用方法、区别以及最佳实践。 1. ref()的基本使用 ref()用于创建一个响应式的数据引用。它可以包装任何类型的值&#xff0c;包括基本类型和对象类型。 …

【科普】 AI大模型应用架构图大全

AI大模型应用架构图大全 AI大模型技术全景视图&#xff1a; AI大模型通用技术架构图 AI大模型通用技术架构图 AI大模型通用技术架构图 RAG知识库业务架构图 AI农业大模型技术架构图 AI导购大模型技术架构图 AI导购大模型技术架构图 AI大模型合规风控管理架构图 AI大模型合规管…