欢迎访问 生活随笔!

生活随笔

当前位置: 首页 >

MDR的进阶版本-GMDR

发布时间:2023/12/31 43 豆豆
生活随笔 收集整理的这篇文章主要介绍了 MDR的进阶版本-GMDR 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

欢迎关注”生信修炼手册”!

MDR多因子降维法作为逻辑回归的一种补充,有效克服了逻辑回归在处理高阶稀疏数据时的局限性,广泛应用于分析基因-基因,基因-环境之间的相互作用,但是该方法存在一些局限性

  • 和逻辑回归一样,该方法仅适用于二分类因变量的分析,比如case/control的实验设计,对于连续型因变量无法处理

  • 和逻辑回归不同,逻辑回归可以进行协变量的校正,而该方法不可以

  • 为了克服上述两个问题,增加MDR方法的适用性,科学家们在MDR核心思想的基础上进行了扩展,引入了score statistic的概念,提出了GMDR的方法,原理示意如下


    MDR算法的核心是统计不同因子组合对应的频数,对应第三步中的单元格内的频数,然后用该频数的比值进行降维,并进行分类准确性和预测错误率的分析,从而挑选佳的模型。

    GMDR仍然沿用了相同的算法框架,只不过将频数改为了打分,关于其打分系统的详细介绍参见下面这篇文章

    https://www.cell.com/action/showPdf?pii=S0002-9297(07)61030-161030-1)

    然后根据该打分值来进行后续的降维,分类准确性,预测错误率等分析。在文章中也比较了MDR和GMDR的分析结果,结果如下

    可以看到,MDR和GMDR结果的一致性非常高,而同样的因子组合,GMDR的预测准确率和交叉验证的一致率都比MDR方法好。GMDR支持广义线性回归等多种模型,图示如下

    可以用于处理各种类型的数据,软件下载的网址如下

    http://www.ssg.uab.edu/gmdr/

    和MDR软件的用法完全一致,导入文件即可。至少要求输入SNP位点的分型结果文件,内容如下

    如果需要进行协变量的校正,也可以输入对应的文件,内容如下

    每一行对应的都是一个样本,分型结果和协变量两个文件中每一行对应同一个样本,最后一列为因变量y。导入文件后,点击Run Analysis即可开始分析,分析结果如下所示

    和MDR输出结果类似,也是有两个部分,第一部分显示了不同数量的因子相互作用中最显著的结果, Training Bal.Acc表示训练集中的准确率,Testing Bal.Acc表示测试集中的准确率,数字越大,范围为0-1,数值越大,准确率越高,CV Consistency表示交叉验证的一致率,8/10表示10次交叉验证中8次该结果都显著。Sign Test(p)表示p值;第二部分则显示了对应的score值等详细信息。

    该软件也可以通过命令行运行,更多用法请参考官方文档。

    ·end·

    —如果喜欢,快分享给你的朋友们吧—

    往期精彩

    • 自己动手进行逻辑回归,你也可以!

    • GWAS大家都知道,Gene-Based GWAS你了解吗?

    • 3步搞定GWAS中的Gene Set Analysis

    • 你听说过Epistasis吗?

    • GWAS中的Gene-Gene Interactions如何分析?看这里

    • 终于搞清楚了Lasso回归和Ridge回归的区别

    • odd ratio置信区间的计算,你学会了吗?

    • 多元回归分析存在多重共线性了怎么办?

    • 基因型与表型的交互作用如何分析,多元回归来搞定

    • 曼哈顿图就够了吗?你还需要LocusZoom

    • GWAS做完了,下一步做什么?

      GWAS meta分析

    • GWAS样本量不够怎么办,meta分析了解一下

    • 你没看错,搞定GWAS meta分析只需一行代码!

    • meta分析的森林图不会画?看这里

    • GWAMA:GWAS meta-analysis的又一利器

    • 点击鼠标即可完成GWAS meta分析,任何人都可以!

    • 用R进行gwas meta分析,原来如此简单

      基因型填充

    • GWAS中的genotype imputation简介

    • 基因型填充中的phasing究竟是什么

    • 基因型填充前的质控条件简介

    • 使用shapeit进行单倍型分析

    • gtool:操作genotype data的利器

    • 使用IMPUTE2进行基因型填充

    • 使用Beagle进行基因型填充

    • 使用Minimac进行基因型填充

    • 使用Eagle2进行单倍型分析

    • X染色体的基因型填充

    • 文献解读|不同基因型填充软件性能的比较

    • Haplotype Reference Consortium:最大规模的单倍型数据库

    • Michigan Imputation Server:基因型填充的在线工具

      CNV分析

    • aCGH芯片简介

    • aCGH芯片分析简介

    • 基于SNP芯片进行CNV分析中的基本知识点

    • PennCNV:利用SNP芯片检测CNV

    • DGV:人类基因组结构变异数据库

    • dbvar:染色体结构变异数据库

    • DGVa:染色体结构变异数据库

    • CNVD:疾病相关的CNV数据库

    • DECIPHER:疾病相关的CNV数据库

    • 全基因组数据CNV分析简介

    • 使用CNVnator进行CNV检测

    • 使用lumpy进行CNV检测

    • CNVnator原理简介

    • WES的CNV分析简介

    • XHMM分析原理简介

    • 使用conifer进行WES的CNV分析

    • 使用EXCAVATOR2检测WES的CNV

    • 靶向测序的CNV分析简介

    • 使用CNVkit进行CNV分析

    • DECoN:最高分辨率的CNV检测工具

      TCGA

    • TCGA数据库简介

    • 使用GDC在线查看TCGA数据

    • 使用gdc-client批量下载TCGA数据

    • 一文搞懂TCGA中的分析结果如何来

    • 通过GDC Legacy Archive下载TCGA原始数据

    • 使用GDC API查看和下载TCGA的数据

    • 使用GDC下载TCGA肿瘤患者的临床信息

    • 使用TCGAbiolinks下载TCGA的数据

    • 使用TCGAbiolinks进行生存分析

    • 使用TCGAbiolinks分析TCGA中的表达谱数据

    • 使用TCGAbiolinks进行甲基化和转录组数据的联合分析

    • Broad GDAC:TCGA数据分析中心

    • 使用cBioPortal查看TCGA肿瘤数据

    • UCSC  Xena:癌症基因组学数据分析平台

    • GEPIA:TCGA和GTEx表达谱数据分析平台

    • TANRIC:肿瘤相关lncRNA数据库

    • SurvNet:基于网络的肿瘤biomarker基因查找算法

    • TCPA:肿瘤RPPA蛋白芯片数据中心

    • TCGA Copy Number Portal:肿瘤拷贝数变异数据中心

      生存分析

    • 生存分析详细解读

    • 用R语言进行KM生存分析

    • 使用OncoLnc进行TCGA生存分析

    • 用R语言进行Cox回归生存分析

    • 使用kmplot在线进行生存分析

      肿瘤数据库

    • ICGC:国际肿瘤基因组协会简介

    • HPA:人类蛋白图谱数据库

    • Oncomine:肿瘤芯片数据库

    • ONGene:基于文献检索的肿瘤基因数据库

    • oncomirdb:肿瘤相关的miRNA数据库

    • TSGene:肿瘤抑癌基因数据库

    • NCG:肿瘤驱动基因数据库

    • mutagene:肿瘤突变频谱数据库

    • CCLE:肿瘤细胞系百科全书

    • mSignatureDB:肿瘤突变特征数据库

    • GTEx:基因型和基因表达量关联数据库

      肿瘤免疫和新抗原

    • Cancer-Immunity Cycle:肿瘤免疫循环简介

    • TMB:肿瘤突变负荷简介

    • 肿瘤微环境:Tumor microenvironment (TME)简介

    • 肿瘤浸润免疫细胞量化分析简介

    • 使用EPIC预测肿瘤微环境中免疫细胞构成

    • TIMER:肿瘤浸润免疫细胞分析的综合网站

    • quanTIseq:肿瘤浸润免疫细胞定量分析

    • The Cancer Immunome Atlas:肿瘤免疫图谱数据库

    • 肿瘤新抗原简介

    • TSNAdb:肿瘤新抗原数据库

    • 使用NetMHCpan进行肿瘤新抗原预测分析

      Hi-C数据分析

    • chromosome-territories:染色质疆域简介

    • chromosome conformation capture:染色质构象捕获技术

    • 3C的衍生技术简介

    • 解密Hi-C数据分析中的分辨率

    • A/B compartment:染色质区室简介

    • TAD:拓扑关联结构域简介

    • chromatin loops:染色质环简介

    • Promoter Capture Hi-C:研究启动子区染色质互作的利器

    • 使用HiCUP进行Hi-C数据预处理

    • Juicer:Hi-C数据处理分析的利器

    • Juicer软件的安装详解

    • Juicebox:Hi-C数据可视化利器

    • Juicer实战详解

    • HiC-Pro:灵活的Hi-C数据处理软件

    • HiC-Pro实战详解

    • 3D Genome Browser:Hi-C数据可视化工具

    • HiCPlotter:Hi-C数据可视化工具

    • 3CDB:基于3C技术的染色质互作信息数据库

    • 3DIV:染色质空间互作数据库

    • 4DGenome:染色质相互作用数据库

    • 4D nucleome project:染色质三维结构研究必不可少的参考项目

    • 3dsnp:SNP在染色质环介导的调控网络中的分布数据库

    • iRegNet3D:疾病相关SNP位点在三维调控网络中的作用

    • 使用WashU Epigenome Browser可视化hi-c数据

    • HiGlass:高度定制的Hi-C数据可视化应用

    • Hi-C Data Browser:Hi-C数据浏览器

    • 使用FitHiC评估染色质交互作用的显著性

    • 使用TADbit识别拓扑关联结构域

    • 使用pyGenomeTracks可视化hi-c数据

    • hi-c辅助基因组组装简介

    • 文献解读|使用hi-C数据辅助埃及伊蚊基因组的组装

      chip_seq数据分析

    • Chip-seq简介

    • chip_seq质量评估之计算样本间的相关性

    • chip_seq质量评估之查看抗体富集效果

    • chip_seq质量评估之PCA分析

    • chip_seq质量评估之coverage分析

    • chip_seq质量评估之FRiP Score

    • chip_seq质量评估之cross correlation

    • chip_seq质量评估之文库复杂度

    • depth, bedgraph, bigwig之间的联系与区别

    • bigwig归一化方式详解

    • 使用igvtools可视化测序深度分布

    • 使用UCSC基因组浏览器可视化测序深度分布数据

    • 使用deeptools查看reads分布特征

    • 使用phantompeakqualtools进行cross correlation分析

    • blacklist regions:NGS测序数据中的黑名单

    • MACS:使用最广泛的peak calling软件之一

    • MACS2 peak calling实战

    • 使用SICER进行peak calling

    • 使用HOMER进行peak calling

    • peak注释信息揭秘

    • PAVIS:对peak区域进行基因注释的在线工具

    • 使用UPORA对peak进行注释

    • 使用GREAT对peak进行功能注释

    • annoPeakR:一个peak注释的在线工具

    • 使用ChIPpeakAnno进行peak注释

    • 使用ChIPseeker进行peak注释

    • 使用PeakAnalyzer进行peak注释

    • 使用homer进行peak注释

    • 利用bedtools预测chip_seq数据的靶基因

      motif

    • 关于motif你需要知道的事

    • 详解motif的PFM矩阵

    • 详解motif的PWM矩阵

    • 使用WebLogo可视化motif

    • 使用seqLogo可视化motif

    • 使用ggseqlogo可视化motif

    • MEME:motif分析的综合性工具

    • 使用MEME挖掘序列中的de novo motif

    • 使用DREME挖掘序列中的de novo motif

    • 使用MEME-ChIP挖掘序列中的de novo motif

      chip_seq数据库

    • ENCODE project项目简介

    • FactorBook:人和小鼠转录因子chip_seq数据库

    • ReMap:人类Chip-seq数据大全

    • IHEC:国际人类表观基因组学联盟

    • Epifactors:表观因子数据库

    • GTRD:最全面的人和小鼠转录因子chip_seq数据库

    • ChIP-Atlas:基于公共chip_seq数据进行分析挖掘

    • Cistrome DB:人和小鼠的chip_seq数据库

    • chipBase:转录因子调控网络数据

    • unibind:human转录因子结合位点数据库

    • chip_seq在增强子研究中的应用

    • DENdb:human增强子数据库

    • VISTA:人和小鼠的增强子数据库

    • EnhancerAtlas:人和小鼠的增强子数据库

    • FANTOM5:人类增强子数据库

    • TiED:人类组织特异性增强子数据库

    • HEDD:增强子疾病相关数据库

    • HACER:human增强子数据库

    • SEdb:超级增强子数据库简介

    • dbSUPER:人和小鼠中的超级增强子数据库

    • dbCoRC:核心转录因子数据库

    • 使用ROSE鉴定超级增强子

      18年文章目录

    • 2018年推文合集

    扫描下方二维码,关注我们,解锁更多精彩内容!

    生物信息入门

    只差这一个

    公众号

    总结

    以上是生活随笔为你收集整理的MDR的进阶版本-GMDR的全部内容,希望文章能够帮你解决所遇到的问题。

    如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。