使用R处理一代测序的结果数据
1、调用Rsamtools包内的函数quickBamFlagSummary()查看BAM文件中的序列是单端或双端比对。在利用readGAlignments()读取基因组比对前,需要用函数ScanBamParam()构建一些参数。
2、使用R软件Vegan包计算16s高通量测序数据的α生物多样性指数这里介绍一下用R软件中vegan包计算生物多样性指数的方法:R软件安装请自行搜索。第一步:制作数据矩阵。第二步,读取数据到R中。
3、R代码是指使用R语言时书写的代码。R是一套完整的数据处理、计算和制图软件系统。
4、高质量:由于Sanger测序技术可以生成相对较长的读段,因此可以获得高质量的测序结果,质量得以保障。高精度:Sanger测序技术的误差极小,同时也具有低重复率的优点,因此可以为生物学研究提供极为精确的数据支持。
5、衔接上一篇数据比对后的结果,使用R包DSS进行处理。我们先来复习一下上一节课得到的数据结果:*.bismark.cov.gz文件这里我们使用的R包为DSS,使用Bioconductor进行安装。
spss相对r的优点:
操作上容易上手,简单易学,大部分功能都是可视化呈现的,操作的话点击鼠标就可以完成,常用到的功能没有多少需要编写语句。
较早进入国内市场,发展已经相对成熟,有大量专门介绍spss的中文参考书可供参考,另外很多统计教材也附带spss操作方法。
汉化程度高,无论是操作界面还是结果界面,都可以中文呈现
spss相对r的缺点:
1.不是开源软件,SPSS有版权问题,使用较新版本的spss会受到限制
2.相比于r来说,更吃内存
3.功能的丰富性、全面性远不及r,r的功能包非常多,需要安的时候写个简单的语句就安上了,随用随安,能够做的统计分析比spss多很多,相对而言,spss的定位还是普通的大众的通常需求,而r则是更多统计专业人士的首选
4.做很多统计分析不如r灵活,其实通常来说需要写代码语句的统计软件灵活性都高于那些只需要点击鼠标的,你想做什么分析、想呈现哪些结果,就写相应的语句就好了,不会呈现出冗余的内容。spss的结果呈现常常会包含一些多余的内容,你通常不关心也不需要报告的内容。
本文由用户上传,如有侵权请联系删除!转转请注明出处:https://nongye.s666.cn/bk/6_6572189494.html