文件格式:word
文件大小:4.63MB
适用专业:自动化
适用年级:大学
下载次数:15 次
我要下载:点击联系下载论文编号:201273
资料简介:
毕业论文-用RNA-Seq数据估计剪接异构体表达的方法调研与程序实现,共59页,25920字
中文摘要
RNA-Seq 技术是利用深度测序技术来进行转录组水平研究的新兴技术,是当
前生物信息领域的一个研究热点。RNA-Seq 技术凭借其高精度、高通量、高检测
范围等一系列优点冲击着传统的转录组研究的方法。
RNA-Seq 技术在转录组研究方面有很多应用,其中很重要的一个应用是估计
基因和剪接异构体的表达值。本文研究了几种利用 RNA-Seq 技术进行表达值估计
的方法,对各方法的特点进行了一定的分析,并且编程实现了其中的一种基于“读
段非均匀分布假设”的算法。
关键词:RNA-Seq;表达值估计;非均匀分布
ABSTRACT
RNA-Seq is a recently developed technology to study transcriptome which is
based on deep-sequencing. RNA-Seq has shaken the status of traditional transcriptome
researching methods, because of its advantages such as unprecedented precision,
throughput and high dynamic range over them.
RNA-Seq can be applied to many transcriptome researching fields, and one of the
most important applications is to estimate the expression level of genes and isoforms.
This paper conducts a study about some methods based on RNA-Seq to estimate the
expression level of transcriptome, analyze the characteristics of each method and
realize one of these methods which is based on the hypothesis of "reads' start position
follow non-uniform distribution"by programming.
Keywords: RNA-Seq; estimation of expression level; non-uniform distribution
目录
第 1 章 引言 .. 1
1.1 研究背景 ........ 1
1.2 RNA-Seq 原理 ........ 1
1.3 RNA-Seq 技术研究现状 ... 2
1.4 本文的主要工作....... 3
第 2 章 基因表达值的估计 ........ 4
2.1 基因表达与基因表达值 ..... 4
2.2 利用基因芯片和 RNA-Seq 进行基因表达值的估计 ........ 4
2.3 RPKM 简介 .... 5
2.4 几种利用 RNA-Seq 估计表达值的方法 ........ 6
2.4.1 基于读段均匀分布假设的基因表达值计算 .... 6
2.4.2 基于读段均匀分布假设的剪接异构体表达值计算 . 7
2.4.3 基于读段非均匀分布假设的剪接异构体表达值计算 ...... 7
2.4.4 几种方法的联系 ... 8
第 3 章 “基于读段非均匀分布假设模型”(N-URD)简介 9
3.1 符号说明 ........ 9
3.2“基于读段均匀分布假设模型”URD 简介... 9
3.3“基于读段非均匀分布假设模型”N-URD 简介 .. 10
3.3.1 在 URD 模型的基础上引入了表征非均匀分布的参数.. 12
3.3.2 GBC, Global Bias Curve ....... 12
3.3.3 LBC, Local Bias Curve 13
3.3.4 GBC 矩阵和 LBC 矩阵 ........ 14
3.3.5 b 矩阵 ....... 15
3.4 似然函数 ...... 16
第 4 章 N-URD 模型的算法实现 .... 17
4.1 程序概况 ...... 17
4.2 程序框架 ...... 18
4.3 获取数据 ...... 18
4.4 数据预处理... 19
4.5 核心算法的实现..... 20
4.5.1 获取带权值的基因结构矩阵 ........ 20
4.5.2 求解最大似然估计 ...... 21
4.6 结果输出 ...... 23
4.7 程序总流程图 ........ 25
4.8 仿真实验 ...... 26
4.9 实验结果 ...... 28
4.10 程序有待改进之处 ........ 28
第 5 章 结论与展望 .... 29
5.1 结论 .... 29
5.2 展望 .... 29
插图索引 .... 31
表格索引 .... 32
参考文献 .... 33
致谢 ........ 34
声明 ........ 35
附录 A 外文资料的书面翻译 ...... 36
附录 B:CisGenome browser 介绍 . 51
资料文件预览:
共1文件夹,1个文件,文件总大小:4.63MB,压缩后大小:1.98MB
- 毕业论文-用RNA-Seq数据估计剪接异构体表达的方法调研与程序实现
毕业论文-用RNA-Seq数据估计剪接异构体表达的方法调研与程序实现.doc [4.63MB]
我要下载:用RNA-Seq数据估计剪接异构体表达的方法调研与程序实现