生物信息學/高通量測序數據比對
< 生物信息学
對高通量測序數據進行比對,就是將測序得到的reads定位到基因組序列上。由於測序 的數據量比較大,因此比對軟件需要能快速將reads比對到參考序列上,並且能並行化運 行。對lllumina測序或454測序得到的short reads進行比對的常用軟件有Bowtie、BWA、(基因組、原核轉錄組) HISAT和Tophat(真核轉錄組)。
illumina測序數據特點:
- 測序覆蓋全基因組
- 測序數據讀長短
- 測序數據具有一定的錯誤率
- 測序數據深度高
- 測序數據具有pair-end關係
短序列比對情況:
- 第一種:一對一無錯配比對
- 第二種:一對一有錯配比對
- 第三種:一對多無錯配比對
- 第四種:一對多錯配比對
- 第五種:無法匹配
短序列比對統計:
- 計算reads利用率
- 計算覆蓋度:測序和物理
- 計算覆蓋比率
短序列比對的應用:
- 序列拼接評估
- 變異檢測
- RNASeq
- 宏基因組16s測序
- NIPT檢測