生物信息學/高通量測序數據比對

對高通量測序數據進行比對,就是將測序得到的reads定位到基因組序列上。由於測序 的數據量比較大,因此比對軟體需要能快速將reads比對到參考序列上,並且能並行化運 行。對lllumina測序或454測序得到的short reads進行比對的常用軟體有Bowtie、BWA、(基因組、原核轉錄組) HISAT和Tophat(真核轉錄組)。

illumina測序數據特點:

  1. 測序覆蓋全基因組
  2. 測序數據讀長短
  3. 測序數據具有一定的錯誤率
  4. 測序數據深度高
  5. 測序數據具有pair-end關係

短序列比對情況:

  • 第一種:一對一無錯配比對
  • 第二種:一對一有錯配比對
  • 第三種:一對多無錯配比對
  • 第四種:一對多錯配比對
  • 第五種:無法匹配

短序列比對統計:

  1. 計算reads利用率
  2. 計算覆蓋度:測序和物理
  3. 計算覆蓋比率

短序列比對的應用:

  1. 序列拼接評估
  2. 變異檢測
  3. RNASeq
  4. 宏基因組16s測序
  5. NIPT檢測