生物信息學
生物醫學組學背景知識及測序原理編輯
1.生物大分子與中心法則
2.生物信息學簡介與測序技術的發展歷程、技術原理、測序策略與基本流程:一代,二代,三代測序,單細胞測序
3.測學原理:基因組,轉錄組,表觀組,宏基因組,宏轉錄組,蛋白質組,代謝組
生物信息數據格式與資料庫編輯
1.生物信息格式:fastq/fasta,SAM/BAM,vcf,gtf/gff,bed,maf,測序數據的格式
2.生物信息資料庫:序列資料庫(NCBI、UCSC、Ensembl),綜合資料庫(ENCODE),癌症資料庫(TCGA)
3.常用專業功能資料庫使用方法:GO、COG、UniProt、KEGG、PubMed、OMIM
生物信息分析基本技能編輯
生物信息分析方法與流程及常用軟體編輯
- 測序數據的預處理原理、方法及流程
- 生物信息分析流程的結構與功能概述
高通量測序數據的質量控制編輯
高通量測序技術主要指第二代測序技術(Next Generation Sequencing Technology)和第三代測序技術。第二代測序包含了 454測序、Illumina測序和SOLiD測序這3種測序技術;第三代測序技術一般指PacBio單分子實時測序技術。8年以前,主要的測序數據來自 454測序現今;而後,Illumina測序成為主流,到如今不斷發展,成為主要的測序平台;近年來,PacBio測序也不斷發展,成為了主流的第三代測序,特別在微生物基因組測序方面發展迅速。因此,本章重點講述Illumina數據的質量控制。
序列比對編輯
高通量測序數據比對編輯
高通量測序數據比對,就是將測序得到的reads定位到基因組序列上。由於測序 的數據量比較大,因此比對軟體需要能快速將reads比對到參考序列上,並且能並行化運 行。對lllumina測序或454測序得到的short reads進行比對的常用軟體有Bowtie、BWA、(基因組、原核轉錄組) HISAT和Tophat(真核轉錄組)。對PacBio測序得到的long reads進行比對的常用軟體是Blasr。
- 使用Bowtie和Bowtie2進行短序列比對
- 使用BWA進行READS比對
- 使用TOPHAT對轉錄組數據進行比對
- 使用HISAT2對轉錄組數據進行比對
- 使用Subread對高通量數據進行比對(未完成)
- 使用STAR對轉錄組數據進行比對 :STARsolo用於單細胞轉錄組分析 (未完成)
- 使用BLASR對PACBIO數據進行比對(未完成)
有參考基因組的轉錄組分析編輯
- 使用featureCounts進行alignment-based的定量
- 使用salmon進行alignment-free的定量:salmon的Alevin用於單細胞轉錄組分析
- 使用Kallisto進行alignment-free的定量:使用bustools的bus命令分析單細胞轉錄組數據
甲基化分析方法與流程編輯
HumanMethylation晶片編輯
甲基化是基因組 DNA 的一種主要的表觀遺傳修飾形式,與人類的癌症、衰老、老年痴呆等許多疾病密切相關,Illumina 甲基化晶片是有效的甲基化高通量篩選技術,可捕捉到單個鹼基的甲基化變化。
該晶片不僅實現基因區域和 CpG 島的全面覆蓋,還包括 CpG 島之外的甲基化位點,在人類幹細胞中鑑定出了非 CpG 甲基化位點、miRNA 啟動子區域以及腫瘤和正常組織中差異表達的甲基化位點等。
Illumina Human Methylation 450K BeadChip晶片可 檢測人全基因組近450,000個甲基化位點,具有單鹼 基的解析度。全面覆蓋了96%的CpG島,並根據需 求加入了CpG島以外的CpG位點、人類幹細胞非 CpG甲基化位點、正常組織與腫瘤(多種癌症)組 織差異甲基化位點、編碼區以外的CpG島、miRNA 啟動子區域和GWAS疾病相關區域的位點,同時覆 蓋了Human Methylation27 BeadChip的90%的位 點。
- A探針(非甲基化)的數目U
- B探針(甲基化)的數目M
- β值或者m值
- β值反映了能夠和給定被甲基化的序列匹配的寡核苷酸的比率,序列中的甲基化率
- M值可以消除探針不同而造成的影響
- HumMeth27QCReport:用於HumanMethylation27k晶片的質控和標準化,後續分析與450k晶片相同。
- ChAMP:用於HumanMethylation27k,HumanMethylation450k,HumanMethylation850k晶片的idat格式的原始數據分析流程,綜合了多個經典的甲基化分析R包。也可用於EPIC晶片的分析。
全基因組甲基化測序 (WGBS)分析流程編輯
WGBS(Whole-genome bisulfite sequencing)被視為甲基化測序的「金標準」,其原理是用 Bisulfite 處理,將基因組中未發生甲基化的 C 鹼基轉換成 U,進行PCR擴增後變成T,與原本具有甲基化修飾的 C 鹼基區分開來,再結合高通量測序技術,與參考序列比對,即可判斷 CpG/CHG/CHH 位點是否發生甲基化,特別適用於繪製單鹼基解析度的全基因組 DNA 甲基化圖譜。
Methyl RAD編輯
Methyl RAD技術(Wang et al,Open Biol,2015)使用甲基化修飾依賴性內切酶如FspEI、MspJL、LpnPI、AspBHI等,此類內切聘識別DNA上發生甲基化的胞曉淀在識別位置的下游隔一定距離切割雙鏈,若DNA雙鏈具有中心對稱甲基化狀態
則可以切割產生一個固定長度的雙鏈DNA片段,對酶切產生的標籤建庫測序,即可進行甲基化位點的定性和相對定量分析。
m6A 甲基化測序(針對轉錄mRNA水平)分析流程編輯
m6A(N6-methyladenosine,6-甲基腺嘌呤)是真核生物mRNA最常見的一種轉錄後修飾占到RNA甲基化修飾的80%。已知絕大部分真核生物中mRNA在5' Cap處存在的甲基化修飾,作用包括維持mRNA穩定性、mRNA前體剪切、多腺苷酸化、mRNA運輸與翻譯起始等,而3' polyA發生的甲基化修飾有助於出核轉運翻譯起始以及與polyA結合蛋白一起維持mRNA的結構穩定。
目前,在全轉錄組範圍檢測m6A修飾的主流技術是MeRIP-seq(m6A-seq),該技術使用N6-甲基腺嘌呤抗體富集高甲基化的RNA片段,然後結合高通量測序,在全轉錄組範圍檢測m6A修飾。
單細胞數據分析方法與流程編輯
單細胞轉錄組數據分析編輯
單細胞測序是指在單個細胞水平上進行測序。單細胞轉錄組測 序(single cell RNA Seq,scRNA-seq)是指對於單個細胞水平上 將mRNA反轉錄擴增後進行高通量測序的技術。
單細胞測序通過在單個細胞水平上進行測序,解決了用組織樣本無法獲得不同細胞間的異質性信息或樣本量太少無法進行常規測序的難題,為科學家研究單個細胞的行為、機制等提供了新的方向。 單細胞基因組測序主要包括四個步驟:單細胞分離→擴增→高 通量測序→數據分析。
目前常規的測序主要是數百萬甚至更多細胞的混合DNA樣本。這種方法能 夠得到基因表達信息,但是對其進行研究得到的結果只是一群細胞中信號的平 均值,或者只代表其中占優勢數量的細胞信息,單個細胞獨有的特性被忽視。 單細胞RNA-seq能夠獨立地提供每個細胞的RNA表達譜,並鑑定異質細胞 群中的稀有細胞。儘管腫瘤異質性可歸因於累積突變,但即使是遺傳上相同的 細胞在相同環境下也可能表現出基因和蛋白表達水平的差異,單細胞RNA-seq 就能夠發現這些稀有個體。比如在腫瘤組織中,腫塊中心的細胞,腫塊周圍的 細胞,淋巴轉移灶的細胞,以及遠端轉移的細胞,其基因組和轉錄組等遺傳信息,是存在差異的。
- 單細胞轉錄組上游分析(從原始數據到表達矩陣)
- 單細胞轉錄組下游分析(基於表達矩陣)
- 單細胞轉錄組在線分析工具及pipline教程匯總
- 單細胞轉錄組資料庫
單細胞scATACseq分析編輯
- Cicero:scATACseq分析(結合Monocle),cis-調控網絡構建和但細胞染色體發育軌跡
單細胞甲基化分析編輯
- MethBank:單細胞甲基化資料庫 http://bigd.big.ac.cn/methbank
單細胞分析工具匯總編輯
- 單細胞分析工具匯總:https://www.scrna-tools.org
- 單細胞資料庫及工具:https://www.singlecell.de/index.php/resources/databases/
生物序列比對及典型軟體的使用方法編輯
bwa、muscle、MUMmer,核酸、蛋白資料庫介紹與blast搜索
4.基因組denovo組裝分析流程:常用軟體使用方法:SOAPdenovo、Canu等
5.基因組組裝及基因組注釋分析流程:重複序列、基因結構與功能、ncRNA、細胞器基因組注釋
6.轉錄組組裝常用軟體使用方法:Trinity、Cufflinks、Tophat
7.轉錄組表現組的差異表達分析流程及差異表達分析軟體使用方法
8.高通量數據可視化常用軟體使用方法
9.分子進化分析常用軟體使用方法
10.重測序變異檢測與注釋分析常用軟體使用方法
在線綜合分析工具編輯
生物信息的應用領域的原理、流程及常用軟體編輯
動植物方向編輯
- 1.動植物基因組學研究概論
- 2.動植物基因組denovo組裝
- 3.動植物基因組注釋
- 4.動植物基因組比較基因組和進化分析
- 5.動植物基因組重測序分析
- 6.動植物基因組研究技術-RNA水平
- 7.基於高通量測序技術的動(植)物基因組研究應用
- 8.動(植)物基因組研究技術-表觀遺傳學水平
微生物方向編輯
- 1.微生物基因組研究
- 2.環境多樣性研究
- 3.宏基因組分析
- 4.微生物經典案例分享
癌症方向編輯
- 1.腫瘤基因組研究概論
- 2.腫瘤基因組分析一:體細胞突變的尋找和歸類
- 3.腫瘤基因組分析二:轉錄組分析
- 4.腫瘤基因組分析三:甲基化分析
- 5.腫瘤的單細胞研究
複雜疾病方向編輯
- 1.基於二代測序的複雜疾病分析
- 2.外顯子和目標區域測序
- 3.GWAS基礎知識介紹及案例分析
- 4. de novo mutation的檢測與分析
網絡藥理學編輯
網絡藥理學是基於系統生物學的理論,對生物系統的網絡分析,選取特定信號節點進行多靶點藥物分子設計的新學科。
網絡藥理學強調對信號通路的多途徑調節,提高藥物的治療效果,降低毒副作用,從而提高新藥臨床試驗的成功率,節省藥物的研發費用。
藥效團模型編輯
藥效團是基於藥效特徵元素為基礎建立的模型。藥效特徵元素主要分為以下幾種,包括:氫鍵供體、氫鍵受體、正負電荷中心、芳環中心、疏水基團、親水基團以及幾何構象體積衝撞。
- 具有相同藥理作用的類似物。
- 化學結構完全不同的分子,但它們以相同的機理與同一受體鍵合,產生同樣的藥理作用。
藥效團模型靶點預測編輯
- 2d結構(Palmatine chloride)
- 3d結構(Palmatine chloride)
- 藥效團
遺傳諮詢編輯
遺傳諮詢(孕前,新生兒,遺傳病)