R/R語言知識架構

< R

在學習一門程式語言之前,我們如果能對要學習的知識框架有一個清晰的認知,了解不同知識的層次所要掌握的內容,可以極大地提高學習效率。

下圖利用流程圖中的泳池圖來展示R語言的知識架構:

R語言知識架構

軟件常識

編輯

從左到右依次來看,首先要了解一些軟件的常識,包括不同平台(Windows、Mac OS X、Linux)的R語言與Rstudio軟件的下載和安裝。

然後,熟悉軟件的界面,不同界面所代表的含義;菜單欄的分佈(常用的功能);掌握一些常用的快捷鍵用法。

基礎語法

編輯

學習R語言的基礎語法,以向量為基礎的R語言數據類型(向量、矩陣、因子、列表、數據框),數據類型的操作,數據類型之間的判斷與轉換,不同數據類型所適應的場景等。

還有R語言擴展包的安裝,這些擴展包中函數,可以提高我們的工作效率。

學會查看R語言的函數和擴展包的幫助文檔,因為任何一個培訓也不能涵蓋所有人的需求,學會查看幫助文檔,增強解決問題的能力。

掌握R語言的基礎繪圖函數:繪製散點圖、柱狀圖、箱線圖、熱圖、韋恩圖的高級繪圖函數,添加點、線、註釋等信息的低級繪圖函數。

數據預處理

編輯

R語言是統計學家設計的,內置有大量的統計學函數,可以很方便地完成數據的清洗、標準化的任務。

R語言含有很多強大的擴展包,裡面包含更多更強大的數據清洗和標準化的函數。

數據可視化

編輯

對於在數據挖掘中間的繪圖,可以使用R語言內置的繪圖函數來完成。

對數據進行可視化,R語言有很多強大的擴展包。

ggplot2擴展包及基於ggplot2開發的一系列R語言繪圖擴展包,如專門適用於發表文章繪圖包ggpubr。

按需求學習

編輯

任何教程也不可能涵蓋到所有問題,因為R語言在不斷地更新,各種技術也在不斷發展,我們每時每刻都可能面臨新的難題。

因此,在掌握R語言基礎之後,就需要根據實際工作的需求,去搜索相應的R語言擴展包,利用其中的函數來解決問題。

這需要我們學習一些相關的數學、統計學等相關理論知識,必要的時候,構建我們自己的R語言擴展包來解決實際問題。