R/R語言知識架構
在學習一門編程語言之前,我們如果能對要學習的知識框架有一個清晰的認知,了解不同知識的層次所要掌握的內容,可以極大地提高學習效率。
下圖利用流程圖中的泳池圖來展示R語言的知識架構:
軟件常識
編輯從左到右依次來看,首先要了解一些軟件的常識,包括不同平台(Windows、Mac OS X、Linux)的R語言與Rstudio軟件的下載和安裝。
然後,熟悉軟件的界面,不同界面所代表的含義;菜單欄的分布(常用的功能);掌握一些常用的快捷鍵用法。
基礎語法
編輯學習R語言的基礎語法,以向量為基礎的R語言數據類型(向量、矩陣、因子、列表、數據框),數據類型的操作,數據類型之間的判斷與轉換,不同數據類型所適應的場景等。
還有R語言擴展包的安裝,這些擴展包中函數,可以提高我們的工作效率。
學會查看R語言的函數和擴展包的幫助文檔,因為任何一個培訓也不能涵蓋所有人的需求,學會查看幫助文檔,增強解決問題的能力。
掌握R語言的基礎繪圖函數:繪製散點圖、柱狀圖、箱線圖、熱圖、韋恩圖的高級繪圖函數,添加點、線、注釋等信息的低級繪圖函數。
數據預處理
編輯R語言是統計學家設計的,內置有大量的統計學函數,可以很方便地完成數據的清洗、標準化的任務。
R語言含有很多強大的擴展包,裡面包含更多更強大的數據清洗和標準化的函數。
數據可視化
編輯對於在數據挖掘中間的繪圖,可以使用R語言內置的繪圖函數來完成。
對數據進行可視化,R語言有很多強大的擴展包。
ggplot2擴展包及基於ggplot2開發的一系列R語言繪圖擴展包,如專門適用於發表文章繪圖包ggpubr。
按需求學習
編輯任何教程也不可能涵蓋到所有問題,因為R語言在不斷地更新,各種技術也在不斷發展,我們每時每刻都可能面臨新的難題。
因此,在掌握R語言基礎之後,就需要根據實際工作的需求,去搜索相應的R語言擴展包,利用其中的函數來解決問題。
這需要我們學習一些相關的數學、統計學等相關理論知識,必要的時候,構建我們自己的R語言擴展包來解決實際問題。