R/R语言知识架构
在学习一门编程语言之前,我们如果能对要学习的知识框架有一个清晰的认知,了解不同知识的层次所要掌握的内容,可以极大地提高学习效率。
下图利用流程图中的泳池图来展示R语言的知识架构:
软件常识
编辑从左到右依次来看,首先要了解一些软件的常识,包括不同平台(Windows、Mac OS X、Linux)的R语言与Rstudio软件的下载和安装。
然后,熟悉软件的界面,不同界面所代表的含义;菜单栏的分布(常用的功能);掌握一些常用的快捷键用法。
基础语法
编辑学习R语言的基础语法,以向量为基础的R语言数据类型(向量、矩阵、因子、列表、数据框),数据类型的操作,数据类型之间的判断与转换,不同数据类型所适应的场景等。
还有R语言扩展包的安装,这些扩展包中函数,可以提高我们的工作效率。
学会查看R语言的函数和扩展包的帮助文档,因为任何一个培训也不能涵盖所有人的需求,学会查看帮助文档,增强解决问题的能力。
掌握R语言的基础绘图函数:绘制散点图、柱状图、箱线图、热图、韦恩图的高级绘图函数,添加点、线、注释等信息的低级绘图函数。
数据预处理
编辑R语言是统计学家设计的,内置有大量的统计学函数,可以很方便地完成数据的清洗、标准化的任务。
R语言含有很多强大的扩展包,里面包含更多更强大的数据清洗和标准化的函数。
数据可视化
编辑对于在数据挖掘中间的绘图,可以使用R语言内置的绘图函数来完成。
对数据进行可视化,R语言有很多强大的扩展包。
ggplot2扩展包及基于ggplot2开发的一系列R语言绘图扩展包,如专门适用于发表文章绘图包ggpubr。
按需求学习
编辑任何教程也不可能涵盖到所有问题,因为R语言在不断地更新,各种技术也在不断发展,我们每时每刻都可能面临新的难题。
因此,在掌握R语言基础之后,就需要根据实际工作的需求,去搜索相应的R语言扩展包,利用其中的函数来解决问题。
这需要我们学习一些相关的数学、统计学等相关理论知识,必要的时候,构建我们自己的R语言扩展包来解决实际问题。