RStudio IDE 入门
创始人
2024-03-01 22:11:33
0

用于统计技术的 R 项目是分析数据的有力方式,而 RStudio IDE 则可使这一切更加容易。

从我记事起,我就一直喜欢摆弄数字。作为 20 世纪 70 年代后期的大学生,我上过统计学的课程,学习了如何检查和分析数据以揭示其意义。

那时候,我有一部科学计算器,它让统计计算变得比以往更容易。在 90 年代早期,作为一名从事 t 检验 t-test 、相关性以及 ANOVA 研究的教育心理学研究生,我开始通过精心编写输入到 IBM 主机的文本文件来进行计算。这个主机远超我的手持计算器,但是一个小的空格错误就会导致整个过程无效,而且这个过程仍然有点乏味。

撰写论文时,尤其是我的毕业论文,我需要一种方法能够根据我的数据来创建图表,并将它们嵌入到文字处理文档中。我着迷于 Microsoft Excel 及其数字运算能力以及可以用计算结果创建出的大量图表。但这条路每一步都有成本。在 20 世纪 90 年代,除了 Excel,还有其他专有软件包,比如 SAS 和 SPSS+,但对于我那已经满满的研究生时间表来说,学习曲线是一项艰巨的任务。

快速回到现在

最近,由于我对数据科学的兴趣浓厚,加上对 Linux 和开源软件感兴趣,我阅读了大量的数据科学文章,并在 Linux 会议上听了许多数据科学演讲者谈论他们的工作。因此,我开始对编程语言 R(一种开源的统计计算软件)非常感兴趣。

起初,这只是一个偶发的一个想法。当我和我的朋友 Michael J. Gallagher 博士谈论他如何在他的 博士论文 研究中使用 R 时,这个火花便增大了。最后,我访问了 R 项目 的网站,并了解到我可以轻松地安装 R for Linux。游戏开始!

安装 R

根据你的操作系统和发行版情况,安装 R 会稍有不同。请参阅 Comprehensive R Archive Network (CRAN)网站上的安装指南。CRAN 提供了在 各种 Linux 发行版Fedora,RHEL,及其衍生版MacOSWindows 上的安装指示。

我在使用 Ubuntu,按照 CRAN 的指示,将以下行加入到我的 /etc/apt/sources.list 文件中:

deb https:///bin/linux/ubuntu artful/

接着我在终端运行下面命令:

$ sudo apt-get update
$ sudo apt-get install r-base

根据 CRAN 说明,“需要从源码编译 R 的用户[如包的维护者,或者任何通过 install.packages() 安装包的用户]也应该安装 r-base-dev 的包。”

使用 R 和 RStudio

安装好了 R,我就准备了解更多关于使用这个强大的工具的信息。Gallagher 博士推荐了 DataCamp 上的 “R 语言入门”,并且我也在 Code School 找到了适用于 R 新手的免费课程。两门课程都帮助我学习了 R 的命令和语法。我还参加了 Udemy 上的 R 在线编程课程,并从 No Starch 出版社 上购买了 R 之书

在阅读更多内容并观看 YouTube 视频后,我意识到我还应该安装 RStudio。Rstudio 是 R 语言的开源 IDE,易于在 Debian、Ubuntu、 Fedora 和 RHEL 上安装。它也可以安装在 MacOS 和 Windows 上。

根据 RStudio 网站的说明,可以根据你的偏好对 IDE 进行自定义,具体方法是选择工具菜单,然后从中选择全局选项。

R 提供了一些很棒的演示例子,可以通过在提示符处输入 demo() 从控制台访问。demo(plotmath)demo(perspective) 选项为 R 强大的功能提供了很好的例证。我尝试过一些简单的 vectors 并在 R 控制台的命令行中绘制,如下所示。

你可能想要开始学习如何将 R 和一些样本数据结合起来使用,然后将这些知识应用到自己的数据上得到描述性统计。我自己没有丰富的数据来分析,但我搜索了可以使用的数据集 datasets;有一个这样的数据集(我并没有用这个例子)是由圣路易斯联邦储备银行提供的 经济研究数据。我对一个题为“美国商业航空公司的乘客里程(1937-1960)”很感兴趣,因此我将它导入 RStudio 以测试 IDE 的功能。RStudio 可以接受各种格式的数据,包括 CSV、Excel、SPSS 和 SAS。

数据导入后,我使用 summary(AirPassengers) 命令获取数据的一些初始描述性统计信息。按回车键后,我得到了 1949-1960 年的每月航空公司旅客的摘要以及其他数据,包括飞机乘客数量的最小值、最大值、四分之一位数、四分之三位数、中位数以及平均数。

我从摘要统计信息中知道航空乘客样本的均值为 280.3。在命令行中输入 sd(AirPassengers) 会得到标准偏差,在 RStudio 控制台中可以看到:

接下来,我生成了一个数据直方图,通过输入 hist(AirPassengers); 得到,这会以图形的方式显示此数据集;RStudio 可以将数据导出为 PNG、PDF、JPEG、TIFF、SVG、EPS 或 BMP。

除了生成统计数据和图形数据外,R 还记录了我所有的历史操作。这使得我能够返回先前的操作,并且我可以保存此历史记录以供将来参考。

在 RStudio 的脚本编辑器中,我可以编写我发出的所有命令的脚本,然后保存该脚本以便在我的数据更改后能再次运行,或者想重新访问它。

获得帮助

在 R 提示符下输入 help() 可以很容易找到帮助信息。输入你正在寻找的信息的特定主题可以找到具体的帮助信息,例如 help(sd) 可以获得有关标准差的帮助。通过在提示符处输入 contributors() 可以获得有关 R 项目贡献者的信息。您可以通过在提示符处输入 citation() 来了解如何引用 R。通过在提示符出输入 license() 可以很容易地获得 R 的许可证信息。

R 是在 GNU General Public License(1991 年 6 月的版本 2,或者 2007 年 6 月的版本 3)的条款下发布的。有关 R 许可证的更多信息,请参考 R 项目官网

另外,RStudio 在 GUI 中提供了完美的帮助菜单。该区域包括 RStudio 快捷表(可作为 PDF 下载),RStudio的在线学习、RStudio 文档、支持和 许可证信息


via: https://opensource.com/article/18/2/getting-started-RStudio-IDE

作者:Don Watkins 译者:szcf-weiya 校对:wxy

本文由 LCTT 原创编译,Linux中国 荣誉推出

相关内容

台风“博罗依”在越南造成3...
据越南堤坝管理与自然灾害预防部门统计,截至当地时间10月1日18时...
2025-10-02 12:44:37
刚刚!美联储,降息大消息
【导读】美国通胀数据稳定,美联储2025年进一步降息的可能性增加 ...
2025-09-12 06:17:07
伦纳德为快船出战301场赚...
北京时间2025年9月8日,美媒统计了科怀-伦纳德效力快船期间的出...
2025-09-08 11:44:01
涉嫌严重违纪违法,王莉霞何...
中央纪委国家监委8月22日消息,内蒙古自治区党委副书记、自治区政府...
2025-08-23 12:44:21
安徽农信系统又一人被查,金...
6月11日,安徽省纪委监委连续发布五则案件通报,其中安徽歙县农村商...
2025-06-17 06:41:33
KoTime:v2.3.9...
功能概览 KoTime的开源版本已经迭代到了V2.3.9ÿ...
2025-06-01 16:06:27

热门资讯

《Apex 英雄》正式可在 S... 《Apex 英雄》现已通过 Steam Deck 验证,这使其成为支持 Linux 的顶级多人游戏之...
Helix:高级 Linux ... 说到 基于终端的文本编辑器,通常 Vim、Emacs 和 Nano 受到了关注。这并不意味着没有其他...
如何在 Github 上创建一... 学习如何复刻一个仓库,进行更改,并要求维护人员审查并合并它。你知道如何使用 git 了,你有一个 G...
JStock:Linux 上不... 如果你在股票市场做投资,那么你可能非常清楚投资组合管理计划有多重要。管理投资组合的目标是依据你能承受...
使用 KRAWL 扫描 Kub... 用 KRAWL 脚本来识别 Kubernetes Pod 和容器中的错误。当你使用 Kubernet...
从 Yum 更新中排除特定/某... 作为系统更新的一部分,你也许需要在基于 Red Hat 系统中由于应用依赖排除一些软件包。如果是,如...
硬核观察 #1245 Open... #1 OpenAI 悄然删除禁止将 ChatGPT 用于 “军事和战争” 的禁令在 1 月 10 日...
什么是 KDE Connect... 什么是 KDE Connect?它的主要特性是什么?它应该如何安装?本文提供了基本的使用指南。科技日...
Epic 游戏商店现在可在 S... 现在可以在 Steam Deck 上运行 Epic 游戏商店了,几乎无懈可击! 但是,它是非官方的。...
如何理解Apache 2.0许... 提要:Apache 2.0许可证中的专利许可条款使得开源代码可以安全使用,但它经常被误解。Apach...