r语言常用数据分析包 数据分析,数据发掘应该用什么编程语言呢?

[更新]
·
·
分类:行业
2775 阅读

r语言常用数据分析包

数据分析,数据发掘应该用什么编程语言呢?

数据分析,数据发掘应该用什么编程语言呢?

不同行业有不同的选择,各行各业都有数据分析的需求。主要是MATLAB,Python,R这些。
以我自己为例,科研中数据分析用的比较顺手的是MATLAB,因为它做矩阵运算很强,语法不难,性能很强,可以调用GPU,界面很友好,有很多数据导入导出数据分析的工具包
用于数据分析非常合适,
也可以可以很方便地构建界面。比如下面这个我为之前项目构建的图形界面:
但是有个问题是MATLAB不是免费的,而且还不便宜。各大高校和科研所会根据需要购买,比如我们学校。
据我了解,有很多人用盗版,但是这是极其不推荐的,即便是买一个短期的学生版也不要使用盗版。
然后就是Python,在天文数据分析和数据挖掘中也非常吃香。因为有很多人写了很多开源工具包,社区很大,大家都给这个社区贡献自己的代码。
太阳物理里面有个著名的sunpy
使用这个包可以很方便地导入并处理各个天文台的观测数据。
再加上近几年兴起的机器学习也是以Python为主阵营的,Python做数据处理和分析也会越来越火。
还有一些金融统计的喜欢用R SPSS之类的。

比较常用的是MATLAB和Python。
就在几年前,Python没有大火之前,在数据分析领域,他家比较习惯于MATLAB,但MATLAB有个非常大的缺点就是应用性不强,MATLAB是一个非常好的数据研究工具,但不是一个很好的应用工具,在应用层面,比方说你想开发一个软件需要用到里边的功能,往往只能借用里边的逻辑,没办法代码直接移植。
Python最近几年形成了非常好的生态,除了在数据分析挖掘领域有非常丰富的类库,在应用层面也得到了很好的使用。Python可以用来做数据分析挖掘、做数据可视化、还可以用来建网站、做客户端,而且代码编写上手容易,较MATLAB有更低的门槛,因此在今天数据分析与数据挖掘领域,Python语言的使用已经远超MATLAB。
希望可以帮到你。

可以用python,比较简便

如何利用R软件进行聚类分析?

1、打开R软件,输入数据,生成距离结构。这里设样本数据为1,2,3,7,8,9,15。输入代码:xc(1,2,3,7,8,9,15)dim(x)c(7,1)ddist(x)其中x是生成向量,dim表示定义向量的维数,dist表示生成距离矩阵。