金融行业数据分析分析用SPSS多还是SAS多或者是R语言

后使用快捷导航没有帐号?
查看: 4934|回复: 18
SAS,R 这两个软件,哪个学的人比较多?哪个用处比较大?
注册会员, 积分 98, 距离下一级还需 102 积分
论坛徽章:1
我知道R是开源软件,SAS是付费的,但是身边很多朋友都学R ,在互联网,金融等行业从事数据分析工作的或者工程师们大多是掌握R软件,所以想了解一下SAS软件学习的必要性。我是初学者,对2者的区别不是很清楚,但是本人想要从事数据分析工作,尤其是现在比较热门的大数据分析,如果有朋友了解2者在大数据分析方面的具体区别和用处,请帮忙解答,谢谢
注册会员, 积分 59, 距离下一级还需 141 积分
论坛徽章:4
从找工作的角度看学SAS更有用一些
另外12胜还是蛮厉害的
新手上路, 积分 28, 距离下一级还需 22 积分
论坛徽章:6
在COURSERA里有R语言的课程,感觉主要还是大学里做研究。机器语言学习里国外好像用OCTAVE.也是开放的原因。但是在真正应用领域感觉还是SAS和matlab.
新手上路, 积分 9, 距离下一级还需 41 积分
论坛徽章:0
sas更商业一些,r语言更自由
高级会员, 积分 820, 距离下一级还需 180 积分
论坛徽章:16
个人感觉R对大数据量处理没有太好的解决办法,而SAS相对成熟,有比较好的解决方案
注册会员, 积分 101, 距离下一级还需 99 积分
论坛徽章:1
SAS,是最权威的,但要编程,建议专业人员选用。 R非常强大,也是免费的,但也要编程。
注册会员, 积分 101, 距离下一级还需 99 积分
论坛徽章:1
R语言和SAS语言在统计方面的比较:
1. R语言上手比较容易,SAS语言较为晦涩
2.R针对行与行之间的运算比SAS容易
3.SAS比R要成熟,很多分析都可以直接用,而不用自己写函数
4.SAS处理大数据更有优势
注册会员, 积分 101, 距离下一级还需 99 积分
论坛徽章:1
以上是百度的答案& &个人觉得关键还是哪个好学一些吧
金牌会员, 积分 1602, 距离下一级还需 1398 积分
论坛徽章:13
学习了,谢谢大家的分享,
新手上路, 积分 5, 距离下一级还需 45 积分
论坛徽章:1
我觉得可能Matlab比较强大一点。苹果/安卓/wp
积分 1111, 距离下一级还需 264 积分
权限: 自定义头衔, 签名中使用图片, 隐身
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡, 显身卡, 匿名卡, 抢沙发下一级可获得
权限: 设置帖子权限道具: 提升卡
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
开心签到天数: 5 天连续签到: 2 天[LV.2]偶尔看看I
& && & 很多人曾问及SPSS,Stata 和SAS之间的不同,它们之中哪个是最好的。可以想到,每个软件都有自己独特的风格,有自己的优缺点。本文对此做了概述,但并不是一个综合的比较。人们时常会对自己所使用的统计软件有特别的偏好,希望大多数人都能认同这是对这些软件真实而公允的一个对比分析。
&& 一般用法。SPSS非常容易使用,故最为初学者所接受。它有一个可以点击的交互界面,能够使用下拉菜单来选择所需要执行的命令。它也有一个通过拷贝和粘贴的方法来学习其“句法”语言,但是这些句法通常非常复杂而且不是很直观。
& & 数据管理。SPSS有一个类似于Excel的界面友好的数据编辑器,可以用来输入和定义数据(缺失值,数值标签等等)。它不是功能很强的数据管理工具(尽管SPS 11版增加了一些增大数据文件的命令,其效果有限)。SPSS也主要用于对一个文件进行操作,难以胜任同时处理多个文件。它的数据文件有4096个变量,记录的数量则是由你的磁盘空间来限定。
& & 统计分析。SPSS也能够进行大多数统计分析(回归分析,logistic回归,生存分析,方差分析,因子分析,多变量分析)。它的优势在于方差分析(SPSS能完成多种特殊效应的检验)和多变量分析(多元方差分析,因子分析,判别分析等),SPSS11.5版还新增了混合模型分析的功能。其缺点是没有稳健方法(无法完成稳健回归或得到稳健标准误),缺乏调查数据分析(SPSS12版增加了完成部分过程的模块)。
& &绘图功能。SPSS绘图的交互界面非常简单,一旦你绘出图形,你可以根据需要通过点击来修改。这种图形质量极佳,还能粘贴到其他文件中(Word 文档或Powerpoint等)。SPSS也有用于绘图的编程语句,但是无法产生交互界面作图的一些效果。这种语句比Stata语句难,但比SAS语句简单(功能稍逊)。
& &总结。SPSS致力于简便易行(其口号是“真正统计,确实简单”),并且取得了成功。但是如果你是高级用户,随着时间推移你会对它丧失兴趣。SPSS是制图方面的强手,由于缺少稳健和调查的方法,处理前沿的统计过程是其弱项。
& & 一般用法。Stata以其简单易懂和功能强大受到初学者和高级用户的普遍欢迎。使用时可以每次只输入一个命令(适合初学者),也可以通过一个Stata程序一次输入多个命令(适合高级用户)。这样的话,即使发生错误,也较容易找出并加以修改。
& & 数据管理。尽管Stata的数据管理能力没有SAS那么强大,它仍然有很多功能较强且简单的数据管理命令,能够让复杂的操作变得容易。Stata主要用于每次对一个数据文件进行操作,难以同时处理多个文件。随着Stata/SE的推出,现在一个Stata数据文件中的变量可以达到32,768,但是当一个数据文件超越计算机内存所允许的范围时,你可能无法分析它。
& & 统计分析。Stata也能够进行大多数统计分析(回归分析,logistic回归,生存分析,方差分析,因子分析,以及一些多变量分析)。Stata最大的优势可能在于回归分析(它包含易于使用的回归分析特征工具),logistic回归(附加有解释logistic回归结果的程序,易用于有序和多元logistic回归)。Stata也有一系列很好的稳健方法,包括稳健回归,稳健标准误的回归,以及其他包含稳健标准误估计的命令。此外,在调查数据分析领域,Stata有着明显优势,能提供回归分析,logistic回归,泊松回归,概率回归等的调查数据分析。它的不足之处在于方差分析和传统的多变量方法(多变量方差分析,判别分析等)。
& & 绘图功能。正如SPSS,Stata能提供一些命令或鼠标点击的交互界面来绘图。与SPSS不同的是它没有图形编辑器。在三种软件中,它的绘图命令的句法是最简单的,功能却最强大。图形质量也很好,可以达到出版的要求。另外,这些图形很好的发挥了补充统计分析的功能,例如,许多命令可以简化回归判别过程中散点图的制作。
& & 总结。Stata较好地实现了使用简便和功能强大两者的结合。尽管其简单易学,它在数据管理和许多前沿统计方法中的功能还是非常强大的。用户可以很容易的下载到别人已有的程序,也可以自己去编写,并使之与Stata紧密结合。&&
& &一般用法。SAS由于其功能强大而且可以编程,很受高级用户的欢迎。也正是基于此,它是最难掌握的软件之一。使用SAS时,你需要编写SAS程序来处理数据,进行分析。如果在一个程序中出现一个错误,找到并改正这个错误将是困难的。
& & 数据管理。在数据管理方面,SAS是非常强大的,能让你用任何可能的方式来处理你的数据。它包含SQL(结构化查询语言)过程,可以在SAS数据集中使用SQL查询。但是要学习并掌握SAS软件的数据管理需要很长的时间,在Stata或SPSS中,完成许多复杂数据管理工作所使用的命令要简单的多。然而,SAS可以同时处理多个数据文件,使这项工作变得容易。它可以处理的变量能够达到32,768个,以及你的硬盘空间所允许的最大数量的记录条数。
& & 统计分析。SAS能够进行大多数统计分析(回归分析,logistic回归,生存分析,方差分析,因子分析,多变量分析)。SAS的最优之处可能在于它的方差分析,混合模型分析和多变量分析,而它的劣势主要是有序和多元logistic回归(因为这些命令很难),以及稳健方法(它难以完成稳健回归和其他稳健方法)。尽管支持调查数据的分析,但与Stata比较仍然是相当有限的。
& & 绘图功能。在所有的统计软件中,SAS有最强大的绘图工具,由SAS/Graph模块提供。然而,SAS/Graph模块的学习也是非常专业而复杂,图形的制作主要使用程序语言。SAS 8虽然可以通过点击鼠标来交互式的绘图,但不象SPSS那样简单。
& & 总结。SAS适合高级用户使用。它的学习过程是艰苦的,最初的阶段会使人灰心丧气。然而它还是以强大的数据管理和同时处理大批数据文件的功能,得到高级用户的青睐。
& &&&总体评价
& & 每个软件都有其独到之处,也难免有其软肋所在。总的来说,SAS,Stata和SPSS是能够用于多种统计分析的一组工具。通过Stat/Transfer可以在数秒或数分钟内实现不同数据文件的转换。因此,可以根据你所处理问题的性质来选择不同的软件。举例来说,如果你想通过混合模型来进行分析,你可以选择SAS;进行logistic回归则选择Stata;若是要进行方差分析,最佳的选择当然是SPSS。假如你经常从事统计分析,强烈建议您把上述软件收集到你的工具包以便于数据处理。
单选投票, 共有 309 人参与投票
您所在的用户组没有投票权限
载入中......
分析的有道理
总评分:&学术水平 + 2&
热心指数 + 2&
信用等级 + 2&
分析很有道理
我是新手,觉得还是SPSS好用点
spss,个人观点仅供参考
只接触过spss,初学者觉得spss也不好学
结构方程建模有点起色 ...
小米582 发表于
我是新手,觉得还是SPSS好用点根据现在投票比例来看,还是spss用的人多些!
几个软件几乎平手呀!
额,每次都是自己编程序,哪个软件都无所谓,个人喜欢R
投入天翼决图u币上的人都
SAS功能上的强大以及计算速度上的优势是SPSS和stata所无法比拟的,真正做统计的人我觉得一般是不会去用SPSS和stata的,社科的人用的比较多。
还有就是lz忽略了潜力无限的R
个人主页,欢迎订阅/
初级热心勋章
初级热心勋章
初级信用勋章
初级信用勋章
中级热心勋章
中级热心勋章
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向,请联系(010-);
邮箱:service@pinggu.org
投诉或不良信息处理:(010-)
论坛法律顾问:王进律师R语言统计分析应用与SAS、SPSS的比较
能够用来做统计分析的软件和程序很多,目前应用比较广泛的包括:SPSS,
SAS、R语言,Matlab,S-PLUS,S-Miner等。下面我们来看一下各应用的特点:
SPSS: 最简单的,都是菜单操作,不过不利于二次程序开发。
SAS: 需要购买,该软件录入语言要非常精确,不能出错,难操作。
R语言:免费软件,可以菜单操作,不过一般要编程的,二次程序开发。
Matlab:基本是程序操作,和R语言差不多,不过功能比较强大。
S-PLUS: 需要购买,基本也是菜单操作,和SPSS差不多。
R与SPSS、SAS相比较,拥有非常突出的优势:
1)产品线齐全。在功能与产品线齐全上已经远远超出SPSS,而与SAS不相上下。有些R的包,比如基因分析常用的Bioconductor在在线基因数据库连接等众多功能上甚至已经远远超出商业软件。
2)免费。请注意,标记为TM或者&符号的软件均需要在SPSS、SAS的基础模块基础之上另行购买,费用往往在千元美元以上。而R的一切功能均是免费。
& 3)开放。由于R本身是一个统计语言环境,再新的统计模型也很
快能实现,所以在结构方程模型、项目反应理论、认知诊断等众多心理测量所使用的功能上,没有现成的统计软件包,使用R则完全可以自己编写算法。同样,由于R是完全开源,我们可以很快地基于研究者已经开发出的算法编写更适合自己情况的算法。&
表:R与SAS、SPSS之比较
SPSS产品线
R语言相关包
SPSS Advanced Models&
stat, MASS及众多扩展包
SPSS Base&
SAS/STAT&: Transreg
SPSS Conjoint&
homals, psychoR , bayesm
SAS/STAT&: Corresp
SPSS Categories&
homals, MASS, FactoMineR
ade4, PTAk, cocorresp, vegan, made4, PsychoR
自定义表格
SAS Base& Report、SQL, Tabulate
SPSS Custom Tables&
SAS/ACCESS&
SPSS Data Access Pack&
DBI, foreign, RODBC
Enterprise Miner&
Clementine&
rattle, arules, FactoMineR
Various procedures
Various procedures,
SPSS Data Preparation&
dprep, various functions
Exact Tests
SAS/STAT&: various
SPSS Exact Tests&
coin, elrm, exactLoglinTest,
exactmaxsel, exactRankTests,及其他许多包
SAS/Genetics&,
SAS/Microarray&
Solution&, JMP
Bioconductor
SAS/Graph&
SPSS Maps&
maps, mapdata, mapproj,
GRASS via spgrass6,
RColorBrewer及其他包的部分功能
Enterprise Guide&
SPSS Base&
JGR, R Commander, pmg,
SAS/INSIGHT&
GGobi via rggobi
iPlots, Mondrian via Rserve
SAS/GRAPH&
SPSS Base&
ggplot, gplots, graphics, grid, gridBase, hexbin,
lattice, plotrix, scatterplot3d, vcd, lot, geneplotter,
SAS/IML&, SAS/IML
SPSS Matrix&
R, matlab, Matrix, sparseM
缺省值分析
SAS/STAT&: MI
SPSS Missing Values Analysis&
aregImpute (Hmisc), EMV,
fit.mult.impute (Design), mice,
mitools, mvnmle
glpk, linprog, LowRankQP, TSP
统计效力检验
SAS& Power and
Sample Size
Application,
SAS/STAT: Power,
SamplePower&
asypow, powerpkg, pwr,
SPSS Base&
SPSS Regression
R, Hmisc, Design, lasso, VGAM, pda
抽样及调查
SAS/STAT&:
surveymeans,等
SPSS Complex Samples&
pps, sampfling, sampling,
spsurvey, survey
结构方程模型
SAS/STAT&: Calis
Text Miner
SPSS Text Analysis for
Surveys&, Text Miner
for Clementine&
Rstem, lsa, tm
SPSS Trends& Expert
大量的包可完成
Enterprise Miner&
SPSS Classification
Trees&, AnswerTree&
ada, adabag, BayesTree,
boost, GAMboost, gbev, gbm,
maptree, mboost, mvpart,
party, pinktoe,
quantregForest, rpart,
rpart.permutation,
randomForest,
randomForests, tree
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。后使用快捷导航没有帐号?
查看: 4159|回复: 12
python在数据分析日常工作中地位如何,与R语言、SAS、SPSS比较?
论坛徽章:13
Python与R不同,Python是一门多功能的语言。数据统计是更多是通过第三方包来实现的。
具体来说,我常用的Python在统计上面的Package有这样一些
<font color="#.Numpy与Scipy。这两个包是Python之所以能在数据分析占有一席之地的重要原因。其中Numpy封装了基础的矩阵和向量的操作,而Scipy则在Numpy的基础上提供了更丰富的功能,比如各种统计常用的分布和都能迅速的在Scipy中找到。
<font color="#.Matplotlib。这个Package主要是用来提供数据可视化的,其功能强大,生成的图标可以达到印刷品质,在各种学术会议里面出镜率不低。依托于Python,可定制性相对于其他的图形库更高。还有一个优点是提供互动化的数据分析,可以动态的缩放图表,用做adhoc analysis非常合适。
<font color="#.Scikit Learn。非常好用的Machine Learning库,适合于用于快速定制原型。封装几乎所有的经典算法(可能是的例外,不过这个有Pylearn2来补充),易用性极高。
<font color="#.Python标准库。这里主要是体现了Python处理字符串的优势,由于Python多功能的属性和对于正则表达式的良好支持,用于处理text是在合适不过的了。
基本上就日常使用就涉及这些。符号运算等等也有Sympy和Theano等强力第三方库来支持。总结,Python在你列举这些里面是综合功能最强大的,但是这些功能分散在第三方库里面,没有得到有机的整合,相应的学习成本会较高。
论坛徽章:13
金牌会员, 积分 1460, 距离下一级还需 1540 积分
论坛徽章:24
来看看 等回复
高级会员, 积分 950, 距离下一级还需 50 积分
论坛徽章:5
金牌会员, 积分 1327, 距离下一级还需 1673 积分
论坛徽章:2
高级会员, 积分 970, 距离下一级还需 30 积分
论坛徽章:6
来看看 等回复
高级会员, 积分 699, 距离下一级还需 301 积分
论坛徽章:15
通过Rpy可以在python中调用R,但R中不能调用python的变量。
论坛徽章:13
yaqli 发表于
来看看 等回复
论坛徽章:13
刀若冰凌 发表于
来看看 等回复
论坛徽章:13
zhenchuxin 发表于
通过Rpy可以在python中调用R,但R中不能调用python的变量。
扫一扫加入本版微信群}

我要回帖

更多关于 金融行业前景分析 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信