统计之都《本周导读》第二辑

前言

转眼间一个星期过去了,本周统计之都的主站、维基、论坛有什么值得我们关注的事情呢,请关注本期《每周导读》。

阅读全文

不得不提的P值

在论坛,经常发现有人发关于P值的帖子,搜索了一下,一共有29个关于P值的帖子。的确,P值是最常用的一个统计学指标,几乎统计软件输出结果都有P值。了解P值的由来、计算和意义很有必要。

阅读全文

闲扯“自由度”

“闲扯”是一个四川方言词汇,指的就是大家在没事的时候坐下来吹吹牛,聊聊天。现在正是夜深人静的时候,找人聊聊天是不合适的,就由我一个人来自言自语下什么是自由度。

我们进行统计分析,就像一个摄影师在拿着镜头在记录世界。但这个摄影师如果用的是广角镜头,那么他将面临一个问题:几何失真。特别是拍近景的时,拍出来的直线是弯曲的。这样就没有真失地反映客观事物的图像。所以这个时候他的反映真实客观现实的“自由”被限制了。虽然他的自由被限制了,但摄影师还是有办法矫正照的几何失真的:他可以尽量避免用广角镜头拍近景;他可以将照片交给专业的图像处理软件修复。所以,这个摄影师是有很多“自由”的手段来矫正照片失真的问题。这就可以当作是自由度的一个不恰当的类比。

阅读全文

决策与风险

读书笔记,白话统计系列,力图用普通话讲述统计学的基本概念。这里的题目是“决策与风险”,讲的就是两类错误(type I and type II errors)。以下改编至维恩堡《数理统计初级教程》(常学将等译,太原:山西人民出版社,1986),英文名叫Statistics: An Intuitive Approach By George H. Weinberg and John Abraham Schumaker 。这书几近绝迹,当回文抄公,以期重见天日。

阅读全文

Rcmdr: 山寨版的SPSS

可以认为R最传统的工作方式为命令行,估计大多数人最开始使用R的时候也会直接在console中就干活了。然后就是有的人使用R自带的那个脚本编辑器(至今为止,绝大部分时候面临较为简单的工作的时候,我还是用它),有的人则发现这个编辑器实在是太简陋了点,属于Notepad的精简版,从而会选择一个自己喜欢的编辑器来编写脚本。

很多人在介绍R的时候,就不约而同会描述“命令行,没鼠标点击完成”,有的人还会过犹不及的介绍说这显示了R的“先进性”等等。其实这应该算误解,在R中 也可以实现SPSS的那种“鼠标为主”的工作方式,其实SAS的一些模块也是“鼠标为主”,Stata、Splus等莫不如此。而我们的R也有完全可以支 持这种“鼠标为主”的用户工作方式,其实John Fox的Rcmdr包就是一个相当赞的尝试。而该包主要使用了R中最基础的tcl/tk等包,可以说只要你安装了推荐的一些包,再加上Rcmdr中的图像 框架就实现了很多人所要求的“鼠标”操作。

阅读全文

刘重杰:和统计接触的经历

首次遇到益辉应该是在一个论坛上,讨论了各类专业统计软件的使用情况,就聊到了R。接着就开始到cos灌水,慢慢就认识了这个领域里面的很多朋友。而益辉等兄弟姐妹为在统计这个领域的推广“正确”方面实在是做出了极其有益处,乃至可以称为辉煌的工作。

我对统计学所知实在是业余水平。首先,我没系统正式的学过统计专业的课程;最多算一个自学者。其次,所从事的正式工作和职业中,和统计直接相关的几乎没有;最多只是擦边球式的“应用”了下统计技术和相应的软件。所以受邀而来,实在是汗颜。不过接触统计学倒是比较多,也足见这门学科的普遍和重要性。

阅读全文

打造得心应手的统计编程平台--Eclipse + StatET

本文的目的是告诉你如何打造一个好的R的编程界面和环境,让你充分享受用R编程的乐趣。这不是一个关于R的教程,可以访问这里以获得更多关于R的资源。大家也可以加入QQ群42131822和R的邮件列表(需要google账号)可以认识正在使用R的更多的朋友,也可以通过hurongxing[at]126.com和我联系。本文论坛讨论帖参见这里

阅读全文

统计之都《本周导读》第一辑

前言

大家好,非常感谢大家对统计之都一贯支持。随着统计之都网站结构的调整,《本周导读》也应运而生了。《每周导读》将回顾一周内统计之都的主站、维基、论坛变化,方便大家了解统计之都的最新动态。

阅读全文

统计学专业应该使用什么样的统计软件(写给在统计学院学习的学弟学妹之四)

过去两三年为院刊写了一些稿件,其中一部分是统计技术层面的,一部分是方法论和原则层面的,姑且作为对低年级统计学子们的一些学习建议,目的在于让大家学会擦亮自己的眼睛,辨明统计学的是与非。文章观点仅为一家之言,而且大多数情况下这些观点相对于流行的、教科书式的观点可能有显著差异,因此请各位小心阅读。

这次要求我写一篇关于统计软件的介绍,我想我也没这个本事去介绍所有的软件,因此私自把主题改成了“统计学专业应该使用什么样的统计软件”,窃以为这样写更有意义,不然这篇文章就变成了死板的统计软件使用手册。

关于统计软件,随着时间的推移,我最终以R语言为中心,基本废弃了其它工具的学习,换句话说,其它统计工具对我来说作用有限,不符合本人的统计分析思想和使用习惯。长话短说,本文的摘要为三个字:用R吧

阅读全文

我的一些统计方法观(写给在统计学院学习的学弟学妹之三)

记得高中很讨厌政治课,但是有几个词烙在脑子里,想忘都忘不掉,比如“世界观”和“方法论”,当时那位老爷爷整天给我们灌输这些玩意儿,搞得我现在对这些词汇仍然如鬼神般敬而远之。这次我要写的是关于统计方法的一些思考(主要是思路),但又不太多涉及方法本身的推导证明,因此只好称之为“方法观”。

现在每天感慨统计领域太宽,模型太多,方法太杂,让人把握不住方向。不过上次高校研究生统计论坛我仍然不知天高地厚地选了一个讲述统计思想的题目,其原因正是觉得方法太杂,应该理出一些头绪来;当然我所理的头绪也仅仅是很局部(local)的,管中窥豹而已。下面我先举几个例子说明一些统计方法的发展思路,这些也是我在上次论坛上发言的部分内容:

阅读全文