调和曲线图和轮廓图的比较

多元数据的可视化方法很多,譬如散点图、星图、雷达图、脸谱图、协同图等,大致可分为以下几类:1.基于点(如二维、三维散点图);2.基于线(如轮廓图、调和曲线图);3.基于平面图形(如星图、雷达图、蛛网图);4.基于三维曲面(如三维曲面图)。其思想是将高维数据映射到低维空间(三维以下)内,尽量使信息损失最少,同时又能利于肉眼辨识。调和曲线图和轮廓图(即平行坐标图)都是多元数据的可视化方法,它们基于“线”的形式,将多元数据表示出来,对于聚类分析有很好的帮助。

阅读全文

统计之都《本周导读》第八辑

一、主站

从寒假到现在共发布了5篇日志。

二、论坛

关于邀请大家成为统计之都高校联系人

阅读全文

在Windows中创建R的包的步骤

本文将向你介绍在Windows下创建包的步骤。在Unix下的创建过程以及如何用R调用C语言代码,请参考Google Group中的如何写R的程序包一文。

在Windows下创建R的包(package)比较容易,但也需要十分小心。下面给出了创建一个R的包的步骤。如果需要了解创建包的更多细节,请参考相关的参考文献。

阅读全文

分类模型的性能评估——以SAS Logistic回归为例(3): Lift和Gain

书接前文。跟ROC类似,Lift(提升)和Gain(增益)也一样能简单地从以前的Confusion Matrix以及Sensitivity、Specificity等信息中推导而来,也有跟一个baseline model的比较,然后也是很容易画出来,很容易解释。以下先修知识,包括所需的数据集:

阅读全文

Google Visualization API 与在线数据分析

近日Google推出了Google Visualization API为在线数据分析开拓了一条崭新的道路。这个项目的初衷就是希望提供一种灵活的在线数据分析的解决方案。之前的名声大噪的Google Map API已经应用到国内的许多诸如地图查询,导航信息,GIS等等诸多领域。也许你也曾是其中一员或将要成为其中一员呢。回过头来,Visualization API则将重点放在数据的探索性分析与结果的展现上。虽然现在没有提供丰富的分析类库,但是在不久的将来,功能强大的在线分析软件,甚至在线开发平台都将不再遥不可及。

阅读全文

WinBUGS在统计分析中的应用(第三部分)

用GeoBUGS做简单的空间数据分析

第一节 实例介绍基本的空间模型

GeoBUGS是WinBUGS的一个模块,专门用来分析空间数据(spatial data)。由于和WinBUGS的基本模型结合得比较好,所以被广泛地使用。目前的GeoBUGS除了自身的地图格式外,还支持Splus, ArcInfo 以及 EpiMap的地图格式。当然了,在使用的时候需要做适当的转化才行。

下面是一个简单的例子,大家也可以在GeoBUGS的Manual中找到它。模型假设为条件自回归模型 Conditional Autoregressive(CAR)。数据为苏格兰唇癌疾病数据,反映的是苏格兰56个郡的唇癌发病率。这个数据比较经典,Clayton and Kaldor (1987) 和 Breslow and Clayton (1993)都曾在他们的论著中分析过该数据。

阅读全文

R与SAS之争:一个导读

现在R与SAS社区里,最热闹的大概是源于《纽约时报》的一篇文章而引发的R与SAS之争。

2009年1月7号,《纽约时报》科技版登了一篇注定要引起四方瞩目的文章, Data Analysts Captivated by R’s Power(1月6号就有网络版),作者是该报的记者Ashlee Vance。这大概是开源统计软件包R,自1996年诞生以来,第一次出现在公众视野,而且是出现在《纽约时报》这样的主流媒体。这篇文章里有一句,让R社区和SAS社区都颇为兴奋,而且有很多私人博客也积极跟进:

阅读全文

统计之都《本周导读》第七辑

一、主站

本周一共发布了2篇日志。

二、维基

本周维基上面内容变化不大。

阅读全文

开源的计量经济学软件gretl

gretl(Gnu Regression,Econometrics and Time-series Library)是一款跨平台的计量分析软件。它是开源软件,用C语言写成,由 Allin Cottrell和Riccardo “Jack” Lucchettii 共同开发。

阅读全文

使用回归分析,样本过少时不妨好先作图看看

回归分析往往是学统计、学计量课程时接触的第一个统计模型了,甚至不少人可能认为回归分析理所当然成为计量的绝大部分内容——毕竟很多教材中提到统计模型的时候,往往就一个OLS为主的讲法。回归分析的内容当然很广泛,也在学科中占据相对基础的位置。

学会OLS,有人还明白了ML等方法的含义;现在学统计分析的时候,或多或少会安排统计软件的实践课程,于是大家学会了使用Excel,乃至SAS中如何来做经典的回归分析。看过不少的文献,很多都忽略了回归分析模型诊断这个环节——可能很多标准教科书没有强调,甚至是没有讲;这不能不说是一个遗憾。

阅读全文