标准正态分布函数的快速计算方法

标准正态分布的分布函数 $\Phi(x)$ 可以说是统计计算中非常重要的一个函数,基本上有正态分布的地方都或多或少会用上它。在一些特定的问题中,我们需要大量多次地计算这个函数的取值,比如我经常需要算正态分布与另一个随机变量之和的分布,这时候就需要用到数值积分,而被积函数就包含 $\Phi(x)$。如果 $Z\sim N(0,1), X\sim f(x)$$f$$X$ 的密度函数,那么 $Z+X$ 的分布函数就是

$$P(Z+X\le t)=\int_{-\infty}^{+\infty} \Phi(t-x)f(x)\mathrm{d}x$$

我们知道,$\Phi(x)$ 没有简单的显式表达式,所以它需要用一定的数值方法进行计算。在大部分的科学计算软件中,计算的精度往往是第一位的,因此其算法一般会比较复杂。当这个函数需要被计算成千上万次的时候,速度可能就成为了一个瓶颈。

阅读全文

COS沙龙第35期(北京)纪要

主题:工业系统大数据分析方法及其应用案例

嘉宾:  刘恺博

主办:统计之都

场地:北京大学

组织:闫晗 常象宇 王高斌

纪要:王高斌

简介:第35期沙龙(北京)与2016年1月9日在北京大学顺利举办。主持人为人大本科生闫晗,嘉宾刘恺博,现任美国威士康星大学麦迪逊分校的助理教授。刘恺博于2009年毕业于香港科技大学工业与工程管理专业,2011年和2013年分别获得美国佐治亚理工学院(Georgia Tech)统计学硕士、工业与系统工程博士学位(系统信息学和控制方向)。刘恺博博士的研究兴趣主要是工业工程背景下的系统信息学和大数据分析,重点通过数据融合的方法研究制造业、服务系统中的系统过程建模、质量监测、诊断与寿命预测等。他的三篇文章曾先后获得运筹学和管理科学学会(INFORMS)、工业与系统工程研究学会(ISERC)的最佳论文。他于2012年获得了美国工业工程学会(IIE)的学术奖金(the Gilbreth Memorial Fellowship), 2013年获得了美国质量协会(ASQ) 的奖学金(the Richard A. Freund International Scholarship), 2014年获得了美国工业工程学会(IIE)的最佳博士论文奖(第二名)。他的研究获得了美国和中国国家自然科学基金 (National Science Foundation)的资助。有关于刘恺博博士的其他信息,可以从他的主页了解更多: http://kaibo.ie.wisc.edu/index.html

阅读全文

COS沙龙第36期(北京)纪要

主题:利用开放数据重新定义中国的城市系统

嘉宾:龙瀛

主办:统计之都

场地:中国人民大学

组织:张心雨 魏太云

纪要:张心雨

简介:第36期沙龙(北京)与2015年1月10日在中国人民大学顺利举办。本次沙龙由人大统院本科生张心雨主持,嘉宾龙瀛老师现任职于清华大学建筑学院。龙瀛博士是清华大学城市规划工学博士,北京城市实验室(The Beijing City Lab (BCL)),创始人和执行主任,剑桥大学国家公派访问学者。他主要从事区域与城市规划、定量城市研究和城市模型等方面的研究工作。他在城市规划相关领域的国际期刊(SSCI)共发表24篇论文,他还在国内期刊有良好的发表记录,著有Springer英文专著《Geospatial Analysis to Support Urban Planning in Beijing》,他还是多个国内外刊物的客座编辑和国内大学的客座教授/研究员,曾受邀在多所大学和研究机构讲学。他的研究方向注重了国际规划理论与中国规划实践的结合,研究成果曾多次被New Scientist、参考消息、中央电视台、北京电视台、澎湃新闻、南方周末、凤凰周刊等报道。

阅读全文

《Rcpp:R与C++的无缝整合》

Rcpp是R应用最为广泛的语言扩展包,它被应用于超过100个CRAN和BioConductor的包中。这本书是关于Rcpp的第一本综合性导论。Rcpp使得用户可以在R和C++之间来回传递数值、向量、列表或者完整的R对象,在给R分析框架带来深度的同时,也带来了C++的威力、速度和效率。

阅读全文

中文文本处理简要介绍

作为一个处理自然语言数据的团队,我们在日常工作中要用到不同的工具来预处理中文文本,比如 JiebaStanford NLP software。出于准确性和效率的考虑,我们选择了Stanford NLP software, 所以本文将介绍基于 Stanford NLP software 的中文文本预处理流程。

阅读全文

COS访谈第二十期:千秋邈矣独留我,百战归来再读书:谢益辉

2002年,谢益辉报考了中国人民大学统计学系。并不是因为他喜欢统计学——那时候他根本不知道统计学是什么——只是因为人大当年在湖北招生统计系有三个名额,比其他系都多,感觉录取概率会大一些。这个日后将跻身华人R开发者名人堂的湖北小伙,就这样从“种地之家”误打误撞地进入统计学的世界。 机缘巧合下,谢益辉在大三时承担了人大统计系网站以及论坛的维护工作。为了管好这个论坛,他学习了网页方面的知识,如JavaScript、HTML、CSS等。这些和数据分析风马牛不相及的技能却成为他未来成功的奠基石。

阅读全文

第八届中国R语言会议(武汉)暨华中地区数据科学会议

第八届中国R语言会议(武汉会场)暨华中地区数据科学会议于2015年11月7日在湖北经济学院大学生活动中心二号报告厅顺利举行。会议由湖北经济学院统计学院和统计之都主办,湖北数据与分析中心协办,优酷土豆和辰智咨询提供了赞助。会议当天,众多R语言兴趣爱好者齐聚一堂,就R语言在行业中的应用进行了交流探讨。经过大家的努力,R语言的火种顺利传到了武汉,接下来还会一直传递下去。

阅读全文

COS沙龙第34期(北京)纪要

主题:医疗问题中复杂系统的建模,检测,优化以及控制问题

嘉宾:黄帅

主办:统计之都

场地:中国人民大学

组织:蔡锐 魏太云 王建桥

纪要:钟琰

简介:第34期沙龙(北京)与2015年12月19日在北京大学顺利举办。本次沙龙由人大统院本科生王健桥主持,嘉宾黄帅老师现任职美国华盛顿大学-西雅图分校的工业工程系助理教授。黄老师于2007年在中国科技大学少年班系获得统计学位,于2012年在美国亚利桑那州立大学工业工程系获得博士学位。其主要研究方向是结合统计、机器学习、运筹方法,去研究一些医疗管理以及工程领域里面的复杂决策问题。具体应用比如老年痴呆、青少年糖尿病、手术感染等问题的监测和预防等等。从医疗问题出发,这些研究成果可以被广泛的应用在其他各类复杂系统之上,比如制造业或者供应链管理。他的研究获得了美国自然科学基金(National Science Foundation),Juvenile Diabetes Research Foundation 以及其他一些医学基金会以及医学机构的资助。

阅读全文

第八届中国R语言会议(上海)纪要

第八届中国R语言会议(上海会场)于2015年11月21日至22日在华东师范大学中山北路校区成功举办。会议分为第一天的主会场和第二天的四个分会场,第一天主会场位于大礼堂(思群堂),第二天分会场位于科学会堂报告厅和逸夫楼一楼报告厅。

一、会议概况

第八届中国R语言会议(上海会场)由华东师范大学经济与管理学部统计学院和统计之都联合主办,并得到了华院数据、辰智咨询、永洪科技、优酷土豆集团等战略合作伙伴的鼎力协助。在华东师范大学统计学院、统计之都各位同仁的不懈努力下,本次会议比往届有了更大的突破。会议共设有5个会场,32场主题报告,覆盖金融大数据、工具与可视化、互联网、统计与机器学习等诸多领域。本届会议报名非常火爆,人数突破了1500人,报名单位超过600个,创下历届之最。

阅读全文

COS沙龙第33期(北京)纪要

主题:神马是数据科学家

嘉宾:林荟

主办:统计之都

场地:中国人民大学

组织:蔡锐 魏太云 张心雨 冯璟烁 于嘉傲 邓金涛 杨舒仪

纪要:杨舒仪

阅读全文