闲话科学哲学

做科研一般都不讨论哲学,太多形而上的东西,说也说不清道也道不明,但懂一点科学哲学还是很有必要的,闲言碎语说不明白,就当是聊天了。

从因子分析到垃圾邮件

想不到真的拖了1年才续写这个系列,因子分析的要义其实就是挖掘背后的信息。例如我给你些综合性经济指标,让你把其中出口的跟内需的部分挖出来你该如何去做?指标都是综合性的,不会说你想抽出一部分就可以。在主成分分析中,其实想得到的是综合性指标去降维而因子分析是想挖掘现有数据中的一部分

最小一乘法的解为什么是中位数

之前写过一篇最小二乘法,为神马不是差的绝对值,当时讨论时对最小一乘的基本思想不太了解,只知道不好寻优。后来想想,数值分析里没有解析解的方程多如牛毛也能用一些方法逼近最优值,想来求解也不困难,本来这一页也就翻过去了。However,最近在统计之都上看到了一篇介绍统计学思想的文章,顿时感觉醍醐灌顶,对回归问题也有了新的认识

八卦一下“致癌”

现代人谈癌色变,仿佛什么东西沾上癌就变得不吉利,其实都是自己吓自己。癌细胞其实没有那么可怕,而致癌过程也并非想象的沾上致癌物就得癌症。这里用一个经典的启动-促进-发展模型(Initiation,promotion,progression theory)来八卦一下致癌过程(特别是环境污染物),该模型大致将致癌过程分了三个阶段: