2009年7月3日星期五

统计和假设




There are three types of liars: Liars, damned Liars and statisticians.
—— Mark Twain


“骗子有三种:骗子,无耻的骗子,统计学家” —— 马克·吐温

之所以要把这句浅显的话翻译一遍,不是卖弄,只是说明这句话在两种语言中的理解没有偏差。而其它一些翻译就不是这样,比如说 Theory 这个词的中文翻译一般有两个:一为理论,二为假设。这不奇怪,因为中文里很多形容词都有褒义和贬义两个版本,译者可以按自己的意愿或上头的指示随意引导读者。我们的传统思维一般是先定性,再论事。而先入为主的观念使得一件事情一旦定了性,要再去深入思考,翻盘就难了。

我的巴比伦字典里关于 Theory 的例句是 "It's not a fact, it's only a theory." 从这句话看,英语里这个词多理解为假设。而在我念书的时候,看到书上出现这个词的时候,第一反应就是,这是个理论,接下来该划线标重点了。

说到统计,我不深知其中的水分,也明白用什么样的统计方法可以得到想要的数据。但我不认为这全然无用,说到底统计数据告诉我们的只是一个 Theory —— 假设而已。以下的统计规律未被完全验证,出现反例也不为怪,只是我倾向于相信它们有点道理:

  • 基尼系数(Gini Coefficient)即贫富差距指标。有统计规律试图证明,贫富差距越大,社会治安就越差。

  • 类比财富分配规律,名人的出镜率也可以立一个指标。我猜想,新闻里名人的出镜率越高,媒体越不自由。试想天下的新鲜事怎么可能都发生在那几个国家领导人和艺人头上呢?是不是什么使得人们不能关心其它的事呢?

  • 个股随大盘同向运动的比率。50% 代表一半股票跌一半股票涨,100% 代表所有股票随大盘同跌同涨。业内人士认为:这个指数越低说明股市信息越透明,个股行情由其业绩决定;这个指数越高说明股市越像赌场,股票无所谓好坏,买什么都差不多,就是赌博。顺便一提,欧美日这个指数一般在 60% 左右,中国十年前大约在 80% 现在大约在 90%,一个月来大盘猛涨,赚得最多的是大盘基金。这个六面骰子游戏终于简化成的两面硬币的游戏了。

没有评论: