Wednesday, December 18, 2013

比特币 (Bitcoin) 系统是如何运行的?zz知乎

http://www.zhihu.com/question/20941124/answer/16668373

深入浅出比特币

作者地址:136LvpXuWFRjfuVBCmoqFFGSstbMQkNEKr
在不删除作者地址,不删改原文的前提下,本文可在任何形式媒体上自由转载。(是的,署名都不需要保留)

第负一章 反馈

第负一章第一节 风险警示

鉴于有人说这是软文,作以下声明:
1.作者目的在于阐述原理,并主观判断比特币作者的本意不在于“骗钱”。但是如果大家认为目前的过分乐观的宣传是为了忽悠后来者接盘,我并不否认这种可能性。
2.比特币随时可以价值归零(或者基本归零) 2013-03-12 IEEE Spectrum: Major Bug In The Bitcoin Software Tests The Community。政府可以随时宣布比特币非法。
3.由于比特币涨跌幅度巨大,我不愿意有人因为我的文字买或者没买而遭受巨大损失,以后如果再答题的话将仅提供纯粹信息,不包含任何主观意见。
4.谁能让@李笑来 给我发点工资?地址见上。那样我就名至实归了。

第负一章第二节 删节版

鉴于大多数人(包括我在内)认为此文又臭又长,特提供删节版,希望有所帮助。
function mine()  {      while(true)      {          longestChain = getLongestValidChain()            -- A number that changes every time, so that you don't waste time           -- trying to calculate a valid blockHash with the same input.          nonce = getNewNonce()            currentTXs = getUnconfirmedTransactionsFromNetwork()            newBlock = getNewBlock(longestChain, currentTX, nonce)            -- http://en.wikipedia.org/wiki/SHA-2          -- and this is what all the "mining machines" are doing.          blockHash = sha256(newBlock)            if(meetReqirements(blockHash))          {              broadcast(newBlock)              -- Now the height the block chain is incremented by 1              -- (if the new block is accepted by other peers),              -- and all the TXs in the new block are "confirmed"          }      }  }  ////////////////////////////////////////////////////////////////  function sendBTC(amount)  {      sourceTXs = pickConfirmedTransactionsToBeSpent(amount)      tx = generateTX(sourceTXs, targetAddrs, amount, fee)      signedTx = sign(tx, privateKeysOfAllInputAddress)      broadcast(signedTx)  }  ////////////////////////////////////////////////////////////////  



第零章 玩具

最近比特币又火了,而且得到了主流媒体的普遍报道。可惜的是大概一万个谈论比特币的人中也没有一个真正懂它是怎么工作的,于是只要一提到比特币,什么庞氏骗局,传销之类的话马上就杀过来了。弄得普及比特币知识的人一个个都是骗子。要知道比特币在进入大众视野之前,是一帮hackers和geeks慢慢养大的玩具,他们绝对不是生长骗子的土壤。

改变世界要从自己做起。所以我今天下定决心,写一篇让初中生也看得懂的文章(如果你觉得还是看不懂,绝对不是你智商不够,而是我无知自大,写得不好。那些说自己智商不够的朋友让我觉得惶恐),来介绍比特币运行的原理。也许你看完跟我一样,会佩服其天才的设计:原来他是这样把“个人发行货币”这种荒诞不经的想法变为现实的。

通俗易懂是本文的初衷,同时又希望篇幅尽量小,势必要忽略细节,或做不精确的比喻,必定贻笑大方,还请谅解,而且欢迎各种批评指正。文中包含了大量比喻,对这部分千万不要当真。我会用非专业性的语言尽我所能地描述事实真相,但是如果想真正懂得原理,请去官网。当然本文也可以用于研究官方文档前的预热。

比特币是个比较复杂的系统,如果你想10分钟就弄明白,神仙也办不到。还希望多开点耐心的预算。

第一章 账单

第一章第一节 撕纸游戏

比特币本质上是一个广播和管理账单的系统。也许有点让人难以相信的是,每个标准客户端都保存有有史以来每一笔帐单。而且没有任何特殊结点(服务器),因而称之为去中心化的点对点系统。

很显然帐单必须唯一,那么在一个点对点的系统中如何能做到这一点呢?想像100个互不信任的人住在一个小岛上,他们没有物理货币,只能相互给账面上钱,并且每给一笔都喊一句让所有人知道。如果他们每人都可以记帐,显然就乱套了:当两个人的帐单对不上号怎么办?如果由一个指定的人来记帐,那他又有可能以权谋私。

比特币怎么解决这个问提?每个人都可以记帐,把每一笔交易都记在一张牛皮纸上,签个名。那么,谁的牛皮纸算数呢?很简单,所有人都得把这张纸撕成等面积的两半,让误差小于一定值,比如0.1%。如果满足这个条件,那么你的就被大家认可,每人复印一份拿回家。什么?你撕完了发现误差是0.100001%?对不起,大侠请重新来过。为什么要撕纸呢,因为纸一分为二形成的那一条线,是独一无二的,具备了防伪的功能。而撕成误差极小的两半,是有“难度”的,没有难度无法成为游戏。

没事干玩撕纸游戏干嘛?因为大家约定,每个人都可以在帐单上添一笔,说“比特岛公共基金给本人25元”。你的账单被判为有效的话,你就得到了这25元。这个撕纸游戏就叫挖矿,因为游戏过程就像淘金一样。

比特币的挖矿就是用电脑来进行这种撕纸撞大运的游戏,当前的数据是全络“撕”61,000,000,000,000次每秒,换句话说大概每61,000,000,000,000 x 600 次尝试产生一个幸运儿。无疑这需要巨大的硬件和能源,但是如你现在所知,这是维持比特币这个金融系统必须付出的成本,而不是所谓的“纯粹浪费资源”。要明白现实中的金融系统要比这个昂贵得多,一个银行客服的成本相当于多少台电脑?

第一章第二节 账单链

所有的有效账单组合在一起,才能成为完整的账单。怎么做到这一点呢?每一份账单都把前一份账单缩小成1/10,贴在自己的角落上,换句话说每个账单都知道上个账单是哪个,一个链就形成了。这对玩记账游戏的人有产生问题了:假如第123份账单生成好了,A和B都拿这个作为前一个节点,记账,撕纸,然后他们几乎同时撕出了符合要求的账单怎么办?那个稍微慢一点点的(假定是B)怎么甘心认输呢?方法很简单:大众只认最长的那一条链。所以,当一个新账单生成并被广播时,每个玩家会立即放弃当前这一局游戏,拿到最新的账单缩小成1/10,贴在自己的新的一张账单的角落上,开始下一轮游戏。否则就算你撕出了合法的账单,也会被孤立,变得无效。

明白B是怎么被淘汰的了吗?想象这样一个有趣的无限接力赛游戏:环形赛道,每一棒一圈,每圈跑完以后你就把棒子插到一个“下一代接力棒生成器”中,生成一大堆下一代接力棒供下一棒的选手们使用。只要你的棒子的下一代被大多数人使用,你就为这一轮的胜者。显然下一棒的选手们会去拿最早生成的新一代棒子,因而其他的上一棒的选手会自动就放弃。哪怕是由于惯性B也跑到交棒点,然后顺手把棒子插到一个“下一代接力棒生成器”中,也是徒劳的。因为大家都已经跑了,再也没人理会你的接力棒了。

但是如果真的有两个人同时跑到终点怎么办?那也没关系,下一轮就会有拿着两种棒子的人跑了。平局的这一轮两个人如何决胜?你应该也已经想到,“我不比你快,我儿子比你快就行”。在现实挖矿中,这种两种棒子同时跑的现象是十分常见的,所以矿工每隔一段时间就要经历一次“空欢喜”。具体可见Orphaned Blocks

第一章第三节 游戏规则

记账是个日常事务,所以矿工每时每刻都在试图制造合法的账单。那么假如我希望每天一份账单就好,但是这些矿工技术越来越好,玩的人越来越多了怎么办呢?没关系,如果账单生成得太快,就提高误差要求,反之降低要求,以达到动态平衡。比特币的控制目标是十分钟一个账单,就是传说中的一个"Block".

怎么保证没有人伪造账单呢?答案是不能100%保证,但是伪造非常困难。由于账单链的存在,伪造一份账单必须把从这份账单以后的所有账单全部伪造一遍。否则,比如你伪造的是第123份,大众拿手里的第124份的复印件中的第123份的缩略图一对比,会发现撕纸的痕迹不一样。因而拒绝承认你的合法性。你也无法直接窜改那牛皮纸,因为撕纸游戏规定一旦有改动,该纸立即作废。因而那个被大众所承认的账单链代表的,其实是历史上所有的最高效的撕纸生产力的总和。你要推翻它就必须拿出比这个更大的生产力伪造一条新的更长账单链,然后指鹿为马说,你这条链才是合法的,因为大众只认可最长的那一条。

这里需要注明的是,不是说如果一个人控制了51%的资源的话他就能为所欲为了,他能做的只是把自己曾经花钱的账单抹掉,或者把自己花出去的某一笔钱的收款人改掉。也就是说他不可能给自己凭空加钱,或者吧别人的账单改掉。这也是为什么有很多山寨币就这样被攻击也没有死掉的原因。

注意,这不是不可能。现实中新一代矿机的制造商完全有这样的能力,因为他们的生产力是别人的成百上千倍,再加上规模化制造矿机,这个是很容易实现的。但问题是很显然这背离了他们的利益,这会是对他们自己赖以赚钱的平台的核心机制毁灭性打击,所以这种事情是不会发生的。

如果对这个还是不放心的话,其实已经有修补这个漏洞的方案,只不过似乎目前并未实施。

第一章第四节 2100万

如同很多人知道斯诺克满分是147一样,很多人最先了解到比特币的信息之一便是,比特币总数上限是2100万。对普通人来说,这就是最大的卖点。而这又是如何实现的呢?其实这个上限就是前面提到的比特岛公共基金的总量,通过撕纸游戏分配给获胜者。显然总有一天是要坐吃山空的,怎么办呢?两个办法。一是往后拖:每四年撕纸的奖励减半,09年还奖励50呢,如今13年就只有25了。这么玩要玩到下个世纪才算瓜分完。二是伸手要:假如你给别人钱的同时,给记账的一点小费,别人就优先给你记账,你的交易就较早第得到确认。原作者的假设是,到最后矿工只通过小费获得收益。

这里面隐藏的一个重要的信息是,比特岛公共基金是通过这个游戏做了另外一件非常重要的事,把钱分发出去的。发现了吧,记账和分发货币,这两个最基本的工作,就是由这个巧妙的游戏完成的。

第二章 支付

第二章第一节 匿名

说了这么多,其实最根本的问题还没有聊到,那就是比特岛上的人都是没有名字的,这个账单要怎么写?更重要的是,D 说 D 给了 WM 0.5元,记账的如何知道 D 的账户上有没有0.5元,又如何记录 WM 从此多了0.5元钱呢?比特岛人是通过“发微博”实现的,神奇吧。

假定 D 的微博号是 188Nxs23XGUonU8og9u6n4CNwr5oqqsVjE(以下简写为188N),WM 的微博号是 19XRiapec1aDN4NCJMmLkkp7iXegEQvBGz(以下简写为19XR)。只要 D 在微博上发 “我支付给 @ 19XR 0.5元” 就好了。为什么这句话直接就被判定为真话呢?@罗永浩说自己的ROM比MIUI好,大家都会怀疑他是不是吹牛,但是如果他说自己的ROM比MIUI差,就不会有人质疑他了。同样的道理如果@188说“@19XR支付给我0.5元”,是不会有人直接采信的,但反之则可。

我们来一个案例分析,其中有三名参与者。除了上文提到的 D,WM 外,再加上微博号为 136LvpXuWFRjfuVBCmoqFFGSstbMQkNEKr(以下简写为136L)的比特岛居民 DS。DS辛苦挖矿得到25元,然后上交20元给 D, 后来 D 又支付0.5元给WM。

首先是 DS 赢得了某轮的撕纸大赛,那个全岛唯一,人手一份的账单链上的最后一份账单是 DS 生成的。那么这份账单上就有一条写着“比特岛公共基金支付 @136L 25元”。(当然如果这位 DS 真名是雷锋,他就会写成 “比特岛公共基金支付 @188N 25元”,完全把自己的劳动成果奉献给 D,这也是完全可以的。)

然后 DS 通过微博账号@136L 发微博说“我支付 @188N 20元”。这时所有矿工们(也就是记账的)都看到了,要不要记录在册呢?他们首先要去查账单链,看看@136L总共收到多少钱,又送出去多少钱,如果其余额大于20的话,那这笔账就是有效的,可以记下了。矿工们查完发现@136L 只存在于一笔获得25元的交易上,余额就是25元,当前交易有效。

后来 D 又通过微博账号@188N 发微博说“我支付 19XR 0.5元”。同样由于根据账单链发现@188N余额大于0.5元,交易被记录。

总结一下。 第一,一组微博的用户名密码就是承载比特币的一个容器,所谓的“钱包”就是记录你所拥有的所有的微博用户名密码的文本文件。第二,账单链中保存的全部都是“微博用户名”,你根本无法知道是谁拥有这些用户名对应的密码,这就是所谓的匿名。

但是从另外一个角度看,比特币又是完全透明的。因为任何一个“微博用户名”的财富总量都是公开的数据。如果你有兴趣可以去观摩一下高富帅的交易历史,比如Bitcoin Address 1933phfhK3ZgFQNLGSDXvqCn32k2buXY8a

第二章第二节 点对点

现实生活中比特币的交易是完全点对点的,不依赖于微博这么蠢的东西。(事实上任何网站都不是比特币系统的一部分,不管是官网,还是最大的交易网站mtgox,或者是http://blockchain.info。它们都只是这个生态圈的一部分,比特币的运转,不依赖于它们任何一个。)而做到这一点,比特币用的是数字签名技术。而且比特币系统并不会刻意跟踪某个地址拥有多少钱,而是通过管理每笔交易的输入输出来记录账目的。

数字签名比较复杂,比特岛人是用不惯的,他们如何操作呢?还是撕纸。我们还是拿 D 给 WM 0.5元为例子。我们先假定 DS 在第1024页账单的419条目给了 D 25元。
第一步,WM 随便拿张纸,随便撕成甲乙两半。然后吧其中甲部分交给 D,这半张纸就是一个比特币地址。
第二步,D 向大众广播这样一封信:“我是第1024页账单的419条目的受益方,我要将其中的0.5元转让给这半张纸(附上 WM 给他的半张纸)。”
第三步,记账者收到消息,调出第1024页账单的419条目,查看此条目的受益方收到的钱够不够,然后验证次受益方就是本次交易的发起人。全部确认后,则把这则账目包括这半张纸(或者其复印件)纳入账单中。假定此条目为1984页1989条。
现在,当 WM 要把钱转让给别人时,他就可以拿出他剩下的那张纸的乙部份,证明的收益方是他,因为世界上只有他这半张纸跟1984页1989条中记载的那半张纸匹配。
再回来看第二步,其实D也是通过提供某张纸的乙部份来证明他是第1024页账单的419条目的收益方的。

总结一下,一个交易包含一下信息:
1.资金来源,即前面某个账单中的某个条目。
2.资金去向,即某张纸的甲部分的复印件,和金额大小。用于指定本次交易的受益方和金额。
3.签名,即资金来源条目中所副的那张半张纸对应的乙部份的复印件,用于证明此次交易是由资金来源所指向的收益方发起的。
这里要注明的是,我们假定撕开的纸的甲部分是可以无限重复复印的。而乙部份由受益方持有,且只有从原件复印出来的第一代复印有效,换句话说签名只有乙部份的持有人才可以做。

实际上在这个例子中,一张纸的甲部分就是比特币地址,比如我提供的136LvpXuWFRjfuVBCmoqFFGSstbMQkNEKr,而乙部份则是被我严格加密保存在wallet.dat中的一个秘钥,他跟136LvpXuWFRjfuVBCmoqFFGSstbMQkNEKr是一对。而所谓的附上乙部份的第一代复印件,就是利用秘钥对信息签名的过程。

换句话说,“我向136LvpXuWFRjfuVBCmoqFFGSstbMQkNEKr打入0.0001BTC”实际的意思是“我把0.0001BTC的控制权交给了136LvpXuWFRjfuVBCmoqFFGSstbMQkNEKr对应的秘密字符串的拥有者”。

第二章第三节 重要的细节

一个典型的比特币客户端含有N个地址及其对应的私钥,而不是一个。而且这N个地址相互没有什么特殊关系,只不过在界面上它会显示所有地址所拥有的比特币的余额。这是相对于常见的一用户名一密码模式的最大区别。这个带来的问题是“钱包备份”的问题:别以为备份一次就万事大吉了,有可能有新产生的地址秘钥没有得到备份。当然这样的备份方法也是有的,这里只是提醒要安全备份,就不展开说了。

再介绍另外一个有趣的细节。如上文所说,当你把比特币打给另外一个地址时,你所发出的消是,“我要吧第M号交易的输出到地址X的一些比特比作为输入源,输出给地址Y”。这里有一个非常重要的规定,就是每笔交易都必须输入源的金额用光!所以比特币客户端的做法是创建一个“找零地址”,把额外的输入输出给这个找零地址。举个例子,假如我的某地址136LvpXuWFRjfuVBCmoqFFGSstbMQkNEKr某次交易获得了1万个比特币,然后当我拿这笔钱中的0.01个币买一瓶矿泉水时,公众就会从全局账单看到地址136LvpXuWFRjfuVBCmoqFFGSstbMQkNEKr打到地址DZA 0.01个币,同时打到DZB 9999.99个币。当然公众无从知道这个DZB只是我的一个找零地址。所以有些搞数据分析的专家看到频繁的大规模财产转移就会以为这是刻意的转移/掩盖财产,最后发现闹了笑话。

第三章 沙发 --总结以及FAQ

第三章第一节 主观臆断

这一章叫沙发,因为文章主体已经结束了。

相信很多人都抢过沙发,或者是在论坛上抢整。我想问大家一个问题:把时间倒回2009年,当比特币还一钱不值的时候,你们会去挖矿抢币吗?我想我一定会的,原因跟抢沙发类似,但是比抢沙发更有意思:
a. 我所抢的东西是个“好”东西,它好到可以让人崇拜。正如你会去抢你喜欢的人的沙发。
b. 稀缺,如果没有总量上限,我就不会去“抢”了。沙发也如此,是限量供应的。
c. 绝对可靠的物权,只要没有丢掉我的私钥,我的就永远是我的,没人能拿走。

我想,不管当初钟本聪开发比特币时,是抱着实验的心态,还是真的预见到自己要改变世界,对于普通玩家来说,在最初很长的一段时间内,挖矿只是一种优雅的抢沙发的方式,当然也许还有认为它日后真的能生根发芽的一种“信仰”。

总有人问我,比特币有什么“实际价值”,一般来说有此会引发一堆关于法币,黄金或者是“Rai stones”的大辩论。这里我不想纠缠于这个问题,只想回答另外一个问题:比特币问什么有价格?有人想要,可以交换,稀缺这三个要素构成了价格形成的必要条件。可以交换,稀缺是比特币天生的,那么”有人想要“这个判断为不为真呢?当然!我只需要举出一个例子,那就是我,本文作者。

回到那个虚拟的比特岛,如果把世界上的所有人分成两类,相信比特币的和不相信比特币的,然后前者都住在比特岛上。那么,不管在岛外的人看起来多么可笑,对于岛上的人来说,比特币就是黄金。

比特岛外的人也是可以持有比特币的,因为尽管他不承认这种货币,但是只要他随时可以到比特岛换回”真金白银“就可以了。

听说过那个2010年有人用1万比特币买一个pizza的故事吗?比特币不是一个突然冒出来的价值上千人民币一个的怪物。只不过是比特岛的人口一直在不紧不慢的增长,比特币的潜在价值也在不紧不慢地增加,在这个IT时代的参照系中,比特币发展得没有你想象的快。但是比特币的价格并没有像其潜在价格一样增长,而经常是积蓄上涨的力量,然后突然像火山喷发一样,吸引全世界的眼球。

比特币真的会改变世界吗?如果你问我而且只能用“会“或”不会“来回答,我的回答是”不会“。正如比尔盖茨所说“I think it's a techno tour de force, but that's an area where governments are gonna maintain a dominate role.(我认为比特币是个技术杰作,但是政府会在这个[货币]领域保持统治地位)”取代法币是妄想。比特币的下限是继续沦为少数人的玩具,上限是成为IT时代的黄金。

以上是主观臆断。

第三章第二节 客观事实

客观事实是:比特币不是骗局,所以任何形式的骗局都跟比特币无关。对我个人而言,说比特币是庞氏骗局会让我很难受,就像我本来有个女儿像奶茶妹一样漂亮却被人说长得跟凤姐一样。

先简单介绍一下庞氏骗局:我要骗钱,于是我成立了一个基金,但是我并不投资,只是做假账,跟投资者说我的基金回报又稳定又高。这样一来我的基金必然会出现越来越大的实际亏空,这没关系,只要有越来越多的人把钱投入我的基金,我的现金流就不会枯竭,骗局也就不会被拆穿。众所周知的诈骗500亿美元的Bernard Madoff就是因为金融危机才导致其骗局显形。

说比特币是庞氏骗局的人认定比特币创始人 Satoshi Nakamoto(注:没人知道Satoshi是一个人还是一个组织,而且目前他已经”退出江湖“) 就是 Bernard Madoff。因为Satoshi作为最早的挖矿者之一,是大量比特币的持有者,所以比特币升值他就是最大的受益者。因而他就是背后的骗子。这个理论最大的问题在于一个”骗“字。在比特币的世界,一切都是透明的,骗从何来?任何人如果购买比特币都是基于自己对公开信息的判断,Satoshi既没有也无法跟投资者保证又高又稳定的回报,而这个是庞氏骗局的基本特征。

任何一个庞氏骗局都有一个死穴,那就怀揣一本假账。Madoff以前总是以商业机密为由,拒绝透露投资细节。任何一个基金只要将自己的投资流向完全公开,就可以洗脱庞氏骗局的嫌疑了。那么我想问,如果Satoshi想要洗脱嫌疑,你作为怀疑者想要他公开什么?他持有的比特币的数量?好吧,就算他如人们所猜测拥有100万比特币,站在镜头前像全世界宣布这个事实,那又怎么样呢?比特币就土崩瓦解了?我看不出来为什么这会对比特币有什么致命性的影响。没有谁骗了谁,没有阴暗的秘密,骗局无从谈起。

现在说说传销,比特币是我见过最滑稽的传销了。假如我拥有十个比特币,那么我传销一个比特币获得的收益有多少呢?我们可以大致估算一下:假定传销出去一个比特币给比特币带来的升值约相当于销毁一个比特币所带来的,那么每传销出去一个比特币我持有的每个比特币大约升值 1/(2100万)。换句话说,我这是为所有的比特岛人搞传销,或者说共产主义传销。这么崇高的共产主义传销你见过吗?

传销的特点是,每个人*直接*从其下家获利,比特币完全不具备这个特点。实际上持有比特币的人鼓吹比特币,跟持有黄金的人鼓吹黄金,或者持有北京房子的人鼓吹房价没有什么区别。是有点讨人厌啦,但是传销这帽子扣得大了点。我个人一般都在鼓吹的同时警示风险,表示不懂的话不要玩。

为什么大家都喜欢说比特币是骗局呢,并不是因为他们真的通过分析比较,然后从逻辑上得出这样一个论断。而是因为他们对比特币的看法是“没有实际价值,最后下家买单”。长得这么反革命,自然就是反革命了,拖出去游街批斗!

比特币长得这么反革命不是没有原因的,但是我想把“没有实际价值,最后下家买单”改成“可能低于实际价值,可能最后下家买单”。对比特币的恶评,无非是来源于对其巨大的泡沫风险和不确定性风险的反感。是的,查理芒格爷爷说得没错”比特币是老鼠药“。对于一个不了解它的人,最好把它当做老鼠药:不要碰!

第三章第三节 结语

比特币是什么?本质上,跟HTTP 或者 Bittorrent 一样,它是基于因特网的一个协议,一个天才的发明创造。跟HTTP 或者 Bittorrent 一样,它以互联网为基础,使得以前不可想象的事情变成可能。

在现实中,它被说成是一帮无政府主义者的乌托邦,也被说成是人类经济史上的一次大革命;它被认为是天才的技术创造,也被认为是有很多缺陷的一个开源软件;它被利用成投资或是投机的工具,也被当做不可接触的老鼠药。

由于不同的背景,不同的看问题角度,每个人眼中必然有不同的比特币。盖茨说它是技术杰作,而芒格说它是老鼠药,从某种角度看,他们都能自圆其说。作为键人我,唯一的希望是,你看完这篇文章后不要再说比特币是“骗局”了。这种说法真的显得很没文化,你不觉得吗?

---------------------------------
[更新 2013-8-2]
添加 51%攻击细节
[更新2013-11-6]
应要求增加Copyfree版权声明。
[更新2013-11-13]
风险警示
[更新2013-11-22]
删节版

Monday, November 18, 2013

德国坦克问题及频率学派与贝叶斯学派

(以后尽量少用公式直接用Latex的plain文本表示简单公式,因为看到的latex在线转换服务都不能让我满意,又要照顾到各个同步blog不同的奇葩问题,十分不爽。以后的以后有空找个靠谱的或自己写一个。。)

这是一个看起来很基础很简单的经典问题:假设所有的德国坦克是从1开始按自然数递增编号的,坦克的总数为N,也就是说坦克的最大编号为N。盟军在战斗中共随机俘获/击毁了k辆坦克,且这些坦克的最大编号为m,那么应当如何对N的大小进行估计?
本问题以应用于二战时对德军产能的实际估计而得名,在这个问题的解决上,基于统计的方法取得了非常大的成功,取得了惊人的准确成果。而这个基本问题的解决方法,体现了统计理论中频率学派与贝叶斯学派的不同。

一、原始问题
这个问题在Wikipedia上有详细的介绍和解法:
频率学派和贝叶斯学派对这个问题的理解和解法是不同的,但他们求解时都用到了下面这个显而易见的结论:
已知N和k,则观测到的最大值为m的概率为C(m-1,k-1)/C(N,k),其中C(x,y)为从x中取y的组合数。即P(m|N,k)=C(m-1,k-1)/C(N,k)。
1. 频率学派
频率学派对原问题的结论是:
N=m(1+1/k)-1
这个结论有一个很直观的解释,就是平均来说观测到的k个序号应该是均匀等间隔的分布在1~N这个范围内的,而去掉观测到的最大的m,剩下的k-1个序号应该均匀等间隔的分布在1~(m-1)这个范围内,根据这个分布的间隔可以估计m距离最大值N的距离。
在上面的wikipedia的link里,推导用了一个很奇葩的方式(虽然它是对的。。),先求给定N,k情况下观测到的最大值的期望,再令这个期望等于m。于是这种方法得到的估计是一个无偏估计(估计值的数学期望与真实值相等),再说明这个估计是最小方差的无偏估计(MVUM)。
wiki页面里的置信区间计算(Confidence intervals部分)我也觉得不太能理解,是按给定N和k之后m的置信区间反推N的置信区间的。而且似乎假设了序号在1~N中为连续的实数分布。最终的结果,概率为r的置信区间是[m/q^{1/k}, m/p^{1/k}],其中p=(1-r)/2,q=(1+r)/2。
我觉得既然m的分布式都有了,感觉可以直接通过分布式求出置信区间啊。而且如果想求0%置信区间就会发现问题:得到的区间这时是一个点,这个点与无偏估计不同,那这个点的值是什么意思呢。。
2. 贝叶斯学派
Bayes学派的解释就清晰多了,但丫需要先对N的先验概率分布进行假设,但现在我们对N没有任何先验知识,最幸福的当然是假设一个在所有自然数上的均匀分布,但这样会导致每个点概率都是0,所以采用的方法是假设N有一个最大值\Omega,这样用Bayes公式就可以方便的进行估计,得到给定m,k的情况下,N的概率分布,式子是这个:
Inline image 1
注意这个式子里是用的n代替本文中的N。
如果在\Omega趋于无穷时上式的分母有限,可以去掉这个讨厌的\Omega,这样就幸福了。。但没有给出什么时候这个条件可以满足。。
几个简单的结论:所有数值中,概率最大的N的值(众数)为m,只有当k>=3时,N有有限的数学期望(m-1)(k-1)/(k-2),k>=4时N有有限的方差。

对原始问题的一些讨论:
1. 总之觉得频率学派的计算和解释不好理解,因为我对频率分析的方法不够熟悉,而在我的知识体系里面,Bayes的推导非常靠谱。但当k=1时,频率学派可以给出一个很Reasonable的解为2m-1,而Bayes方法没有\Omega的话N的期望是无穷大。。
2. 重新写一下频率学派的无偏估计:N=m-1+m/k,Bayes的数学期望:N=m-1+(m-1)/(k-2),两个式子只差最后一项,注意m一定大于k,所以m/k>1/2,所以Bayes的结果会较大,如果观测点的数目k越来最多,m也会越来越大,两者的值就很接近了。
3. 看起来两种方法的推导都是对的啊,为啥得到的结果会不一样呢?是因为求的东西不一样。频率学派是假设给定N,求m的数学期望,“无偏估计”是指在N确定的情况下,多次进行观测实验,对结果进行估计,得到的结果的数学期望就是真实值N;Bayes学派是认为观测m确定,求N的概率分布。
4. 等一下。。。上一条的解释里为什么没有提到k?m和k都是已知的一部分,数学上是两个地位等同的变量啊?再重新看看上一条的解释,如果把上一条中的"m"替换为"m和k",对于Bayes学派来说仍然说得通,但是频率学派就有问题了:为什么没有求k的数学期望呢?上面说的“多次进行实验”是在k和N确定的情况下进行实验的,为什么k要确定呢?Things are getting a little interesting ... 试试把频率学派推导中的m和k交换一下,第一步要求m和N确定情况下k的概率P(k|N,m),发现求不出来。。因为没有k的先验。。那为啥P(m|N,k)就可以求呢?为啥m就不需要先验呢?因为有了N和k,m的分布就唯一确定了,但是有了N和m,k的分布却无法知道。所以在频率学派的解释里,k和N被认为是确定的模型参数而非随机变量,而m是每次观测得到的随机变量。“无偏估计”是按每次观测m来说的。
5. 事情还没完。。。那按上面的解释,从频率学派的角度来讲,数学上N和k的地位就可以交换了,于是我们的问题如果换成:已知所有坦克的数量N和观测到的最大值m,估计观测的次数k。频率学派的解法应该是类似的。尝试解了一下,按原来的方法强制代入是可以求出估计值的:k=m/(N-m+1),但这感觉应该不是无偏估计,因为k和m的关系是非线性的。按频率学派的思想求解k的最小方差的无偏估计,直观感觉可做,但应该会比较麻烦。而反过来,如果Bayes学派来回答这个问题,需要假设k的先验,按定义域最简单的应该是[1,m]这个区间内自然数上的均匀分布(但这听起来也不合理啊)。

二、频率学派与Bayes学派
这个问题的确可以反映出两者的很多区别,翻了翻一些相关的资料总结一下我的理解:
1. 可以把所有已知的未知的数值分成两部分,一部分是模型参数,一部分是观测到的数据。频率学派认为,模型参数是客观存在的,固定的,比如“火星上是否有生命”,要么有要么没有,只是我们不知道而已,而观测到的数据是在确定的模型参数下依模型决定的分布进行采样的结果。而Bayes学派认为参数也是随机变量,所以需要参数的先验分布,也就是人们对参数的先验知识,但有时这个先验分布本身又是带参数的,这些参数就是“超参数”了,这样有可能会有多层到"超超..参数",比如LDA的各种变种,但最上层的参数我们仍然会认为是确定的,或者说,给一个确定的分布形式。
2. 看起来,如果把Bayes中最上层的“超参数”理解成模型参数的话,两者不就一样了?不是的,世界观的不同造成了方法论上的区别(这话还是很有道理的。。。),首先通常不会有频率学派的方法引入超参数,这本来就是个Bayes理论里的概念啊。。其次,频率学派更注重“点估计”(point estimation),得到一个待求参数的数值(无偏估计或MVUE),Bayes学派则会得到一个待求参数的分布,再计算期望方差什么的。对应的,频率学派可以用置信区间描述估计的准确程度,置信区间大约意思是这个确定的真实模型参数以概率r(比如95%)落入的区间范围。
3. 似乎从前频率学派是非常流行的,但慢慢Bayes学派在有方便描述的先验的领域取得了非常好的效果,方便引入domain knowledge,逐渐占了上风(这个理解可能会有偏颇)。
4. 似乎在概率推导时采用Bayes学派思想的很多,但evaluation中经常用到频率学派的置信区间,假设检验的计算方法。

参考文献:

三、原始问题的变化
一边看一边想到的。
1. 在坦克问题里观测到的序号是不会重复的,坦克被俘了就没了,下一次不会看到同样的坦克,如果每次记下序号之后再放回去(蛋疼。。。),也就是观测到的序号可以重复,结果会是如何?
不管对什么学派,都要把P(m|N,k)改为P(m|N,k)=(p(m,k)-p(m-1,k))/p(N,k),这里p(x,y)为x中取y的排列数,用小写p与大写P的概率区分。后面的做法应该是相似的。
2. 如果在上面1的基础上,已知k次观测中每次观测得到的序号从小到大为m_1, ..., m_k(于是m_k就是原始问题中的m),结果会是如何?
情况又有点不一样了。。对于Bayes学派,后验概率为:当N>=m_k时,P(N|.)正比于1/N^k,N取其他值时为0,于是N的众数为m_k,k<=2时数学期望无穷大,k>2时有有限的数学期望,没仔细算,但这个数学期望(形式非常简单,一个求和除以一个求和)很可能和原来不一样,因为N的分布和原来不一样。这个期望有时为超越数,参见:
对于频率学派,我不会做。。。
3. 在What If有一个相关的更有趣的Twitter时间线长度问题,中文版:
What If英文原版:

Thursday, October 10, 2013

美国通过的医改法(奥巴马医改方案)是什么样的?zz知乎

http://www.zhihu.com/question/20321772

奥巴马医保法案(Obamacare),即《病人保护和经济适用医疗法案》(Patient Protection and Affordable Care Act,PPACA)是这次美国大选的核心议题,在政治、经济和法律上有太多的东西需要讨论。这里先给出一些背景资料,等着看@talich老师吐槽。

曾参加共和党议员初选的龚小夏博士在《医改与美国政治》简述了医保法案的基本内容http://blog.caijing.com.cn/expert_article-151463-19930.shtml
这份医改法案从开始到完成,需要八年的时间。其内容大概有这样一些:

(1)保险公司必须在全国范围内对同一年龄与性别的群体提供同样金额的保险,不得根据投保者的身体状况来调整。也就是说,健康的人和有病的人都缴纳同样的保险费。而在医改之前,如果一个健康的人等到有病之后再去投保,保险公司有权拒绝或者收取更高的费用。

(2)扩大政府医保Medicaid的范围,收入在贫困线133%之下的人由政府来承担医疗保险费用。对贫困线收入400%以下的家庭提供保险补助。

(3)雇佣50人以上的公司,如果不给雇员买医疗保险,则必须缴纳罚款。不加入保险的个人也有可能被罚款。政府要求每个人都购买保险,并且根据你的收入水平来决定你是否能够买得起。如果收入不够,政府就会根据情况给一点补贴。但如果收入足够而拒绝购买,政府便会予以惩罚。

(4)政府对于老人医疗给予更多补贴,同时允许26岁以下的年轻人留在父母的家庭保险计划中。原来的规定是18岁以上的成年人必须自购保险。当然,这些不离家的年轻人的保险金仍然要由父母来支付。

(5)法律会对保险计划的细节作出规定,包括要支付什么样的药物、手术、检查,等等。
《哈佛经济学笔记》的作者陈晋在《模拟美国国会投票:为什么医改举步维艰》描述了民主和共和两党在医保法案上的重大分歧http://reading.caixin.com/111389/111407.html
共和党的声音

11月初的全国选举使共和党在众议院成为多数党,其党魁约翰•博纳(John Boehner)即将在2011年1月份成为众议院发言人。学生模拟他的思路,就2010年3月由奥巴马签署而成为法律的医疗体系改革方案(Patient Protection and Affordable Care Act,PPACA)发表政见。

首先,我们要把小公司、小企业的利益放在重要地位。美国经济主体由中小企业组成。如果他们购买医疗保险的价格因为入保人数小、分散风险的规模小而高于大公司为雇员买医疗保险的价格,那么小公司和大公司就不是在同一起跑线上竞争。我们主张,按照小公司的类别,例如建筑业、修理业等,让他们各自形成购买医疗保险的团体,增加他们的入保规模,这样保险公司就不能在价格上区别对待;就能减少小公司的运营成本,提高他们的竞争力。

其次,我们反对扩大政府医疗保险的覆盖面,主张建立私人医疗储蓄账户(Health Savings Account),让每个人对自己的身体健康和医疗成本负责。这种账户的运作类似于一些养老储蓄金账户(IRA 和 401k 等),主要目的是鼓励人们把一部分税前收入放进这个账户。无论就业还是失业,无论换多少工作,这个账户都跟随个人;一旦生病,专款专用。有这种账户的人不用为存入账户的那部分收入缴税,所以他们有动力存款。这是鼓励储蓄、抑制消费,尤其是减少人们依靠国家医疗保障的好方法。

最后,我们还主张允许保险公司跨州竞争,增加消费者选择,降低保险价格;对医疗花费高于一定额度的自费部分,国家要免去对这部分收入的税收,减少一次性巨额医疗费用对一般家庭的负担。

民主党的声音

模仿众议院民主党的学生的思路与卡特勒上课的思路如出一辙。卡特勒是民主党奥巴马从总统竞选到入主白宫过程中经济政策的智囊之一,也是起草PPACA议案的主要策划人之一。民主党对美国医疗体系的分析和矛头主要指向体系中的低效率、高浪费、高价格、行政人员臃肿、付账体系繁杂而且激励机制适得其反等缺陷。他们认为,其中最重要的问题是,美国还有大约有1/6的人没有医疗保险。民主党想通过提高医疗体系运作效率、减少浪费的办法来解决这些人的医疗保险问题。

美国GDP的16%花在医疗方面,但整个医疗体系却不尽如人意。各种抽样调查显示,人们的满意程度很低。没有医疗保险的人中有很大一部分是年轻人;他们不在大公司工作,没有公司提供的固定福利,也不愿意自费购买医疗保险,凭借身体健康、年富力强,选择待在医疗体系之外。对这些人,民主党主张要专门策划一种保险产品,叫“青年医疗”(Youth Care),让他们买得起医疗保险。让这部分人有着落的另一个办法是,让家庭医疗保险覆盖26岁以下的直系亲属,也就是说,这些人仍然可以停留在他们父母的医疗保险上,推迟成为“独立成年人”的年龄。另一部分没有医疗保险的人是年龄较大、体弱多病的人。这部分人最需要健康保险,也最没有经济实力购买保险。他们是私营保险公司最想甩掉的包袱,也是最想拒之门外的客户。只有依靠国家财政的支持,他们才能被纳入医疗体系之内。

民主党并不想削减国家医疗保险(医疗保证计划和医疗补助项目)的覆盖面和条件,只是想把国家医疗保险资源运作得更加高效,例如,提高医疗保险中自费部分的上限(医疗保险一般不报销小额医疗费用,这个额度叫deductible),从而不用为报销小额花销耗费行政资源。民主党主张提高医疗质量,降低医疗成本和价格,扩大加入医疗保险的人数。他们还建议,通过鼓励疾病预防、加强关于身体健康的公共宣传等措施来降低医疗费用

Sunday, September 29, 2013

科学是不是在抢占哲学和非理性的地盘zz

http://songshuhui.net/archives/85387

科学是不是在抢占哲学和非理性的地盘?
by Ent
科学松鼠会Yesterday, 07:38
本文作者:Ent

 【Does philosophy or science have all the big answers? 图片出处:http://www.theguardian.com/

本日志是针对《科学是什么?将来科学是不是会攻陷艺术?》 这个问题的答复和整理。顺带掺点儿私货。

有些东西在之前的帖子里也写过。

本科时候我选了张祥龙老师的《哲学导论》。其实内容绝大多数都还回去了,但老师在课堂上下的定义我还记得:哲学是“对边缘问题进行理性探索的学科”。

既然是理性的,那就不应该和科学发生本质的冲突。(可供参考的文章:《如果争论不欢而散,那么必有一方是虚伪的》)

而既然面向的是边缘问题,那就意味着它永远会走在科学前面,但也意味着它应该不断将不再边缘的领土让给其它学科。

泰勒斯时代,天文是哲学的领域,托勒密时代天文学已经可以自立了。

亚里士多德时代,博物也是哲学的领域,到了近代博物学同样自立了,并具体化成为物理、化学、生物、地学等等领域。

当下我们所看到的,是“人性理论”正在走向自立。柏拉图康德维特根斯坦这些人绞尽脑汁试图总结出的人性规律,正在由神经生物学、行为学、心理学、演化论和博弈论等学科逐一展开。当然,这对哲学家来说不是很舒服,但这并不是什么新鲜事情。It's time to move on.

同样的事情也发生在人文学科领域。事实上不仅哲学,相当一部分学科都会孕育出新的学科,只不过哲学作为“一切学科之母”,见证的成长最多而已。

所以,说“科学攻下了哲学的半壁江山”,这个说法我是不赞成的。这只是孩子长大了要离开母亲而已。会不会有一天所有的孩子都离去,留下母亲独身一人?我不知道,但就算有这么一天,也是极其遥远的。

2

但是科学除了逐渐接手哲学的领域之外,还总在试图插手传统上的“非理性”领域,比如艺术。这其实也不稀奇,哪个学科没越过界嘛。

一个典型的例子,是计算机作诗/作曲。

华兹华斯说,一切好诗都是强烈情感的自然流露。目前计算机显然还不能模拟人类情感,它们所用的手法无非是研究现有的人类语料,对其进行分解和重组,在这个过程中尽量用一些较大尺度的规则来约束。

这样的手法能产生出什么呢?David Cope编制了一个名为EMI的程序,用来“创作”历史上著名作曲家的作品,所用的基本原则正是分解-重组,而其成果已经可以蒙骗相当一部分听众——甚至包括一些专业人士。候世达在《如聆巴赫》一文中表达了他对此的担忧:

“触及我心灵最深处的东西……可能可以被简单的机制有效生产出来,这样的机制要比产生人类灵魂的复杂生物机制简单数千倍……令我产生了巨大的担忧……我悲观地罗列出了下面三个原因:
(1) (比如说) 肖邦要比我想象的浅薄得多。 (2) 音乐要比我想象的浅薄得多。 (3) 人类灵魂/心智要比我想象的浅薄得多。 ”

类似的,《一种宋词自动生成的遗传算法及其机器实现》这样的论文,也以相近的思路对宋词给出了生成方案。

也许候世达过虑了,EMI毕竟是仿作。人类情感的表现方式不计其数,用重组获得一个“崭新”、“肖邦风格”同时“不令人觉得情感空乏”的作品,并非什么难以想象的事情。我的猜测是,在计算机获得人类情感之前,它们无法完成真正的创新——发现一种新的人类体验,或者为一种旧的人类体验找到全新的表达方式。

但是,这个分解和重组的创作手法,也不是计算机发明的。每一个初学写诗词或者谱曲的人都尝试过堆砌辞藻,甚至有些人终生都只停留在这一步。有些人依靠拼凑和堆磊甚至可以成名、可以发大财、可以成为青春偶像,也许文艺界对此忿忿不平,但又没有一个简明有效的办法来告诉大众:这是堆出来的、是浅薄的。

可是我们现在有了计算机程序。不是大家都觉得计算机低人一等吗?那正好,我们用这些低贱的、机械化的程序也能制造出外表华丽、像模像样的文字和乐曲。对于那些依赖拼凑的文艺创作者,还有什么比这个打击更大的呢?还有什么更好的办法来去伪存真呢?把那些用堆砌模仿抄袭来沽名钓誉的人剔除出队伍,留下真正的伟大创新者,这难道不是文艺界几千年来的梦想吗?

和哲学的情形类似,这样的事情在历史上同样发生过了:摄影技术的诞生。它把那些只会技巧的人踢出艺术家的行列,同时又促生了一大批抛弃写实的伟大画家。我相信,诸如计算机诗词这样的成就,也会产生类似的结果。

3

但是,如果计算机真的掌握了人类情感又怎么办?如果人类情感真的被还原成了更低阶的东西又怎么办?

如果考虑情感的起源和作用的话,这种情况其实是可能发生的。

我们都熟悉一个现象:对某种事物的判断,第一印象往往是完全受感官支配的,但时间拖得越久,理性判断的成分就越大。于是我们习惯地认为,情感和感官直接相连,是低级的;而理性则是花时间处理“原始”资料的后果,是高级的。可为什么未经处理的原始材料反而会产生更强烈的冲击,并且往往淹没了理性呢?不合理啊。

但事实上,如果“高度适应环境的心灵乃是生存和繁殖的终极器官”(D.S.Wilson语),而情感和理性思考都能直接引导人类行为,那么二者大概都是有用的,区别只是在发挥作用的场合和前提条件。

毕竟在EEA里面,快速反应是至关重要的。我们无法对每一个环境都先理性分析再做出抉择。简单的情景,本能反应可以解决(比如见了狮子就跑);不着急的场景可以理性分析。但是复杂而紧迫的场景呢?譬如一个族人受了伤落在后面,帮他逃跑会拖累自己的速度,可能威胁自己的生存。这时是帮还是不帮?

友谊、同情、爱、怜悯什么的,都是在这种场合下才能发挥真正的用场。用演化博弈论或许可以找到一个最优策略,但是古人当然没有时间也没有能力去做。被自然选择留下来的也许只是简单的几个原则:

今人乍�孺子�入於井,皆有怵惕��之心;

敢问圣人之德,无以加於孝乎?

或者,山无陵, 江水为竭, 冬雷震震, 夏雨雪, 天地合, 乃敢与君绝。

这其实就是打包了的理性,是对于复杂收益方程的一个快速的近似解,恐怕从某种意义上,这个策略比单纯的理性还要高级。难怪很多时候,这个解的优先级是高于具体的理性分析的——尤其是时间紧迫下的第一反应。

而如果这样的收益方程能够用高速计算机瞬间得出最优解,那么人类理论上就不需要依靠感情来做出判断了。

这是一个糟糕的未来吗?
有一种可能是:感情因为不再生死攸关,而被人们遗忘。

但同样的可能是,感情因为不再关乎存亡,而得到了自由发展的空间。猎人站在旷野上时,心目中必须对猎物有一个精确的描绘,否则就要饿肚子;但是当他围着火堆坐在夜色下的山洞里时,他却可以自由地将脑海里的一切画在石壁上,而不必担心有任何不良后果。事实上,艺术之所以成为艺术,正是和人类直接存亡脱节的后果。

我不知道哪一种会成为现实,我甚至不敢说哪一种更好,因为我个人的好恶对未来大趋势是毫无意义的。但至少,当人意识到未来不止一种可能时,总是会有成就感的。

Friday, September 20, 2013

非原生Android系统Download Manager/Android OS偷流量解决方法

Nexus 4重刷了AOKP的rom之后,在大约8月1日左右出现这样的问题:有时在无wifi情况下,系统会显示叫"Android OS"的应用在很短的时间内会消耗很大的流量,几分钟就会走几兆,如果装了腾讯手机管家,会显示消耗流量的程序是"Download manager"。
产生这个的原因应该是非官方的系统没有处理好OTA自动更新,非官方系统是无法通过OTA自动更新的,但原生系统可以。大约在2013.8.1左右原生系统会通过OTA自动从Android 4.2更新到4.3,非原生系统检测到了新版本并不断尝试下载,实际上是永远无法更新的。。。
解决的方法是修改系统里的文件/system/build.prop(需要root),让系统觉得自己已经是新系统了,具体来说是修改ro.build.fingerprint=...这一行,具体修改成什么在Google上搜一下build.prop ro.build.fingerprint 4.3就能找到,对于4.3来说应该修改成:

ro.build.fingerprint=google/occam/mako:4.3/JWR66V/737497:user/release-keys

尝试直接用文本编辑器修改是不行的,可能是由于更改了文件的属性,会使手机重启无法进入系统(幸亏我有一个recovery的备份。。。)。可以随便在Google play上搜一个修改build.prop的工具,比如System Tuner,用软件改就可以了。

还有一个方式应该也可以:下载一个防火墙工具,比如DroidWall,在里面禁止"10010: Download Manager"通过移动网络访问数据,试了一下似乎对Google同步和邮件推送的服务都没有什么影响。这个不是很确定,可以尝试一下。

Sunday, August 18, 2013

读书笔记摘抄13.04.06~13.08.18

前一版的读书笔记在这里:

生活中的经济学 茅于轼
经济学是一门研究怎样作决策的学问。它所研究的对象,既包括政策制定者如何“经国济世”的大谋略,也包括一家一户、摊贩厂商怎样“打醋买盐”的小计划。所以,无论你是鲜衣华盖之辈,还是引丰贩浆之流,经济学都与你息息相关。 经济学主要研究两个问题:一是“资源的稀缺性”,二是“人的积极性”
怎样利用这有限的资源最大限度地满足人们现在和将来的需要,是经济学研究的第一大问题。第二大问题是如何调动人的积极性的问题,即如何通过某种制度安排来促使人们努力工作。
(1)市场经济学对个人行为的一个基本的假设是:人是“理性”的。理性意味着:每个人都会在给定的(法规、政策)约束条件下争取自身的最大利益。
(2)市场经济学假定交易者在市场交换中对他所买卖的商品或劳务有着完全的选择自由。

如果以 Friends 里面的六人行契约(多人信任忠诚互助关系)代替或补充婚姻的形式,能否解决存在于一对一的婚姻中的现实问题? 知乎
现存民主制度的相对先进之一,就在于它充分估计了人性的复杂,又高度地信赖、鼓励和保护人性中的积极层面(如用优良的教育投入提高人的素养,用新闻的独立和高质量来保障公众的知晓权,公选)。

沧海横流方显英雄本色,大疫来时足见中医真容 李清晨

N/A
旅行就是离开自己呆腻了的地方,去别人呆腻了的地方看看。

Dioxygen difluoride (O2F2) is so volatile that it makes almost any organic substance ignite and explode at any temperature hotter than 300°F below zero. It can literally make ice catch fire.

记得豆瓣还是哪里的程序员自述,计算机科班教育不会开脚本语言课,但谁真正掌握了一门脚本语言,说明他是爱计算机的,所以我们会招聘他。

烧纸钱真的会造成阴间的通货膨胀吗? 知乎

你是想读书,还是想读完书?
如果我们不能专注于它本身并享受这种过程,那整个生活就会变成急不可耐的煎熬。

(我擦这个的出处被删了。。)
我现在每天知识的「获取-处理-整理存档」强度依仗着Google Reader、Pocket、Evernote、Dropbox、Toodledo、以及每天在背后默默地为我转移上百信息息的ifttt。这些产品背后最核心的便是API和RSS。但RSS奄奄一息,API也命途多舛。尽管笔者一直避免使用国产,避免使用小众,不惜每月支付各种费用,尽量选择一款靠谱的公司,让我不要担忧数据的迁移和安全,将自己的注意力集中到内容中去。可当互联网巨头Google都可以关闭它曾经的主力产品Reader时,笔者不禁又读了一下上面提到的名字,这些现在的明星值得我赋予多大的信任,产生多大的依赖?

[What if]闰秒 科学松鼠会
地球自转一直在变慢,这很麻烦。麻烦的原因之一是这使得时间标准更加复杂。我们已经有太多时间标准了,包括:
国际原子时(TAI):以一台原子钟作为时标,无视任何地球运动
零类世界时(UT0)及一类世界时(UT1):基于精确测量的地球自转周期
GPS时间系统:GPS卫星所使用的时间标准
协调世界时(UTC):计算机所使用的时间标准,有点像TAI,但为了与地球同步需要进行闰秒调整。
地球时(TDT),质心力学时(TDB),质心坐标时(TCB)及地心坐标时(TCG):全都是更糟糕的标准
这会带来各种令人头疼的琐事,特别是对程序员来说。比如你手机的GPS时间会与系统时间相差16秒。因为手机系统使用的是协调世界时(有闰秒),而GPS时间并没有闰秒。这两个时间在1980年1月曾经是同步的,但今后大概再也不会了。

为什么 500 欧元现钞成为洗钱者、逃税者,甚至是恐怖分子的最爱,被认为也许是世界「最肮脏货币」?
重量轻、体积小、而且分割方便、兑换方便、清点鉴别容易,还有比这个更合适的洗钱工具了吗?

为什么自从有了人之后,再没有一只猴子变成人了?
一般人知道猴子不能变成人是常识问题, 但是猴子们身为和人类一本同源的灵长目确实还是有进化的时间和空间的. 所以, 猴子不可能变成人类, 但是却可以进化成和人类相似的高智慧灵长目生命体.

为什么饮料瓶一般都是圆形的,牛奶瓶都是方形的?
好多人提到「牛奶可����」,我是��局的… 我不知道���的到底有多好,有多少人�此迷�上了���;但是如果你除了����「水�」,���曼昆的「宏����」和平狄克的「微����」,你就知道,不是所有的��都可以用����解答。牛奶可�的��也一�。

传言「飞行员和雷达站的工作人员大多生女孩」是否可信?
事实上如果做一个 Pearson's chi-squared test 就会发现这个分布有很大机会纯属偶然,没有强有力的证据。

比特�——史上最�狂的���� BYVoid

解谜禽流感
流感病毒是一种RNA病毒,它的RNA基因组分为7-8个节段,分别编码不同的病毒蛋白质。根据内部蛋白抗原性的不同,流感病毒可被分为甲型(A型),乙型(B型)和丙型(C型)三种,其中乙型和丙型流感病毒 通常仅引起局限性流行或散发。流感病毒颗粒外面包裹着一个双层的脂质膜,在脂质膜上面含有几种不同的病毒蛋白质,其中血凝素(HA)和神经氨酸酶(NA)分别具有不同的亚型。对于甲型流感病毒,现在已经至少发现了17种HA亚型(H1~H17)和10种NA亚型(N1~N10),新闻里听到的H7N9就是根据这两种蛋白亚型做出的分类。理论上,HA和NA共有170种不同的组合,预示着可能存在170种不同亚型的甲型流感病毒,这些流感病毒在感染宿主类型,感染力和致病力等方面各有不同。
会导致禽类出现严重疾病的主要是高致病性H5和H7两个亚型。人流感病毒则主要是H1,H2和H3三个亚型。

藏地密码 何马
(话说这本书充斥着伪科学...)
科学界曾做过这样一个推论,如果人类没有进化成这个世界最高级的动物,那么最有可能取代人的动物里,狼是排在第二位的。” 唐敏道:“那第一呢?” “海豚。”方新教授答道:“第三是大象。"

论文写作如何区分引用和抄袭?
别人的文字用引号引起来,别人的观点把来源标出来。就像填借书卡一样简单。所以如果根本没有过抄袭的念头,并按照学术规范操作,这界线是很难碰到的。那些特别关心界线在哪里的,要么是法律研究者,要么是想在界线附近占便宜的。

二战后物理学最重要的实验有哪些?
Bell不等式简言之,即是说任何定域隐变量理论不可能重复量子力学的全部统计预言。其所要验证的,是量子力学和爱因斯坦的「隐变量」(局域实在论)哪个才是真实世界的理论。这是非常基础的物理乃至哲学问题。1972年,Stuart Freedman和John Clauser做了第一个Bell不等式实验。1981-82年,Alain Aspect等人第一次在精确意义上对EPR作出检验,证实了「量子纠缠」的存在。至今40年间,大量实验表明Bell不等式不成立,即量子力学才是正确的理论,世界在本质上是非局域的。
Higgs粒子是粒子物理标准模型最后一个待发现的粒子,因此被称为「天杀的粒子」(Goddammed particle)。后为和谐起见,被媒体称为「上帝粒子」(God particle)。

雅安地震中的谣言战争
关于地震期间的谣言 1,徐敬女孩转发的(号码是个吸费电话)。2,成雅高速公路收费(早不收了)。3,地震解密之祖的预测(1500次预测准5次)。4,跳伞的照片(那是滑翔伞的广告)。5,航空公司恢复原价(航空公司大部分都把飞机投入紧急救援了)。5,说磁铁能预报地震的(等TM余震来了你丫就是杀人)。6,温总理去了救灾现场(那图是去年的,而且没下雨,要连接?7,雅安震后的熊猫(那图是06年的) 爱国贼比卖国贼更可怕 。

真正永久使用的电子邮件 月光 (williamlong)
2007年的时候,中国雅虎曾高调宣布推出“无限容量”的免费“终生邮箱”,该“终生邮箱”整合了雅虎相册、音乐盒、音乐搜索等实用功能,这种不负责任的宣传当初也吸引了不少中国用户,2009年10月30日,中国雅虎关闭了雅虎空间服务,取消相册功能,但因为有许多用户没能及时备份照片,引发很多用户的不满,而雅虎邮箱的关闭给用户造成的麻烦远比关闭相册要多的多。

到底找到一个困难问题的答案困难,还是证明一个困难问题的答案正确困难? �浩
问题中提到的两个问题分别是「找到答案」和「验证答案」,而验证答案的方法可以是先找到答案,再与要验证的答案比较(假设这步很简单)。
因此「验证答案」不会比「找到答案」更困难:会「找到答案」就一定会「验证答案」,而会「验证答案」不一定就会「找到答案」。

信息图示:那些转发过万的地震“常识”都是错的 一起剥坚果
包括生命三角,动物预测地震等等:http://songshuhui.net/archives/80723

TED 演讲中「视频版权生态系统」所采用的技术,除了版权管理外,是否还能有其它的商业应用?
上述演讲中Youtube使用的Content ID技术实际上是一种数字指纹技术,简单来讲就是把视频音频分割成很多片断,然后针对每个片段(对于视频来讲是一帧或几帧)提取一些不变的特征量。特征量的提取是一个技术门槛比较高的活,通常都是一些小而精的高科技创业公司/团队做出的成果。比如YouTube用的音频指纹技术实际上是从Audible Magic这家公司搞来的。

为什么美国学生学的数学比我们简单却还能做出很牛逼的东西? Dave Geng
"美国给予不热爱数学的学生最基础的数学教育,而给予热爱数学的天才最高水平的数学教育。"

哲学和科学有什么关系吗? �浩
智慧不一定要通过学习哲学来获得。但就算不懂哲学,你也有自己的哲学。

员工代打卡怎么办? 
人类的智力,很大程度上用来探索如何利用各种规则,以及,钻各种规则的空子,无论是自然规律,还是人为定出的规章制度。
海底捞是个好例子。海底捞的每个服务员都有给客人加菜或免单的权力,这里就有一个问题,如何防止服务员滥用权力?流程和制度在这里很难设计,得需要多细、多全面的条文啊。海底捞的做法是依赖基层管理者的能力,信任他们的判断,通过人的经验和智力很容易识别问题。
很多时候,当我们设计出一个制度,就必然会有很多漏洞,为了堵住这些漏洞,又不得不殃及更多的人。其实不用怕有人会钻空子,一个钻空子的人,必然会在很多地方暴露出问题,只有有一个好的管理团队,你可以很快识别出这些  ,然后有针对性的处理,不应该影响到其他人舒服的状态。

如何做一名优秀的博士生 jerrydeng
他们的成长过程差别极大,性格、能力也各有不同。应该说,没有任何一个学生可以简单地遵循另外一个优秀科学家的足迹脱颖而出。从这个意义上讲,科学家的成功是不可能复制的。但是,优秀科学家常常具备的共同特点应该对年轻学生有很大启发。

为什么人越想忍住笑却越想笑? 程毅南
如何控制情感?摆在你面前大致上有三条路:1. 压制这种情感,2. 重新理解、改变这种情感的含义,进而达到控制其影响的作用3. 分心。很多各种各样的研究,包括认知心理学研究、大脑神经分析研究、性格心理学研究、对抑郁症和焦虑症的临床心理学研究,都找到了统一的结果,那就是:控制情感的方式中,1最没用,2最有用。

为什么电影里拆炸弹都是红线蓝线选一根? 权力
全国范围内,一两年也不会有人真实的手工拆除一颗炸弹(训练不算)。也就是说,如果正确处理爆炸物的方法有五种,那手工拆除法是最最不可取的一种,也是出现频率最低的一种,低到有些公安系统的拆弹专家终其一生也没在实战中手工拆过炸弹,甚至见都没见过。
一个专门做炸弹的小伙子跟我说过“我做的炸弹要是铁了心不想让你拆,打死你你都拆不了,拆一百回爆一百回”

做手术前患者一定要签同意书吗? 欧阳宏
医疗授权人有明确的梯级层次,下级层次只应该在上级失效时起效,并且在上级恢复时重新授权。梯次大致如下:1 自己(成年)2 夫妻3 父母子女4 其他亲属朋友5 领导6 路人

鸟妈妈会抛弃被人类摸过的小鸟吗? 鸟窝里的猫妖
小鸡小鸭如果出壳后第一眼看到的是人类,就会跟在人类后面,把人类当成自己的母亲。这就是“亲子印痕”的一个例证。

物理学的困顿:宇宙学心脏上的黑暗虚空
现在的主流宇宙学模型与观测事实符合得极好,只是必须用到太多不明“真相”的黑暗成分。
空间中普通物质的平均密度为每立方米0.426幺克(1幺克等于10-24克,0.426幺克大约相当于0.25个质子),占宇宙总能量密度的4.5%。暗物质占了22.5%,暗能量则占到了73%。基于广义相对论的大爆炸宇宙模型与我们的观测符合得极好——只要我们能够坦然接受“虚构”出来的那95.5%的宇宙。

[What if] Sunset on the British Empire
Every night, around midnight GMT, the Sun sets on the Cayman Islands, and doesn't rise over the British Indian Ocean Territory until after 1:00 AM. For that hour, the little Pitcairn Islands in the South Pacific are the only British territory in the Sun.

论语中有一些糟粕的东西为什么没有删掉?
今人喜欢捧古人,说他们的哲学多么多么高明,艺术多么多么伟大,给人一种错觉,似乎都是不可超越的巅峰,让现代很多人也开始崇拜起来,似乎觉得古人真的有多厉害,但实际上并不是这样的,无论从哪方面讲,今人的成就都要远高于古人。就拿勾践墓出土的那个什么宝剑来说,一些书上说古人这种冶炼水平今人至今难以超越,其实就是放屁,且不说这把剑在当时是举国之力铸造的,单说现在我们要是不计成本的话,完全可以用纳米技术搞出一把史上最牛逼之剑。古人的哲学思想,包括儒释道,在今人看来都是粗糙的,含糊的,经不起推敲的,后人给这些哲学上打了无数的补丁,勉强让他自圆其说,但如同那个悖论所说的,一门被打了无数补丁的哲学还能算是原来那个哲学吗?和康德黑格尔金岳霖冯友兰的哲学著作相比,论语中哪里有那么详细和成体系的描述?艺术的,科学的领域里就更多了。所以,很多现代人被另一些现代人迷惑了,觉得古人真的好牛逼好牛逼,然后一个不好的影响就是开始崇拜古人,比如孔子都说什么什么了,你能有孔子聪明吗?居然还敢说他的不对?实际上孔子说的不一定对,如果他说的直到现在都还是对的话,那么中国人三千年的文明延续,居然毫无发展,那就成笑话了。

五子棋最好的开局方式是什么?
无禁手的五子棋是很容易获胜的,事实上有禁手的五子棋也早就研究出必胜了。google一下“花浦月必胜” 背一下,基本上一下午就记住了。(玩过五子棋,有一定基础的同学认真看一下午)

素数并不孤独
当陈景润做出哥德巴赫猜想的突破性结果(1 + 2)时,他得到的评价是“榨干了筛法的最后一滴油”。因为如果只靠筛法,是无法证明哥德巴赫猜想的。(1 + 2)是筛法所能做到的最好结果。

什么是 Dirty hack?
以不符合设计原理 / 不易维护 / 不易调整 / 不够健壮 / 不够美观的方式解决问题。比如水管连接处生了锈开始漏——
把水管系统整个重新布置成没有接头的管线,叫做 refactor
按原样把锈掉的水管换新的,叫做 proper fix
把水管拆下来用防渗胶带缠住螺丝纹再装回去,叫做 patch
叫你女朋友先把漏水的地方捂住然后下面放个脸盆接漏水,叫做 monkey patch
用电焊把接头焊起来,叫做 hack 用口香糖塞住漏缝然后用水泥把接头浇筑起来,结果因为那一大坨太重,下面不得不放一根木棍撑着,叫做 dirty hack
Dirty hack 不一定总是坏事,如果你没有脸盆、电焊、管钳、女朋友、新水管和防渗胶带,而这套水管系统反正就快整个报废了的话。

Extreme Boating
Bromine and mercury are the only known pure elements that are liquid at room temperature. (ok就是溴和汞了。。)

被水母蜇了怎么办?浇尿止疼可不靠谱
清水和尿液都是不靠谱的,而就近可以获得的海水则有效得多。醋和小苏打都可以用来中和水母刺细胞的毒液,但要根据水母的种类,以及蛰伤的部位来选择处理的方法。

千万别上魔术的当
Arthur Clarke(1917—2008),英国科幻作家、科学家,他提出了克拉克三法则。前两条是:一,德劭望重的科学家说某事是可能的,那几乎可以肯定他是正确的,但若说某事是不可能的,那他大抵是错误的;二,发见可能之边界的唯一办法是稍许越界,突入不可能之境地。第三法则:“大凡足够高深之技术,都与魔法无异。”
尼文(Larry Niven)法则:“大凡足够高深之魔法,都与技术无异。”
哈佛医学院神经生物学家Margaret Livingstone在《科学》杂志发表文章认为,蒙娜丽莎的神秘微笑是观察者眼睛运动的结果。她认为,人眼通过两个不同的区域来观察世界。被称为视网膜的中央小窝让人们看到颜色,认出符号,辨别细节。分布在中央小窝周围的区域是人们区别黑白、捕捉运动、分辨阴影的区域。在欣赏《蒙娜丽莎》时,观察者首先注意到的是人物的眼睛。当观察者眼睛的中心区在蒙娜丽莎的眼睛上时,“外围区”视线会落在她的嘴上。由于外围视区不注重细节,因此很快注意到蒙娜丽莎颧骨的阴影,这些恰恰使人们意识到笑容的存在。但当直接观察蒙娜丽莎的嘴时,人眼的中心区不会注意到阴影,所以人们永远无法从她的嘴上看到笑意。

疫苗接种,打还是不打?
天花是除鼠疫之外最恐怖的人类杀手,其恐怖之处在于:①通过空气传播,传染性极强;②高达30%的病死率;③幸存者的皮肤会遗留大量疤痕,天花也由此得名。

看静图会动,压力山大?
边漂移错觉的神经基础——具有方向选择性的神经元对不同的对比度刺激做出的反应时间存在差异,视觉神经元对高对比度刺激的反应更快
2006年,北冈的研究则发现周边漂移错觉中最具迷惑性的颜色组合是蓝色-黄色和红色-绿色【6】,“旋蛇”也开始有了各种色彩更绚丽的版本。

如何解释能让普通人清晰地理解「银行挤兑」是什么意思?
商业银行由于【信用危机】引起市场【恐慌】,大量存款客户【同时】要求提取现金,而此时银行【存款准备金】不足,无法应对流动性需求。银行所面临的这种危机就叫【挤兑】。

女人的乳房、中药以及其他
究发现,即使对这类病人使用并无实际疗效的安慰剂,其“疗效”亦可达10-30%,某些得到病人高度信赖的医生,使用安慰剂甚至能达到50-80%的疗效——这也部分地解释了在现代医学出现之前,仍会有所谓的名医大师备受推崇。

牛奶是否只是成功营销?长期喝牛奶有好处还是坏处? talich
只有四岁以下的孩子是没有乳糖耐受问题的。世界上的大部分人,都是有一定程度的乳糖不耐受。只有北欧人口,有接近 100% 的乳糖耐受率,到南欧北非,就只有 40%,非洲和亚洲人口里,可能只有三成是乳糖耐受的。

染色体数最多,DNA所含总信息量最大的生物分别是什么? 吴亮
目前已知染色体数最多的生物是一个科,叫做Ophioglossum,中文名为瓶尔小草科瓶�小草科,属于蕨类,这个科的物种最多可有1260条染色体。
现今公认基因组最大的生物是Paris japonica,中文名叫衣笠草,含有约1500亿个碱基对(150Gb),大约是人类的50倍。

猪肝明目?悠着点!
猪肝中丰富的维生素A对于维持视力的确有一些好处,但猪肝不是获取维生素A的唯一途径,也不是获取维生素A的最佳食物来源。猪肝作为动物的重要代谢器官,更容易富集一些重金属、兽药等有害物质残留,猪肝的胆固醇含量也很高,为了所谓的“明目”效果而吃大量的猪肝,并不是好的选择。

打破致癌物的“核威慑” 科学松鼠会
IARC分级的定义如下图所示,1类是明确的人类致癌物;2A类是很可能导致人类癌症;2B类是可能导致人类癌症;3类是不明确是否能导致人类癌症;4类是不太可能导致人类癌症。
1类致癌有些是名声在外,比如黄曲霉毒素、苯并芘、香烟、槟榔。有一些多少听说过,比如砷、镉、苯、甲醇、氡、煤焦油、X射线、二�英。还有一些非常常见,可很多人意识不到,比如酒精和酒精饮料、中式咸鱼、太阳辐射、紫外线、室内烧煤、橡胶工业和木屑。等等,木屑君,你在这里是肿么一回事?是的,你没看错,木屑!
2类致癌里有一些也是新闻里的常客,比如丙烯酰胺、黄曲霉毒素M1、铅、4-甲基咪唑。但也有一些也会让你颇感意外,比如咖啡、汽油。还有些会让你觉得内牛满面,比如理发师、干洗业、消防员。你们要珍惜绳命啊!
3类致癌其实证据很不充分,有些你也许还能理解,但有些真的可以毁三观了,比如煤粉(啊?)、三氧化二铁(铁锈)、咖啡因(咖啡、可乐、红牛)、胆固醇(体内就有)、静态磁场(地球算吗?)、单宁酸和单宁(很多食物中都有)、茶(这...)、维生素K(这...)。这。还。让。不。让。人。活。了!

ATM 机的结构是什么? 王焱欣
(长知识了,下面的评论也很有趣。。)
存取款一体机,存款和取款都是会验钞的,而且是取款验钞一次,存款验钞两次,所以1、取款不会取到假钱。银行对这事非常重视,而我从业几年中,从没有银行对我们投诉这点。(有些取款机是十多年的机型早该淘汰了,取款不验钞,自然有可能取到假钱)。

走近量子纠缠(6)——帮倒忙的贝尔 科学松鼠会
实际上在目前,‘多世界诠释’已经代替‘哥本哈根诠释’,成为了量子论解释的主流派。

饕餮盛宴:黑洞如何迅猛扩张?
科学家推测几乎每个大型星系的中心都有一个巨大的黑洞,包括我们的星系。银河系的质量是太阳的500万倍。在大约5千万光年之外,有一个达到60亿倍太阳质量的黑洞,它的事件视界(物体一旦越过即无法逃脱的边界)大小几乎是海王星轨道的五倍。

政府定点酒店乱象:色情业进入 黄色消费开发票
全国酒店业会议性收入占全部酒店业总收入的23%左右,而这其中有25%则是政府的会议性收入。

走近量子纠缠(7)——贝尔不等式
(这一节终于开始讲贝尔不等式了。。。)

Monday, June 3, 2013

别想说服我zz

有时我们会有意无意的关闭自己理性的一面而去选择符合自己认知或有利于自己的观点,从而使得很难被说服和接受正确的观点。如果能更多的认识到这一点,可以使自己更加容易接受不同的观点。

这篇文章引起我很多共鸣,看完了再转念一想,是不是这本身也是confirmation bias呢。。。

Highlight用粗体标记。

以下zz自学而时嘻之post

(《东方早报上海书评》,201362)

霍金写《时间简史》和《大设计》二书,都有一个被所有人忽视了的第二作者,列纳德蒙洛迪诺。这两本书能够畅销,我怀疑霍金本人的贡献也许仅仅是他的名气,因为公众其实并不真喜欢科学知识哪怕是霍金的知识。而霍金也深知每一个数学公式都能让这本书的销量减少一半。如果真有读者能在这两本霍金的书中获得阅读上的乐趣,很可能要在相当的程度上归功于蒙洛迪诺。从他独立完成的Subliminal(《潜意识:控制你行为的秘密》)这本书来看,蒙洛迪诺真的是个非常会写书的人。他完全了解读者想看什么。

看完《潜意识》,我也知道读者想看什么了。在书中蒙洛迪诺讲了个很有意思的笑话。说有一个白人天主教徒来到天堂门口想要进去,他跟守门人列举了自己的种种善行,但守门人说:可以,不过你还必须能够正确拼写一个单词才能进。”"哪个单词?”"上帝。”"GOD.”"你进去吧。

一个犹太人来到天堂门口,他同样被要求正确拼写一个单词才能进。守门人考他的单词仍然是上帝。这个单词非常简单,所以他同样拼写正确,于是也进去了。

故事最后一个黑人来到天堂门口,他面临同样的规则。但是守门人让他拼写的单词是,捷克斯洛伐克

这个笑话的寓意是像我们这样受过高等教育的人接收信息都有一个门槛,低于这个门槛的我们根本不看。我的门槛就相当高,谁想向我说明一个什么科学事实,我一般都要求他出具学术论文。比如作为一个爱国者,我对中医的存废和转基因的好坏这两个问题非常感兴趣,特别关注相关的论文。然而就算是论文也有好有坏,要知道有的论文根本不严谨。所以一篇论文质量好坏,我也有自己的判断标准,达到我的标准才算得上是严谨的好论文:

如果这篇论文是说中医有效的,我就要求它拼写上帝。如果这篇论文是说转基因无害的,我就要求它拼写捷克斯洛伐克

你不用笑我,你也有同样的毛病。蒙洛迪诺说,人做判断的时候有两种机制:一种是科学家机制,先有证据再下结论;一种是律师机制,先有了结论再去找证据。世界上科学家很少,你猜绝大多数人使用什么机制思考?每个人都爱看能印证自己已有观念的东西。我们不但不爱看,而且还会直接忽略,那些不符合我们已有观念的证据。

有人拿芝加哥大学的研究生做了个实验。研究者根据某个容易引起对立观点的议题,比如是否应该禁枪,伪造了两篇学术报告,受试者随机地只能看到其中一篇。这两篇报告的研究方法乃至写法都完全一样,只有数据对调,这样其结果分别对一种观点有利。受试者们被要求评价其所看到的这篇报告是否在科学上足够严谨。结果,如果受试者看到的报告符合他原本就支持的观点,那么他就会对这个报告的研究方法评价很高;如果是他反对的观点,那么他就会给这个报告挑毛病。

去年方舟子大战韩寒,双方阵营都使用各种技术手段寻找证据,写了各种论文,来证明韩寒的确有代笔或者的确没有代笔。有谁记得看到过有人说本阵营的论文不够严谨的么?都认为对方的论文才是胡扯。这远远不是最可怕的。如果我反对一个结论而你支持,那么当我看一篇支持这个结论的论文就会不自觉地用更高的标准去看,就会认为这个论文不行;而你,因为支持这个观点,则会认为这个论文很好如此一来我不就认为你是弱智了么?于是两个对立阵营都会认为对方是弱智。一切都可以在潜意识发生。

认为别人弱智和被别人认为是弱智,其实也没那么可怕。真正可怕的是媒体也参与到观念的战争之中。

如果人已经被各种观念分成了阵营,那么媒体就不应该追求什么客观中立,因为没人爱看客观中立的东西!媒体应该怎么做呢?技术活动家Clay Johnson  The Information Diet (《信息食谱》)这本书里,给我们介绍了美国收视率最高的新闻台 Fox News (福克斯新闻)的成功秘密。尼克松时期,媒体人Roger Ailes有感于当时媒体只知道报道政府的负面消息,认为必须建立一个拥护政府的新闻系统。然而事实证明Fox News 的成功并不在于其拥护政府 —  它只拥护共和党政府 —  而在于Ailes有最先进的新闻理念:

第一,有线频道这么多,你不可能,也没必要取悦所有观众。你只要迎合一个特定观众群体就可以了。第二,要提供有强烈主观观点的新闻。

给观众想要的东西,比给观众事实更能赚钱。观众想要什么呢?娱乐和确认。观众需要你的新闻能用娱乐的方式确认他们已有的观念。福克斯新闻台选择的观众群体,是美国的保守派。每当美国发生枪击事件,不管有多少媒体呼吁禁枪,福克斯新闻一定强调拥枪权他们会找一个有枪的采访对象,说如果我拿着枪在现场就可以制止惨案的发生。美国对外军事行动,福克斯新闻一定持强硬的支持态度,如果有谁敢提出质疑,他就会被说成不爱国。哪怕在其网站上转发一篇美联社消息,福克斯新闻都要做一番字词上的修改来取悦保守派,比如《选民对经济的担心给奥巴马带来新麻烦》这个标题被改成了《奥巴马跟白人妇女有大问题》。

我们可以想象知识分子一定不喜欢福克斯新闻。的确没有哪个大学教授宣称自己爱看这个台。就连我当初物理系毕业典礼,系里请来的演讲嘉宾都说物理学有什么用呢?至少能让你学会判断福克斯新闻说的都是什么玩应儿。可是如果你认为福克斯新闻这么做是为了宣传某种意识形态,你就错了。他们唯一的目的是赚钱。

比如修改新闻标题这件事,其实从技术角度说并不是网站编辑的选择,而是读者自己的选择。很多新闻网站,比如赫芬顿邮报(The Huffington Post),使用一个叫做 multivariate testing(也叫A/B testing)的技术:在一篇文章刚贴出来的时候,读者打开网站首页看到的是随机显示的这篇文章的两个不同标题之一,网站会在五分钟内判断哪个标题获得的点击率更高,然后就统一使用这个标题。事实证明在读者的选择下最后胜出的标题都是耸人听闻型的。

福克斯新闻的收视率在美国遥遥领先于其他新闻台。因为CNN在北京奥运传递火炬期间对中国的歪曲报道,很多人认为CNN是个有政治色彩的媒体,其实CNN得算是相当中立的这也是为什么它的收视率现在节节败退。2012年《经济学人》的报道,倾向自由派的MSNBC现在收视排名第二,CNN只得第三,而这两个台的收视率加起来也比不上福克斯。乔布斯1996年接受《连线》采访,对这个现象有一个非常好的评价:

当你年轻的时候,你看着电视就会想,这里面一定有阴谋。电视台想把我们变傻。可是等你长大一点,你发现不是这么回事儿。电视台的业务就是人们想要什么它们就给什么。这个想法更令人沮丧。阴谋论还算乐观的!至少你还有个坏人可以打,我们还可以革命!而现实是电视台只不过给我们想要的东西。

美国人玩的这一套,中国也有人早就玩明白了。今天我们的媒体和网络上有各种观点鲜明的文章和报道,它们或者骂得特别犀利,或者捧得特别动人,观众看得畅快淋漓,十分过瘾。但是这些文章提出什么切实可行的解决方案没有?说过什么能够修正我们现有思想的新信息没有?它们只是在迎合和肯定人们已有的观念而已。因为它们的生产者知道他们不需要取悦所有人。他们只要能让自己的粉丝基本盘高兴就已经足够获利的了。他们是肯定贩卖者。政治辩论?其实是一种娱乐。

王小波写过一篇《花刺子模信使问题》,感慨中国人(主要是领导们)听不得坏消息,一旦学者敢提供坏消息就恨不得把他们像花刺子模的信使一样杀掉。我想引用乔布斯的话:王小波说的太乐观了。真正令人沮丧的现实是所有国家的所有人都有花刺子模君王的毛病,而且他们的做法不是杀掉坏消息,而是只听消息那些能印证我们观念的消息。

这个毛病叫做确认偏误confirmation bias)。如果你已经开始相信一个什么东西了,那么你就会主动寻找能够增强这种相信的信息,乃至不顾事实。这样一旦我们有了某种偏见,我们就无法改变主意了。《信息食谱》说,Emory 大学教授 Drew Westen 实验发现,对于那些已经支持强烈共和党或民主党的学生来说,如果你给他们关于其支持的党的负面新闻,功能性磁共振成像(fMRI)会显示这些人大脑中负责逻辑推理的区域关闭了,而负责感情的区域却激活了!换句话说他会变得不讲理只讲情。因为他们感到受到了威胁。这个受威胁的感情会让你把相反的事实用来加强自己的错误信念。社会学家Brendan Nyhan甚至发现了一个逆火效应:你给一个保守派人士看关于布什的减税政策并没有带来经济增长的文章之后,他居然反而更相信减税可以带来经济增长。

在确认偏误的作用下,任何新证据都有可能被忽略,甚至被对立的双方都用来加强自己的观念。这就是为什么每一次枪击事件之后禁枪派和拥枪派都变得更加强硬。另一本书,Future Babble(《未来乱语》)讲了个更有意思的实验。实验者给每个受试学生发一套性格测试题让他们做,然后说根据每个人的答案给其各自分析出来了一份性格概况,让学生评价这个概况描写的准不准。结果学生们纷纷表示这个说的就是自己。而事实是所有人拿到的性格概况都是完全一样的!人自动就愿意看到说的跟自己一样的地方,并忽略不一样的地方。

可能有人以为只有文化程度比较低的人才会陷入确认偏误,文化程度越高就越能客观判断。事实并非如此。在某些问题上,甚至是文化程度越高的人群,思想越容易两极分化。

一个有意思的议题是全球变暖。过去十几年来媒体充斥着各种关于全球变暖的科学报道和专家评论,这些报道可以大致分成两派:一派认为人类活动产生的二氧化碳是全球变暖的罪魁祸首,如果不采取激烈手段限制生产,未来气候就会不堪设想;一派则认为气候变化是个复杂问题,现有的模型并不可靠,二氧化碳没那么可怕。如果你对这个问题不感兴趣,你根本就不会被这些争论所影响。而《信息食谱》告诉我们,对全球变暖的观点分歧最大的人群,恰恰是那些对这方面有很多了解的人。调查显示越是文化程度高的共和党人,越不相信全球变暖是人为原因造成的;越是文化程度高的民主党人,则越相信这一点。

如果谁想看看这个争论严重到什么程度,可以去看《经济学人》最近一篇报道2013330日)的读者评论。这篇文章说尽管过去几年人类排放的二氧化碳不顾气候学家警告而继续增加,可是地球平均温度却并没有升高,远低于科学模型的预测。文章下面的评论水平跟新浪网足球新闻的评论不可同日而语,敢在这说话的可能没有高中生。评论者们摆事实讲道理,列举各种论文链接和数据,然而其观点仍然鲜明地分成了两派。就连这篇文章本身写得够不够合理,都有巨大的争议。

观念的两极分化并不仅限于政治,人们可以因为很多事情进入不同阵营,而且一旦选了边就会为自己阵营而战。你的手机是苹果的还是安卓的?这两个阵营的人不但互相鄙视,而且有时候能上升到认为对方是邪恶势力的程度。人们对品牌的忠诚似乎跟政治意识形态没什么区别。我们看苹果新产品发布会,再看看美国大选前两党的集会,会发现二者极为相似,全都伴随着狂热的粉丝关注和激动的专家评论。

也许因为手机已经买了或者政治态度已经表过了,人们为了付出的沉没成本而不得不死命拥护自己的派别,也许是为了表明自己的身份,也许是为了寻找一种归属感。但不管是什么,这种阵营划分肯定不是各人科学推理的结果。根据诺贝尔奖得主 Robert Aumann 1976年的论文Agreeing to Disagree,说如果是两个理性而真诚的真理追求者争论问题,争论的结果必然是二人达成一致。那么现实生活中有多少真理追求者呢?认知科学家 Hugo Mercier Dan Sperber 2011年的一篇论文,Why do humans reason?,甚至认为人的逻辑推理能力本来就不是用来追求真理的,而是用来说服别人的。也就是说我们天生就都是律师思维,我们的大脑本来就是个争论设备。这也许是因为进化总是奖励那些能说服别人的人,而不是那些能发现真理的人吧。

互联网很可能加剧了人们观念阵营的划分。在网上你连换台都不用,推荐引擎自动根据你的喜好提供信息。我相信气候学家对全球变暖的预测大大言过其实,我认为决不可以废除死刑,我使用苹果手机,我还要求豆浆必须是甜的豆腐脑必须是咸的在这些原则问题上我从来不跟人开玩笑。如果微博上有人发出违背我理念的言论我怎么办?我果断取消对他的关注。我们完全有权这么做,难道有人上微博是为了找气生么?可是如果人人都只接收符合自己观点的信息,甚至只跟与自己志同道合的人交流,那么就会形成一个回音室效应echo chamber effect)。人们的观念将会变得越来越极端。

有鉴于此,Johnson 号召我们改变对信息的消费方式。他提出的核心建议是Consume deliberately. Take in information over affirmation.”— 要主动刻意地消费,吸收有可能修正我们观念的新信息,而不是吸收对我们现有观念的肯定。这其实是非常高的要求。要做到这些,我们必须避免那些预设立场的说服式文章,尽可能地接触第一手资料,为此甚至要有直接阅读数据的能力。可是有多少人能亲自研读各项经济指标再判断房价是否过高呢?对大多数人来说现在房价是高是低只与一个因素有关:他是不是已经买了房。

我建议把上面那两句英文刻 iPad 上。不过我发现最新的一系列针对社交网络的研究显示,也许回音室效应并不存在。有人对Facebook的朋友关系研究发现人们并没有只跟与自己政见相同的人交朋友。我们在网上辩得不可开交,生活中仍然可以跟对方辩友隔着一张桌子吃饭。哪怕在网上,统计表明人们的关注集群也不是按照政治立场划分,而更多的是按照视野大小划分的。更进一步,我们也许过高估计了对方阵营的极端程度。有人通过调查统计美国两党的支持者,发现如果一个人对某个政治方向有强烈的偏好,那么他对对方阵营的政治偏好,往往会有更高的估计。可能绝大多数人根本没那么极端,可能互联网本身就是个极端的人抒发极端思想的地方。Twitter的一个研究表明其上的言论跟传统的民意测验相比,在很多问题(尽管不是所有问题)上更加偏向自由派。一般人并没有像Twitter上的这帮人那样拥护奥巴马,或者支持同性恋婚姻合法化。互联网不是一个调查民意的好地方。

但不论如何,确认偏误是个普遍存在的人类特性,而且有人正在利用这个特性牟利。错误观点一旦占了大多数,正确的做法就可能不会被执行。既然改变那些已有成见的人的观念如此困难,也许双方阵营真正值得做的只有争取中间派。今年的 Nature Climate Change 上发表的一篇论文说,虽然不可能改变那些已经对全球变暖学说有强烈看法的人的观点,但是可以用亲身经历来影响那些对气候变化并没有什么成见的人,而这些人占美国成年人口的75%一个策略是可以告诉一个中间派,你爱去凿冰捕鱼的那个地方,现在每年的冰冻期比十九世纪少了好几个星期,来吸引其注意力。

这个真不错。当然在我这个坚定的全球变暖学说质疑派看来,那些看见自己家门口的池塘不结冰了就认为全球变暖的人纯属弱智

Sunday, May 12, 2013

毛发会越剃越浓,越硬,越黑吗zz

一个我一直很好奇的问题。。。

流言: 剪头发、剃毛会使毛发变得更多更粗更黑。

真相: 对于这个流言,真是几家欢喜几家愁。头发少的人希望通过常剪头发来增多头发,需要除体毛的女士担心体毛越来越多,越来越粗,越来越黑。实际上,毛发是多是少,是粗是细,是黑是浅,都和你是剪了它,剃了它没有关系,这些是由基因和荷尔蒙决定的[1]。直接影响毛发生长的毛囊,它藏在皮肤的深处,仅仅是表面的剪切,不会影响到毛囊,所以也就不会对毛发的状态产生什么影响[2]。

如果这个流言是真的,那就不会有为秃头而烦恼的人了。天天刮胡子的男士,也会渐渐都变成是大络腮胡子的,而实际上并非如此。毛发的数量是由毛囊数量决定的,剪头发并不能改变毛囊数量。另外,长的头发会显得更软一些,剪短以后显得更硬些,这是因为人的错觉。类似的例子,同样都是竹子,长的时候能折弯,切短了想把它弄弯就很难了。至于粗细问题,发梢的部位因为一段时间的摩擦,会比刚长出来的部分细一些。颜色的问题也是类似,暴露在空气中,阳光的照射会使头发的颜色变浅,使得新长出来的头发看起来要更黑。但这一些不同和剪头发本身都是没有关系的。

结论: 谣言破解

参考资料:

Monday, May 6, 2013

n维单位球上任意两个向量交角的统计性质

想到这个问题源自于Domingos在A few useful things to know about machine learning提到,在高维的空间中,任意两个向量都几乎是正交的。我们可以从"n维单位球上任意两个向量交角"的统计性质来验证。

我们的目标是要在n维单位球面上独立同分布的均匀采样两个向量x与y,计算两者交角Inline image 4的统计性质。

其实这个问题挺简单的,只要稍微推一下。
首先显然我们并不需要采样两个向量,由对称性,只需假设其中一个向量固定在(1,0,...),求另一个向量与它的交角就可以了。
当n=2时,2维单位球面就是2维平面上的单位圆,向量的均匀采样可以方便的用在[0,2pi]上均匀采样向量的方位角来实现。这时可以方便的求取夹角Inline image 5的期望与方差:




当n为任意数时,求这一夹角的余弦比直接求夹角更方便。
由对称性很容易得到夹角余弦的数学期望为0:

对于方差,问题的关键在于如何均匀的在n维球面上均匀采样,Wikipedia提供了常用的标准做法:独立同分布的采样n个标准正态分布作为n个分量并将其归一化到单位球面上:

证明很容易,直接想一想就出来了,根本原因是归一化前的随机向量的概率分布只与其到原点的距离有关。
所以可以得到夹角余弦的方差:

由对称性很容易得到:

总之结论是夹角余弦的期望为0(对应两向量正交),方差随n增大而成反比的减小,也就是说,当维度n非常大时,任意两向量几乎以概率1正交。高维情况下不少事情和我们想象的很不一样。

p.s.1: 本文的公式由
生成,其中前两个小\theta是在线的图片,而其他是生成后离线下载下来的,用于之后测试在线的公式生成是否靠谱。
p.s.2: 这个问题做面试题不错。。。