2015 New Year Resolution

回首2014年,全年在这里一共写了一篇文章,就是new year resolution……

去年的resolution是三件事:记账,多读书和多运动。现在回顾起来,记账和运动算是做到了,但是多读书这件事,还很是不足啊。

那今年的resolution就这个吧,多读书。

不过怎么才算多呢?作为程序猿,显然需要一个量化指标。那就做个简单的定义吧:全年读书12本,也就是平均每月一本吧。

为了监督自己,每读完一本,都要在这里写个读书笔记。

至于读什么,我觉得不重要,计算机,统计,机器学习,小说,历史什么的,我觉得都挺好。

希望能延续2014年的执行力,完成2015的resolution!

2013双十一杂想

  1. 各家电商的业绩都比去年大幅提升,背后是网民对电商越来越高的认可度和信赖度。
  2. 长出来的销售额是从哪里来的?首先是透支了至少一个月左右的正常网上购物,其次应该也抢了一部分线下店的份额。
  3. 物流毫无疑问是接下来要接受考验的行业,不过经过几年的双十一,人们在这个时期的心理期待应该也降下来了。但是物流企业对破损等质量问题还是应该多注意。
  4. 树大招风,有关部门对电商这块肥肉会盯得越来越近,征税什么的可能会提速。
  5. 如果还能有另外一个行业像物流行业这样得到电商行业的大力提升,将会是一件很好的事情。不过也可能有,但是我不知道。
  6. 新势力颠覆旧势力真的是分分钟的事情,百货大楼等商业地产如果不抓紧时间采取行动,真的有可能很快枯萎。电商相比实体店最大的劣势目前就是购物体验和售后保障,而且更重要的是前者,这方面我觉得需要新技术的出现来再推电商一把。
  7. 秉着近攻远交的原则,电商在对抗线下店的同时,应该大力和其他相关行业建立更好的行业间关系,这对于抢占地盘有好处。
  8. 不写了,该工作了。

推荐一个ML/DM的学习资源

最近发现一位大牛组织的ML/DM学习资源集合:http://www.autonlab.org/tutorials/

里面的东西都是该大牛自己的Slides,估计是自己上课时候用过的吧。

主要特点:

  1. 分块式。这是和其他学习资源 最大的区别。这个资源中的内容没有严格的先后顺序,每个slide都比较独立,我感觉适合有一定基础,并且知道自己在哪方面需要加强的同学。
  2. 内容风趣。对于很多晦涩的内容都有比较贴近实际的阐释方法,还有大量的例子,适合自学。

希望对有需要的人有帮助。

Too Fast to Live, Too Yougn to Die

这一年,如同之前的每一年,过得很快,而时间就像自由落体,总是越来越快。

我们的人生就像是110米栏的跑道,有着那么一些固定的目标,我们站在起跑线的时候,就已经能够望见所有的目标:考大学,找工作,找对象,买房,买车,生孩子,孩子考大学……嗯,你没有听错,我不是在讲放羊娃的故事。

比赛开始之后,我们在满场亲戚朋友的关注下奋力向前冲,是不是在跑道的那一端,也有一块金牌等着我们?

我想了想,还真有,那就是上帝的召唤。

就像这几天网上流行的一句话:“人生就是九吨饭,谁先吃完谁先走”。这句话从吃这个维度无情而又准确地说穿了人生。

但是我想广大吃货应该明白一个道理:吃饭不在于吃得快,而在于吃得香。当然也有一种动物的人生意义就在于比谁吃得快,但是可惜这种动物最后基本都被我们吃了。

仔细想来,这种追求所谓“中国速度”的生活方式,比那种动物又强了多少呢?

吃得太快,活得太快,其实都没有味道。

李宗盛的《忙与盲》中说道:“忙是为了自己的理想还是为了不让别人失望?”

那我们跑这么快,是为了自己心中的金牌,还是为了不让满场的观众失望?

Too fast to live, too young to die.
这句话,说得就是你。

祝大家新年快乐。

2013,活得慢一点。

驳一个著名伪命题

人生最大的挑战不是客服具体的困难,而是寻找人生的方向。

常常听人把这样一句话作为座右铭:“上帝,请赐予我平静去接受我无法改变的,给予我勇气去改变我能改变的,赐我智慧辨别这两者的区别。”

其实这是一个伪命题,更是一种懦弱的人生观。

你能否改变什么,其实很大程度上取决于你的决心,是一个以你的决心为自变量的函数,而不是一个天生就确定的常数。
所以当你从那句话中错误地认为它是一个常数时,你的人生已经失去了很多的可能性。

换句话说,这世上不存在那样的智慧,能让你”辨别这两者的区别“,因为这两者之间的界限,随时在变化,而且严重依赖于你是否相信那句话。如果你相信,那么你无法改变的就会变得更多,如果你不相信,那么你的世界就多了很多可能性。

当年乔布斯封闭系统的苹果电脑惨败给了开放的PC,如果拥有上述“智慧”的人在如此长时间、彻底的失败之下恐怕就会认为这是不可改变的,认为封闭的做法是不行的,进而就会“接受”这样的事实,转而使用其他策略。但是老乔的态度和决心让他坚持了下来,在多少年后Android到处冒尖儿的时候,用同样封闭的iPhone和iPad赢得了天下。你或许会争辩说这些对于老乔来说属于可以改变的范畴,那么,既然当时那么落魄的老乔都可以做到今天的成就,我们对自己的要求有时是不是太低了呢?

所以,总结来说,喜欢那句话的人,其实是在逃避,希望不通过艰辛的努力和反复的失败就能有明确的人生方向,但是,寻找人生的方向,正是人生最大的挑战。

想象力的极限

有时候我会想,人类发展的极限会在哪里?会是什么时候?以及,会在什么情况下到达?

最近的感觉是,想象力的极限处,就是人类发展的极限处。

古时候的人就很富于想象力,对于飞翔,天空,乃至宇宙的各种遐想和向往屡见于各种文献中。而且古人也做了很多尝试,我还清楚得记得中国科技馆五层的那个中国人坐在椅子上,后面帮着爆竹准备飞天的雕像。进入近现代以来,对于未来的各种想象更是空前繁荣。记得前几年有人翻出了50年前一个人写的文章,大意是展望50年后的生活。文章对以前提到的对未来新技术的想象逐一进行了分析,发现诸如自动驾驶,定时厨具等等已经实现,有一些还没有实现,但是人类一直在那个方向上努力着。到了现在,医学都已经到了能把基因提溜出来改一改再放回去治病的程度,相信只要是想到的东西,总有一天会做到。

但是这种想法也会带给我困扰,那就是,我们想象力的极限究竟在哪里?这个问题其实挺奇怪的,就像是一个计算机在问自己:我究竟具有多大的智能水平?这种问题似乎只有上一个层次的东西才能回答。比如计算机的这个问题只有人类能回答,那么人类的问题呢?如果没有上帝的存在,谁来回答?谁来在人类无助的时候引导我们?还是说,想象力这种东西,是不会有极限的?

有没有极限我不敢说,但是我知道在某个历史时期内,或许还是有的。比如我们现在对待超自然现象的态度,一部分人坚持那是不存在的,他们只承认现有的科学,认为相信超自然的人都是不科学的。但是我倒认为,“超自然”这个名字的另一个叫法就是“待发现”,我们因为自己还没有走到那里,就说那里不存在,是否自大了一些?

人啊,最拿手的果然就是折腾自己。

关于“三扇门智力题”的概率解法

相信很多人对于这个三扇门的智力题都不陌生,这个题在西方叫做Monty Hall Problem:你去参加一个抽奖活动,面前有三扇门,其中一扇后面是大奖,其余两扇后面啥都没有。你选了一扇(不失一般性我们假设你选择了1号门),之后主持人在剩下的两扇门中打开一扇,并且告诉你他打开的是一扇空门,现在给你一个机会:你可以坚持你第一次的选择,也可以更换选择,换为选择剩下的那一扇,问题是,你换不换?或者说,换和不换两种策略中,哪一种策略的中奖概率更大?当然,正确答案是要换。

关于这个题的描述性解法在网上有很多,所谓描述性解法,就是试图用自然语言来帮你理解为什么要换。这种解法可谓是多种多样,最近在看一些概率的书,碰巧书中又提到了这个问题,是作为习题让读者用概率来证明,所以我今天打算用正式的概率语言来描述这个问题,目的在于揭示一个道理:自然界有很多骗人的东西,所以要相信科学,而不是直觉。

概括来说,这个题目的陷阱就在于混淆了先验概率和后验概率,也就是条件概率。大部分做错的人都是误以为判断的依据是先验概率,所以觉得换不换无所谓。但这是错的,这个题目的关键就是要计算后验概率。

概率说到底是一种推测,是一种判断,但应该是合理的推测和判断。在没有任何信息的时候,以及假设随机分布的情况下,我们认为三扇门中奖几率相等是合理的。但是做第二次选择时就不一样了,因为在本题目中,你做第二次选择的时候不是像做第一次选择时没有任何信息,你是有信息的,主持人给你揭开的空门就是你所持有的信息,所以在拥有一定信息量的时候,我们做出的判断就不一样了。这就是所谓的条件概率,也就是后验概率(这两者可能不严格完全等价,但是我觉得不妨碍理解)。举个例子,再不给你任何其他信息的情况下,我问你,如果来自两个足球联赛的冠军进行一场比赛,他们取胜的概率分别是多少?这个时候,在没有任何其他信息的情况下,你可以假设分别都是50%,这种假设可以认为是合理的。但是如果我告诉你,这两个联赛分别是西甲和中超的话,你仍然认为都是50%显然就很不合理了(你当然可以出于某种原因坚持你的判断,但它会和实际情况相差较远)。

那么如何用概率的方式解决这个问题呢?其实很简单。首先需要做一些形式定义。我们用随机变量X表示大奖所在的门的号码,显然X的样本空间为{1,2,3},用Y表示主持人揭开的那一扇门,由于我们不失一般性的假设了你选了1号门,所以Y的样本空间为{2,3}。那么要解决本题目需要求的是什么呢?我们现在知道了某一扇门是空的,我们要做的就是:如果主持人揭开的是2号门,比较P(X = 1 | Y = 2) 和 P(X = 3 | Y = 2);如果揭开的是3号门,比较P(X = 1 | Y = 3) 和 P(X = 2 | Y = 3)。在这两个比较中,如果前者大,则说明坚持选择是对的,如果后者大,说明换是对的,如果两者相等,那就说明无所谓。

要计算上面几个概率值,我们首先列出如下的联合概率分布表,表里的每个数值都很容易理解:

X\Y Y = 1 Y = 2 Y = 3
X = 1 0 1/2 * 1/3 1/2 * 1/3
X = 2 0 0 1 * 1/3
X = 3 0 1 * 1/3 0
总计 0 1/2 1/2

 

那么,根据条件概率的公式可以算出P(X = 1 | Y = 2)  = P(X = 1, Y = 2) / P(Y = 2) = (1/6) /(1/2) = 1 / 3, P(X = 3 | Y = 2) = P(X = 3, Y = 2) / P( Y = 2) = (1 / 3) / ( 1/ 2) = 2 / 3。

显然,后者更大,也就是说,更换选择能使你的中奖概率变为原来的二倍。Y = 3的情况计算过程是相同的。

于是我们得出结论:在题目所给情况下,更换选择能够提高中奖几率。

有时靠感觉能解决问题,但有时感觉也会坑了你。比如这个题目,靠直观上去理解是比较难以理解的,但是一旦落到概率计算上来,其实很简单,而且更可靠,不需要你动很多所谓机灵的脑子。关键是要搞清楚题目的数学本质。