backup

从工具的奴隶到工具的主人

作者:王垠

当我高中毕业进入大学计算机系的时候,辅导员对我们说:“你们不要只学书本知识,也要多见识一下业界的动态,比如去电脑城看看人家怎么装机。”当然他说我们要多动手,多长见识,这是对的。不过如果成天就研究怎么“装机”,研究哪种主板配哪种 CPU 之类的东西,你恐怕以后就只有去电脑城卖电脑了。

本科的时候,我经常发现一些同学不来上数学课。后来却发现他们在宿舍自己写程序,对MFC之类的东西津津乐道,引以为豪。当然会用MFC没有什么不好,可是如果你完全沉迷于这些东西,恐怕就完全局限于Windows的一些表面现象了。

所以我在大学的时候就开始折腾Linux,因为它貌似让我能够“深入”到计算机内部。那个时候,书店里只有一本 Linux 的书,封面非常简陋。这是一本非常古老的书,它教的是怎样得到Slackware Linux,然后把它从二三十张软盘装到电脑上。总之,我就是这样开始使用Linux的。后来我就走火入魔了,有时候上课居然在看GCC的内部结构文档。后来我又开始折腾TeX,把TeXbook都看了两遍,恁是用它写了我的本科毕业论文。

后来进了清华,因为不满意有人嘲笑我用Linux这种“像DOS的东西”,以及国内网站都对Windows和IE进行“优化”的情况,就写了个“完全用Linux工作”。确实,会Linux的人现在更容易找到工作,更容易被人当成高手。但是那些工具同样的奴役了我,经常以一些雕虫小技而自豪,让我看不到如何才能设计出新的,更好的东西。当它们的设计改变的时候,我就会像奴隶一样被牵着鼻子走。

这也许就是为什么我在清华的图书馆发现《SICP》的时候如此的欣喜。那本书是崭新的,后面的借书记录几乎是空白的。这些看似简单的东西教会我的,却比那些大部头和各种 HOWTO 教会我的更多,因为它们教会我的是WHY,而不只是HOW。当时我就发现,虽然自认为是一个“资深”的研究生,学过那么多种程序语言,各种系统工具甚至内核实现,可是相对于SICP的认识深度,我其实几乎完全不会写程序!在第三章,SICP 教会了我如何实现一个面向对象系统。这是我第一次感觉到自己真正的在开始认识和控制自己所用的工具。

因为通常人们认为Scheme不是一个“实用”的语言,没有很多“库”可以用,效率也不高,而Common Lisp是“工业标准”,再加上Paul Graham文章的怂恿,所以我就开始了解Common Lisp。在那段时间,我看了Paul Graham的《On Lisp》和Peter Norvig的 《Paradigms of Artificial Intelligence Programming》。怎么说呢?当时我以为自己学到很多,可是现在看来,它们教会我的并没有《SICP》的东西那么精髓和深刻。开头以为一山还有一山高,最后回头望去,其实复杂的东西并不比简单的好。现在当我再看Paul Graham和Peter Norvig的文章,就觉得相当幼稚了,而且有很大的宗教成分。

进入Cornell之后,因为Cornell的程序语言课是用SML的,我才真正的开始学习“静态类型”的函数式语言。之前在清华的时候,有个同学建议我试试ML和Haskell,可是因为我对Lisp 的执着,把他的话当成了耳边风。当然现在用上SML就免不了发现ML的类型系统的一些挠人的问题,所以我就开始了解Haskell,并且由于它看似优美的设计,我把“终极语言”的希望寄托于它。我开始着迷一些像monads,type class,lazy evaluation 一类的东西,看Simon Peyton Jones的一些关于函数式语言编译器的书。以至于走火入魔,对其它一切“常规”语言都持鄙视态度,看到什么都说“那只不过是个monad”。虽然有些语言被鄙视是合理的,有些却是被错怪了的。后来我也发现monad, type class, lazy evaluation这些东西其实并不是什么包治百病的灵丹妙药。

但是我很不喜欢Cornell的压抑气氛,所以最后决定离开。在不知何去何从的时候,我发了一封email给曾经给过我fellowship的IU教授Doug Hofstadter(《GEB》的作者)。我说我不知道该怎么办,后悔来了 Cornell,我现在对函数式语言感兴趣。他跟我说,IU的Dan Friedman就是做函数式语言的啊,你跟他联系一下,就说是我介绍你来的。我开头看过一点The Little Schemer,跟小人书似的,所以还以为Friedman是个年轻小伙。当我联系上Friedman的时候,他貌似早就认识我了一样。他说当年你的申请材料非常impressive,可惜你最后没有选择我们。你要知道,世界上最重要的不是名气,而是找到赏识你,能够跟你融洽共事的人。你的材料都还在,我会请委员会重新考虑你的申请。IU 的名气实在不大,而Friedman 实在是太谦虚了,所以连跟他打电话都没有明确表态想来IU,只是说“我考虑一下……”这就是我怎么进入IU的。

Friedman的教学真的有一手。虽然每个人对他看法不同,但是有几个最重要的地方他的指点是帮了我大忙的。有人可能想象不到,在Scheme这种动态类型语言的“老槽”,其实有人对“静态类型系统”的理解如此深刻。也就是在Friedman的指点下,我发现类型推导系统不过是一种“抽象解释”,而各种所谓的“typing rule”,不过是抽象解释器里面的分支语句。我后来就通过这个“直觉”,再加上Friedman的逻辑语言miniKanren里面对逻辑变量和unification的实现,做出了一个Hindley-Milner类型推导系统(HM 系统),也就是ML和 Haskell的类型系统。虽然我在Cornell的课程作业里实现过一个HM系统,但是直到Friedman的提点,我才明白了它“为什么”是那个样子,以至于达到更加优美的实现。后来经他一句话点拨,我又写出了一个lazy evaluation的解释器(也就是Haskell的语义),才发现原来SPJ的书里所谓的“graph reduction”,不过就是如此简单的思想。只不过在SPJ的书里,细节掩盖了本质。后来我在之前的HM系统之上做了一个非常小的改动,就实现了type class的功能,并且比Haskell的实现更加灵活。所以,就此我基本上掌握了ML和Haskell的理论精髓。

可是类型系统却貌似一个无止境的东西。在ML的系统之上,还有System F,Fw,MLF,Martin Lof Type Theory,CIC,……怎么没完没了?我一直觉得这些东西过度复杂,有那个必要吗?直到Amal Ahmed来到IU,我才相信了自己的感觉。然而,这却是以一种“反面”的方式达到的。

Amal是著名的Andrew Appel(“虎书”的作者)的学生,在类型系统和编译器的逻辑验证方面做过很多工作。可是她比较让人受不了,她总是显得好像自己是这里唯一懂得类型的人,而其他人都是类型白痴。她不时的提到跟Bob Harper, Benjamin Pierce等类型大牛一起合作的事情。如果你问她什么问题,她经常会回答你:“Bob Harper说……”她提到一个术语的时候总是把它说得无比神奇,把它的提出者的名字叫得异常响亮。有一次她上课给我们讲System F,我问她,为什么这个系统有两个“binder”,貌似太复杂了,为什么不能只用一个?她没有正面回答,而是嘲讽似的说:“不是你说可以就可以的。它就是这个样子的。”后来我却发现其实有另外一个系统,它只有一个binder,而且设计得更加简洁。后来我又在课程的 ailing list 了一个问题,质疑一个编译器验证方面的概念。本来是纯粹的学术讨论,却发现这封email根本没有发到全班同学信箱里,被Amal给moderate掉了!

看到这种种诡异的行为,我才意识到原来学术界存在各种“帮派”。即使一些人的理论完全被更简单的理论超越,他们也会为“自己人”的理论说话,让你搞不清到底什么好,什么不好。所以后来我对一些类型系统,以及Hoare Logic一类的“程序逻辑”产生了怀疑。我的课程project报告,就是指出Hoare Logic和Separation Logic所能完成的功能,其实用“符号执行”或者“model checking”就能完成。而这些程序逻辑所做的事情,不过是把程序翻译成了等价的逻辑表达式而已。到时候你要得知这些逻辑表达式的真伪,又必须经过一个类似程序分析的过程,所以这些逻辑只不过让你白走了一些弯路。当Amal听完我的报告,勉强的笑着说:“你告诉了我们这个结论,可是你能用它来做什么呢?”我才发现原来透彻的看法,并不一定能带来认同。人们都太喜欢“发明”东西,却不喜欢“归并”和“简化”东西。

可是这类型系统的迷雾却始终没有散去,像一座大山压在我头上。我不满意Haskell和ML的类型系统,又觉得System F等过于复杂。可是由于它们的“理论性”和它们创造者的“权威”,我不敢断定自己的看法就不是偏颇的。对付疑惑和恐惧的办法就是面对它们,看透它们,消灭它们。于是,我利用一个independent study的时间,独立实现了一个类型系统。我试图让它极度的简单,却又“包罗万象”。经过一番努力,这个类型系统“涵盖”了System F, MLF 以及另外一些类似系统的推导功能,却不直接“实现”他们。后来我就开始试图让它涵盖一种非常强大的类型系统,叫做intersection types。这种类型系统的研究已经进行了20多年,它不需要程序员写任何类型标记,却可以给任何“停机”的程序以类型。著名的Benjamin Pierce当年的博士论文,就是有关intersection types的。没几天,我就对自己的系统稍作改动,让它涵盖了一种最强大的intersection type系统(System I)的所有功能。然而我却很快发现这个系统是不能实用的,因为它在进行类型推导的时候相当于是在运行这个程序,这样类型推导的计算复杂度就会跟这个程序一样。这肯定是完全不能接受的。后来我才发现,原来已经有人指出了 System I 的这个问题。但是由于我事先实现了这个系统,所以我直接的看到了这个结论,而不需要通过繁琐的证明。

所以,我对类型推导的探索就这样到达了一个终点。我的类型系统是如此的简单,以至于我看到了类型推导的本质,而不需要记住复杂的符号和推理规则。我的系统在去掉了intersection type之后,仍然比System F和MLF都要强大。我也看到了Hindley-Milner系统里面的一个严重问题,它导致了这几十年来很多对于相关类型系统的研究,其实是在解决一个根本不存在的问题。而自动定理证明的研究者们,却直接的“绕过”了这个问题。这也就是我为什么开始对自动定理证明开始感兴趣。

后来对自动定理证明,Partial Evaluation 和 supercompilation的探索,让我看到那些看似高深的Martin Lof Type Theory, Linear Logic等概念,其实不过也就是用不同的说法来重复相同的话题。具体的内容我现在还不想谈,但是我清楚的看到在“形式化”的美丽外衣下,其实有很多等价的,重复的,无聊的东西。与其继续“钻研”它们,反复的叨咕差不多的内容,还不如用它们的“精髓”来做点有用的事情。

所以到现在,我已经基本上摆脱了几乎所有程序语言,编译器,类型系统,操作系统,逻辑推理系统给我设置的思维障碍。它们对我来说不再是什么神物,它们的设计者对我来说也不再是高不可攀的权威。我很开心,经过这段漫长的探索,让我自己的思想得到了解放,翻身成为了这些工具的主人。虽然我看到某些理论工具的研究恐怕早就已经到达路的尽头,然而它们里面隐含的美却是无价和永恒的。这种美让我对这个世界的许多其它方面有了焕然一新的看法。一个工具的价值不在于它自己,而在于你如何利用它创造出对人有益的东西,以及如何让更多的人掌握它。这就是我打算现在去做的。


评论
热度(15)

© backup | Powered by LOFTER