Victor Zue是MIT EECS的co-director,负责领导CSAIL(原先的人工智能实验室),在MIT有37年了,主要研究方向是语音识别。Frank Soong是微软亚洲研究院的研究员,Stanford毕业,在贝尔实验室工作过,也是研究语音识别的。两位都是很厉害的人。这次他们来可能是宣传,合作,也可能是学术访问,总之让HIT这个地处东北一隅的学校的学生们有了一个难得的和大师接触的机会。
总体的印象是,越是牛人越不显得自己清高,从Victor和Frank的言谈举止上看不出是那么有名气的人来,倒是像两位富有经验的老师,又是两个对学术精深的学者。和他们的交流没有想像的那么拘束,Victor更是要我们直呼其名,不过依然能感觉到他们那逼人的智慧的气息,因此必须提醒自己保持一个清醒的头脑以便能听懂他们在讲什么。
昨天的报告会上,Victor概要地介绍了CSAIL的主要工作成就,show了不少好玩的demos,从中可以看出那些他们所研究的东西在应用领域中的价值。一个收获就是,在MIT这种地方,研究中时刻关注的是研究的价值,他们选题或者组织结构优化的角度都是从研究价值出发,比如他们的很多成果都有实际的模型,可以让人感受到科技的神奇。相比之下我的思路就比较窄,仅仅是集中在如何解决领域中公认的难题,而没有去考虑这些难题的价值。或许该做的,应该是提出难题,提出对这个方向发展有益的难题。由于这种从价值出发的角度,首当其冲的是知识的结构,不知道别人,至少我的知识结构都是从教科书上,前辈的论文上得来的。同样的知识,不同的人对它有不同的角度,可能最初提出问题的人认为这个角度看,对于其应用的问题更明晰一些。然而越是通用的知识,使用的角度就越多,我们遇到的问题很可能不是当初作者遇到的那种情形,因此,我们需要从我们需要的角度重新构建知识体系,知识结构。而很多新的领域就是这样诞生的。
技术上看,CSAIL的很多工作都是应用了多种信息渠道(或者信息媒介)。他们融合了语音和图像以及手写等多种方式,比较单纯实用一种方式精度甚至要高出10倍!What a wonderful technique!
在今天的交流中,正如二位的专长那样,讲的主要是关于speech方面的,也讨论了一些中国学生和MIT中美国学生的不同。
我提了一个问题关于大师们的共同之处和成为大师的必要因素。Victor似乎不太赞同大师这个词,或许在大师们的眼中,同行们不过是有些成就的普通人罢了。他认为,他所认识的比较厉害的人的共同点是都具有独立的想法。对这一点,Frank给予了肯定,他说,他在贝尔实验室认识的大师们都具有相信真理,不畏惧权威的特点,我想应该是这样的,称得上大师的人物必然在其领域有着开拓性的贡献,如果想冲破界限,得到创新,就必须有足够的自信,即相信的是充分的证据而非其他所谓大师们的说法。接着Frank又补充道,他认识的人有的思想跳跃,有的思想很有条例,笔记清楚,有的人习惯做Demo,让人明白。然后又提到我在问题中列举的MIT出来的Feynman,说他的思维很有启发性,虽然听众可能是外行,不过听了Feynman的报告后依然能够激发起兴趣。大师们都深入浅出,能够用浅显的话语让人明白高深的道理,并不用晦涩的语言炫耀学问。大师们学的多,知道的多,有很深的“内功”。他们注重自己的直觉,平时主要靠直白的方式思考,当然他们能用公式证明这些直觉,而这种直觉往往正确的背后,就是长期经验积累的所谓“内功”。
Frank引用胡适之先生的话“做学问要在无疑处求疑,做人要在可疑处不疑”,说,做学问的人应该看到别人未看到的东西,这是创新的前提。而Victor则告诫我们,不要怕错,尤其是在交流中,不可能把话都考虑的非常严密再说。我想,一些分歧正是很多灵感的起点,而任何学术研究都有其风险,不能因为担心出错而畏首畏尾,正应该“大胆假设,小心求证”。
Victor还讲了两个笑话,似乎我都听过,不过还从来没有这么认真思考过。其实第一个是个谚语“手里有个榔头,看什么都像钉子”。说的是,做研究到一定深度,思路就会狭小,难以继续创新,需要左看右看一些和自己的工作相通而又不同的人的工作,甚至应该经常多看一些非本领域的东西乃至从文化上吸取营养。每个研究人员的兴趣都应该广泛一些,每天做些与研究不同的东西。另一个笑话说的是:一个人晚上丟了钥匙,在路灯下低头找,另一个人问他在哪里丢的,他指了指旁边,“那你为什么不到那边去找?”“因为这边有路灯,比较好找啊。”这个笑话说的也是学问做深了的情形,有可能研究中用的方法不对,因此即使方法再好也不能有任何收获。我想,这在我们的研究过程中的确是出现过的。当我们用一种较为通用的方法解决一个特殊领域的问题的时候,并没有考虑这个方法是否适合这个问题。有些困难不可避免要遇到,有人觉得太难而不敢碰它,就一直在回避这些问题,这是不是也在南辕北辙呢?
随后有老师问实验室应该如何组织安排。两位老师的建议是,实验室的研究环境应该相对稳定,以利于知识的积累。
接着Victor又给计算机学院的老师们做了一个关于如何创新的报告,下面是他的提纲
A real problem(做有意义的课题)
A change in perspective(改变自己的知识结构,以适应新的需要)
Synergy
Peripheral vision(可能有意栽花花不开,无心插柳柳成荫,视野宽一点,借鉴所有能借鉴的东西)
Unanticipated consequences
Allow for unintended consequences
Victor似乎不太喜欢这种“开药方”式的座谈。也许在MIT这样的牛校鼓励学生有自己的想法,找到最适合自己的解决方案,而不是头疼医头,脚疼医脚。即便如此,在这次交流中,我已收获颇丰。
总而言之,通过这次和牛人的零距离接触,让我真正感受到像MIT这样优秀学校的气质,其中吸引我的是,他们有如此循循善诱的教师,如此充满活力与智力的氛围,以及把想法迅速实现的一流的环境。如果没有最好的图像处理能力,他们将语音和表情结合处理的想法再好也不可能迅速实现。就像做核物理,那么就应该去有最好的加速器的地方一样。一句话,丰富的学术资源和积极的研究氛围。
努力吧。
想再次恢复Blog的撰写
6 年前
没有评论:
发表评论