星期五, 一月 25, 2008

天马行空之电话IP

以前很羡慕那些清楚地记得朋友电话号码的人,我打电话就得低头看几遍号码才能保证没拨错。好在现在的电话都有号码本,也让我这样的记性不好的人方便了许多。不过万一号码本丢了就比较麻烦了,还要四处去借不说,很可能一些朋友就再也联系不上了。
最初计算机上能上网的时候,用的也不过是个号码而已(IP地址),后来大家懒得记这一串数字,就发明了DNS服务器。只须记得一串相对有意义的字母就可以了。但是仍然有人记不住这个域名,于是像Yahoo!这样的网页分类网站就建立起来了,上网的时候只要记着Yahoo!的网址,顺着那个树形结构的目录就能比较方便地找到想去的网站和相关的网站。这是第一次从按地址检索转换到按类别检索。但是从Yahoo!的分类目录能够找到的网站毕竟是少数,接下来该Google登场了,在Google,我们只需记得想找的网页中的某些词就可以找到它们了。也许再下一代检索系统,我们连那些词都不需要记了,搜索引擎会猜透我们在想什么,呵呵。
电话其实也可以借鉴电脑的发展历程,首先给每个电话一个域名,比如说每个运营商有一个一级域名,人们在购买电话的时候会得到一个这个电话的固定号码(IP地址),如果需要还会得到一个相应的二级域名,同时把这个二级域名绑定到该电话号码上,如果用户已经有一个二级域名,不希望朋友再改动他们的电话号码本的话,把原来的二级域名绑定到新号码上就行了。这样,我们就不用再记那些麻烦的电话号码了。
上面说了些幻想的东西,实际上电话本方面还是可以做一些互联网服务的,比如做一个专门帮人管理电话号码本的网站,提供短信息存储,通话时长记录等服务,帮助人们管理信息,和通话计费理财,进一步的服务可以包括日程时时提醒(类似于黑莓手机的Push Mail)。其实这些东西本地上的版本已经有了,微软的OutLook就能实现联系人同步,在线的Google Calendar也有短信息日程提醒(估计Google考虑短信而非GPRS联网是因为短信的平台无关性更好吧),不过都还不太方便(OutLook跨平台性不好,短信太贵)。到了手机3g网络时代,就可以提供基于手机网页浏览器的服务了。

星期二, 一月 22, 2008

好好活,做有意义的事

昨天和同学聊天,谈到什么样的研究才是有意义的研究,感慨每年学术界发表的无数文章中能够对他人有用的寥寥无几,真正能够写进教材的就更少了。往往是大牛们提出问题,小牛们解决问题,而我们这些学生则做些修修补补的工作,看看被人漏下的东西还好用不好用。细算算一个人的学术生涯中容易做出突出贡献的也就那么几年,从博士开始到评上教授这段时间是学者最能集中精力在学术一线研究创新的阶段,其中尤以博士毕业右面这后半段时间为精华。而一个人的学术能力的养成则在前半段。就像铸鼎,先要搭好模具,而后浇铸铜汁,鼎的形状规模在制造的模具上就固定好了,浇铸铜汁的成色,退火的工艺则决定了鼎的质地。所以,如果希望自己的研究真的有一天能够被人用到,就应该从现在开始,仰望高空,脚踏实地,做一些真正有价值的东西。

星期三, 一月 16, 2008

旁听AIRS

今天AIRS开幕,起早到华融饭店旁听。看到很多相关领域的领军人物:软件所的曹右琦老师,微软的马维英,李航,周明,林钦佑四位老师,加拿大的特利尔大学的聂建云老师,清华的张敏老师,台湾国立大学的陈信希老师,韩国POSTECH的Gary Geunbae Lee老师,还有美国圣地亚哥大学的Eric Jiang老师。还有很多学者似乎见过,但是不知道叫什么名字,希望下次再开会的时候都能认识。这次会议也有不少学生参加,应该见贤思齐,多向他们学习。

星期二, 一月 15, 2008

旋转的剪影


这是一张前一段时间网上讨论得很火的图片,图中舞者的剪影在有些人眼中是逆时针旋转,在有些人眼中则是顺时针旋转,还有人看有时是逆时针,有时是顺时针。
很多人给出了他们的看法,不乏很有道理的,这里说一下我的一点猜测。
我们知道,人的视觉具有暂留现象,典型的应用就是电影。每秒钟24张胶片就可以让人感觉图像是连续变化的。这说明,人的眼睛是离散式采样的,我猜想,人眼的各个感光细胞以一定采样频率并行地工作,所有这些细胞的采样的总体频率宏观上和一个值,可能是1/24秒有很强的关系。大脑来处理各个细胞传递给它的视觉信号流。在两次采样之间的部分通过插值来完成:如果在上一次视觉信号衰减到一定阈值之前,下一次视觉信号便到来的话,我们便感觉图像应该就是连续的。
另外,往往图像的比度越明显,信号越强烈。我猜想,人们对灰度值渐变的反应应该没有对图像边缘运动的反应快。在下面这张图中,AB两块颜色是一样的,但看上去好像A的颜色要深一些。上图中的舞者只有一个剪影,没有其他内部细节,这使得我们对剪影边缘的印象很深。
回到舞者这幅图,如果用GIF图像编辑器分帧查看舞者这组动画的话会发现,每一帧图像都无法区分左右,也就是说,在每一帧图像中,端起的那只胳膊既可以看成左胳膊,又可以看成右胳膊。作者所选取的每一帧如果被上色的话,都可以被还原成左右截然相反的两幅。也就是说,将这个动画看成左转还是右转都是主观上的还原,而事实上这两种还原都缺乏确凿根据。但为什么我们只要看到这幅图像就都固执地认为是不是左转就是右转,而不会看着看着就左右来回变呢?我认为,人们在第一眼看到这幅图像的时候会给出一个经验性、试探性的判断,并在后续的观察中加以修正。由于后续的观察和我们第一眼的假设并无矛盾,所以修正过程就被逐步弱化了,从而对原有的判断进一步加强,所以后续再改动的可能就很小了。简单地说,人脑处理问题的策略就是,如无必要,不做改动。这与奥卡姆剃刀原理不谋而合,不知其中是否有更深层次的联系,或许机器学习上应用这条原理使得系统更加符合人脑的习惯?也未可知。
还有一点,在分帧查看这组图像的过程中,如果查看的速度足够慢,也能够在左右两种判断之间随意切换,但如果浏览速度超过一定阈值或者观察不够仔细,仍然很难区分,说明这种判断意识的逐渐累积也类似于视觉暂留现象,在一次意识的神经冲动强度降低到一定阈值以下之前,如果下一次刺激能够到来,便加了强这个意识,否则,修正性意识便会冲破抑制,重新审视先前的判断。这一微观的结论同样适用于宏观的心理现象,很多所谓的“洗脑”就是通过连续的灌输某些判断,在人能够充分否定这一判断之前再次强化,使人认为这一判断是既定结论。辩论中的偷换概念也是这个道理。在旋转剪影这幅图中,舞者剪影的边缘两侧对比明显,使得我们每次意识上的采样获得的刺激都很强烈,在一定程度上也相对较强地抑制了修正意识。在宏观中,往往也越是强烈偏激的判断,越能够起到“洗脑”作用。

本科都学了什么?

本科阶段学了很多课程,但现在能够立刻回想起来的着实不多,多少有些让人遗憾。不过仔细想想,如果现在去读一本本科教材,应该没有当初那么困难了。经历了这些教育之后最大的收获就是了解了相关领域的知识框架,知道了一些概念都是怎么来的。这就好像从学校的电脑上下载资料,也许没有下载到什么文件,但是把目录,子目录都下载下来也能对领域有一定认识。

星期五, 一月 04, 2008

时间管理

目前一种比较流行的时间管理方式如下:
根据紧急程度和重要程度将任务分成四类:即紧急且重要,紧急但不重要,重要但不紧急,不重要也不紧急。
这样划分比较粗糙,在心理上接受总有空位,现在增加一维指标:任务的困难程度,并对由此生成的任务分布图拓扑排序,给出经验上较好的优先级。如下表所示:

顺序

紧急

重要

困难

1

1

0

1

1

1

0

1

0

1

0

0

1

0

1

0

1

1

0

0

0

0

0

1

星期二, 一月 01, 2008

听师兄的博士毕业答辩

实验室两位师兄今天答辩,我有幸旁听了整个答辩过程,记下几点值得自己注意的地方。
  1. 方法对其他领域的贡献,也就是方法的泛化能力决定了研究的意义。做研究不同于做工程的一个方面就是研究成果的适用面相对较大,对特定领域需要用特定的方法,但是有意义的研究要么领域的范围较大,要么这些方法经过简单的抽象就可以被套用到其他领域当中。
  2. 研究需要理论基础的支撑。如上段所述,研究需要将方法进行一定程度的抽象。通常意义上的理论基础,就是将方法抽象到数学的层次上,以符号、数字的形式表示,并且最好能够证明理论的正确性。
  3. 科研需要总体的规划,分别设定短期,中期和长期的目标,在研究过程中根据新的发现不断修正。