2009年3月3日

闲谈搜索

现在大部分网民,用得最多的应该就是搜索引擎,因为互联网上的东西实在是太多了,简直是海量,没有搜索引擎这支“盲公竹”,还真的很难找到想要的信息。

一、多即是少?
互联网和搜索引擎可以说是相互影响的,互联网催生了搜索引擎,而搜索引擎的技术发展,又反过来使互联网上的信息呈现爆炸性增长。而这种增长是两面性的,垃圾信息总是伴随着有用信息一起增多,以致有时反而觉得谷歌的机器搜索没有雅虎最早的分类搜索有用!最近就出现了谷歌好坏的争论。这正正符合了以前看过的一本书所说,为何多即是少?

二、原因
产生这种现象的原因,是因为谷歌搜索算法的机器性,它是完全没有人工参与的,这样就能突破雅虎分类目类需人工参与的限制,不需要大量人手去维护目录,完全交由机器完成。但机器毕竟不是人脑,它只能根据算法得出优先级,却没有办法判断一个网站的真假。

虽然机器学习、人工智能等领域均在研究相关问题,但离人脑还是有很大的差距。谷歌去年底加入的SearchWiki功能,就是让用户根据网站的好坏来提高或降低排名,但说实话这个功能用处不大,一般网民都不会去碰它。

三、看法
Twitter是最近很火爆的一个应用,作为微型博客,Twitter能该信息更快地传播,实时性更强,之前发生的央视大楼火灾,Twitter的反应就比其它主流媒体都要快得多。而Twitter上线不久的Twitter Search,更令我看到了一点搜索引擎的未来。

不同于Google直接在浩翰的互联网上搜索,Twitter的用户对互联网进行了初步的筛选,发布的信息大部分都是经阅读的且有意义的(当然,这个“意义”是针对不同群体的,且不排除有恶意发布源),所以在这些内容上再搜索,就可以大大感少垃圾信息,我理解这是手工和机器的结合。

相对于Google来说,现在的Twitter实在太小了,信息量也不够。不过随着用户数的增多,Twitter的信息量也会不断增大,那时候Twitter Search的能量绝对不能小觑,特别是对一些突发事件。只要保持增长势头,以及相关搜索技术的不断完善,我很看好Twitter Search。

没有评论: