如果我们回顾搜索引擎的发展历史,我们会发现技术主导的网页式搜索和人力主导的分类目录几乎同时出现,但最终雅虎式的分类目录引爆了流行,并使雅虎成长为 流量第一的网络媒体,当然这中间的功劳并不能全部归功于雅虎分类,但我们不能否认雅虎分类是雅虎其后一系列发展的第一推动。 字串1
令人惊讶的是早期成功的网页式搜索AltaVista等并没有象雅虎一样成长起来,个中原因很复杂,简短说AltaVista等确实是成功的产品,并产生了巨大的搜索流量,但它并未找到赚钱的门道。
字串7
Google的成功可以归纳为两点,第一:对网页搜索而言,排序很重要,PageRank算法给出了一个网页评价体系,保证质量最“好”的网页会出 现在搜索的前面。这从某种程度上消减了雅虎分类目录的优势,人力主导的网站目录最大的优势就是质量。第二:Google找到了盈利的途径,在有了流量之 后,按关键字,按上下文出售文字广告,用流行的话说就是Google找到了长尾市场。
字串4
至此技术主导的网页搜索占了上风,雅虎自己也很快意识到了这点,收购了除Google外几乎所有提供搜索技术的公司,网站首页则不断改版,原来的主打分类目录已经快找不到了,首页风格更象精简了的报纸网站。 字串8
这时,第三种概念出现了,社区化搜索,其实没什么新鲜的,就是利用论坛(或其他通讯手段/形式),问别人而已。百度知道,新浪爱问和雅虎Answers等是其代表。反倒是Google未曾切入这个概念,Google原先有个付费的问答平台,也已在实验室阶段被放弃了。 字串5
那么,除此之外还有哪些搜索引擎的新机会呢?
字串6
这里所说的可定制,指的是搜索排序可按个人搜索习惯或需求定制。网页式搜索引擎的质量其实就是排序保证的,但实际上并不存在一个让每个使用者都满意的搜索排序。 字串8
比如我搜索:XXX,对于99.99%的网络搜索者而言,这意味着性,一些有趣的图片或视频。但对物理学家而言,这是:xxx.lanl.gov,最著名的预印本网站。(类似的例子,我们还可以举蛋白质,学生搜索蛋白质是为了学习,普通人是为了保健知识,厂家则可能是为了猪饲料。)
搜索XXX,xxx.lanl.gov在雅虎里的排序是第四,在谷歌中是第五,在Google中则是第九,略去百度,因为它只懂中文。
实际上在几年前,Google搜索XXX,xxx.lanl.gov可是高居第一的,这个可以解释为xxx.lanl.gov拥有很高的 PageRank,因为几乎每个大学的数学系、物理系和计算机系都会有它的链接。但现在xxx.lanl.gov的排名稳步下降,清晰地告诉我们 Google排序算法的复杂性和不断改进,除PageRank外也许还要考虑点击展现比率等。
这样做的后果是,大多数人在大多数情况下会欢呼Google的搜索给他们带来了便利。但他们也会在很多情况下,抱怨Google。事实上不可能存在对所有用户,所有情形下都适用的通用网页排序法则。在这个时候,推出可以定制,可以学习的排序机制就是必要的。
字串9
如果推出可定制的搜索服务,Google具有天然的优势,它的人力资源构成,庞大的用户信息等都是保证Google未来在这一方向成功的重要因素。
网页式搜索的另一弊病是需要人力从十几,二十几网页中挑选打开哪一页。因此获得所需信息至少需要搜索、选择网页、阅读、再选择网页、再阅读……的过程。如果我们能把这个过程缩减至最少,对于用户来说就是最舒服的搜索体验,对搜索引擎来说则是最高效的。 字串3
而把以上过程缩减至最少就是所谓一键式搜索,不论你键入什么关键词,直接出来的就是你需要阅读的网页,里面信息足够丰富,可为进一步阅读的起点。
由以上叙述,我们可知一键式搜索很类似于综合搜索,综合搜索是把网页搜索、图片搜索、字典等搜索结果集成在一个网面中呈现。从实现的角度说综合搜索 是很容易的,而一键式搜索似乎没有那么容易。而就搜索体验而言,综合搜索其实并未比普通网页搜索有本质提高,究其原因是人们在搜索时对纯粹文字信息的需求 是占了压倒性优势的,此时把图片等一并集成往往并未本质地改进搜索质量。即综合搜索并未缩短:搜索、选择网页、阅读、再选择网页、再阅读……的过 程。
字串1
体验一键式搜索的最好范例其实是维基百科,或基于其上的Answers.com。维基百科可看作是人力主导的搜索(或信息组织方式)的进化版本,输入一个关键词,可直接进入词条,而该词条经众人协作写作,几乎已是互联网上的最好参考。 字串6
如果我们看一下最新的Alexa排名的话,我们会惊讶地发现,维基百科(蓝色)已经悄悄超过百度(褐色),QQ(土黄色),新浪(青色),Ask.com(黑色,美国第四大搜索引擎)等我们熟悉的网站了。
字串2
当然这经过了一个漫长的过程,
字串8
这里我们不讨论如何复制一个维基百科到中国的话题,但维基百科的成长告诉我们,一键式搜索这个概念确实是成立的,它有可能代表着搜索引擎的未来发展 方向。但纯粹使用机器的智能来汇总,编写百科全书确实是个挑战。换个角度,我们不难发现对于Google这样的搜索引擎巨头,鼓励CC确实是它们的利益所在。 字串1