下载此文档

网页库级垂直搜索引擎技术.docx


文档分类:IT计算机 | 页数:约16页 举报非法文档有奖
1/16
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/16 下载此文档
文档列表 文档介绍
网页库级垂直搜索引擎技术
(一) 垂直搜索引擎的选型
本文原创,没有版权,可以任意转载,但是请别转载了一下就变成你写的了哦^_^
网页搜索引擎的存在有他存在的土壤,土壤环境是怎么样的呢?
,互联网上有海量的数据,并且这些数据在快速增长、不断更新
,这些数据存在于成千上万个网站中



,并且这种需求量很大
,能够完整的满足用户的这种需求,提供完整的信息检索体验
垂直搜索引擎存在的土壤:
,提供更多的细化的服务
(数据种类、数据类型等),不利于满足用户细分的服务
,数据的深度加工提供更细化的服务的需求,这种需求量非常巨大

、更快速,更可依赖性更强的服务

垂直搜索存在的必备条件:
,所选择的垂直搜索的数据必须是海量的数据,数据量和增长速度、增长量都比较大。符合搜索引擎的基本条件
,这种数据必须要分散在很多个不同网站。不能是仅存在于几个网站。如果仅存在于几个网站不如做元搜索了(如果信息集中在几个网站,用户可以直接去使用)
,但是又不能是对实时性要求极高
(显然,春运期间的二手火车票信息就不适合做垂直搜索,因为等采集处理完毕,那票说不定已经卖掉了。拍卖的价格信息不适合做垂直搜索,有可能还没有采集处理完毕,价格已经变化了。)
,而且需要长期使用。(搜索是需要学****长期使用才能很好的驾驭的一种应用)
、深度加工,并且加工后能够完整的满足用户对这类数据的搜索需求,提供完整的应用体验。
、深度加工是网页搜索引擎完全不可以替代的。
垂直搜索选型的步骤:
,您熟悉的,有一定的资源背景的几个垂直搜索的被选方案。
(其它搜索引擎不行)检索关键词数据。
最好能搞到连续一段时间的全部词汇(按照检索频率排序),当然这几乎不可能,进行详细的分析、统计、挖掘。搞不到只要看风云榜和百度指数了,这估计就有很大偏差了。
对这些用户需求数据库进行深度分析找出用户到底要什么、互联网上缺什么。(第1步和第2步交替进行)
,评估用户需求、数据情况、横向竞争、纵向竞争、潜在竞争情况和可能遇到的其它问题。
?如何保持产品和门户网站、搜索门户等的差异化和挖掘出用户潜在的最大的需求?
,能否实现完整用户体验。
(资源、效果、市场、技术、销售……)
(这点非常非常重要,如何在竞争对手反应过来之前低成本的快速抵达有效用户群是成败的关键)
;收入模型、成本模型
第一步完成到什么程度,达到什么目标。需要多少成本
第二步完成到什么程度,是否可以收支平衡或者获得投资
…………
。产品的生命周期的每一步可能出现的紧急问题如何应对。
,这世界上聪明人太多了,你能想到的肯定有n个人已经想到了。
  关键在于您能不能充分利用自己的资源,做好前期的调查后专注的执行。
(市场暂时不够大)、或者不可能能做的应用(受制约、有更重要的事情要做),不要把你的模式和意图暴露得太早,这个市场的竞争实在是太激烈了,中国人也都太聪明了。
  务必要找和门户网站、网页搜索引擎有很大差异化,并且用户有持续的很大的需求的。理由很简单:搜索是需要持续使用才能熟练的一种产品、从门户和网页搜索引擎到您的垂直引擎的门槛很高(比多点击10次的门槛还高很多)。
网页库级垂直搜索引擎技术(二)如何做好一个垂直搜索引擎
本文先引用几句话:
1.“确解用户之意,切返用户之需。”
2.“门户网站都想着是怎样省钱,而不是怎样花钱来买技术。”
3.“搜索引擎不是人人都能做的领域,进入的门槛比较高。”
4.“只是优秀还不够,最好的方式是将一件事情做到极致。”(google十大真理)
5.“做搜索引擎需要专注”“对于一项排到第四的业务,门户很难做到专注。”
6.“用户无法描述道他要找什么,除非让他看到想找的东西。”
7. “所谓楔形,其实就是个倒三角,

网页库级垂直搜索引擎技术 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数16
  • 收藏数0 收藏
  • 顶次数0
  • 上传人2024678321
  • 文件大小0 KB
  • 时间2015-11-13
最近更新