首页 > 教育学习 > 为什么 > 有人做过搜索引擎吗,能对Heritrix和Nutch的性能及适用性做个比较分析么?

有人做过搜索引擎吗,能对Heritrix和Nutch的性能及适用性做个比较分析么?
2012-01-19 17:52:54   来源:   点击:

    有人做过搜索引擎吗,能对Heritrix和Nutch的性能及适用性做个比较分析么?搜索引擎里面肯定得用到爬虫框架,现在找到的比较好的框架中有Heritrix和Nutch两个,由于网山对它们的比较分析的文章大多数是重复的,所以看看这里有没有哪位对这个比较了解,并能给点比较分析。谢谢。

    2 个答案

    • 答案 1:

      目前来说Java版本的是Lucene,一般可以考虑Solr+Lucene来实现分布式的可容灾的一个索引和检索的平台,如果数据量是海量级别,可参考Hadoop+Nutch实现,其他的开源技术框架有,Lily(solr+Hbase+hadoop),zoie(实时搜索引擎),Sphider (Sphider是一个轻量级,采用PHP开发的web spider和搜索引擎)。
    • 答案 2:

      我用的是Lucene

相关热词搜索:

上一篇:开发一个聊天软件需要学哪些知识?
下一篇:腾讯全面开放,会有那些创业机会?