-
答案 1:
说说微博的做法。自已建立最近几小时的内存索引,搜索时同时搜索内存的实时索引和底层的搜索服务。根据底层的搜索服务的更新延时来决定内存索引的大小。另外还需要处理搜索后结果的merge。微博这边是按时间来分段在内存索引和底层中搜索,所以并不会存在重复结果。知乎应该也可以这么搞。比如将sphinx弄成定时更新结果。然后更新之前的查询由内存索引来提供。当然,似乎sphinx本身也直接支持实时索引,不知道效率上是否可靠,如果可靠的话,直接用就可以了。 -
答案 2:
lucene系方面linkedin开源的zoie是实时搜索lucene目前也有一个实时搜索的分支,由twitter工程师主导的貌似,但没到什么进展的消息。还有一个Solandra:github.com/tjake/Solandra 没用过,不甚了解。
实时搜索有哪些最佳实践?
2012-01-19 19:55:32 来源: 点击:
相关热词搜索:
上一篇:互联网开放平台大家更看好那个?
下一篇:为什么苹果的 iTunes Store 登录选择中有一个 AOL 账号登录选项?