首页 > 教育学习 > 为什么 > 在搜索引擎中,什么叫stop word?

在搜索引擎中,什么叫stop word?
2012-01-19 19:41:52   来源:   点击:

    在搜索引擎中,什么叫stop word?

    7 个答案

    • 答案 1:

      正如字面意思,停词。有些高频词,例如“的”,对用户查询的意义不大,同时在索引中又占据比较多的资源,所以,干错不让它参与分词。
    • 答案 2:

      停止词,原来在英语里面会遇到很多a,the,or等使用频率很多的字或词,如果搜索引擎要将这些词都索引的话,那么几乎每个网站都会被索引,也就是说工作量巨大。在中文网站里面其实也存在大量的stop word。比如,我们前面这句话,“在”、“里面”、“也”、“的”、“它”、“为”这些词都是停止词。这些词因为使用频率过高,几乎每个网页上都存在,所以搜索引擎开发人员都将这一类词语全部忽略掉。如果我们的网站上存在大量这样的词语,那么相当于浪费了很多资源。原本可以添加一个关键词,排名就可以上升一名的,为什么不留着添加为关键词呢?停止词对SEO的意义不是越多越好,而是尽量的减少为宜。
    • 答案 3:

      既然问的是stop words, 我想主要是针对英文吧,也叫common words,(Stop Words. Most Search Engines do not consider extremely common words in order to save disk space or to speed up search results.) google中提出的stop words的概念是把一些对短语表述不构成直接影响的单词的的搜索结果直接过滤掉,包括a,an,the等冠词,in, at, of等介词, 一些人称代词,时态的助动词等,如果需要我这有一个停止词的大概列表可以发到你邮箱,这些词应为使用频率过高,所以搜索引擎把这些词的搜索结果会直接过滤掉,针对seo的话,这些词尽量少用较好,但如果不用对原来意思造成比较大的歪曲的话还是坚持使用吧,毕竟写的东西搜索只是抓取,最后看内容的还是人类。
    • 答案 4:

      DF值高于一定阈值的都可以归为停止词,未必要局限于“的”之类极少数的词
    • 答案 5:

      停止词的意思就是不让搜索引擎索引,也不让查询的词。比如无意义的词,和被河蟹的词。
    • 答案 6:

      搜索引擎文本的分词会用到停词库。将无意义的词放入停词库,分词时忽略掉,比如也、啊、的等。
    • 答案 7:

      停止词,如“的”、“也”、“了”等.停止词对SEO的意义不是越多越好,而是尽量的减少为宜。

相关热词搜索:

上一篇:哪些音乐人有自己的独立博客?
下一篇:中国什么时候书写由竖变横,由右变左的?为什么