SEO培训 > SEO常见问题 > 正文内容

什么是TF-IDF?

发布时间:2019-01-03 14:17 阅读:69次 内容标签:

TF-IDF算法,是搜索引擎来更好更好地理解被低估的内容,虽然创建高质量的内容是目标,但了解Google如何识别优质内容对于保持竞争力至关重要,因为Google的SERP将继续发展。将同义词和类似短语结合在一起是更智能的Google算法的开始,但现在Google可以将相关概念联系在一起,以了解哪些内容提供最大的广度,并计算这些概念在页面上出现的频率,以确定哪个部分提供最重要的深度。这种深入的内容分析称为术语频率 - 逆文档频率(TF-IDF)分析。

TF-IDF

简而言之,TF * IDF得分(重量)越高,该术语越罕见,反之亦然。

无界SEO写本文的目的是通过TF-IDF的未知主题指导大家,通过更好地了解Google如何利用此算法,可以对TF * IDF进行逆向工程,从而优化网站内容,使其更好地适用于用户和搜索引擎。并且SEO可以将其用作搜索具有更高搜索量和相对较低竞争的关键字的工具。

TF-IDF公示

TF-IDF算法用于权衡任何内容中的关键字,并根据该关键字在文档中出现的次数分配该关键字的重要性。更重要的是,它会检查关键字在整个网络中的相关程度,即所谓的语料库。

公式:Wt,d = TFt,d log(N / DFt)

TFt,d是文档d中t的出现次数。

DFt是包含术语t的文档数。

N是语料库中的文档总数。

TF - IDF定义

单词的TF(术语频率)是文档中单词的频率(即它出现的次数)。当你知道它时,你就可以看到你使用的术语是太多还是太少。

例如,当一个100字的文档包含12次“cat”这个词时,“cat”这个词的TF就是

TFcat = 12/100即0.12

单词的IDF(逆文档频率)是该术语在整个语料库中的重要程度的度量。

为什么SEO应该关心TF-IDF

SEO工作人员可以使用TF-IDF根据当前在前10个搜索结果中排名的内容来识别其当前内容中的内容差距。它也可以在创建新内容时使用,以便内容排名更高,更快。

TF-IDF首先,它告诉您一个单词出现在文档中的频率 - 这是TF-IDF的“术语频率”部分。然后,它告诉你这个术语有多重要,它用“逆项频率”来衡量,它会减轻频繁出现的词(例如“the”或“a”),并扩大更独特的词。这可以调整这样一个事实,即某些单词比其他单词更常出现并且几乎没有相关性。

这个加权分数告诉我们关键字的相关性,但是当你将它应用于SEO时尤其方便。

如何查询网站TF-IDF得分

推荐一个国外免费查询工具,您需要注册Ryte(再次:100%免费)。Ryte让您使用TF * IDF免费优化您的内容!通过非常简单的用户界面,它是您或您的内容编写者的最佳选择之一。您的内容编写者可以创建自己的帐户并在几分钟内开始工作。

用户评价:什么是TF-IDF?

关闭
评论内容不能为空
如果联系方式是E-MAIL地址,有新回复您会第一时间收到邮件消息!