一、什么是相关性
百度和谷歌等为了给用户提供高质量的信息,从中过滤掉匹配度不高或黑猫垃圾信息
搜索引擎如何计算
什么叫百度分词算法
搜索引擎对关键词进行规划,就是把原先的这种不公平性去掉。把他们的对比的数字变成一个可以对比的纯量。关键词次数/字数
所以不能够按照关键词出现的次数计算,这样是不合理的
二、相关性与SEO有什么关系
三、相关性如何来进行判断
搜索引擎如何判断相关性
首先了解搜索引擎分词算法技术;(搜索引擎为了辨别搜索词跟页面关键词的匹配度而进行的分词,将搜索词分解为不能再分的短语)
搜索引擎如何去判断那些网页是否相关
1)查看网页页面包含搜索词最多的;(不能按照关键词出现的次数计算,这样不合理)
2)对关键词进行规划;(对网页内关键词出现的频率进行量化)消除1)中的不公平性
那么通过网页关键词的次数除以网页的总字数,我们称之为关键词的频率
关键词频率:出现次数/总字数
关键词密度:出现字数/总字数
四、相关性我们如何去运用他让我们的站内页面获得很好的流量 和长尾关键词排名
1.“比如SEO、是、什么,在一个1000字的页面中分别出现了,SEO 15次,是出现53次,什么出现了21次。 那么他们的频率分别是 0.015 、0.053、0.021 这3个频率。我们把这3个数字相加,0.089 就是相应网页和查询“SEO是什么”相关性的一个简单的度量值。”但是“是”这个词太多了
在汉语中,应删除词还有“的”、“和”、“中”、“地”、“得”等等几十个。
那是不是这样我们就完全计算出页面的相似度了呢?如果我们再仔细的观察,我们会发现还有一个小漏洞。那就是什么这个词是一
关键词频率:出现次数/总字数
关键词密度:出现字数/总字数
1. 一个词预测主题能力越强,权重就越大,反之,权重就越小。我们在网页中看到“SEO”这个词,或多或少地能了解网页的主题。我们看到“什么”一次,对主题基本上还是一无所知。因此,“SEO“的权重就应该比“什么”这个词权重大。2. 应删除词的权重应该是零
那么我们怎样是分辨一个是主词还是副词呢?可能各位同学脑袋上还有很多很多问号?其实不难分辨,我们只需要知道我们搜索的这个短语中,去掉常规的过滤词(应删除词)外哪个词可能出现的网页数量要低于另外一个词,那个词就是主词,反之就是副词,所以这个逻辑还是非常简单的。