经历SEO这么多年,你可曾思索过,为何有些内容看似平淡无奇,然而排名却能稳稳凌驾于你之上呢?极有可能是TF-IDF算法在发挥作用,其无声无息地判定着你的页面在百度谷歌眼中究竟价值几何。
TFIDF到底是什么
搜索所运用来评定一个词于页面里重要程度的数学办法是TF - IDF。简略来讲,TF称作词频,也就是某个词在你页面之上出现了几回;IDF称作逆文档频率,其含义为这个词在整个互联网当中是不是稀罕之事物。
倘若在整个网络范围内所有人都提及“水果”,那么这个词汇的IDF值会处于很低的状态,缘由在于其太过平常普通。然而要是在你的页面之上“苹果”这个词汇出现的状况恰如其分,并且竞争对手几乎都未曾怎么提及,那么当搜索“水果”时你的页面便极有可能排在前列。
百度谷歌都在用的核心算法
不少人对百度是否运用TF-IDF持有怀疑态度,实际上,百度自身的专利文件《基于非线性统一权值对检索结果进行排序的方法及装置》中早就清楚明确地写好了。这并非是什么隐秘未宣之事,而是搜索引擎的底层逻辑所在。
历经码迷团队依据对约2G的谷歌搜索资料所开展的人工智能训练,进而预测出TFIDF分值大概占据百度所占权重的40%左右,而谷歌更是高达50%。这表明倘若一篇内容的TF - IDF做得出色,那么其排名已然于起跑阶段取得优势了。
告别关键词密度的野蛮时代
早些年的时候,SEO圈里流行着这么一种做法,就是去堆关键词,一篇文章,那是恨不得把目标词写上几十遍。等到TF-IDF算法出来以后,这种玩法就直接废掉了。为啥?因为它,不仅要看词频,而且还要看这个词在整个互联网上面的稀缺性。
遭百度、360启用TF-IDF后,一大批凭借关键词密度来糊弄人的SEO小白被屏蔽了。如今你妄图依靠重复几个词便获取排名,那是根本不可能的。搜索引擎所需要的乃是切实覆盖用户需求的内容,而非词频机器。
内容得分公式的秘密
当前的搜索引擎打分呈现为组合拳形式,页面得分由TFIDF分乘占比后所得数值,与链接分乘占比后所得数值,以及用户体验分乘占比后所得数值相加而成,这三项占比总和为百分之百,在此之中TFIDF的占比颇为可观。
于百度这一体系当中,大概四成的得分源自内容质量,即TFIDF。用户体会的分数同样占据四成左右,剩余的两成便是域名与外链。那些依旧执着于外链的人,或许并未察觉到内容质量早已占据主导地位了。
从TFIDF到BM25的进化
最初的TF-IDF公式着实有点粗糙,随后出现了升级版称作BM25算法,该算法纳入了文档长度、关键词权重这些能够调节的参数,在经过机器学习训练后,排序结果与谷歌的搜索结果极为相符。
最初,摩天楼内容助手使用过基础TF-IDF这种方式,然而,在进行几个网站的操作后,却都未能登上首页。之后,转而运用BM25算法,借助对K参数展开调整,排名的精准程度显著得到了提高。尽管百度存在较多广告,不便直接进行验证,不过,实战方面的案例证实,结果大致是准确的。
怎么用工具拿内容质量分
如今做内容,再也不能只凭感觉了。有像摩天楼内容助手这类的工具,它能够从政 五个维度去评测你的标题以及正文,并且还会跟踪不同的相关词,从而帮你对照竞争 对手的覆盖状况。你只要把排名在前五十的相关词全部都覆盖到,那么内容质量根本 上就能跻身全网前三。
那么依据词频给出的建议,将最为关键的十个词分布得更为合理些,大体上也就处于第一了。此个过程是枯燥的,然而的确是有效果的。开发者码迷表示这个工具是供那些愿意郑重其事做内容的人使用的,并非是让你去走捷径的。
有没有想过,要是大家全部都不产出优质内容,那百度抓取什么来给用户看?到那个时候,SEO市场只会是越来越糟糕的状态。想听听你们当下做内容的时候,是靠着感觉来写,还是也有着自己那一套的方法?欢迎在评论区里聊聊你的经验,要是觉得文章有用别忘了点个赞然后分享给更多同行。




还没有评论,来说两句吧...