百度宣布《移动搜刮建站优化白皮书》:网站优化篇
页面理会,首要指网站页面被蜘蛛抓取,会对页面举办说明辨认,称之为页面理会。页面理会对网站至关重要,网站内容被抓取是网站被发明的第一步,而页面理会,则是网站内容被辨认出来的重要一环,页面理会结果直接影响搜刮引擎对网站的评价。 3.2.1 页面元素 3.2.1.1 页面问题 关于网页问题,百度搜刮于 2017 年 9 月推出清风算法,重点冲击网站问题作弊,引导用户点击,侵害用户体验的举动;清风算法重点冲击的问题作弊环境有以下两种: √ 文差池题,网站问题与正文有明明不切合,误导搜刮用户点击,对搜刮用户造成危险 √ 大量堆砌,网站问题中呈现大量堆砌要害词的环境也异常不倡导 关于网站问题作弊的具体解读,参考搜刮学院宣布官方文档《百度搜刮内容质量白皮书——网页问题作弊详解》 关于网站TDK,有以下几种环境必要留意:("T"代表页头中的title元素,"D"代表页头中的description元素,"K"代表页头中的keywords元素,简朴指网站的问题、描写和择要) √ 百度未理睬严酷凭证title和description的内容展示问题和择要,尤其是择要,会按照用户检索的要害词,自动匹配展示吻合的择要内容,让用户相识网页的首要内容,影响用户的举动决定。 √ 站长会发明统一条链接的择要在差异要害词下是变革的,也许不会完全切合站长预期,尤其是站长在检索框举办site语法操纵时,也许会感受择要都较量差。但请不要担忧,事实绝大大都平凡网民不会这样操纵。在此环境下呈现不切合预期的择要并不代表站点被处罚。 √ 尚有一种环境,是网页中的HTML代码有误,导致百度无法理会出择要,以是偶然各人会看到某些功效的择要是乱码(虽然这种环境很少见),以是也请站长留意代码类型。 3.2.1.2 主体内容 主体内容留意两个点,一个主体内容过长(凡是网页源码长度不能高出128k),文章过长也许会引起抓取截断;其它一个是留意内容不能空短,空短内容也会被判定为无代价内容。 以下说明两个示例: 关于主体内容过长的示例说明: 某网站主体内容都是JS天生,针对用户会见,没有做优化;可是网站特针对爬虫抓取做了优化,直接将图片举办base64 编码推送给百度,然而优化后发明内容没有被百度展示出来 页面质量很好,还特意针对爬虫做了优化,为什么内容反而无法呈此刻百度搜刮中 说明首要有以下缘故起因:
这样的环境给到以下提议:
关于内容空短的示例说明: 某网站反馈网站内容未被建索引,说明发明,网站抓取没有题目,但被抓取到的页面,都提醒必要输入验证码才气查察所有页面,这类页面被判定为空短页面,这类页面在抓取后,会被鉴定为垃圾内容。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |