一直以来,百度搜索都致力于与广大开发者共同努力,为亿万搜索用户提供优质可信的内容、安全便捷的搜索体验。搜索算法是保障搜索安全与内容质量的重要防线。百度搜索资源平台特此将搜索算法进行梳理及更新,汇编为《百度搜索算法规范详解》,系统化地阐明了搜索优化过程中不允许发生的违规问题、需规避的运营“雷点”,助力开发者更好地提升自身资源质量。

一、页面内容质量

1.1飓风算法3.0——针对页面内容质量问题

百度搜索于2017年7月4日发布飓风算法,严厉打击恶劣采集问题,在2018年9月13日公布飓风算法升级为2.0版本,在2019年8月对飓风算法进行升级,上线飓风算法3.0。

飓风算法主要针对以下页面内容质量问题:

1.1.1恶劣采集行为:

(1)存在大量从其他站点、智能小程序或公众号等内容生产方采集、搬运而来的内容,信息未经整合,排版混乱,文章可读性差,有明显采集痕迹,对用户无任何增益价值。

(2)存在多段文章拼接的内容,文章逻辑性差,无法满足用户需求,阅读体验差。

(3)站点或智能小程序内存在大量采集内容,自身内容生产力极差。

1.1.2跨领域采集问题:

指站点/智能小程序为了获取更多流量,发布不属于站点/智能小程序领域范围的内容,通常这些内容采集自互联网,内容质量及相关性低、对搜索用户价值低。对于这样的行为搜索会判定该站点/智能小程序的领域专注度不足,会有不同程度的限制展现。

跨领域采集主要包括下面两类问题:

第一类:主站或主页的内容/标题/关键词/摘要等信息显示该站有明确的领域或行业,但发布内容与该领域不相关,或相关性较低。

第二类:站点/智能小程序没有明确的领域或行业,内容涉及多个领域或行业,领域模糊、领域专注度低。

1.1.3站群问题:

指批量构造多个站点/智能小程序,获取搜索流量的行为。站群中的站点/智能小程序大多质量低、资源稀缺性低、内容相似度高、甚至复用相同模板,难以满足搜索用户的需求。

问题示例:多个智能小程序复用同一模板,内容质量低、相似度高

1.2劲风算法——针对恶劣聚合页问题

2020年2月,百度搜索技术团队发现,部分网站及智能小程序通过恶意构造聚合页面内容来获取搜索排名,获得搜索用户关注,上线劲风算法,控制恶意构造聚合页的问题对搜索用户的影响。

聚合页,是指页面并无文章主体内容,而是多个页面的索引链接围绕在特定主题下的信息整合页。

恶劣聚合页问题主要包括以下四种类型:

(1)页面内容与站点本身所属领域不符,或站点无专注领域,多为采集拼凑内容。

问题示例1:站点内容领域分散

(2)页面内容与标题及页面中标记的标签不符。

(3)由网站搜索功能生成的静态搜索结果页。

(4)空短、无有效信息、失效的聚合页。

1.3细雨算法2.0——针对B2B领域低质问题

2018年6月,百度搜索发布细雨算法,针对B2B行业的网站受益问题进行规范和引导。

2019年11月,百度搜索发布细雨算法2.0,针对B2B行业的恶劣违规问题及低质内容。

细雨算法主要针对以下问题:

1.3.1页面标题作弊及误导:

(1)非公司官网,title中包含“官网”等字样,误导搜索用户认为是官网

(2)页面title中堆砌相近关键词;

(3)页面title中穿插火星文字或者特殊符号,影响正常阅读;

(4)页面title中穿插受益方式。

1.3.2页面正文内容中存在受益信息:

(1)正文内容不完整,频繁穿插变形的受益方式。

具体是指:正文内容为无价值内容的拼接或者正文内容不完整,同时采用“英文字母”、“汉字谐音”、“特殊符合”、“全角符合”等方式代替联系方式,穿插在正文内容中。

(2)文章的配图图片中存在受益联系方式。

具体是指:图片中联系方式水印面积较大,严重损害浏览体验。

(3)正文中商品或者服务信息内容为乱采集、拼接而成、排版混乱、用户从页面中无法获得商品或者服务信息。

1.3.3恶劣违规内容:

(1)页面内容恶劣采集。

如:拼接内容、纯采集内容、跨领域采集内容等。

(2)发布软文信息。

问题示例:利用小程序页面发布软文,页面标题是“垃圾车厂家哪家好“,内容是品牌软文,对用户产生误导

(3)发布无法满足用户需求的空白页面,对用户完全无价值。

(4)商品信息有误。

如:商品详情、价格等与实际情况不符

(5)功能不可用。

如:交易、联系电话、查看详情等交互功能不可用等情况。

1.3.4低质内容:

1、图片内容低质。

如:图片内容与文字描述不一致、图片嵌入电话号码、图片质量极低影响阅读体验等。

2、页面内容低质。

如:页面中只有图片无有效信息,或信息提供不完善等情况。

1.4蓝天算法——针对目录交易问题

2016年11月,百度搜索推出蓝天算法,持续打击新闻类站点售卖软文、目录的行为,还用户一片搜索蓝天。被“蓝天算法”所覆盖的站点将会被降低其在百度搜索系统中的评价。

二、用户需求满足

2.1标题规范——针对页面标题违规问题

2017年9月,百度搜索发布清风算法,严惩开发者通过页面标题作弊,欺骗用户并获得点击的行为;从而保证搜索用户体验,促进搜索生态良性发展。

2018年11月,百度搜索针对页面标题作弊行为发布《百度搜索页面标题规范》,对搜索生态下的网页标题进行了严格的规范和要求。不符合《百度搜索页面标题规范》的站点,将会被清风算法1.0覆盖,受到限制搜索展现的处理。

2.2清风算法3.0——针对下载站违规问题

为了规范下载行业站点及智能小程序的欺骗下载、捆绑下载等伤害用户的行为,百度搜索分别于2018年4月、2018年10月发布清风算法2.0、3.0版本,清风算法覆盖的问题范围从标题作弊行为扩展到下载行业站点及智能小程序的欺骗用户行为。

2018年10月,百度搜索发布《百度搜索下载站质量规范》,对百度搜索范围内下载站点及智能小程序的行为进行严格要求和控制。不符合此规范的下载站或智能小程序,将会被清风算法3.0覆盖,受到搜索展现的限制。

2.3信风算法——针对虚假翻页诱导问题

2019年5月,百度搜索发布信风算法,控制网站或智能小程序利用翻页键诱导用户的行为。

信风算法主要针对以下情况:

用户点击翻页键时,自动跳转至网站的其他频道页(如目录页、站外广告页等)。

2.4违规信息规范——针对违法违规信息

为了维护安全健康的搜索生态,保障搜索用户的合法权益,2019年2月,百度搜索发布《关于百度搜索严厉打击虚假诈骗等违法违规信息的公告》,打击电信网络中的虚假诈骗、违法交易、黄赌毒等违法违规信息。

三、用户体验友好

3.1冰桶算法5.0——针对移动落地页体验问题

一直以来,百度搜索致力于提升搜索用户的浏览体验,营造健康的搜索生态。2014年8月22日,百度搜索针对低质页面问题发布冰桶算法,经过不断更新迭代,在2018年11月对冰桶算法进行升级,上线冰桶算法5.0。

冰桶算法5.0以《百度APP移动搜索落地页体验白皮书5.0》为标准,对落地页广告、APP调起、展开全文功能等问题进行控制进行控制。

四、搜索公正及用户安全

4.1惊雷算法2.0——针对恶意刷点击问题

为了保证搜索用户体验,促进搜索生态良性发展,2017年11月,百度搜索发布惊雷算法,严厉打击刷网站点击的作弊行为。2018年5月,惊雷算法升级至2.0版本。

当前,惊雷算法2.0主要针对“恶意制造作弊超链”和“恶意刷点击”的作弊行为。针对作弊的网站,将会受到限制搜索展现、清洗作弊链接、清洗点击的处理,并会将站点作弊行为计入站点历史,严重者将永久封禁。

4.2烽火算法3.0

一直以来,百度搜索对于危害用户隐私、恶意劫持站点的行为态度坚定,一经发现一律严惩。2017年2月,百度搜索发出针对恶意劫持行为的公告:《打击劫持百度移动搜索推出烽火计划》,严惩恶意劫持的行为。2018年5月,百度搜索上线烽火算法2.0,严惩“窃取用户数据”和“恶意劫持”的行为。2019年3月,烽火算法升级至3.0版本。

4.3被黑相关——针对被黑问题

2018年3月,为了保证搜索生态安全,保障用户权益,百度搜索发布《网站被黑操作指南》,引导站点排查被黑情况。

网站被黑,通常表现为网站中出现大量非本网站发布的类似博彩内容,或网站页面直接跳转到博彩页面。

转载注明出处:http://m48.cn/wangluozhengli/1596.html