怎么让搜索引擎精准的抓取

今天就和大家说说,我们怎么做,让搜索引擎精准的抓取我们站点!
timg_(1).jpg

一、head标签中的部分

1.URL设计

URL尽量含有通用已成趋势的移动命名,例如“m./wap./3g./mobi./mobile./mob/wml/”,可以在子域名等方面体现

2.页面顶部的doctype标签

作为协议的重要部分,doctype中是否移动化也很重要,检查是否存在与移动相关的声明,如这些关键词,openmobilealliance, xhtml-mobile, xhtml-basic,wapforum,dtd compact html

例:“”

3.meta标签中的viewport属性和x-ua-compatible 属性

viewport,移动前端开发中最重要的标签,响应式设计的根基,如果你的页面是遵守响应式设计的,那么说明这些页面对移动设备有友好的输出。

典型的的viewport代码是这样的,,判断移动与否的关键属性值为width,如果width=device-width这是典型的移动友好的设计,增加判定为移动页面的砝码,如果width有具体值,且值大于典型的移动屏幕(应该小于600),那么该页面被判定为PC页面的几率大大增加。

但,META中还有一个很独特的属性作为SEO人员应该很少接触到,那就是x-ua-compatible 属性,该属性是PC意味非常强烈的功能性代码。示例代码如此,,从百度工程师处得知,该代码会有较强暗示当前页面为PC页面的功能,需选择性使用。

4.title中的移动暗示

制作移动页面时,在title标签中写明:“移动版”、“手机版”、“WAP版”、“触屏版”不仅是照顾用户体验的方案,也利于页面的移动识别,反之PC页面要谨慎使用这些文案。

5.链接link标签的media和href属性中需要注意的细节(多为样式文件)

media属性值为screen时,表示屏幕中的显示样式,link的href所填写的URL(基本为样式文件的URL)就比较重要了,一定程度加大不同设备的偏重。此时URL中尽量出现/wap,/mobile/这样的命名,同URL设计一样,用于提高页面识别为移动的效率和概率。如URL中含有pc字样则加大识别为PC页面的几率。

6.一些通用的PC类识别HTML代码

embed:经常用于嵌入多媒体

object:用于嵌入对象

marquee:老旧的滚动特效实现代码

iframe:想必网站优化人员很熟悉了,典型的PC常用标签

这些典型的用于PC或者老旧的、HTML5已经有更高效替代方案的旧标签,意味着使用它们将增加页面的PC属性,需要有目的地取舍。

7.一些javascript中典型的PC特征

加载swfobject、含有activexobject语句:移动页面根本不会使用如此重的多媒体引用方案(可以问你的前端工程师)

含有netscape(网景)、msie(IE)、firefox(火狐)、browser.msie(IE)这些典型的非移动端浏览器兼容代码的

设置了timer的 ,以及JS代码含有settimeout的(此处不知道为什么设置timer还有识别的问题),均大幅增加识别为PC页面的可能性

以上这些中出现的内容

二、正文body中需要注意的部分

链接和文本遵照的原则基本与head中一样——多出现移动相关的字眼;页面设置的宽度不要超过常规移动设备的大小;那些常识中(除非招错前端工程师)绝对只用于PC的一些兼容性代码。

此外div块的个数也值得注意,没有哪家移动页面会过量使用div块;还有典型的只用于适配PC机器的HTML代码,例如:accesskey(如果移动页面用,要不前端招错人了,要不产品招错人了,应该引起警觉)

head和正文两大部分,基本涵盖了一张页面最主要的部分。

网站优化人员一定要把握这些使用细节,协助前端工程师从正反方向将公司的PC和手机页面泾渭分明地呈现给搜索引擎。试想如果你每日被抓取页面达到90%的识别率,而一般水平是70%,这种优化增量是非常显著的。

最后,分享一个机器学习的思想给网站优化的新人,此文中心思想截取如下:“你从市场上的芒果里随机的抽取一定的样品(训练数据), 制作一张表格, 上面记着每个芒果的物理属性, 比如颜色, 大小, 形状, 产地, 卖家, 等等。(这些称之为特征)。 还记录下这个芒果甜不甜, 是否多汁,是否成熟(输出变量)。你将这些数据提供给一个机器学习算法(分类算法/回归算法),然后它就会学习出一个关于芒果的物理属性和它的质量之间关系的模型。 下次你再去市集, 只要测测那些芒果的特性(测试数据),然后将它输入一个机器学习算法。算法将根据之前计算出的模型来预测芒果是甜的,熟的, 并且/还是多汁的。
 
相关标签:

1 个评论

挖掘海量数据,第一时间反映跨境电商行业的热门风向,为跨境客户提供真实客观的市场决策依据。
让搜索引擎搜索结果更精准的方法:
1、完整搜索”关键词“表示查询词不能被拆分,在搜索结果中必须完整出现。
2、不含某个词,表示所有搜索结果不包含减号后面的词,含有它的网页将被过滤掉。
3、标题中搜索intitle,表示搜索结果的标题都必须含有intitle:后的查询词,帮助排除无关网页。
4、指定网站site:表示搜索结果一定来自你输入的网站。
5、并行搜索|,表示搜索结果中包含词语A和B中的任意一个,不必同时包含这两个词。
6、ERL中搜索inurl,表示搜索结果中,查询词需要出现在网页的URL里。
7、搜索政府网页inurl:gov,表示搜索出来的网页都是URL中带有gov的政府网站。
8、指定格式filetype,表示搜索特定的文件格式
想了解更多独立站信息可以加刘小喵QQ 982709520 现在加好友还可以免费获得十五天试用哦

要回复文章请先登录注册