如果我们从搜索引蜘蛛的角度去看待一个网站,在抓取、索引和排名时会遇到哪些问题呢?解决了这些问题的网站设计就是搜索引擎友好的设计
1.搜索引蜘蛛不能找到网页
要让搜索引擎发现网站首页,就必须要有外部链接到首页,找到首页后,蜘蛛沿着内部链接找到更深的内容页,所以要求网站要有良好的结构,符合逻辑并且所有页面可以通过可爬行的普通HTML链接达到,Javascript链接、Flash中的链接等搜索引擎蜘蛛一般不能跟踪爬行,就会造成收录问题。
网站所有页面离首页点击距离不能太远,最好在四五次点击之内。要被搜索引擎收录,页面需要最基本的权重,良好的网站链接结构可以适当传递权重,使尽量多的页面达到收录门槛。
2.找到网页后能不能抓取页面内容
URL必须是可以被抓取的。数据库动态生成、带有过多参数的URL、整个页面都是Flash、框架结构、可疑的转向、大量复制内容等都可能使搜索引擎敬而远之。某些文件站长不希望被收录,除了不链接到这些文件,更保险的方法是使用 ROBOTS.TXT或者 meta robots标签禁止收录。
3.抓取页面后怎样提取有用信息
关键词在页面重要位置的合理分布、重要标签的编写、HTML代码精精简、起码的兼容性等可以帮助搜索引擎理解页面,提取有用信息。只有搜索引擎能顺利找到所有页面,抓取这些页面并提取其中真正相关性的内容,网站才可以被视为搜索引友好的设计。
既然找到了问题的根源,那么怎么进行网页设计才能最大程度提升搜索引擎的友好度呢?
(1)目录结构和URL。
URL是统一资源定位,即每个网页的网址、路径。网站文件的目录结构直接体现于URL。清晰简短的目录结构和规范的命名不仅有利于用户体验和网址传播,更是搜索引擎友好的体现。
(2)目录层次。
对于一个小型网站来说,一般只有一层子目录
如://www.yoursite.com/dirl/page.htm
www.yoursite.com是域名,dirl是一级目录名,page是文件名。对搜索引擎而言,这种单一的目录结构最为理想,即扁平结构(Fat)。
(3)目录和文件命名。
根据关键字无所不在的原则,可以在目录名称和文件名称中使用到关键词。但如果是关键词组,则需要用分隔符分开。
(4)绝对URL和相对URL。
绝对URL:即网页路径使用包含顶级域名在内的完整的URL。
如:www.yoursite.com/pagel/index.html是一个绝对路径,其中/pagel/in-dex.html则为相对路径,由浏览器自动在该链接前加上www.yoursite.com。总体上,Google在排名时并不在意URL使用的是相对路径还是绝对路径。
(5)导航结构。
网站导航是对引导用户访问网站的栏目、菜单、在线帮助、布局结构等形式的统称。其主要功能在于引导用户方便地访问网站内容,是评价网站专业度、可用度的重要指标。同时对搜索引也产生诸多提示作用。概括地讲,网站在导航方面应注意以下几点:
①主导航醒目清晰。
②“面包屑型( Breadcrumbs)”路径。
③首页突出重要内容。
④使用网站地图。
(6)框架结构。
框架型网站的优越性体现在页面的整体一致性和更新方便上。尤其对于那些大型网站而言,框架结构的使用可以使网站的维护变得相对容易。但框架对搜索引摹来说是一个很大的问题,这是由于大多数搜索引擎都无法识别框架,也没有什么兴趣去抓取框架中的内容。此外,某些浏览器也不支持框架页面。
(7)图像优化。
一般而言,搜索引擎只识读文本内容,对图像是不可见的。同时,图像文件直接延缓页面加载时间,如果超过20秒网站还不能加载,用户和搜索引擎极有可能离开你的网站。
(8)Alt属性。
每个图像标签中都有Alt属性,搜索引擎会读取该属性以了解图像的信息。因此,最好在所有插图的Alt属性中都有文字描述,并带上该页关键字在其中。
(9)文本说明。
除了Alt属性文字,还可以考虑以下方法直接优化图像,使之被搜索到:
①在图片上方或下方加上包含关键词的描述文本。
②在代码中增加一个包含关键词段的 heading标题标签,然后在图片下方增加文字描述。
③在图片下方或旁边增加如“更多某某”链接,包含关键词。
④创建一些既吸引用户又吸引搜索引擎的文本内页,先把流量吸引到这些页面,再提供文本链接指向你的图片页面。
(10)Gif和JPGE图像优化。
对图片文件优化的目的是在尽量不影响图像画面效果的情况下,将其文件大小降到最低,以加快页面整体下载速度。
(11)FLASH优化。
FLASH优化可以从以下三个方面来考虑:
①做一个辅助HTML版本;
②将Flash内嵌HTML文件,付费登录搜索引擎。
(12)表格使用。
如果某个网页采用了大段的长篇文本,除了可以将一页文本分成多面,还可以考虑将文本置入不同表格中,这样不仅管理方便,也使得该页加载时每个表格内容依次加载,这样访问者就可以一边看已下载内容一边等待剩余部分加载,而不是等待很久之后才一齐加载出来。表格之内套嵌太多表格也不利于页面加载,因浏览器是先加载完大表格之后再加载内嵌的小表格,因此内嵌表格会最终降低整页加载速度。
(13)网页减肥。
代码不妥不仅延长网页加载时间,也严重影响蜘蛛程序对网页内容的抓取。去掉臃肿杂乱的代码,减小网页文件大小,能够加快网页加载速度,让蜘蛛快速索引到重要内容。
(14)Javascript
采用Javascript技术的网页往往在页面一开始就堆积大量JAVA代码,以至META及关键字迟迟不能出现,被推至页面底部,对搜索引擎很不友好。有两种方法可以使之得以改善:
①将脚本移至页面底部。
②将JAVA脚本置入一个,js扩展名的文件。
(15)301水久重定向。
301水久重定向页面也叫301转向或者301跳转,它的作用就是将域名永久地转移到另一域名上去。可别小看了这个简单的功能,在许多时候起着不可替代的作用,比如:网站更换域名,网页批量跳转,更重要的是301页面对于网站的SEO方面。
301跳转会告诉搜索引,网址已经迁移。这时搜索引擎会对新的网址进行抓取,同日时还会将旧网址的原有连接和外链逐步转移至新的网址下,这就意味着新域名可以得到老域名的权重,从而将域名更换的影响降到最低。
不过从实践来看,情况并不像理论上那么好。301起作用还是比较缓慢的,有的网站设置301跳转将近半年,可百度依然将老域名排在前面,新域名则落在了老域名的后面。
(16)404错误页面。
当用户输入了错误的链接时,将返回404错误页面给用户,这个页面是为了提醒用户地址不存在而设置的
对于搜索引擎来说,如果蜘蛛访问的某个URL却返返回了404错误的页面,这时蜘蛛就知道这个页面是不存在的,便不再抓取这个页面,同时会向搜索引整的数据中心提交这个URL,从而将这个网址从索引中删除。
(17)500服各器内部错误提示页面
服务器、数据库出错总是无法预料的,如果这些地方先出出了故障,并且正好搜索引擎的蜘蛛抓取到了这个返回了404的页面,那对于搜索引擎将会产生非常不好的印象。怎么才能解决这个问题呢?500页面就是个很好的方法。
500页面是一个带有草屋描述的页面,它告诉搜索引擎该网站目前出现了个暂时性的小技术性问题,或许是数据库出错,或许是网站维护。这样蜘蛛就不用吃闭门羹,自然会友好很多。
(18)友好错误页面。
IS默认的错误页是很不友好的,很多人看到默认的错误页时都会说:网站打不开了!白白损失了这部分流量。而如果错误页直接跳转到首页又对搜索引擎很不友好,搞不好首页还会被封掉。所以根据情况,有两个方法解决这个问题如果是博客等内容型的网站,可以返回一个带有404错误的搜索框让访客搜索,若是电子商务:%%%%%%%%%型网站,则可以返回一个带有404错误的进度条进行跳转。这两种方法既照顾了访客又顾及到了SEO。可以 Google webmaster tools中查看自己网站错误页有多少。
修改默认错误页的方法很简单:在IS中右键单击要管理的网站,在自定义错误中设置404为相应的错误信息:htp:/ww.………&&&.com.cn/enews/页这里有两种方式:
①如果“消息类型”你选择的是“文件”,则则只能使用.html或htm结尾的文件,否则用户访问错误页时会出现:http:/product.……&&&.com.cn/pnce plist32_2535. shtml码。用这种方式设置的错误页,虽然.hml文件中没有输出404状态,但IS执行后会自动输出404状态。
②如果“消息类型”你选择了“URL",则必须用asp文件(因为只有在asp文件中才能设置404状态),否则访问错误页时会返回200状态码。如果你希望定时跳转到首页,则也有两种方法
①利用meta标签的 refresh进行跳转。据Google中文博客管理员介绍, Yahoo就使用的此方法进行跳转。
②使用讲行跳转。我感觉使用is的方法t好一些搜索引擎会识别为“200”或“302”。
常常看到许多网站的自定义404错误页面采取类似这样的形式:首先显示一段错误信息,然后,通过 Meta Refresh将页面跳转到网站首页、网页地图或其他类似页。根据具体实现方式不同,这类404页面可能返回“200”状态码,也可能返回“302临时重定向”,但不论哪种,从SEO技术角度看,均不是一种合适的选择。
制作中文友好网页同样是一种讨好搜索引擎非常重要的方方法,当你按照上述方法对网站制作进行修改和设计后,是否发现蜘蛛一下子跟你亲呢了很多?你在搜索主页的排名是不是开始稳稳上升了?
本文地址://www.xrqsnxx.com//article/3411.html