1.确保你的网站导航对搜索引擎友好
例如,如果你不知道如何让flash对象对网络爬虫来说是可访问的和友好的,那么使用flash作为网站导航是一个糟糕的选择。搜索引擎很难捕捉到使用flash的网站。
css和低调的java可以提供任何你需要的精心设计的效果,而不会牺牲你的搜索引擎排名。
2.将脚本放在html文件之外
当为网站编写代码时,请确保通过外部引用使用java和css。
搜索引擎通过html文件中包含的所有内容检查网站。如果您不在外部引用中使用java和css,您将在html文档中添加一些特殊的代码行。在许多情况下,这些代码会出现在真实内容的前面,从而减慢爬虫的爬行速度。搜索引擎希望尽快获得网站的内容。
3.使用搜索引擎爬虫可以阅读的内容。
内容是人类生活的一个网站,也是搜索引擎所需要的。设计网站时,确保你已经仔细研究了内容的优秀结构(如主题、段落和链接)。
内容很少的网站总是在搜索的结果中“挣扎”。在许多情况下,如果在设计阶段有一个更合适的计划,这是完全可以避免的。例如,除非使用css匹配图片油墨替换技术,否则不要用图片替换油墨。
4.将你的网址设计成搜索友好的
搜索友好的网址并不是那些难以捕捉的网址,例如询问字符串。最好的网址包括帮助描述网页内容的关键词。应该注意一些使用自动生成的数字和唯一符号作为页面url的内容处理系统。一个好的内容处理系统将允许你定制和修饰网站的网址。
5.限制不希望搜索引擎索引的页面
可能有些页面你不想让搜索引擎索引。这些页面可能对您的内容没有用处,例如服务器端脚本。当你创建一个新网站时,这些页面甚至可以用来测试你的设计(虽然这不是建议,但我们中的许多人仍然会这样做)。
不要向网络机器人展示这些页面。你可以给搜索引擎重复的内容,同时稀释你的关键内容。这些页面可能会对您网站的搜索位置产生负面影响。
防止搜索引擎检索这些页面的最好方法是使用机器人和txt文件来改进你网站上的五个文件之一。
如果您的网站的一部分正在测试环境中使用,请使用代码来保护这部分内容。一个更好的方法是使用本地网站创建一个环境,如xampp或wampserver。