如何创建一个方便 Google 收录排名的网站?

2008-06-12 来源:外贸壹号

                                                                                                                                               转自Google问题解答
网站准备就绪后

•    将其他相关网站链接到您的网站。

•    将网站提交给 Google,网址为:http://www.google.com/addurl.html 。

•    将 Sitemap 作为 Google 网站管理员工具的一部分提交。Google 使用您的 Sitemap 来了解您网站的结构,并提高对您网页的抓取率。

•    确保应了解您网页的所有网站都知道您的网站已处于在线状态。

•    将您的网站提交到相关的目录,例如,Open Directory Project 和 Yahoo!,以及其他特定行业的专业网站。

 设计与内容指南

•   网站应具有清晰的层次结构和文本链接。每个网页应至少可以通过一个静态文本链接打开。

•  为用户提供网站地图,列出指向网站重要部分的链接。如果网站地图上的链接超过或大约为 100 个,则需要将网站地图拆分为多个网页。

•    网站应实用且信息丰富,网页文字应清晰、准确地表述要传达的内容。

•    要考虑到用户会使用哪些字词来查找您的网页,确保网站上确实包含了这些文字。

•    尽量使用文字而不是图形来显示重要的名称、内容或链接。Google 抓取工具无法识别图形中所含的文字。

•    确保对 TITLE 和 ALT 标记属性的描述和表达准确无误。

•    检查链接是否损坏,并确保 HTML 格式正确。

•   如果您决定采用动态网页(即网址中包含"?"字符),请注意并非所有搜索引擎的抓取工具都能像抓取静态网页一样抓取动态网页。动态网页有助于缩短参数长度并减少参数数目。

•    将特定网页上的链接限制在合理的数量内(少于 100 个)。

 技术指南

• 由于大部分搜索引擎 Spider 查看网站的方式与 Lynx 一样,所以可以使用 Lynx 之类的文本浏览器来查看您的网站。如果因应用了 Javascript、Cookie、会话 ID、框架、DHTML 或 Flash 等复杂技术,而导致在文本浏览器中无法看到网站的所有网页,则搜索引擎 Spider 在抓取您的网站时可能会遇到麻烦。

• 允许搜索漫游器在不采用会跟踪其在网站上浏览路径的会话 ID 或参数的情况下抓取您的网站。这些技术对跟踪单个用户的行为非常有用,但漫游器的访问模式却完全不同。如果采用这些技术,则可能会导致对网站的检索不完整,因为漫游器可能无法排除那些看上去不同,但实际却指向同一个网页的网址。

• 确保您的网络服务器支持 If-Modified-Since HTTP 标头。通过该功能,您的网络服务器可以告诉 Google 自上次抓取您的网站以来,内容是否已发生变化。该功能可以节省您的带宽和开销。

• 利用网络服务器上的 robots.txt 文件。该文件会告诉抓取工具哪些目录能够抓取,哪些不能抓取。确保该文件是网站的最新版本,以免意外拦截 Googlebot 抓取工具。请访问http://www.robotstxt.org/wc/faq.html ,了解如何在漫游器浏览您的网站时对其进行指示。您可以使用 Google 网站管理员工具中的 robots.txt 分析工具测试 robots.txt 文件,以确保正确使用此文件。

• 如果您的公司购买了内容管理系统,请确保该系统能导出您的内容,以便搜索引擎 Spider 可以抓取您的网站。

• 使用 robots.txt 可避免抓取搜索结果页或其他自动生成的页面,这些页面对来自搜索引擎的用户没有太多附加值。

 质量指南

上述质量指南介绍了最常见的作弊形式或操纵行为,对于此处未列出的其他误导行为(例如,通过注册知名网站的错拼形式来欺骗用户),Google 仍可予以拒绝。不要抱有侥幸心理,认为某种欺骗手段未在本页中列出,Google 就会认可该手段。作为网站管理员,与其花费大量时间寻找漏洞加以利用,不如尽其所能维护基本原则,以便为用户带来更好的体验,从而使网站获得更高的排名。

如果您认为其他网站正在滥用 Google 质量指南,请通过 https://www.google.com/webmasters/tools/spamreport?hl=zh_CN 举报。Google 希望能开发出灵活的自动解决方案来解决上述问题,因而尽量避免一一处理违禁行为。我们收到的滥用行为报告将用于创建灵活的规则系统,以便于识别并阻止以后的滥用企图。

 质量指南 - 基本原则

•    设计网页时该考虑的是用户,而不是搜索引擎。不要欺骗用户,或提交给搜索引擎一种内容,而显示给用户另一种。这种做法通常称为"隐藏"。

•    请不要为了提高搜索引擎排名而弄虚作假。一个简单分辨是非的方法是:您是否可以坦然地跟竞争对手网站解释您对网站所做的事情。另一个有用的测试手段即扪心自问:"这能否给我的用户带来帮助?如果不存在搜索引擎,我是否还会这样做?"

•    请不要参与旨在提高您的网站排名或 PageRank 的链接方案。尤其要避免链接到违禁的网站或"恶邻",因为您自身的排名会受到这些链接的负面影响。

•    请勿使用未经授权的计算机程序来提交网页和检查排名等。这些程序会耗用计算机资源,而且违反我们的服务条款。Google 不建议使用 WebPosition Gold™ 这类产品向 Google 发送自动查询或用程序编写的查询。

质量指南 - 具体指南

•    请不要使用隐藏文本或隐藏链接。

•    请不要使用隐藏真实内容或欺骗性的重定向手段。

•    请不要发送自动查询给 Google。

•    请不要加载使用无关字词的网页。

•    请不要创建包含大量重复内容的多个网页、子域名或域名。

•    请不要制作安装有病毒、特洛伊木马或其他有害软件的网页。

• 请不要专门针对搜索引擎创建"桥页",或使用其他联属计划这类原创内容很少或几乎没有原创内容的俗套 (cookie cutter) 方法。

如果您的网站参加联属计划,请确保您的网站可为其增添价值。请提供独特且相关的内容,使用户有理由首先访问您的网站。

向访问者提供他们要查找的信息

在网页上提供高品质的内容,尤其是主页。这是您要做的最重要的工作。如果您的网页包含有用的信息,其内容就可以吸引许多访问者并使网站管理员乐于链接到您的网站。要创建实用且信息丰富的网站,网页文字应清晰准确地表述要传达的主题。想一想,用户会使用哪些字词来查找您的网页,然后尽量在网站上使用这些字词。

 确保有网站链接到您的网站上

链接可帮助我们的抓取工具找到您的网站,并提高您的网站在我们的搜索结果中的展示率。返回搜索结果时,Google 会配合使用 PageRank(我们对网页重要性的评测)与先进的文字匹配技术,对每个搜索结果都显示兼具重要性与相关性的网页。Google 会计数网页收到的投票数量,作为 PageRank 的评判标准之一,其计算方法是将从网页 A 指向网页 B 的链接计为由网页 A 对网页 B 所投的一票。本身很"重要"的网页所投的票会更具分量,且有助于提高其他网页的"重要性"。

请注意,我们的算法可区别自然链接与非自然链接。指向您网站的自然链接是当其他网站发现您的内容具有价值并认为其可能对访问者有所帮助时,在网络的动态生成过程中形成的。指向您网站的非自然链接是专门放在那里,使您的网站显得更受搜索引擎欢迎的链接。我们的网站管理员指南介绍了一些此类链接(例如,链接方案和桥页)。

只有自然链接对网站的索引和排名有帮助。

 让您的网站易于访问

以合理的链接结构建立您的网站。每个网页应至少可以通过一个静态文本链接打开。

使用文本浏览器(如 Lynx)检查您的网站。大部分 Spider 查看网站的方式与 Lynx 一样。如果因应用了 JavaScript、Cookie、会话 ID、框架、DHTML 或 Macromedia Flash 等技术,而造成在文本浏览器中无法看到整个网站,则 Spider 在抓取此网站时可能也会遇到麻烦。

考虑创建动态网页的静态副本。虽然 Google 索引中包括动态网页,但它们只占索引的一小部分。如果您怀疑您动态生成的网页(例如包含问号的网址)给我们的抓取工具带来了麻烦,可以为这些网页创建静态副本。如果要创建静态副本,不要忘记将动态网页添加到您的 robots.txt 文件,防止我们将其当成重复内容。

 需要避免的事项

不要使用关键字填满网页、尝试"遮蔽"网页或建立"仅供抓取"的网页。如果您的网站上包含您不希望访问者看到的网页、链接或文字,Google 会认为这些内容具有欺诈性并可能忽略您的网站。

合法的搜索引擎优化咨询公司可以改善您网站的流量和内容,但某些公司会采用欺骗性手段试图骗过搜索引擎。请务必小心,如果您的域名与这些欺诈性服务相关,我们可能禁止其加入我们的索引。

不要使用图片来显示重要的名称、内容或链接。我们的抓取工具无法识别图形中所含的文字。如果网页上的主要内容和关键字不能以普通的 HTML 格式显示,请使用 ALT 属性。

不要为不同网址下的一个网页创建多个副本。许多网站提供纯文本或易于打印的网页,其内容与相应的图形丰富的网页不相上下。为了确保您首选的网页包括在我们的搜索结果中,请使用 robots.txt 文件拦截 Spider 抓取到的重复内容。有关使用 robots.txt 文件的详情,请访问关于拦截 Googlebot 的信息。

转自Google问题解答



Copyright © 2003-2019 外贸壹号 宁波商库网络科技有限公司 All Rights Reserved. 备案号: 浙ICP备10043662号-6

浙公网安备 33020502000371号

, XML, Sitemap