HDwiki百科建站系列讲座:针对HDwiki的搜索引擎优化

时间:2010-08-05 15:57来源:鱿鱼 作者: 点击:

  HDwiki百科建站讲座第12期邀请到爱丁堡大学博士王文星,他就“HDwiki搜索引擎优化”与大家进行了交流。

  大家下午好,我是王文星。

  首先说一下我对SEO的理解吧。SEO的中文是搜索引擎优化。通常把SEO分为白帽SEO和黑帽SEO。我肯定是白帽SEO,虽然我长的不白。网上可以查出很多解释,我的理解是这样的:白帽SEO是用搜索引擎不反感的方式,让我们的网站排在搜索引擎排名中应该排的位置。举个例子吧。我一会发个网站,QQ尾号为单号的先点击,不然这个网站就瘫痪了。http://www.redchillirestaurant.co.uk/ 大家打开下这个网站。主持人打开了吗?现在尾号为双号的可以点了。谁点开了截个图。有google工具条的可以看出人品值(PR值) 是2,之后大家再用google百度一下红辣京川菜馆,大家会发现几十页后也找不到这个网站。这就是典型的一个网站没有在搜索引擎中排在合理的位置的例子。其实很简单:网站建立者不懂得 搜索引擎,看不懂图片和flash,否则凭着这个PR值=2 随便在哪写上“红辣京川”四个字搜索这么冷的词,他们网站注定排在第一位的。我从来不喜欢把一个网站弄得排在它应该排的位置的前面,因为这种行为绝对是暂时的,长远来看迟早会掉下来,而且会掉得比应有位置还低。要想排的更好,那就把内容作得更好。(估计你肯定想,估计你也弄不上去 )。这就和管理一样,一个能力适合在德州做牛仔的,偏偏去当了美国总统。其结果把自己的名声搞臭了,把美国也折腾的很惨。在我看来HDwiki 在没有适当优化前,用其搭建的网站就是排在了应该排的位置后面了。但没那个菜馆那么惨。

  HDwiki有太多的优点了,我这里就不提了,关上门没外人,我们探讨一下它的缺点。

  首先便是内部链接问题。HDwiki4.1 的内部链接的格式是: http://www.abc.com/index.php?doc-innerlink-关键词 。这个结构造成的后果是 搜索引擎会认为同一篇文章有两个连接 比如 http://www.abc.com/大熊猫 和 指向它的内部链接 http://www.abc.com/index.php?doc-innerlink-大熊猫。 这样很傻很天真的搜索引擎会认为这是两个重复页面,从而降低你的网站的信任。这个问题在前天发布的5.0测试版里面得到了非常好的解决,害得我讲稿还要重新整理。但5.0解决后还是存在着一定的提升空间的:

  首先举个例子说明下搜索引擎怎么对待链接。比如李四丢了一万元钱,我们是法官,他的朋友、亲戚、邻居都说是张三偷的。在没有任何证据的情况下我们一查历史记录发现张三偷过东西。这样我们就很怀疑是张三干的。搜索引擎通过外部的链接帮忙识别网页内容和这的原理差不多。这个就很类似超链分析。如果把指认张三可能是小偷的人分下等,比如张三的亲属认为张三是小偷的算3分,路人算2分,李四家属算1分,这就是PR值了,当然实际算法要复杂一些。

  搜索引擎一样,比如大家看某人不爽,我们两千多人都把 “遛白菜”的这个链接指向他的网站,就算他的网站没有“遛白菜”这三个字而仅仅提到了“我昨天吃了白菜”,搜索引擎也会认定,某人是遛白菜的。某人就会惊喜的发现,流量增高了很多,结果都是来自关键词“遛白菜”,他就晕掉了。也就是说,文章内容很重要,链接源头关键字也很重要。

  现在的百科网站——互动百科、百度百科、wiki百科 、soso百科等都是用的一一对应的链接模式,就是“北京”指向“北京”;“北京市”指向“北京市”。 其实更好的方式是北京;中国首都;北京市;2008年奥运会举办城市;中国房价最贵的城市之一;都指向北京,这样不但丰富了北京这个页面的链接,提高了搜索引擎对这个页面的理解,提高了它的权重,而且对网站整体的内部结构大有好处。不管怎么样,控制内部链接比控制外部链接更容易些。

  下面是我具体实施这个理论的一些建议:

  一是网站自动生成内部链接。用户在编辑“北京”词条的时候,会提供一些同义词,在生成内部链接的时候把这些词都指向“北京”词条。后台也可以专门给管理内部链接的页面。(当然有优先级别。比如“北京”和“北京市”同时添加了内部链接就麻烦了,)记得wordpress有这个插件,代码可以参考。

  另外一个是手动添加内部链接时候,比如 选了“北京的烤鸭”之后点内部链接,而网站里可能根本就没这个词条。这样HDwiki里会出现一个“本站尚未收录词条‘北京的烤鸭’,欢迎您来创建”这样的页面,对应链接是 http://www.abc.com/index.php?doc-innerlink-北京的烤鸭。 搜索引擎收录过多的这种页面 会觉得页面间相似度太高。而且浪费了“北京的烤鸭”指向 “北京”或者“烤鸭”,或者“北京烤鸭 ”这个有效的内部链接。

  我的建议是:当用户选择“北京的烤鸭”之后点内部链接按钮时候,如果有这个链接就算了。 如果没有提示一下“该词条还没建立”。 如果能提示一下“您是否想指向北京、烤鸭或北京烤鸭”就更好了。

  群里知道我是搞SEO的朋友,好多人问过我 www.abc.com/doc-view-123.htm 和 http://www.abc.com/北京 哪个更好些。为了回答这个问题,我先拿互动主站说事吧。

  我认为互动百科google排名靠前的原因之一是中文链接;之二是目录化设计;之三是HDwiki软体给带来的大量的外部链接,当然更重要的是优质的内容。

  普遍测试表明 www.abc.com/关键词/ 这种扁平式结构最适合google。 在链接中出现关键字google给了非常高的权重,另外这种结构google 认为是一个目录,而不是一个页面,一般目录比页面权重要高。hudong主站的结构是 www.hudong.com/wiki/关键词 多了个wiki影响不大,关键词后面没”/” google也认为是个目录,基本接近了 www.abc.com/关键词/结构。再加上合适的关键词密度,过得去的内部链接和较高的PR导致互动主站在google表现不错。

  那百度表现不佳的原因呢?是不是百度打击自己的对手呢?这个问题还蛮复杂的,从我个人的角度分析一下。大家先百度一下“毛细管电泳法”。大家发现在百度里去百度名词,百度百科基本是占据第一位的,不过 soso百科排在了第一页,而互动百科应该是不在前五页的。

  这个关键词说明:1.百度偏爱自己的产品 2.百度没有针对 soso百科下手 3.大家应该发现排在这一页的貌似没有中文url。

  从链接角度上说,很具讽刺意义的是百度这个最大的中文搜索引擎很长时间对中文的url不友好,经常显示成乱码,给的权重就可想而知了。还好现在终于支持了,不过给的权重也不是很高。

  那百度是否故意降低了互动百科的权重呢?这个问题比较有争议,我上周想尝试回答这个问题,编写了一个英文标题的词条,这样在互动显示的链接就不是中文了。 里面的关键词密度为7.5,该词在互联网上页面数也不多。 可惜这个词条没骗过互动百科的审核人员,没有上传上去。我也懒得再编了,大家谁闲的无聊自己测试着玩吧。

  但无可厚非的一点是受着中国传统文化熏陶长大的一些中国人建立的搜索引擎百度并没有学会严于律己宽以待人。一个SEO熟悉的例子:大家百度一下“碧可”。这个页面仍旧还显示在首页95.2%的关键词密度,前一段时间还显示在了第一条。如果大家有兴趣可以把自己的网站也弄这么高的关键词密度,看看是否能排在第一页。

  总结一下: 百度更喜欢 www.abc.com/abc.htm;google更喜欢 www.abc.com/关键词/,百度封不封互动对HDwiki没啥关系。如果大家的网站更喜欢google一些 ,可以弄成 www.abc.com/关键词/的结构,如果更喜欢百度建议用 www.abc.com/doc-view-123.htm 的结构好些,让google迁就下百度,毕竟google对abc.htm也不反感。

  有没有回答两个我都喜欢的?估计应该有,我就是其中一个。不过我的解决方案还不成熟,还在测试中,现在的结果google是认可的。百度爬虫反应太慢,不知道哪天才能爬到这个站上来。也不知道傻瓜的搜索引擎们是否会认为作弊,等测试成熟了会公布在论坛上。

  HDwiki内容设置了审核项,也就是网友编辑的完 提交后文章处于被审核状态,这个时候原始文章就不见了, 需要审核后才能看到。如果审核人员不能及时的审核,那么搜索引擎就会发现这个文章时而出现时而消失,如果是我们设计搜索引擎算法,对这样的文章排名也不会放在前面。我觉得应该保留原始版本,等新版本通过后再用新版本替代老版本。至于模板级的优化,我前几天分享了一个 “搜索优化模板”,里面修改了几十处等审核通过了大家可以参考。不过编辑完后犯了个小错误,当时太激动了就在版权位置写上了“seo by我用HDwiki搭建的网站”。这个错误可以引出交换链接时候应该注意的事项,如果大家,不用全部,只要某一些个人对我的模板感兴趣。同时安装了,搜索引擎发现哦,这个站一天多了几十个外部链接,建不久,而且外部链接和该站的相关性如此之差,沙盒去吧。

  大家交换链接一定要注意相关性,就是我们交换链接的站点和我们的站点的关键词有一定的交叉。举个例子吧:

  2006年初,枫叶之都使用百度搜索竞价排名时,发现自己的网站在许多与加拿大旅游相关关键词的搜索排序中发生了巨大变化――从前十位被调到倒数第一或第二页中。由此,枫叶之都认为,百度存在人为干涉搜索结果的可能,为配合其竞价排名销售推广业务,百度对该公司的搜索结果进行了人为技术降权和恶意锁定,构成不正当竞争,因此要求百度道歉并赔偿经济损失10万元。百度就此解释称,枫叶之都网站在百度搜索排名中的位置变化,是百度搜索引擎算法策略自动计算所为。枫叶之都网站存在大量针对搜索引擎的垃圾链接,被百度搜索引擎算法规则系统识别,并调整了其网站权值所致。据百度提供给法院的证据显示,枫叶之都在多个压缩机、干燥机等与旅游业不相关的网站以及私人博客和留言板上进行了大量、重复的网站链接。而这种与该公司网站内容无任何关联性的网站超过百家。2006年3月,枫叶之都的大量垃圾外链被百度的自动反垃圾外链系统发现,自动将其排名压后。北京一中院经审理后判定,枫叶之都采用垃圾链接方式违反了搜索引擎业相关规则。“这也表明了对于百度目前采用的‘竞价排名’和‘自然排名’相关规则在法律上获得的肯定。”所以,交换外部链接要谨慎,特别是不小心交换了作弊网站的链接就更郁闷了。另外哪天你的网站被业内人士访问了一定会笑话我,估计会想优化成这个样子,还写上了“SEO by 某某”,因为模板只是一部分,内容的格局和处理等细节是无法用模板来解决的。

  所以大家用那个模板之前,先把我的“SEO by网站”在footer.htm里删掉,如果感兴趣可以联系我QQ1322121026,我给些具体的个性化的建议后,你再把版权信息放上也不晚。放心,我只提供具体建议是免费的。那帮助改代码收费吗?不收,因为我从来不给别人改代码。但我不敢保证我一定有时间,因为最近休假比较闲,时间还富裕。

  我一直觉得SEO不应该成为一个行业,应该是每个站长应该具备的常识,同时,我也觉得管理不应该是一个专业,应该是每个专业的人都必修的一门课程。结果不幸的是我不但搞SEO而且搞管理。

  HDwiki的图片地址是随机代码,如果能自己设置和图片标题相关的链接就更好了,比如支持中文,或者拼音,编写者不填的话再按随机码处理。如果大家很希望别人点击你的图片的话,由于计算机无法识别图片的内容,但计算机可以识别图片的大小,如果同一标题大小和格式一样,一般后被收录的不是很有优势。所以大家如果是下载图片换个标题再上传的话,最好是改下大小。

  最后提一下就是robots.txt的问题, 时间不多了,大家在里面一定把“随便看看”的链接禁掉,不然搜索引擎每次访问都看到不同的页面,而且和某个页面重复。另外HDwiki往往一个页面有n总链接可以到达,要只保留一种其他的都禁掉。

  好的就讲到这里吧!



特别申明:本站文章均来自网络文摘,如有侵权,请联系我们 ,我们收到后将立即删除!
特别注意:本站属于IT网络文摘站,所有转载文章言论不代表本站观点,本站所提供的照片,插画等,版权归原作者所有。
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
验证码:点击我更换图片

Copyright 2003-2005 中华龙腾网(www.f361.com)
地址:中国.成都 邮编:610039 电话:13880439919(值班)
点击这里给我发消息 QQ:245104558 395441976(已满) MSN:fly361@hotmail.com mailto:webmaster@f361.net
本站CNNIC信息 新网互联授权证明 信息业务经营许可证备案编号:蜀ICP备05005991号