Feed on
Posts
Comments

翻看之前写的文章,想到曾经提及的新小莉影像馆。

查了一下流量排名,还是在100多万开外。这个让人困惑。

据我所知,小莉当初主要就是在各种论坛,吧,社区发贴,然后通过口碑,流量迅速放大。

也许,是没空打理,还是找到了更好的方向?

从这里也突发感慨,大环境变了!

论坛的权重再度下降,同时论坛、博客对发帖,包括敏感字,链接审核更加严格。

将来传统社区日趋式微,渐渐被微博取代,而由于跨社区的分享,网站的原发内容对用户也变的不那么重要。

搜索引擎还是会重视内容,大网站更有优势,除非你去买关键词。

我觉得中小网站想发展,一个要提供价值;一个就是网站之间的合作。

最近一个朋友的网站徐汇吉的堡少儿英语的网站刚刚上线。

其实我对这类网站一直感兴趣。

曾经想过做一个少儿英语培训的网站,专门做少儿英语及各种培训机构的排名。

还可以做一个奥数训练的网站,相关信息,比赛,培训班。

然后可以为各种机构提供排名相关的广告合作。

之前一个上海的意大利餐厅,叫红意艺术主题意大利餐厅

想做“意大利餐厅”的百度排名,由于全英文,又是全FLASH。真有点难度。

做了大概一个月,排到了第3页。

突然,由于空间服务商的原因,网站上不去,很快百度没有任何收录了。一身冷汗!

据说,空间过期,被指向了一个国外的购物网站,具体情况不太清楚。

网站恢复后,没过几天谷歌百度纷纷收录。“红意”一词位于首页较前的位置,

又过了个把礼拜,“意大利餐厅”排到了第二页差不多11~14的位置。

最近百度收录的速度挺快的,更新的也不慢,最万幸的是没被认为存在作弊行为。

为一个网站做了一个友情链接。

原因是觉得健康生活很重要。

新鲜果园

我们观察一下腾讯的各级域名及栏目的PR分布:

腾讯的顶级域名qq.com   PR=8

导航各频道多数为二级域名,其中news.qq.com PR=8

新闻站导航包括部分三级域名或二级域名下的栏目,

其中view.news.qq.com PR=7;history.news.qq.com 及部分其它三级域名PR=6

栏目news.qq.com/***  PR=6;

个别栏目专题与排行   PR=5;

其它二级域名PR比新闻低一个级别

ent  PR=7

auto PR=7

book  PR=7

finance  PR=7

这些二级域名下的三级域名或栏目PR=6

在下一级,多数为三级域名的栏目PR=5,部分为4。

可以看出腾讯整站的PR分布非常均匀,合理。

个别略高,通常是由于本身内容比较丰富,下级栏目或域名也如此。

作为综合门户,新闻的权重较高,既合理又有利;

view.news.qq.com 偏高是由于本身又分许多子栏目,同时又显示在高两级的导航条或首页重要位置。

部分偏低,通常是下属子栏目比较少,内容也比较少,许多都是来自于其它域名下。

更多的是作为一个列表页面。

网站之所以这样做,是出于引导阅读的目的。

许多网站在设计过程中也是这样做的,但有时候是自身内容数量质量不足,

有时候是结果设计过于随性,造成搜索引擎对网站结构理解上的混乱。

个人觉得腾讯在网站结构设计与PR传递方面做的不错。

大家在做站的时候,一方面可以学习腾讯,一方面也要考虑自身的情况,不能一味模仿。

再观察一个行业垂直搜索:www.ctrip.com

顶级域名PR=8;

导航条基本PR=6,无论结构***.ctrip.com,还是www.ctrip.com/***(国际机票PR=5)

特例是–国内机票预定(http://flights.ctrip.com/Domestic/SearchFlights.aspx)PR=7

频道首页各航线PR值基本为5

http://flights.ctrip.com/booking/BJS-INC-day-1.html 北京到银川  PR=5

http://flights.ctrip.com/booking/BJS-LHW-day-1.html 北京到兰州  PR=4

国际机票没有这类单独页面;

这个很好理解,机票预定是携程的基础,网站在机票预定放假、方面站外推广做的比较多,

尤其是机票预定的关键词是在航线(比如北京到上海)的基础上展开的,甚至直接是在更长尾的词上,

比如“北京到上海的一折机票预定”,携程做了大量站外关键词优化(链接),

但在国际机票上可能暂时还没做的这么细。

在国内酒店域名下,各城市酒店PR基本为6(http://hotels.ctrip.com/hotel/***)

具体酒店页面PR为4(http://hotels.ctrip.com/hotel/78853.html)-可能许多为5,没细查。

这种情况很好理解,携程优化主要加在酒店名及城市酒店页面,otels.ctrip.com反而未作太多内容与优化。

这个网站,我不知道是否算个案,但其特征非常合理,可以看出网站优化的努力方向,而且结果也与预期吻合。

携程的优化重点在于城市酒店,酒店名称,国内机票预定,机票航线,其它的二级域名未作太多努力;

所以二级域名普遍与顶级域名PR差了2级。

而上述目标优化页面,即使是内容页其PR值也非常高,达到4~5。

2月7日,我在新浪上发表一篇文章《一个小意外-我的文章收录好快呀》。

因为我在那里将我个人博客的部分文章重新发布了一次,主要是为了将我的文章做个备份。

结果发现几分钟之内就被百度收录,并可以看到显示了,排列位置也比较靠前。

今天,我发现我的好几篇文章,之前有被收录的,突然又没了。

包括《网站seo遇到了困难和挑战?》,《小莉影像馆关掉后的“落井下石”》,《二级域名及频道栏目的PR传递》。

不太清楚是为什么?

我唯一做过的相关的事就是在新浪上也发了一遍。所以,我也搜了一遍。

《网站seo遇到了困难和挑战?》,新浪博客还在,排在第4页中间位置;

《小莉影像馆关掉后的“落井下石”》新浪博客排第一,个人博客首页(houbo.sitepower.com.cn)排第2;

《二级域名及频道栏目的PR传递》新浪没找到,(houbo.sitepower.com.cn)排第1页最后排;

《一个让人诧异的网站-网站大就可以为所欲为》新浪第一,个人博客没有(文章名:一个让人诧异的网站)

这样的观察结果,让我很困惑。

而且因为新浪的文章我是剪贴过去的,所以文内都有指向个人博客的原文的链接。

为什么呢?这让我有点困惑,又不想全部归结于百度技术的粗糙。

首先,我觉得与更新的频率有关。

各种网站更新有先后,其分值有变动,再经过百度的计算,然后再排列,中间会有这种波动。

其次,这是一个历史老问题:首页内有某些文章的标题,搜索引擎计算标题的排名,其权重比文章内容页的还要高,这样,反而会影响文章的收录。这是一个常见的现象;可能过一段时间,比如首页没有这些文字了,反而这篇文章的内容页的收录却体现出来了。

这是一个双刃剑。内容页被收录当然是好事,表示搜索引擎充分理解网站结构,收录良好;首页被作为标题关键词的着陆页面的好处是权重高,容易获得好的排名。就是说用网站的首页去抢文章标题这个关键词的排名。

最后,在上述观察过程中,百度对文章标题这样长度的关键词,所呈现的页面结果,通常是非完全匹配的。

这是搜索引擎的一种设定。因为这种长度的搜索是小概率事件,它为了给大多数搜索使用者一个有价值的信息,

同时,又不要给数据分析太多的条件设定-越多设定意味者越多的计算量。

所以,许多情况下,显示的结果,是按照整个标题中的核心关键词来排列的,什么是核心关键词,搜索引擎有自己的判定标准。

我可以持续观察这些排名与收录的波动,就目前的观察与分析,有一些有用的结论:

1. 在首页放内页的链接是很重要的,有时会有非常明显的效果;

2.  不管是新浪博客还是个人博客,都不要太快的更新(比如,一周7篇就算太快了)。

似乎搜索引擎对博客有一定喜新厌旧的嫌疑,反应很快,一段时间后会沉,当然这需要更多观察才能定论;

3.  有鉴于此,一些旧文章,对你很重要,不妨隔断时间推到首页一下。

4. 文章标题的重要性大家都知道。

现在看起来,不要迷信长尾词的效果,不是说不好。

而是说,你期望的组合效果与搜索引擎的理解可能会有偏差,这是一个需要精细调整的活。

如果你很在意一些关键词,这方面还是要注意观察搜索引擎的结果,及时调整组合策略。

在看这里的一些结论之前,先看一下今年1月17日我写的一篇文章《近期对百度与谷歌收录的观察》。

今天2012年2月3日。继续我的观察。

百度的快照更新到了2012年1月26日,首页是23日的,还有部分更早的。

1月18日发布的《二级域名及频道栏目的PR传递》也已经收录,快照日期1月20日;

1月10日的关于小莉的文章也收录,显示快照1月13日;

但是,其中一篇1月17日的《近期对百度与谷歌收录的观察》却没有收录,有点蹊跷。

–1月6日发布的《网站seo遇到了困难和挑战?》也未被收录?!

不论如何,有些事情可以下些判断:

谷歌对博客程序(wordpress这类)似乎更友好,而对一些更新少的企业站抓取频率较低,

百度没有对这方面有明显的偏好;

我能看到的首页更新为1月6日,1月23日;而内页链接的更新为1月26日,

说明,首页的更新频率似乎比内页更快,而首页的链接确实是被蜘蛛收藏后再来爬的,这里可以认为是3天后。

即1月23日来首页抓到链接,26日在来爬这些链接,然后进行了更新。

时间次序是这样,但过程并非如此。

蜘蛛抓取以后,有个处理过程,这就是为什么我直到今天才看到1月26日的快照,而不是1月29日就看到。

说明蜘蛛抓取以后要进行分析,然后才决定哪些结果,对数据库进行更新,并把结果显示给用户。

这也许能解释为什么《近期对百度与谷歌收录的观察》今天还未在百度搜索结果里找到,肯定不是蜘蛛的抓取问题;

而是这样的题目需要受到更多的审核。需要更多的时间。

是否可以做一个大胆的假设?百度的技术,抓取是非常快的,而且对服务器等资源的占用其实也非常小;

但是因为各种原因所限制(有技术特点,资源成本控制,非技术要求等原因),对这些内容的审核及发布

(发布是指百度更新数据库,并将结果显示)需要更多的时间。

也就是说,我们看到的更新快照的频率,并非完全由于百度对网站内容更新频率的判断,而是百度对网站内容的信任程度也同样重要。

有人看到这篇文章,也许会觉得无聊,到底我在干什么?

没什么。就是细心的观察。如果你看出什么,就是你的心得;如果你没看出什么,我提供点初级爱好者的结果:

百度(包括谷歌)对网站的内容抓取,判断及显示需要一定的时间,仅仅是首页的更新或页面的抓取可能就超过2周。

如果你还希望排名的变化,就可能需要更久的时间。

如果你愿意,可以持续观察,在你做了各种动作之后,可能是加了一些链接,可能是增加快了页面的链接,

注意百度对你首页快照更新的频率,首页链接的快照更新频率,更深页面的更新频率,

这样的观察对你了解搜索引擎,如何优化网站可能会很有帮助。

慧聪是一个历史悠久的网站,B2B的代表之一;ALEXA=564,百度收录31百万,谷歌收录102百万,算是牛站吧,

最牛的是其PR值竟然只有4!!!

我没有持续观察过这个网站,但影响中其PR值没有这么低,至于何时降的,什么原因就不得而知,只能尝试去揣摩一下。

首先输入,hc360.com及www.hc360.com没有跳转,显示的内容是一样的,说明没有做绑定或跳转。

但这是一个小问题,对于像慧聪这样的大站来说影响一般不会很大,有时可能会引起小波动。

再来看站内,里面使用了大量的多级域名,之所以我说是多级域名而不是二级域名,是因为许多域名确实难以定义级别。

先看导航条:

“创业加盟”://info.b2b.hc360.com/list/agent.shtml,PR=0;

“小额批发”://info.b2b.hc360.com/list/pifa.shtml,    PR=4;

“展会”://info.hc360.com/list/exhibition.shtml, PR=5;

“博客”://shehui.hc360.com/,    PR=3;

与上述PR相同的各有若干,另有大量域名结构类似www.broadcast.hc360.com若干,基本PR=4;

在上述各域名下存在大量其它域名的内容,这是它的一个重要问题。

总体感觉结构混乱,肆意使用多级域名。

另外还有一个可能更致命的问题,我无意中在打开某一个网页时,谷歌浏览器明确告知我该页面有病毒!

可能是上述原因造成慧聪的各级域名、页面,尤其是顶级域名PR值如此低,而收录正常。

通常大家会认为二级域名的权重比频道或栏目来的高,实际情况中是这样吗?找了几个网站对各级页面的PR值观察了一下。

(顺便提一下,我在搜索谷歌浏览器的时候发现了查内页PR值的插件,虽然针对部分网站无法获得数据,但也比没有强,但是这个插件只能用在chrome)

第一个是www.2144.cn ,一个小游戏网站。采用少量二级域名。PR=6。

其栏目:策略、益智为5,其余为4;专题、合集的url格式与栏目相同domain/htlm/123/,PR值也大多为4

每个游戏的界面的url格式domain/htlm/123/456/;PR多为无或0。

我是这样解读的:在同一域名下栏目的PR自然减1,但是如果栏目质量不够好,会减的更多;

内容页即使url采用目录格式,搜索引擎(至少谷歌)也会根据其它因素来综合判断。

栏目的质量包括内容数量,更新频率,内容质量,外部链接。

这个网站也用了三个二级域名,社区,网页游戏,积分,PR俱为5.看起来二级域名比栏目的PR均值要高。

我们在看另外一个游戏站:7k7k.com,他的PR=7,结构与2144相同;

不同之处在于栏目页的URL格式有区别,domain/flash_fl/456_1.htm或/tag/62/,PR为5;

我们不能以此断定完全是因为URL格式的因素造成了PR减2,也有可能是基于对其内容判定,毕竟两个网站的内容大同小异。而顶级域名的PR差异是外链的质量与数量,包括历史长短决定的。

7K7K也有几个二级域名,网页游戏=6,下载=5,论坛=5,动画=0,有差别了。

我们换一个网站来考察一下二级域名的情况。

uuu9.com是一个网游平台,这种网站的结构与小游戏完全不同,大家都使用了大量的二级域名,包括游戏专区也是。

在ww.uuu9下反而没什么内容。

二级域名多数PR=6,个别为5;各游戏专区4~6都有若干;

PR为6的新闻下面有专题等几个栏目,PR多为5,专题下有列表页PR为4;

我觉得可以得到一些结论:

二级域名的权重可以很高(注意www.与asd.都是一个等级的,都算二级域名,通常我们将www直接指向顶级域名了);

二级域名的权重不一定很高,不一定会高于另一个二级域名下的栏目甚至列表页,本身的质量也同样重要。

当然,这些观察后的推论基于这个插件是否可靠,是否准确的显示了真实的PR,另外我也未对各级的内容做详细的比对,我也不知道几个网站做站外推广的时候采用的策略。

如果你有兴趣可以自己做两个站对比一下。

另外,我前面的描述如果让你觉得抓不到重点,重点来了

1,二级域名可以用,但前提还是要保证二级域名下的站点的质量,你要有足够的内容;

2,二级域名的推广是分别的,虽然二级域名之间可以相互提携,但效果甚微,你要分别进行外部链接建设;

3,URL的格式与层数对PR权重的传递是有影响的,但也不是万能,不要用错误的格式企图误导搜索引擎;

4,我在此不做展开,但前面在观察中发现,站内链接对PR传递也有影响,最好,首页以及各级页面导航条对个栏目都有链接导出,首页给出的链接尤其重要。

下次,有空的时候我找样本的门户站观察一下。

前几日为一个客户改了一下首页的title,因为之前都是英文,不含中文的。

其后的几天做了持续的观察,发现百度对首页收录的更新比较快,不出一周;而谷歌迟迟不动。

当然,这个网站没内容也没有更新。

近日我在这里发了2篇文章,一篇发布于2012年1月6日,题目为网站seo遇到了困难和挑战?

另一篇为1月10日,题目是小莉影像馆关掉后的“落井下石”

今天想起来去百度与谷歌搜索了一下文章标题,发现谷歌已经全部收录,并且排名靠前(即使去掉部分文字)。

而百度里却找不到。试着用url及site命令搜索了一下,找不到这2篇文章。

同时,我注意到百度在1月1日对一篇博文更新快照,而首页的快照是1月6日。也就是说,它爬了首页,可能抓了新的文章的链接,但还没来得及抓我的文章页面。

我会持续观察它一下,并在此阶段暂时不对蜘蛛做站外引导。

今天是2012年1月17日…..观察中……

(还有一个前提,博客有半年多没更新过)

今天是2012年1月29日:–百度首页快照时间为1月23日其它页面快照为1月6日以及更早。

Older Posts »