Feed on
Posts
Comments

在看这里的一些结论之前,先看一下今年1月17日我写的一篇文章《近期对百度与谷歌收录的观察》。

今天2012年2月3日。继续我的观察。

百度的快照更新到了2012年1月26日,首页是23日的,还有部分更早的。

1月18日发布的《二级域名及频道栏目的PR传递》也已经收录,快照日期1月20日;

1月10日的关于小莉的文章也收录,显示快照1月13日;

但是,其中一篇1月17日的《近期对百度与谷歌收录的观察》却没有收录,有点蹊跷。

–1月6日发布的《网站seo遇到了困难和挑战?》也未被收录?!

不论如何,有些事情可以下些判断:

谷歌对博客程序(wordpress这类)似乎更友好,而对一些更新少的企业站抓取频率较低,

百度没有对这方面有明显的偏好;

我能看到的首页更新为1月6日,1月23日;而首页链接的更新为1月26日,

说明,首页的更新频率似乎比内页更快,而首页的链接确实是被蜘蛛收藏后再来爬的,这里可以认为是3天后。

即1月23日来首页抓到链接,26日在来爬这些链接,然后进行了更新。

时间次序是这样,但过程并非如此。

蜘蛛抓取以后,有个处理过程,这就是为什么我直到今天才看到1月26日的快照,而不是1月29日就看到。

说明蜘蛛抓取以后要进行分析,然后才决定哪些结果,对数据库进行更新,并把结果显示给用户。

这也许能解释为什么《近期对百度与谷歌收录的观察》今天还未在百度搜索结果里找到,肯定不是蜘蛛的抓取问题;

而是这样的题目需要受到更多的审核。需要更多的时间。

是否可以做一个大胆的假设?百度的技术,抓取是非常快的,而且对服务器等资源的占用其实也非常小;

但是因为各种原因所限制(有技术特点,资源成本控制,非技术要求等原因),对这些内容的审核及发布

(发布是指百度更新数据库,并将结果显示)需要更多的时间。

也就是说,我们看到的更新快照的频率,并非完全由于百度对网站内容更新频率的判断,而是百度对网站内容的信任程度也同样重要。

有人看到这篇文章,也许会觉得无聊,到底我在干什么?

没什么。就是细心的观察。如果你看出什么,就是你的心得;如果你没看出什么,我提供点初级爱好者的结果:

百度(包括谷歌)对网站的内容抓取,判断及显示需要一定的时间,仅仅是首页的更新或页面的抓取可能就超过2周。

如果你还希望排名的变化,就可能需要更久的时间。

如果你愿意,可以持续观察,在你做了各种动作之后,可能是加了一些链接,可能是增加快了页面的链接,

注意百度对你首页快照更新的频率,首页链接的快照更新频率,更深页面的更新频率,

这样的观察对你了解搜索引擎,如何优化网站可能会很有帮助。

慧聪是一个历史悠久的网站,B2B的代表之一;ALEXA=564,百度收录31百万,谷歌收录102百万,算是牛站吧,

最牛的是其PR值竟然只有4!!!

我没有持续观察过这个网站,但影响中其PR值没有这么低,至于何时降的,什么原因就不得而知,只能尝试去揣摩一下。

首先输入,hc360.com及www.hc360.com没有跳转,显示的内容是一样的,说明没有做绑定或跳转。

但这是一个小问题,对于像慧聪这样的大站来说影响一般不会很大,有时可能会引起小波动。

再来看站内,里面使用了大量的多级域名,之所以我说是多级域名而不是二级域名,是因为许多域名确实难以定义级别。

先看导航条:

“创业加盟”://info.b2b.hc360.com/list/agent.shtml,PR=0;

“小额批发”://info.b2b.hc360.com/list/pifa.shtml,    PR=4;

“展会”://info.hc360.com/list/exhibition.shtml, PR=5;

“博客”://shehui.hc360.com/,    PR=3;

与上述PR相同的各有若干,另有大量域名结构类似www.broadcast.hc360.com若干,基本PR=4;

在上述各域名下存在大量其它域名的内容,这是它的一个重要问题。

总体感觉结构混乱,肆意使用多级域名。

另外还有一个可能更致命的问题,我无意中在打开某一个网页时,谷歌浏览器明确告知我该页面有病毒!

可能是上述原因造成慧聪的各级域名、页面,尤其是顶级域名PR值如此低,而收录正常。

通常大家会认为二级域名的权重比频道或栏目来的高,实际情况中是这样吗?找了几个网站对各级页面的PR值观察了一下。

(顺便提一下,我在搜索谷歌浏览器的时候发现了查内页PR值的插件,虽然针对部分网站无法获得数据,但也比没有强,但是这个插件只能用在chrome)

第一个是www.2144.cn ,一个小游戏网站。采用少量二级域名。PR=6。

其栏目:策略、益智为5,其余为4;专题、合集的url格式与栏目相同domain/htlm/123/,PR值也大多为4

每个游戏的界面的url格式domain/htlm/123/456/;PR多为无或0。

我是这样解读的:在同一域名下栏目的PR自然减1,但是如果栏目质量不够好,会减的更多;

内容页即使url采用目录格式,搜索引擎(至少谷歌)也会根据其它因素来综合判断。

栏目的质量包括内容数量,更新频率,内容质量,外部链接。

这个网站也用了三个二级域名,社区,网页游戏,积分,PR俱为5.看起来二级域名比栏目的PR均值要高。

我们在看另外一个游戏站:7k7k.com,他的PR=7,结构与2144相同;

不同之处在于栏目页的URL格式有区别,domain/flash_fl/456_1.htm或/tag/62/,PR为5;

我们不能以此断定完全是因为URL格式的因素造成了PR减2,也有可能是基于对其内容判定,毕竟两个网站的内容大同小异。而顶级域名的PR差异是外链的质量与数量,包括历史长短决定的。

7K7K也有几个二级域名,网页游戏=6,下载=5,论坛=5,动画=0,有差别了。

我们换一个网站来考察一下二级域名的情况。

uuu9.com是一个网游平台,这种网站的结构与小游戏完全不同,大家都使用了大量的二级域名,包括游戏专区也是。

在ww.uuu9下反而没什么内容。

二级域名多数PR=6,个别为5;各游戏专区4~6都有若干;

PR为6的新闻下面有专题等几个栏目,PR多为5,专题下有列表页PR为4;

我觉得可以得到一些结论:

二级域名的权重可以很高(注意www.与asd.都是一个等级的,都算二级域名,通常我们将www直接指向顶级域名了);

二级域名的权重不一定很高,不一定会高于另一个二级域名下的栏目甚至列表页,本身的质量也同样重要。

当然,这些观察后的推论基于这个插件是否可靠,是否准确的显示了真实的PR,另外我也未对各级的内容做详细的比对,我也不知道几个网站做站外推广的时候采用的策略。

如果你有兴趣可以自己做两个站对比一下。

另外,我前面的描述如果让你觉得抓不到重点,重点来了

1,二级域名可以用,但前提还是要保证二级域名下的站点的质量,你要有足够的内容;

2,二级域名的推广是分别的,虽然二级域名之间可以相互提携,但效果甚微,你要分别进行外部链接建设;

3,URL的格式与层数对PR权重的传递是有影响的,但也不是万能,不要用错误的格式企图误导搜索引擎;

4,我在此不做展开,但前面在观察中发现,站内链接对PR传递也有影响,最好,首页以及各级页面导航条对个栏目都有链接导出,首页给出的链接尤其重要。

下次,有空的时候我找样本的门户站观察一下。

前几日为一个客户改了一下首页的title,因为之前都是英文,不含中文的。

其后的几天做了持续的观察,发现百度对首页收录的更新比较快,不出一周;而谷歌迟迟不动。

当然,这个网站没内容也没有更新。

近日我在这里发了2篇文章,一篇发布于2012年1月6日,题目为网站seo遇到了困难和挑战?

另一篇为1月10日,题目是小莉影像馆关掉后的“落井下石”

今天想起来去百度与谷歌搜索了一下文章标题,发现谷歌已经全部收录,并且排名靠前(即使去掉部分文字)。

而百度里却找不到。试着用url及site命令搜索了一下,找不到这2篇文章。

同时,我注意到百度在1月1日对一篇博文更新快照,而首页的快照是1月6日。也就是说,它爬了首页,可能抓了新的文章的链接,但还没来得及抓我的文章页面。

我会持续观察它一下,并在此阶段暂时不对蜘蛛做站外引导。

今天是2012年1月17日…..观察中……

(还有一个前提,博客有半年多没更新过)

今天是2012年1月29日:–百度首页快照时间为1月23日其它页面快照为1月6日以及更早。

小莉影像馆(xiaoli.cc)在数年前是一个非常著名的网站。曾经是女士们观看电视剧(尤其是韩剧)的首选。

很难清晰的定义这是个什么网站,因为它既不是资讯站,也不是视频站,它并不直接提供内容,提供的实际上是土豆或其它视频网站的链接。不过土豆看连续剧很不方便,不知现在改好了吗?

但是小莉的站长(据我所知是个人站长)非常勤奋,无论是更新还是口碑推广。所以非常受欢迎,我记得07年的时候ALAXE排名非常高,1000左右吧?记不太清了。

最近我突然发现爱看韩剧的老婆一直在风行上看,不用小莉影像馆了,才听说有很久登不上去了。

今天在网上查了一下,果然是这样,原来的域名不用了,换了一个新的。不知什么原因?

对外人而言,原因并不重要,我倒是发现一个有趣的现象:绑架网站品牌的网站好多!

我在豆单里找到一段文字提示:新小莉影像馆可以去搜索不不影院

我就搜不不影院,发现数个高度疑似站点,但都不是真的(毕竟我不是普通用户);

后来还是搜索新小莉影像馆,才发现这个域名打开像真的:www.xlyxg.com

估计小莉曾想改名字,有人跟风在后面抢流量?

另外还发现xiaoli.in    xiaoli.tk等域名曾使用过,但已经不用了。

如果是站主人用过的,可见其曾经的尝试与努力;如果是别人用过的,可见它的影响力挺大。

小莉影像馆的站长弃用xiaoli.cc一定有其不得已的苦衷,连保留域名做301重定向也不行,损失巨大;

也许当初发展好的时候还是应该对自己的域名与品牌做一些保护措施;

(可能这些站点当初就存在,只是因为小莉影像馆的关掉才凸显出来)

以小莉站长的勤奋(如果还是当初的那个人)应该多做点事情回复失地。

现在小莉的流量并不高,和几个落井下石的网站没有质的差别,都是ALAXE排名七位数,这些网站的分流还是有影响的。劫持网站品牌抢流量,在互联网好像并非少见,多数行为甚至连不道德都谈不上,对大站来说问题不大,如果起步就有这个问题,还是影响很大的。

祝福新小莉影像馆!为了它曾给我太太带来的用户体验和我对她勤奋的敬重!

谈起SEO,大家就想到关键词战略,内部结构,外部链接。
许多SEOer都会利用到各种各样的外部工具。
2006年刚开始专注于此的时候,我也如此:
我是谷歌的高度使用者,观察搜索引擎的行为;
常用雅虎站长查外链,查竞争对手的情况,页面的竞争强度;
有百度工具,可以查竞价的情况,搜索申请量的对比数据,从而帮助选择关键词…

这两年比较少为各种网站做SEO顾问,很少使用这些。
现在因为工作的原因,又有了这方面的需求,可是情况大不同了!

google用多几次就访问不了;
雅虎查外链的功能近日取消了;
百度的许多数据基本不对外开放了;
查各级页面的PR值的插件都没了;
IE8出来,说不准用户可以屏蔽cookie了!

虽然有些问题可以克服,有些可以找一些替代性的工具,但总体感觉是SEO们遇到更多的技术障碍。

回头想想,可能这些改变也不完全是坏事。
不管将来搜索引擎如何变化,核心是不变的:评价一个网站是否有价值。

内容、内容、内容是核心:即使内容做不到原创,内容组织/编排/呈现方式也要创新;
结构、结构、结构是表达:网站要为用户服务,也要调整与搜索引擎的沟通方式;
外链、外链、外链是力量:总统选举不是也要拉选票吗?

我觉得这三方面就是SEO工作的核心。
从这个角度而言,做好自己的工作,那些工具并不那么重要,甚至搜索引擎的微调也没那么要命了。

只做排名换钱是没办法,做站的话,别盯着搜索引擎,埋头做好自己的事。

我的wordpress被攻陷了!

许多博客程序都有评论功能,可以有标题,有链接。

我用的是wordpress,会有一些人写一些评论,有些是有感而发的交流,有些纯粹就是为了放外链。

一般情况下,如果对方不是放许多链接,我都通过。

纯粹放外链的以英文居多,有时还有其它文字,我也就是抽空删除一下这种评论。

有近一个月没上,突然发现有了5万多评论,而且4万多是通过审核的!(我的设置是评论都要经过审核的)

4月中旬也就每小时20个评论左右,4月16日以后每分钟2篇,也就是每小时100多个评论!

删都来不及删,而且不仅文章,连设计的页面也都有评论。

不知道是有专门的发布工具,还是这个wordpress程序有漏洞被装了木马。

我只好将所有文章都设置为禁止评论,然后再把那些评论一一删除,好累!!!

另外我稍微观察了一下,这些链接应该是被雅虎收录了,谷歌是否收录就不是太清楚。

但是这些链接在相应关键词上的排名都不好,基本在10页之外。

所以,我感觉在博客程序的评论中放外链的做法应该是不可取的;

国外用的比较多,可能是他们是根据外链的数量收钱的,这些外链是用来充工作量,方便收钱的。

网站是否需要考虑在搜索引擎的推广营销?

要回答这个问题,可以换一个思路,想想大家用搜索引擎干什么。

第一种,最直接-就是搜索商品或服务。

比如一种软件的下载,某个品牌或某个型号的电脑,机票的预定,或者一个咖啡壶的购买。

如果你是提供产品或相关信息服务的网站,从这些相关的信息可以拓展出好几类目标关键词,具体选择哪些,还是有许多后续的工作来提高总量与转化率。

当然,有些时候B-B与B-C还是有所区别,主要是考虑搜索引擎使用者对具体词汇的选择习惯是不一样的。

第二种,是搜索信息。

这里的搜索信息一种是对某一些具体问题的答案,比如“喝咖啡对心脏有害吗?”;有些用户只是宽泛的想了解,比如就是“咖啡”。

有时候,有一些热门事件,或其它媒体获得的信息,希望进一步进行了解,也会在搜索引擎上进行搜索。

作为网站可以分析哪些信息与你提高的产品或服务相关,而且最重要的是,在搜索引擎上出现的问题信息以及登录页面都要尽可能地吸引你的客户,这比排名更重要。

第三种,可能现在比例并不是那么高,就是寻找“组织”。

就是某一的分类网站,可能是垂直门户,可能是社区论坛,可能是一个资料学习站点。

有的时候,这种搜索用户正式你的网站想要的,并且是可以吸引到的。

最近几天,重庆江津区的风水门事件闹得沸沸扬扬。这里不想发表社会评论,但目前为止确实发现政府部门在公关方面的缺少与薄弱,尤其是在网络公关方面。

首先,最引起大家一个直观的诟病,就是区政府搞的新闻发布会(事件通报会),竟然前台做了多达6排的政府工作人员!由副区长直接进行事件通报(似乎由规划部门出面更合情合理),明显带有以势压人,要证明自己说的对,改变规划是英明的政府决策。

很明显,通过之前的几次政府事件,已经意识到网络公关的重要性。

所以,我看到在10月15日百度搜索“风水门”的时候,在首页最后出现天涯论坛的帖子,题目为风水门”事件之我见_重庆_天涯社区楼主作者:我是李小维  发表日期:2010-10-14 20:36:52。看到文章的最后一段,感觉口气很官方,同时又特意伪造小朋友的口气。

在11楼看到一个回帖: 本来很想信楼主 一看楼主资料 唉~~~

我点击楼主“我是李小维”,4月注册,只发过玉树祝福的转帖及风水门的帖子,难怪身份让人质疑。

在其它回帖中内容比较多,又直接不利房产商的帖子,基本都是当天发帖当天回帖的。

我不是网络口碑营销的专家,也无意告诉大家如何更有效的进行类似的危机公关,也不知道江津区政府是自己做的,还是找的网络公关公司,但这个事件提醒我们,网络公关是一个长期的积累,应该平时就重视,临时抱“佛脚”,很容易露“马脚”,被人疑似强奸民意,也很容易陷入更大的漩涡。效果会大打折扣,甚至适得其反。

之前在搜索引擎上看到的文章,都是说yahoo!雅虎制作网站地图的要求是:

txt文本,命名为sitemap.txt.

文章都是转来转去,差不多。

实际上要求已经变了,大家可以访问(

http://help.yahoo.com/l/us/yahoo/search/siteexplorer/siteexplorer-45.html?pir=6FM1RkNibUn29XOhui9Q.PR7OiRjKiqTT1iN29sx3wGMqzpyMc.jxoG6

)这是今年雅虎官方网站上发布的关于sitemap的制作格式与提交。

其中一段文字:

Yahoo! supports the Sitemaps format and protocol as documented on www.sitemaps.org.

You can provide us a feed in the following supported formats. We recognize files with a .gz extension as compressed files and decompress them before parsing.

·                 RSS 0.9, RSS 1.0, or RSS 2.0, for example, CNN Top Stories

·                 Sitemaps, as documented on www.sitemaps.org

·                 Atom 0.3, Atom 1.0, for example, Yahoo! Search Blog

·                 A text file containing a list of URLs, each URL at the start of a new line. The filename of the URL list file must be urllist.txt. For a compressed file the name must be urllist.txt.gz.

这段文字清楚表明yahoo支持4种方式,我们比较熟悉的可能是xml,txt.

yahoo雅虎现在明确支持www.sitemaps.org格式的网站地图,这一点与谷歌相同。

即我们可以在根目录上传/sitemap.xml文件,并在robots.txt里写一行,就可以了(与谷歌相同);

同时,也支持txt格式的网站地图提交,但是一定要注意,文件名不是sitemap.txt,

而必须是urllist.txt。这跟之前网上到处转载的不一样了

Older Posts »