Feed on
Posts
Comments

之前在搜索引擎上看到的文章,都是说yahoo!雅虎制作网站地图的要求是:

txt文本,命名为sitemap.txt.

文章都是转来转去,差不多。

实际上要求已经变了,大家可以访问(

http://help.yahoo.com/l/us/yahoo/search/siteexplorer/siteexplorer-45.html?pir=6FM1RkNibUn29XOhui9Q.PR7OiRjKiqTT1iN29sx3wGMqzpyMc.jxoG6

)这是今年雅虎官方网站上发布的关于sitemap的制作格式与提交。

其中一段文字:

Yahoo! supports the Sitemaps format and protocol as documented on www.sitemaps.org.

You can provide us a feed in the following supported formats. We recognize files with a .gz extension as compressed files and decompress them before parsing.

·                 RSS 0.9, RSS 1.0, or RSS 2.0, for example, CNN Top Stories

·                 Sitemaps, as documented on www.sitemaps.org

·                 Atom 0.3, Atom 1.0, for example, Yahoo! Search Blog

·                 A text file containing a list of URLs, each URL at the start of a new line. The filename of the URL list file must be urllist.txt. For a compressed file the name must be urllist.txt.gz.

这段文字清楚表明yahoo支持4种方式,我们比较熟悉的可能是xml,txt.

yahoo雅虎现在明确支持www.sitemaps.org格式的网站地图,这一点与谷歌相同。

即我们可以在根目录上传/sitemap.xml文件,并在robots.txt里写一行,就可以了(与谷歌相同);

同时,也支持txt格式的网站地图提交,但是一定要注意,文件名不是sitemap.txt,

而必须是urllist.txt。这跟之前网上到处转载的不一样了

许多人都知道友情链接的增加对网站是非常重要的工作,网上也有许多的文章。

但是还是有许多细节值得重视。

我最近查看一些网站的友情链接,发现了一些细节问题,虽然是老生常谈,还是要引起重视。

在新华网(www.xinhuanet.com) 的首页有一些友情链接,最后是黄金链接,鼠标放在上面会下拉出来几个网站链接。
检查这些网站的链接,分别利用google的link命令及yahoo的站长外链工具,都没有发现有新华网的外部链接。
在检查黄金链接前面的一些网站,也是同样的情况。
发现这些网站是滚动展示的,使用的是JS,下拉更是这种情况。
这又一次证明一点:JS确实不被搜索引擎所抓取。
所以大家再让别人加链接的时候,要注意对方加外链使用的方法,技术。
我又查了一些携程的首页链接及链接页面。
在链接页面里有个远播教育网,用同样的方法检查该网站,
在yahoo的外链里面携程的外链处于前面显著的位置,而在google却找不到,
有两个原因,google的这个命令本身只具有参考性,并不详细;
另外一种情况,谷歌虽然记录链接但并未展示,甚至没有计算在内,原因就是2个网站没有相关性。
在首页有个搜房网的链接,检查外链的结果与远程教育网结果相同。
所以,对google来说,加友情链接的时候还是要考虑相关性,而不仅仅看PR

利用google的关键词分析工具,以下几类关键词的搜索申请比较多,或者说搜索引擎的曝光率比较高。

主要对中文简体,台湾繁体,英文进行分类整理。

针对机票预订的关键词:

中文简体:

核心关键词-机票;飞机票

动词-预定;预订;订;查询

形容词(副词等)-形容词-特价,打折,折扣,2折,二折

其它-热门目的地或热门出发城市

        航空公司

        主要预订网站

台湾繁体:(部分语言习惯不同)

核心关键词-机票;飞机票

动词-订;查询;买;订购;预订

形容词或副词-便宜;特价;促销;特惠;优惠;廉价;折扣;打折机票

其它-同简体

英文

核心关键词-flights;flight;airlines;airticket;travel

动词-book; booking

形容词-cheap; discount

其它-同上

 

针对酒店预订的关键词

中文简体

核心关键词-酒店;宾馆

类型-旅游酒店;假日酒店;酒店公寓;机场酒店;经济型酒店;连锁酒店

动词-预订;预定

其它-热门地区

台湾繁体

基本相同,但酒店一词对台湾含义不同,一般用饭店

类型中会有一个不同的-民宿

预定和预订很难说一定哪个使用的更多

英文版本

核心关键词-hotels;inn;hotel room;luxury hotels;motel

(英文的酒店类型往往就是一个新的词)

形容词-cheap; discount

动词-find; book; booking

 

以上的几类的多重组合及次序的调整,形成了一个基本的旅游预订网站的关键词群。

还有酒店或航线的名字是另一类关键词,每个量不是很大,但总量大;

如果增加细分,比如酒店的具体商圈或其它常选条件,就形成了一个体量具大的长尾关键词群。

全部展开来,据说可达数万乃至数十万个关键词。

一些领头的旅游预订类网站,每年只在搜索引擎上的广告投入就可达亿元。

谷歌放到香港以后,经常上不去,而且多用2次马上就不允许在搜索了。

刚刚可以用,也搜索“世博交通管制”,想对比一下。

首先从用户体验角度,我觉得谷歌做的不错。

10个页面,形式不同,内容也不同,来源也不同类,有2篇文章题目相近,内容截然不同;

作为用户比较容易获得不同角度的信息,可以满足不同用户的不同需求。

从技术角度,我不知道是如何判断的,可能也很少人说得清,我们就分析一下排名的结果吧!

1,排名首页的网站PR从1到9都有,但排名次序好像于此无关;

2,排在前3的TITIE与世博交通管制这个关键词都不是完全匹配,说明标题的匹配程度并没有影响那么大;

3,文章的原创性会有很大优势,但更加会引起谷歌重视的我觉得的页面整体的相关性,谷歌应该是抓取的大量页面内的链入链出,并进行相关性分析,这应该与百度一个重要的不同。

4,一个未解之谜:排在第四的是cctv的网站,标题是《世博交通管制 物流业痛并快乐着》,

发布时间为4月12日15:39,比网上其它许多网站的同样文章发布时间都晚了数小时,即使搜索这个标题,cctv也是位列第一。

当然cctv的PR为9,实在国内少见;所以我感觉谷歌在做信息评价时,对传统企业的发布信息的原创性或重要程度是天然评价就比较高。

谷歌认为传统媒体CCTV肯定比新浪网腾讯网重要的多,原创性也高的多;

做产品的公司网站肯定比买产品的商城或行业资讯站来的重要的多,信息原创比例也高的多。

我的问题是:谷歌是通过技术实现的吗?如何实现的呢?

(接上篇《世博交通管制搜索引发的思考》-1)

疑问一:问什么网易的排名会在前面,title的匹配程度并不高呀!

分析:其它都是分类子栏目的资讯新闻,而网易是放在新闻的滚动新闻里,层次少,重要性高;

疑问二:为什么天涯排在前面,只是一个动态URL的页面呀!

分析:页面内SEO做的认真,而且还加了TAG-关键词云。

终极疑问:为什么百度hi的博客文章排在第二?

分析:首先,PR够高;其次,这个作者蒲振我没认真去研究他是谁,但文章是有合理的关键词密度。

 

结论:

说了这么多,还是总结一下:

1. PR,PR,PR, 网站PR值的重要性在去除掉商业操作的掩蔽,而彰显出来;

2.网站的层次少则优,最好不要超过3层,大家都知道,只是这里再证实一次吧了;

3.即使为了方便大型网站的内容发布管理或满足其它要求,而不得不复杂,也要让URL短一些;

4.TAG的合理使用是大有用处的;

5.对百度而言,动态链接的收录及对关键词排名的影响没有被证实

  -可能收录效率降低,但还是被收录,而且不见得就没法与静态页面相比一定在关键词排名方面就明显劣势。

4月27日,我搜索五一期间上海世博会交通管制的具体安排,看看会不会对我的出行造成影响。

在百度键入关键词“世博交通管制”,出现的结果挺有意思的;

因为很少对生活及新闻的词汇进行搜索,所以趁机对搜索结果页面仔细观察了一下。

还真有些收获,毕竟这里没有疯狂加外链的商业操作。

第1名是百度的新闻专题,里面是百度选择的相关类别的新闻源(新民网自从成为百度新闻源后流量与PR上升很快呀);

第3名是百度知道,按照惯例排在前面,习以为常;

第2名是百度hi,进入就是一个普通博客的文章页面,难道是为了推广百度hi?即使这样也应该有一定的技术逻辑。

再往后看。。

第4,第5分别是网易与天涯,边栏的世博关键词数量差不多,权重也差不多都是PR7的子域名的文章内页。

第6,第7分别是一大把与新浪的,很巧都是同样的内容《世博交通管制 物流业痛并快乐着》,

新浪的发布时间为4月12日10:53;一大把发布的时间为11:17;而且PR肯定不如sina,文章页面相似。

无论从原创,还是网站权重分析,新浪都应该排在前面呀,为什么会这样呢?(而且新浪的点击进去是文章的第2页)

我分析主要还是页面的层数与URL。

一大把比较扁平,URL为http://info.yidaba.com/201004/121117431001100100000114861.shtml ;

而新浪的页面URL为http://finance.sina.com.cn/chanjing/cyxw/20100412/10537731559.shtml ;

(排在最后一名的竟然也是同样的内容,感觉有点遗憾!)

其它几个排列,就没什么多说了。我们要再回头看前面得排名分析。(接下篇

有人问我这个问题,回答是不假思索的-肯定!

有人问我如果是站内通过选择而产生的动态页面也能收录吗?蜘蛛也能爬到这个页面吗?

-我的经验告诉我,可以!

怎么证明呢?–哈哈,因为这是很久以前的观察结果,现在突然问我,倒是不容易回答。

没办法,SEO就是要不断搜索找到答案,就想办法证实呗。

我先去了真旅网,用蜘蛛模拟器看了一下,提示谷歌没有相关数据;

我再去了携程网,找了一个搜索北京酒店(左第1个边栏,点酒店,输入进行搜索),出现一个动态URL,

【注意–它的Title是固定的“酒店查询结果 - 酒店预订 - 国内国际酒店预订服务 - 携程旅行网”】

将URL复制输入蜘蛛模拟器,提示该网页内部是动态的不确定信息,其他内容都是空白;

又去了到到网,同样在首页选择搜索北京酒店,出现一个动态的URL,

【注意–它的Title是跟搜索对应的“北京市酒店的搜索结果 】

同样用蜘蛛模拟器去查,里面有大量信息Title/Meta都显示正常。

然后再到百度下,输入“site:daodao.com 北京市酒店的搜索结果”排第一的就是上面的那个页面。

也可输入“site:ctrip.com  酒店查询结果 - 酒店预订 - 国内国际酒店预订服务”,可以有8个页面。

在谷歌下搜索,没有我们的目标页面,都是静态url的页面,而且只是部分匹配的。

这个应该可以证实,

1.无论百度还是谷歌的蜘蛛都可以爬到需要输入选择的动态URL的页面;

2.谷歌(或雅虎)是否会抓取被收录,取决于TITEL/META的个性化描写,也取决于程序的写法,

  到到比携程要规范的多,也更迎合搜索引擎;

3.搜索引擎肯定更喜欢静态URL,它更容易判断内容与title/meta1是否一致,可以决定放在哪里展示;

4.搜索引擎对动态URL的判断不太一致,如果网站不想冒风险,受到部分搜索引擎的“歧视”,还是进行伪静态处理吧。

开始写博客之后,我一直对搜索引擎:百度,谷歌的收录与关键词排名进行跟踪比较。

考察关键词包括:

上海网站推广顾问;上海网站推广策划;上海网络营销顾问;品牌网络形象;品牌网络识别。

大概2008年7月开始写的,开始的时候比较勤奋,文章发表频率比较高,我开始跟踪时排名还都不错。

第一次有记录是2009年2月,谷歌更新PR=0(之前是没有)

  上海网站推广顾问-谷歌2,百度1;上海网站推广策划-谷歌3,百度6;上海网络营销顾问-谷歌1,百度1;

  品牌网络形象-谷歌27,百度无;品牌网络识别-谷歌2,百度2;

2009年3月,PR=2

上海网络营销顾问-谷歌7,百度34(大幅下滑,估计网络营销们过好年开始工作了,哈哈)

品牌网络形象-谷歌1,百度409(有了飞跃的提高,因为我更关注品牌网络形象的方面)

接下来的几个月,基本没有什么变化,而且-品牌网络推广-谷歌5,百度66;

2009年8月 PR=0,不知为什么被降权了

上海网站推广顾问;上海网络营销顾问;上海网站推广策划;排名稳定,谷歌、百度都是排名第一;

品牌网络识别还是在前面;品牌网络识别;品牌网络推广已经看不到了(估计搜索引擎重新评估词,增加收录来源)

又过了大半年,期间基本没有文章更新,而且因为服务器的原因,很久无法访问,结果又如何呢?

今天查了一下:2010年4月16日

上海网站推广顾问-谷歌5,百度157;上海网站推广策划-谷歌9,百度52;上海网络营销顾问-谷歌147,百度12;

品牌网络形象-谷歌no,百度2;品牌网络识别-谷歌no,百度1;品牌网络推广-谷歌no,百度113;

(这里还发生的事情包括谷歌退居HK,国际上大量PR10的网站被降权到9….)

结论:

1.从另一个侧面看出,百度的数据库与排名的更新是比较慢的;

2.但这并非完全是负面的,(我们不要从SEO的角度看问题),这种慢速度也会影响认为的技术手段。

  因为只有商业需求的人才会要求速度,对于其他人而言这种收录与排名的更新对他毫无意义,所以我的文章过了很久才成为百度首页,同时也很久不会下来,因为它不是商业价值非常直接的。

  时效对多数搜引擎的用户并不重要,你要最新的文献,资料,你可以通过引擎找到合适的网站,而不仅仅由网页提供;

  你追求其他重要的实时信息,必有商业网站提供广告位于显要位置。

我不敢确认这是百度对搜索引擎搜索结果页面更新频率的设计出发点,,也不是因为谷歌走了就给百度唱赞歌,我只是觉得一种行为从另外角度观察也有它的合理性。

SEO顾问与SEO职务

实际上我不太愿意用这个做标题,怕搜索引擎们不喜欢,O(∩_∩)O哈哈~

我觉得突然顿悟了!

国外的SEM与SEO为什么专业,为什么国外SEO顾问是按小时收费的?

我们目前的SEM大多数是以拓展关键词,控制出价为工作核心;好点的会进行流量分析,优化转化率。

这里多数是靠个人的创意(一个技术人员去研究客户偏好与市场行为,真的可靠吗?),跟踪对手,简单的数学。

可是国外专业的SEM,比如Efficient Frontier 他们已近为这些优化的行为建立了数学模型。

(以后我对它如果有进一步工作上的接触,我会做更进一步的分析-我觉得光模型也是不够的)。

再看国外的SEO,是按小时收费的。

而我们的SEO多数就是提供一个优化调整方案,与程序,美工保持沟通,让网站修改能够顺利执行。

(更多的提供个3点修改意见,然后不断加外链,做关键词排名,我们就不在这里讨论了。)

为什么国外SEO是按时间收费的呢?

因为国外的SEO不是仅提供方案那么简单,他需要与一个企业网站内部的不同职能部门的人沟通,市场部,销售部,程序,….,了解需求,配合企业经营活动推动进展,不断数据反馈分析,不断行为修正。

不同的企业,部门职能设定是不一样的,企业管理文化也不一样。

SEO顾问需要知道什么事找什么人,企业关注那些目标,这些目标有跟什么数据有关,改善这些数据的流程。

这些工作是大量的琐碎的,当然不同企业,不同要求,不同阶段花的时间不一样,劳动量当然就不一样。

所以国外的(或说理想的,我觉不是崇洋媚外之人)SEO顾问应该是有很强的执行能力,

一个公司请SEO顾问绝不仅仅是请外脑,而是加强自身的SEO执行能力。

这种理想可能在国外也不一定能实现,所以许多大网站干脆自建SEO团队,

设立SEO经理,SEO专员,等等。

不管是外部的SEO顾问,还是内部的SEO职务,要想细化工作,还是需要用数据说话。

以后我找机会结合一些实践,进一步进行描述这一点。

今天一看,喔~~~,已经有一年没有写博客了。

当初曾经下决心每周写个1~2篇,可是没有坚持下来。虽然可以找出各种各样的理由,但理由并不重要,因为人总能找到理由。

在这里还是写2句吧,就算是写给自己。

开博的时候是思考最活跃的时候,觉得把思考写下来,与别人是一种交流,对自己是一种参考。

(我是不太写具体的技术细节的文章,其实seo/sem更重要的是细节,这期间一定是有很多的实验在里面。

kyw在这方面就做的比较多,比较好–当然过去一年他也有没坚持住的地方)。

一段时间以后遇到的各种类型网站少了,就有一种疲倦。

觉得这种网站就这么改改,那种网站就那么修修,流量上去了,OK了。

这段时间重新思考一下,反省一下,觉得SEO顾问到底是什么?

应该不仅仅是提供一个整改方案,真的是要花时间去做好,而这个“做”也不是仅SEO自己的做。

只不过我们大多数去专研SEO的是个人站长比较多,而一个大型的企业网站的SEO绝不是一回事。

相同的是,不管是个人站长,还是大网站的SEO,还是SEO顾问都需要一种坚持。

Older Posts »