网站JS代码、对于JS可以很多SEO新手都不了解、JS = JavaScript,一种计算机脚本语言,主要在web浏览器(客户端)解释执行,由网景公司开发,而JavaScript 是一种新的描述语言,此一语言可以被箝入 HTML 的文件之中。
今天我们来说说搜索引擎对js代码的看法、(这里我们只谈百度对JS代码看法) 百度对JS、百度站长指南中说过:“尽量使用文字而不是flash、Javascript等来显示重要的内容或链接,百度暂时无法识别Flash、Javascript中的内容,这部分内容可能无法在百度搜索得到;仅在flash、Javascript中包含链接指向的网页,百度可能无法收录”
那么我们知道百度现在来说暂时是无法识别JS的、可能很多高手会说现在百度是可能认识JS的、我前不久就看到一篇文章、里面做了一个实验、是关于一个网站描述问题、文章写到百度是可以识别JS的、因为当是他网站描述正好就是SE抓取了他的JS里面的文字做为描述的、但是后面他又写到、他自己在百度快照中根本没有看到JS里面的文字! 下面我这个实验也是一个关于对百度SE对网站JS代码的抓取情况。
百度对JS代码的看法
我们先来看看这个网站快照http://cache.baidu.com/c?m=9d78d513d9d706ef06e2ce384b54c0676a499d267992c7150895c417c23b0d564711b2e6783f51538ed27c1141f41107f7f336712a&p=98759a45d2af57b740a6c7710d43&user=baidu 快照时间 www.semcmd.com/seo-riji/121/ 2010-6-28 - 百度快照
从图上面、我们可以得知、这篇文章在6月28号被百度SE从数据库中放出来(这是SE收录后、放出来的文章)。
这个图是从www.semcmd.com/seo-riji/121/ 这个网站快照中截取出来的、大家可以看到里面SEO学习资料、热门文章下面都没有文字了,如果懂ZBLOG的朋友都知道、这里是一个调用、用的是代码调用一些文章标题! 那么这里的文章为什么没有快照出来了!我来先来看看这块区域的代码。
这是我用[引擎爬取与引擎抓取工具_Google管理工具] 抓取到的内容、大家也可以用其它的工具来抓取下这个网站的URL 、就知道SE引擎是怎么样抓取你的网站的(GOOGLE模拟抓取工具很强大,他与GOOGLE抓取你的网站信息一模一样)。
那么现在我们可以谈谈、百度对网站JS代码抓取看法了、如果要DJ小向说、百度现在仍然不可以对JS进行抓取、从上面的实验我们就可以理解到、如果文章中出现JS代码的区域那么百度将会跳过这个区域收录下个文字内容、可能百度目前因为是在测试对JS的抓取、但是这一向技术一定还没有成功、大家都知道、如果百度对这项技术成功了一定会对外宣传、大家都知道能成功对JS正常理解的、目前任何搜索引擎都做不到、包括GOOGLE、目前只是在抓取阶段、正在慢慢研究中!
所以很多在做优化的时候、对网站有重要信息与能带来网站优化方面信息、尽量不要放在JS中来显示出来、因为搜索引擎就算能抓取到、但是不会索引到数据中、那么如果内容只能被抓取、不能被索引、对于SE来说这些内容将没有任何意义。(因为只有索引后的内容才能进入排序中、至于排序中的算法、也只有李XX知道了)。 还有一点很多人会问、为什么快照里面没有快照出来、DJ小向就说他不可以抓取或不可以索引了、如果你了解什么叫“百度快照”、你应该就知道、百度快照中的内容就等于搜索引擎索引数据库的内容、如果说里面的图片没有、DJ小向还会相信、但是里面的文字一定是! (至于为什么我不多解释)。