欢迎来到合肥浪讯网络科技有限公司官网
  咨询服务热线:400-099-8848

SEO的艺术:搜索引擎在网页能“看到”什么内容(3)

发布时间:2018-06-27 文章来源:本站  浏览次数:3456

2.2.4 搜索引擎在网页上能"看到"什么内容(3)

搜索引擎看不到的东西

搜索引擎"看"不到的内容类型也值得研讨。

例如,虽然搜索引擎可以检测到你显现一幅图片,可是除非你在前面介绍的alt特点中供给了信息,不然它们无法得知图片展现的是什么。它们只知道图片中的某些基本的信息,例如,图片上有一张脸,或许图片是否含有色情内容(经过图片中有多少肉色来判别)。搜索引擎无法得知一幅图片显现的是Bart Simpson仍是一条船,一所房子仍是龙卷风。此外,搜索引擎也无法辨认图片中显现的任何文本。搜索引擎正在实验运用光学字符辨认(Optical Character Recognition, OCR)从图片中提取文本,可是这种技能还没有得到遍及的使用。

另外,传统的SEO观念一向认为搜索引擎无法读取Flash文件,可是这有些夸大其词了。搜索引擎多年前就现已能从Flash中提取一些信息。可是,搜索引擎不容易断定Flash里到底有什么。最大的问题之一是,即便搜索引擎探求Flash的内部,它们所寻觅的仍然是文本内容,而Flash是图形化的媒体,没有什么因素可以唆使规划人员在Flash中选用文本(除了对搜索引擎的好处以外)。即便HTML与Flash一同运用,存在于HTML文本中的一切语义头绪(例如,标题符号、粗体文本等)也都不见了。

并且,搜索引擎看不到Flash中包括的任何图片内容,这就意味着当Flash中的文本转化为矢量轮廓时,搜索引擎所能读取的文本信息也就丢掉了。

音频和视频文件也不容易被搜索引擎读取。和图片相同,这些数据难以解析。在少量破例情况下,搜索引擎可以提取有限的一些数据,例如,MP3文件中的ID3符号,或许以AAC格局存在的具有嵌入式"注释"、图片和章节符号的改进型播客。不过,搜索引擎毕竟无法区分足球赛和森林火灾的视频。

搜索引擎也无法读取程序里包括的内容。搜索引擎实际上寻觅的是网页源代码中人们可以看见的文本,这在前面现已论说过。在浏览器加载网页之后你所能看到的内容杯水车薪,只要在页面源代码中可以看到和阅览的信息对搜索引擎才有含义。

AJAX技能就是这样一个比如,人们可以看到它所显现的内容,而搜索引擎却无法看到。 AJAX是一种基于JavaScript的技能,用于从数据库中获取数据,然后在不刷新整个页面的情况下动态显现网页内容。这种技能常用于网络上的一些东西,当用户拜访网址时供给某些输入,AJAX东西获取并显现正确的内容。

在用户输入信息后,在客户计算机(用户计算机)上运转的一个脚本担任获取内容,这成为问题的本源。这种办法可能形成许多不同的输出。此外,在接收到输入之前,内容不出现在页面的HTML中,所以搜索引擎无法看到。Google供给了树立可爬行的AJAX使用程序的详细技巧。

一些其他方式的JavaScript在用户采取举动之前不显现HTML内容,然后形成了类似的问题。

在HTML 5中,创建了一个嵌入符号()结构,这种结构答应在HTML页面中参加插件。插件是在用户计算机而不是网站Web服务器上的程序。这个符号常用于在网页中刺进视频或许音频文件。符号奉告插件在哪里寻觅数据文件。经过插件包括的内容关于搜索引擎来说彻底不行见。

结构(frame)和iframe是在网页中参加来自其他网页内容的办法。Iframe比结构更常用于刺进来自另一个网站的内容。

结构一般用于切割发布者网站的内容,但它也可以用于从其他网站加载内容。可是,搜索引擎可以辨认从其他网站拉取内容的iframe或许结构,然后疏忽iframe或许结构中归于其他发布者的内容。换句话说,它们不将从其他网站拉取的内容作为独特内容的一部分。

上一条:SEO的艺术:断定查找者...

下一条:SEO的艺术:查找引擎在...