标签归档:SEO技术

真正的SEO技术:页面时间信息对SEO的影响

在SEO的时候,我们经常需要和时间打交道。

和时间相关,比较常见的有这么几个:页面载入时间、页面停留时间、发布时间等。

今天,我们讲一下:页面上的无用时间信息,可能会影响网页的抓取、收录和排名。

真正的SEO技术:页面时间信息对SEO的影响插图

什么是无用的时间信息?

1.网页无明确的发布时间或内容产出时间

2.网页上出现错误的时间信息(错误:超前、无效、陈旧、不存在等。)

3.网页有多个时间信息,存在误导

存在无用的时间信息时,会有什么问题?

当网站的抓取是正常时,会因为网页上的无用时间信息而对网页内容做出消极的判断,进而影响整体网站的网页抓取。

当两个网站的权重相当,而且所发布的文章的内容也比较类似,那么发布时间较近的内容的排名会优于发布时间较早的内容,特别是具有时效性的时事新闻更是如此。(搜索引擎也会逐步把老旧内容清理,已释放更多空间来存储新的内容。)

继续阅读

真正的SEO技术:生僻字SEO的实践思路和案例

bá xiāo kuí jì chī mèi wǎng liǎng

魃 魈 魁 鬾 魑 魅 魍 魉

yòu shuāng ruò zhuó

又 双 叒 叕

huǒ yán yàn yì

火 炎 焱 燚

shuǐ zhuǐ miǎo màn

水 沝 淼 㵘

真正的SEO技术:生僻字SEO的实践思路和案例插图

——

我们中国的文字,一撇一捺都是故事。

生僻字又称冷僻字,指不常见的或人们不熟悉的汉字。

但是,古代皇帝却很喜欢使用生僻字来命名。

举个例子,汉朝的皇帝命名:

汉元帝刘奭:奭念shì,《说文》里其意思为“盛”。

汉成帝刘骜:骜念ào。《吕氏春秋》注解其为千里马的意思。

汉平帝刘衎:衎念“kàn”,快乐的意思。

汉章帝刘炟:炟念dá,“火爆”的意思。

汉和帝刘肇:肇念zhào,“开始、初始、引发”的意思。

汉安帝刘祜:祜念hù,有“福”的意思。

——

这些文字,已经很少人在使用。

自然而然的,在搜索引擎的数据库中,这些生僻字的使用也是比较少的。

能否利用这些生僻字来做SEO呢?

答案是肯定的:

可以利用生僻字来做SEO,而且利用得好的话,还能起到意想不到的效果。

继续阅读

真正的SEO技术:网页图片预加载技术

前面我们说了网页图片延时加载技术,今天,我们再来说一下图片的预加载。

我们经常可以看到浏览器在加载大图的时候,通过自上而下这样铺过来,这样一来一是对用户体验不好,而是在图片下载完之前我们完全不知道图片大小,不利于控制网页界面。

真正的SEO技术:网页图片预加载技术插图

那么有没有一种方法,能让图片整体一次加载到网页上呢,答案是有的,那就是图片预加载技术。

来看下面一个例子:

——

<script>
function preloadimg(url,callback){
var Img=new Image();
Img.onload=callback;
Img.src=url;
}
window.onload=function(){
preloadimg(“http://localhost/example.jpg”,function(){document.getElementsByTagName(“img”[0]
.src=”http://localhost/example.jpg”});
}
</script>

——

其实非常简单了,它的基本原理就是先用JS获取到服务上的图片,获取到之后,浏览器会缓存起来,等到需要的时候,我们在HTML插入图片,浏览器会直接使用缓存的图片。

这样,图片预加载技术可以让图片在用户不知晓的情况下就完成了下载,用户不必在去漫长的等待,可以说,对于提高网站的用户体验来说是非常有用的。

继续阅读

真正的SEO技术:网页图片延时加载技术

当一个网站访问量过大时,过多的图片展示往往会影响其网页的加载速度,过多没用的图片加载既影响用户体验,又会增加服务器的负载,可以说有百害而无一利。

相信做前端的人都知道“Ajax”,Ajax的核心是“按需异步加载”。

当用户需要数据库时候,去服务器上拿数据,然后给用户展示出来,这样做的优点无疑是很多的。

真正的SEO技术:网页图片延时加载技术插图

实际上,网页在加载图片时也会有类似Ajax的异步加载技术。

我们知道,浏览器在解析html文档时,遇到img标签的src属性就是用过get请求的方式,从服务器上获取图片,html中的img标签有多少,浏览器就会从服务器上获取多少个图片。

图片的延时加载技术就从这个地方着手,把HTML文档中需要延时加载的img标签的src都指定成同一张图片,用过另外一个非标准的属性来指定图片的实际位置,如下:

<img src=”space.jpg” data=”reallyimg.jpg”/>

如果我的有10个img标签,实际上只需要下载一张图片占位符就可以了。

继续阅读

真正的SEO技术:JFIF格式图片对SEO的影响

很长的一段时间,我在从网上保存图片素材的时候,都发现图片保存下载的格式是JFIF格式。

这种格式在win10系统下使用图片工具倒也可以正常打开,唯一让我感到苦恼的是无法直接拖进PS中处理,而且部分插入图片的组件也不支持导入JFIF格式的图片,需要先将它进行转换格式才能使用,非常不方便。

真正的SEO技术:JFIF格式图片对SEO的影响插图

是什么原因,让浏览器和Win10系统都如此看好JFIF格式的图片?

那使用JFIF格式的图片,会不会对SEO产生什么影响?

今天,我们就说一说这个问题。

——

大家都知道,图片格式是计算机存储图片的格式,常见的存储的格式有bmp,jpeg/jpg,png,tif,gif,pcx,tga,exif,fpx,svg,psd,cdr,pcd,dxf,ufo,eps,ai,raw,wmf,webp,avif,apng、jfif、ico等。

JPEG(Joint Photographic Experts Group)是最常用的图像文件格式。

JPEG格式压缩的主要是高频信息,对色彩的信息保留较好,适合应用于互联网环境。

JPEG的性能,用质量与比特率之比来衡量,是相当优越的。

继续阅读

真正的SEO技术:百度蜘蛛IP段位的知识

如果大家有经常查看网站访问日志的话,对于百度蜘蛛(baidu spider)应该就不陌生了。

百度蜘蛛,是百度搜索引擎的一个自动程序。它的作用是访问收集整理互联网上的网页、图片、视频等内容,然后分门别类建立索引数据库,使用户能在百度搜索引擎中搜索到您网站的网页、图片、视频等内容。

细心的朋友,应该已经发现了,百度蜘蛛的IP段和IP其实是很多的。

坊间流传这一种说法,说百度蜘蛛会使用不同IP段来抓取网站,不同的IP段所对应的权重也不太一样。

后来,百度有针对此事辟谣过,说百度是会通过不同的IP段来爬取内容,但是这个不涉及权重方面的判断。

不管是真是假,通过我的观察和研究,整理了一些内容常见的IP段和IP,以供参考。

01

以123开头

123.125.66.* :代表百度蜘蛛预备抓取。

123.125.68.*: 每天这个IP段蜘蛛来的最多,其余IP段较少的话示意网站被降权或者进入沙盒。

123.125.71.*: 低权重蜘蛛,抓取内页收录的,但是权重较低,文章内页不会很快被放出来。

123.181.108.77:低权重蜘蛛,抓取内页收录的,但是权重较低,文章内页不会很快被放出来。

121.14.89.* :此蜘蛛为考察蜘蛛,此IP段蜘蛛来光顾基本上是网站无排名!

继续阅读

真正的SEO技术:TF-IDF统计方法在搜索引擎算法中的应用

TF-IDF(Term Frequency-Inverse Document Frequency, 词频-逆文本频率指数)

TF-IDF,是一种统计方法。

TF-IDF,是一种常用于信息检索于数据挖掘的加权技术。

TF-IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。

TF-IDF计算公式:

TF-IDF=TF*IDF

TF-IDF值越大,则这个词成为一个关键词的概率就越大。

相关的,还有TF和IDF的计算公式:

TF计算公式:

真正的SEO技术:TF-IDF统计方法在搜索引擎算法中的应用插图

逆向文件频率指数 (inverse document frequency, IDF) IDF的主要思想是:

如果包含词条w的文档越少, IDF越大,则说明词条具有很好的类别区分能力。某一特定词语的IDF,可以由总文件数目除以包含该词语之文件的数目,再将得到的商取对数得到。

IDF计算公式:

真正的SEO技术:TF-IDF统计方法在搜索引擎算法中的应用插图2

某一特定文件内的高词语频率,以及该词语在整个文件集合中的低文件频率,可以产生出高权重的TF-IDF。

TF-IDF倾向于过滤掉常见的词语,保留重要的词语。

继续阅读