浅谈互联网页面价值

Featured

浅谈互联网页面价值
作者:百度搜索研发部

搜索引擎每天处理着数以亿计的查询请求,每个查询请求都代表了一个用户对于某种资源的特定需求。多数时候,通过查询返回的网页结果,这些需求被满足了,我们可以认为结果中的某些页面对特定用户的特定需求产生了价值。那么对于搜索引擎而言,页面的价值是指什么,我们为什么要研究页面价值,技术上怎样判断页面的价值呢?本文将逐一回答这些问题。
判断一个页面检索价值的依据

一、什么页面价值

前面我们说了,某个页面满足了某一用户的特定需求,就体现了这个页面对用户的价值。那么对搜索引擎而言,价值体现在哪些方面呢?一个简单的推论,所有可能会对用户产生价值的页面都是对搜索引擎有价值的,将这些页面建入搜索引擎的索引中能够满足最终检索到它们用户的需求,我们称这种价值为检索价值。只要是能解决某个用户信息需求的,并且是可以通过某些正常检索需求到达的,那么就是有检索价值的。

小学生张三喜欢在qzone上写日记,写他前天吃了什么,今天玩了什么。这些内容,是有价值的。它们对张三的家长、同学、老师,以及其他小学生,和对小学生日记感兴趣的人来说,都是有价值的。对于这个信息体来说,“张三”这个名字是检索的“key”。

有一些信息单元,只有“浏览”价值,而没有到达该信息的检索途径,那么该资源可能是有价值的,但检索价值就很低。比如一张百度大厦附近的地图,从浏览角度,是有价值的;但是如果没有任何周边文字说明(或者link的anchor text),只有一张光秃秃的地图,就没有检索价值。当然,如果图片的内容识别技术,有朝一日能自动识别出这个是“百度大厦附近地图”,或者能够自动分析出地图内的各种大厦、街道、餐馆等的名称,那么这张图一样变得有检索价值了。所以一个页面是否有检索价值,应该取决于两点:

1) 是否能解决某个特定的需求(价值)
2) 是否可以通过某个常规的搜索方式获得该信息(检索)

那么,没有检索价值的页面,是否对搜索引擎就没有价值了呢?仔细想想,答案是否定的。索引只是搜索引擎的一个环节,对于其他环节而言,没有检索价值的页面有可能对我们更好的收录那些检索价值高的页面有帮助。比如对负责抓取互联网资源的spider而言,有一些页面,本身没有检索价值,但通过这些页面的抓取和分析,能够更快的帮助我们掌握这一类页面没有检索价值这一重要信息,从而节省更多的流量进行更加有效的抓取。

考虑到这种价值可以算作一种“间接的”检索价值,最终还是立足于索引价值的,在本文中就不再展开论述,我们只关注“检索价值”这一根本问题。下文中提到的“页面价值”特指页面的“检索价值”。

二、为什么要研究页面价值

首先,互联网上的页面是无穷尽的,而搜索引擎的硬件资源是有限的,想用有限的资源去覆盖无穷尽的互联网,我们就需要对页面价值做出判断,不收录那些无检索价值的页面,少收录那些检索价值低的页面。这是页面价值在收录控制方面的应用。

第二,搜索引擎spider的抓取能力是有限的,出于访问友好性的考虑,对于一个网站或一个IP抓取速率需要有一个抓取速率的上限。在这一限制下,抓取或页面更新就需要有一个先后顺序,而这一排序的主要参考依据就是页面价值,或者说对页面价值的预测(未抓取时)。这是页面价值在spider调度方面的应用。

第三,对于某些页面,页面内容发生变化,导致它的检索价值从有到无,典型的就是变为“死链”,或者“被黑”。对于这些页面,好的搜索引擎会在第一时间将其排除出索引,或在检索时对其进行屏蔽,以保证返回给用户的结果是更多检索价值高的“好页面”。对于另一些页面,它不仅具有很高的检索价值,而且有很强的“时效性”,能够第一时间让用户检索到这些页面对搜索体验有很大的提升。对搜索引擎而言,越快的收录和索引页面意味着越多的额外资源开销,以多快的速度收录和以多短的周期更新索引,需要通过页面价值的分析来指导。这两方面是页面价值在死链率时效性两大搜索引擎指标提升上的应用。

最后,普遍意义上的页面价值高低对搜索引擎返回给用户的结果排序上也存在着指导意义。理想情况下搜索引擎的结果是按照与查询请求的相关性进行排序的,在相关性大体相当的情况下,用户更倾向与浏览普遍意义上页面价值高的网页。这是页面价值在ranking方面的应用。

可以说,页面检索价值的研究是搜索引擎中的一项较为基础的工作,对页面价值的认识和判断的准确程度直接影响着搜索引擎的覆盖率死链率时效性等几大主要指标。

三、如何判断页面价值

前文中提到过一个小学生张三qzone日记的例子。我们认为这个页面是有价值的,对张三的同学,朋友,家人都有价值。与此类似的,百度CEO李彦宏在i贴吧上发表一条十几个字的i贴,也是有价值的,对李彦宏的上千万粉丝都有价值。虽然李彦宏的i贴长度可能远小于张三的日记,但就这两个页面的价值来说,我们都会有一个共同的认识,即从普遍意义上讲,李彦宏的i贴价值远大于张三的日记。(当然,对于张三的妈妈来说很可能这个价值的关系是相反的)

再举个例子,搜索某个人的手机号码,搜索引擎返回了一个结果,是这个人在某个论坛上的一个回复。虽然这个手机号码关心的人不多,但因为资源是绝对稀缺的,对于关心这个手机号码的查询需求,这个页面是完全不可替代的,因此具有极高的价值。

另外,页面检索价值,还受到页面质量的影响。相似的页面,对于满足用户需求来说,往往会有很大差异,比如资源下载速度,页面的布局,广告的多寡。这类差异,姑且称之为页面质量。

最后,有些页面具有明显的公众话题性质,且这些资源往往在刚刚产生时有非常高的关注度,随着时间的推移热度显著下降,有着“新闻”的特征。典型的像各种“门”事件,地震、火灾等大型的自然灾害。我们认为这类资源具有“时效性”特征。

所以,一个页面的检索价值,大致受以下四个要素的影响:

感兴趣的受众群大小
该页面的稀缺程度(可替代性)
该页面的质量高低
该页面的时效性特征强弱

这四种要素,简称受众稀缺质量时效性

1. 受众

受众群体的大小,即代表了用户检索需求的大小。评价受众的大小主要依据信息发布源的受众信息内容本身受众两大方面。具体因素包括且不限于:

网站忠实用户群大小

一般来说,拥有自己忠实用户群的知名网站,他们的成功,在于他们的内容和服务,比别人更能吸引和满足用户。从这个角度来说,我们可以推论,拥有更多忠实用户群的网站上的内容,会比忠实用户群较少的网站上的内容,有更多的既有和潜在受众群。这样的话,忠实用户群大小,就可以变成对站点内资源检索价值的一种衡量指标。忠实用户群的好处在于,它是变动的。如果一个网站变差了,那么用户就会用脚投票。超链有过期问题,作弊问题,而虚假用户群作弊很难。一般所谓的网站知名度,会和忠实用户群数量密切相关。

资源分布规律

我们再考虑一个网站内部的资源分布所体现的受众群大小问题。比如新浪新闻首页的那些推介内容。新浪编辑为什么要推这些内容?因为他们认为这些是用户最感兴趣的。那么从索引价值角度而言,相当于有一个庞大的编辑团队,已经对这些内容打上了“符合大众口味”的标签。搜索引擎只需要乐享其成就行了。这样的话,资源相对于某些结构性关键页面(首页、频道页等)的链接深度,也可以成为衡量一个资源受众群大小的指标了

访问热门度

我们再从访问热门度角度来考虑受众群大小问题。这个是最直接的,当然,它需要第三方的工具来获取关键数据。通过这个途径,获取的不应仅仅是需要入库的页面,还有用户访问一个网站的访问模式。

超链

超链某种程度上也是受众群大小的反映。某个资源的质量越高,接触的受众群越大,那么获得正常链接的数量往往也越大。

内容特征

A:我写博客:“传言郭德纲要上春晚了。”
B:我写博客:“我今天吃早饭了。”

同样的来源,前者的受众必然高于后者。即:当在发布源相同的情况下,具有公众属性的内容分值会更高

2. 稀缺

稀缺主要是描述页面在互联网中的独特性。说到稀缺往往会想到重复,稀缺是否等同于无重复,我们应该怎样解读这一概念呢?可以看一个例子:

某人发表了一篇针对某新闻事件的原创博客,随后被新浪转载到了新闻频道。从描述的内容上讲,这是一种重复。但这种重复仅仅是主体内容上的重复,

一方面它的转载带来了访问速度、稳定性等方面的增益,并且之后的检索用户还有可能用“新闻事件+新浪”来检索此新闻。这可以被称之为站点增益

另一方面,它在转载过程中可能会改变页面的标题,而且依托其受众,在转载页面上,还有可能出现更多的有价值评论和回复等,还有可能存在指向其它相关事件的新闻链接。这些可以被称之为内容增益

因此即使主题内容没有任何变化,新浪的这次转载也是有价值的,其稀缺度也是较高的。

同样,反过来说,如果转载的网站相当不知名,则其无法带来站点名/稳定性/速度的增益。更有甚者,转载之后在页面上加入大量广告妨碍阅读,或者只转载了内容中不完整的一部分,这样的转载,或者说采集,就是纯重复的,与采集源相比,就是没有检索价值的了。

综上所述,对于主体内容重复的页面,我们应该评价其是否存在站点增益和内容增益,只有对于大量完全无增益的重复页面,我们才应该认为其稀缺度较低

3. 质量

页面的质量是它对需求的满足程度的一种体现。判断页面质量的高低,应该是从最基础的需求依次递进的。

首先,不能是死链、网站要有一定的稳定性、访问速度要令人满意。
其次,主体内容是否完整、版式和字体是否易读、各类广告会不会太多。
最后,信息是否丰富、延伸出的次级需求是否满足。

典型的低质量页面存在以下一些特征:

主需求无效/未满足(过期分类广告/软件下载页面,下载链接无效等)
死链
虚假信息/诈骗等
空页面
站点不稳定
影响主需求的权限问题(下载/浏览需要注册会员/积分等)
信息不完整(转载不全等)
浏览体验差(广告/字体/页面布局等)

典型的高质量页面存在以下一些特征:

访问速度快(页面加载快/资源下载速度快)
页面整洁干净,主体内容在显著位置
页面信息完整
页面元素丰富(文字、图片、评论、相关推荐等)

4. 时效性

“时效性”是页面价值的一个属性,它一般体现在两个方面:一是页面所描述的事物本身有着较强的公众话题性,容易被传播。这其实是受众的一个体现。二是页面所描述的事物仅在第一时间有较高热度,随着时间推移热度显著下降。这是一种“新闻”性。对于具有上述两种属性的页面,如果搜索引擎spider发现页面的时间正处于该事物的“爆发期”或“爆发期”之前,我们认为该页面具有时效性。

需要说明的是,搜索引擎的广义“时效性”是指对所有有价值新资源的及时收录提供检索,而所有的有价值新资源中,有一大部分其收录速度的提升对用户的搜索体验改善意义是不大的,比如介绍如何瘦身的知识性文章,张三的日记。页面价值中的“时效性”指得是一种突发时效性,也就是所有有价值页面中最需要及时收录的那些。对页面时效性的判断是为了指导我们将搜索引擎有限的资源投入到最关键的地方,产生最好的性价比。

判断页面的时效性价值,主要通过下面一些途径:

页面本身受众是否有短时间的突增,比如超链爆发。贾君鹏的帖子就是一个典型的例子。
描述相同事物的互联网页面是否有段时间的突增。贾君鹏事件短时间内爆发出大量相关讨论、报 …
根据一个集合内的页面是否具有上述两种特征,推测该集合的时效性价值。比如魔兽世界吧经常 …

四、页面价值的研究重点

前文已经介绍了页面价值的含义,研究的意义与价值判断的方法。最后我们再看一下,从技术角度上,这一方向的研究中的重点方向。对页面价值的研究工作主要致力于三方面:

对页面价值体系的认识。我们目前对页面价值的认识是来源于前文所述的四个维度,这个认识是否全面,对于不断变化的互联网环境与用户需求,这些维度应该如何扩展与变化才能更好的服务于整体的搜索体验提升,是一个很重要问题。

对于反映页面价值的页面特征提取。巧妇难为无米之炊,挖掘更多的页面特征,更准确合理的特征提取是页面价值判定准确率提升的基础。

对各种页面特征的组合策略(机器学习)。针对不用的应用方向,需要利用相应的特征通过合理且高效的策略拟合出页面价值的最终评价结果。

不同层次的SEO都怎么做,兼答百度知道网友

不知道题主的既往SEO经验,仅谈谈个人从事SEO的相关经验,仅供参考,欢迎交流:

SEO基本要求
修改下Title, Description, 起码你的网页标题要包含你所想得到排名的关键词。
分类合理,网站页面结构扁平(也就是目录层级尽可能的少),清晰。
站在用户的角度来说,就是用户能轻易的找到所需要的内容,网站易用性好,优质内容能及时呈现。

进阶SEO做法:
网站内容相互关联好吗?有相关内容推荐吗?是否可以更好的改善内链?是否有同类型的较优秀的站点可以给你连接?
有没有可能搜集尽可能多的行业相关的关键词,去创造或者获取尽可能多的内容,从而形成对用户需求的广泛覆盖,即使是低频的长尾词,也能有足够的内容去覆盖。
内容多了,是不是可以聚合相关内容,实现内容多样性,有效性,实现内容增益?
通过日志分析,找到当前网站存在的问题,和可以改善的点,比如服务器的稳定性,比如搜索引擎抓取内容时更加快速、方便。

高阶SEO做法:

同理心,和用户换位思考,多站在普通用户的角度去考虑问题。
用户在不同的使用场景下,会遇到什么样的问题?
用户的痛点是什么?你能提供什么独特的价值给用户?
考虑一下客户的需求在哪里,客户都对哪些内容感兴趣?
在同类型网站很多的情况下,你提供的信息或内容怎么比别人提供的更有价值,即内容增益?
站在行业生态的角度去考虑问题,你想通过什么样的途径去触达你的客户

内容敲定了,再谈谈用户体验

网站服务器快吗? 网页加载速度快吗?用户体验好吗?站内导航,如面包屑齐全吗?
网页设计符合用户的审美吗?页面内容字号、字体是否设置合理,可读性高吗?
网站有太多的广告吗?是否到处是闪动的广告,用户分不清哪里是广告,哪里是内容呢?
用户看了觉得爽,你提供快捷的方式让用户分享了吗?

你有没有为你的用户提供基于移动场景下的 HTML 5 移动版网站?
你的网站提供移动版了吗?有没有快速的入口提供给用户,方便用户多屏阅读、使用;如扫个二维码,到手机或者平板上去看、玩。

内容建设好了,那收录得如何?有没有读读百度站长学院的文档,有没有按照要求推送你的内容给百度,方便索引?
有可能让用户自发帮你宣传,变成你站点的自来水吗?

有没有可能引导用户互动,引导UGC内容的创造?

如何将站点的资源优势实现业务互补?
有没有可能输出优质内容给其他网站,打造网站品牌,形成行业影响力?

优质内容传播途径创新

优质内容是否跟着用户经常使用的场景而产生变化呢?

微信上聚集了大量的用户,你的内容有没有通过微信公众号的形式分享出去,或者引起用户的共鸣,从而触动用户主动的传播呢?
今日头条、搜狐自媒体、微博等各大自媒体渠道上是否可以再次传播,形成内容的多重场景触达用户呢?

90,00后的年轻用户群体偏爱QQ,QQ空间,我们也应该想办法覆盖到,尤其是当网站用户群定位为年轻,时尚的群体时。

SEO工作的目的与价值
最后,任何网站的SEO工作,都是为了达成一定的目的而做的,我们应该让SEO工作更好的服务业务目标,帮助业务实现更好的发展。此为重中之重,亦为SEO工作价值之所在。

以上仅为个人思考,欢迎补充

Linode SSD VPS最新优惠码,新用户注册冲5刀送50刀,手要快

Linode VPS 新用户注册,冲$5送$50刀,差不多可以用半年(VPS套餐最低10刀/月)
作为一个深度Linode老客户,只有艳羡的份了,老用户无此优惠。

数量有限,手快者得,慢了就可能过期了

Promo Code操作
1,在Promo Code(优惠码): BSFM50
2,我的Referral Code: e44e48dac5137097d560a696d4a5b6b28de588be (备注:点这个的链接注册,自动输入,无需手动,支持我就这么简单)

注意事项
送50美元给你的条件是你至少要充值5美元才可以!目前linode最便宜的VPS是月付10美元,如果你自己充值10美元的话,这下子可以使用半年了!
1,请勿使用QQ邮箱注册,Linode 已经屏蔽了;

2,喜大普奔,据说不需要VISA卡,国内用户会自动走银联通道。

3,Linode只有Linux操作系统可选,需要有点折腾精神Linux基础用户使用。

心动不如行动,现在就买个自己的Linode VPS吧

如果过期了,请通过奇才哥简介里的联系方式联系我,我把文章撤掉!

八卦一下:奇才哥自2011年9月6号使用Linode的VPS服务器至今,其VPS稳定型,逼格超高!真刀真枪玩Linux 也是从Linode 开始的。当然,现在的水平也就配置个VPS web服务器环境轻轻松松而已。

此外,业界良心的Linode在你使用超过一年之后,还会提供免费升级服务,比如加硬盘空间,带宽等

CentOS 6.5 64位VPS源码安装PHP 5.2.17

CentOS 6.5 64位VPS源码安装PHP 5.2.17
先添加用户及用户组

/usr/sbin/groupadd www
/usr/sbin/useradd -g www www

一、编译安装PHP 5.2.17 所需的支持库
PS, 如果已经安装过这些支持库的,不必重复安装!
按顺序依次安装如下软件:

1.1 下载LIBICONV 1.14 并安装
Libiconv URL: http://www.gnu.org/software/libiconv/ http://ftp.gnu.org/pub/gnu/libiconv/

wget http://ftp.gnu.org/pub/gnu/libiconv/libiconv-1.14.tar.gz
tar zxvf libiconv-1.14.tar.gz && cd libiconv-1.14
./configure --prefix=/usr/local/libiconv --enable-extra-encodings && make && make install && cd ../

注:enable-extra-encodings 选项是为了能支持以下扩展字符集,详情请参考:http://www.gnu.org/software/libiconv/
主要是为了支持Magento的 ISO-2022-JP Mail for Japanese
插件所需要的 ISO-2022-JP-3 字符集

European languages
CP{437,737,775,852,853,855,857,858,860,861,863,865,869,1125}
Semitic languages
CP864
Japanese
EUC-JISX0213, Shift_JISX0213, ISO-2022-JP-3
Chinese
BIG5-2003 (experimental)
Turkmen
TDS565
Platform specifics
ATARIST, RISCOS-LATIN1

1.2, 下载 MHASH 0.9.9.9 并安装
URl: http://sourceforge.net/projects/mhash/

wget http://downloads.sourceforge.net/project/mhash/mhash/0.9.9.9/mhash-0.9.9.9.tar.bz2 
tar jxvf mhash-0.9.9.9.tar.bz2 && cd mhash-0.9.9.9
./configure && make && make install && cd ../
/sbin/ldconfig

1.3,下载 MCRYPT 2.6.8 并安装
myrypt URL: http://sourceforge.net/projects/mcrypt/?source=dlpaz

wget http://hivelocity.dl.sourceforge.net/project/mcrypt/MCrypt/2.6.8/mcrypt-2.6.8.tar.gz
tar zxf mcrypt-2.6.8.tar.gz && cd mcrypt-2.6.8
./configure && make && make install
/sbin/ldconfig
cd ../

1.4, 下载 LIBMCRYPT 2.5.8 并安装
URL: http://sourceforge.net/projects/mcrypt/files/Libmcrypt/

wget http://downloads.sourceforge.net/project/mcrypt/Libmcrypt/2.5.8/libmcrypt-2.5.8.tar.gz
tar zxf libmcrypt-2.5.8.tar.gz && cd libmcrypt-2.5.8
./configure && make && make install
/sbin/ldconfig
cd libltdl/
./configure --enable-ltdl-install && make && make install
cd ../../

创建系统软连接

ln -s /usr/local/lib/libmcrypt.* /usr/lib/
ln -s /usr/local/bin/libmcrypt-config /usr/bin/libmcrypt-config
ln -s /usr/local/lib/libmhash.* /usr/lib/

开始以下步骤前,请确保已经成功安装MySQL 或者 MySQL的变种如:mariadb,PHP 5.2.17 如果没有安装MySQL 是无法顺利安装的,否则安装后无法支持 MySQL,需要重新编译!

二、下载、编译、安装PHP 5.2.17
第一步,下载、编译、安装PHP 5.2.17源码
注意下文中 –with-mysql –with-mysqli 字段的路径根据自己服务器上MySQL的实际情况更改

wget http://museum.php.net/php5/php-5.2.17.tar.gz
#下载PHP 的 php-fpm 补丁
wget http://php-fpm.org/downloads/php-5.2.17-fpm-0.5.14.diff.gz
tar zxvf php-5.2.17.tar.gz
#应用php-fpm 补丁
gzip -cd php-5.2.17-fpm-0.5.14.diff.gz | patch -d php-5.2.17 -p1

#请注意一下编译参数中的 --with-mysql --with-mysqli 及 --with-iconv 参数的路径,改为你服务器中实际项目地址

./configure --prefix=/usr/local/php \
--enable-fastcgi \
--enable-fpm \
--with-config-file-path=/usr/local/php/etc \
--with-mysql=/usr/local/mariadb \
--with-mysqli=/usr/local/mariadb/bin/mysql_config \
--with-iconv-dir=/usr/local \
--with-freetype-dir \
--with-jpeg-dir \
--with-png-dir \
--with-gd \
--enable-gd-native-ttf \
--with-zlib \
--enable-zip \
--with-libxml-dir=/usr \
--enable-xml \
--disable-rpath \
--enable-discard-path \
--enable-safe-mode \
--enable-bcmath \
--enable-shmop \
--enable-sysvsem \
--enable-inline-optimization \
--with-curl \
--with-curlwrappers \
--enable-mbregex \
--enable-force-cgi-redirect \
--enable-mbstring \
--with-mcrypt \
--with-iconv=/usr/local/libiconv \
--with-openssl \
--with-mhash \
--enable-pcntl \
--enable-sockets \
--with-ldap \
--with-ldap-sasl \
--with-xmlrpc \
--enable-soap

make ZEND_EXTRA_LIBS='-liconv'
make install

第二步:下载安装 PDO_MYSQL

wget http://pecl.php.net/get/PDO_MYSQL-1.0.2.tgz

tar zxvf PDO_MYSQL-1.0.2.tgz && cd PDO_MYSQL-1.0.2/
/usr/local/php/bin/phpize
./configure --with-php-config=/usr/local/php/bin/php-config --with-pdo-mysql=/usr/local/mariadb

第三步:安装ZendOptimizer-3.3.9(可选)
ZendOptimizer的作用是分析,优化由Zend 编译器加密产生的代码的程序,对不是Zend编译器加密过的程序,没有必要安装这个。
64位:http://downloads.zend.com/optimizer/3.3.9/ZendOptimizer-3.3.9-linux-glibc23-x86_64.tar.gz
32位:http://downloads.zend.com/optimizer/3.3.9/ZendOptimizer-3.3.9-linux-glibc23-i386.tar.gz

cd /soft
http://downloads.zend.com/optimizer/3.3.9/ZendOptimizer-3.3.9-linux-glibc23-x86_64.tar.gz
tar xzf ZendOptimizer-3.3.9-linux-glibc23-x86_64.tar.gz
cd ZendOptimizer-3.3.9-linux-glibc23-x86_64/data/5_2_x_comp/
mkdir -p /usr/local/zend/lib/
cp ZendOptimizer.so /usr/local/zend/lib

加载zendoptimizer,打开/usr/local/php/etc/php.ini文件,在配置文件的最底部加入如下代码:

[zend]
zend_optimizer.optimization_level=15
zend_extension=/usr/local/Zend/lib/ZendOptimizer.so

遇到一些问题的解决办法:
1, configure: error: Cannot find ldap libraries in /usr/lib 解决办法

今天在centos 6.2 64位版本上安装LNMP,config php的时候出现下面错误而退出
configure: error: Cannot find ldap libraries in /usr/lib
解决办法:

cp -frp /usr/lib64/libldap* /usr/lib/

然后再./configure …即可

2, configure: error: libpng.(a|so) not found, libjpeg.(a|so)not found 的解决办法
http://blog.csdn.net/alexdream/article/details/7408438

解决configure: error: libpng.(a|so) not found. libjpeg.(a|so)not found

yum install libpng libpng-devel libjpeg libjpeg-deve

# ln -s /usr/lib64/libjpeg.so /usr/lib/
# ln -s /usr/lib64/libpng.so /usr/lib/

CentOS 通过 yum –exclude=postfix* update 排除不需要升级的包

通常在用yum进行更新时老是会更新内核,这样就造成了两个问题:
1.内核过多,占用系统的空间
2.如果是自行编译安装的nvidia显卡驱动的话,进入更新的核心时需要再重新安装显卡驱动

这里介绍好的办法解决这个问题,就是在更新时排除对内核的更新,方法有两个:
1.修改yum的配置文件 vi /etc/yum.conf,在[main]的最后添加exclude=kernel* 或者你想排除的软件包,比如 exclude=postfix*
2.直接在yum的命令行执行如下的命令: yum –exclude=kernel* update 或者 yum –exclude=postfix* update 排除不需要升级的内核或者软件包.

清除YUM缓存
yum 会把下载的软件包和header存储在cache中,而不会自动删除。如果我们觉得它们占用了磁盘空间,可以使用yum clean指令进行清除,更精确 的用法是yum clean headers清除header,yum clean packages清除下载的rpm包,yum clean all一 股脑儿端

1.清除缓存目录(/var/cache/yum)下的软件包
命令:yum clean packages
2.清除缓存目录(/var/cache/yum)下的 headers
命令:yum clean headers
3.清除缓存目录(/var/cache/yum)下旧的 headers
命令:yum clean oldheaders
4.清除缓存目录(/var/cache/yum)下的软件包及旧的headers
命令:yum clean, yum clean all (= yum clean packages; yum clean oldheaders)
附:
由于 Fedora 的 yum
预设的更新主机在外国,也就是 Fedora 的官方更新主机
连线到国外下载,速度之慢,可想而知….
在这里,我们可以修改 yum 的配置文件
把连线主机,改成国内各大学的 Linux 更新主机,如此速度就会比较快

BTW:

yum -y upgrade 和 yum -y update 区别
分别测试yum -y upgrade和yum -y update

升级前
系统版本: centos5.5

内核版本: 2.6.18-194.el5

升级前做过简单配置文件修改

yum -y upgrade 升级后

系统版本: centos5.7

内核版本: 2.6.18-194.el5

系统和软件配置不做修改

yum -y update 升级后

系统版本: centos5.7

内核版本: 2.6.18-238.el5

系统和软件配置文件更新

结论:
yum -y update
升级所有包,改变软件设置和系统设置,系统版本内核都升级

yum -y upgrade
升级所有包,不改变软件设置和系统设置,系统版本升级,内核不改变