Archive for 六月, 2005

真正的大牛

Posted in 网络文章 on 六月 23, 2005 by maximliu
Bill Joy, 前任Sun的首席科学家,当年在Berkeley时主持开发了最早版本的BSD。他还是vi和csh的作者。当然,Csh Programming Considered Harmful 是另一个话题乐。据说他  看看自己能不能写个操作系统,就在三天里写了个自己的Unix, 也就是BSD的前身。当然是传说了,但足见他的功力。另一个传说是,1980年初的时候,DARPA让BBN在Berkley Unix里加上BBN开发的TCP/IP代码。但当时还是研究生的B伯伯怒了,拒绝把BBN TCP/IP加入BSD,为他觉得BBN的TCP/IP写得不好。于是B伯伯出手了,端的是一箭封喉,很快就写出了高性能伯克利版TCP/IP。当时 BBN和DARPA签了巨额合同开发TCP/IP Stack,谁知他们的代码还不如一个研究生的好。于是他们开会。只见当时B伯伯穿个T-shirt出现在会议室(当时穿Tshirt不象现在,还是相当散漫的哈)。只见BBN问:你怎么写出来的?而B伯伯答:简单,读协议,然后编程就行了。最令偶晕倒的是,B伯伯硕士毕业后决定到工业界发展,于是就到了当时只有一间办公室的Sun, 然后他就把Sparc设计出来乐。。。象这种软硬通吃的牛人,想不佩服都不行的说。据Bill Joy的同事说,一般开会的时候B伯伯总是拿一堆杂志漫不经心地读。但往往在关键之处,B伯伯发言,直切要害,提出漂亮的构想,让同事们彻底崩溃。对了,他还是Java Spec和JINI的主要作者之一。

John Carmack,ID Software的founder和Lead Programmer。上个月和一个搞图形的师兄聊天,他竟然不知道John Carmack, 也让偶大大地晕了一把。不过也许搞研究的和搞实战的多少有些隔吧。想必喜欢第一人称射击游戏的都知道J哥哥。90年代初只要能在PC上搞个小动画都能让人惊叹一番的时候,J哥哥就推出了石破天惊的Castle Wolfstein, 然后再接再励,doom, doomII, Quake…每次都把3-D技术推到极限。J哥哥的简历上说自己的专长是"Exhaust 3-D technology",真是牛人之言不我欺的说。做J哥哥这样的人是很幸福的,因为各大图形卡厂家一有了新产品就要向他“进贡” ,不然如果他的游戏不支持哪种卡,哪种卡基本就会夭折乐。当初MS的Direct3D也得听取他的意见,修改了不少API。当然,J哥哥在结婚前十数年如一日地每天编程14小时以上,也是偶们凡人望尘莫及的。对了,J哥哥高中肆业(?),可以说是自学成才。不过呢,谁要用这个例子来为自己学习不好辩护,就大错特错了。那Leonardo Da Vinci还是自学成才呢(人是私生子,不能上学)。普通人和天才还是有区别的。对了,其实偶们叫“达分奇”是相当不对的,因为Vinci是地名,而Da Vinci就是从Vinci来的人的意思。换句话说,Leonardo Da Vinci就是“从Vinci来的Leonardo”的意思。叫别人“Da Vinci”就不知所谓乐。嗯,扯远了,打住。

David Cutler,VMS和Windows NT的首席设计师,去微软前号称硅谷最牛的kernel开发员。当初他和他的手下在微软一周内把一个具备基本功能的bootable kernel写出来,然后说:“who can’t write an OS in a week?",也是牛气冲天的说。顺便说一句,D爷爷到NT3.5时,管理1500名开发员,自己还兼做设计和编程,不改coder本色啊。D爷爷天生脾气火爆,和人争论时喜欢双手猛击桌子以壮声势。 日常交谈F-word不离口。他面试秘书时必问:"what do you think of the word ‘[censored]’?" ,让无数美女刹羽而归。终于有一天,一个同样火爆的女面对这个问题脱口而出:"That’s my favorite word"。于是她被录取乐,为D爷爷工作到NT3.5发布。

Don Knuth。高爷爷其实用不着偶多说。学编程的不知道他就好像学物理的不知道牛顿,学数学的不知道欧拉,学音乐的不知道莫扎特,学Delphi的不知到 Anders Hejlsberg,或者学Linux不知道Linus Torvalds一样,不可原谅啊。为了让文章完整,就再罗唆几句吧。高爷爷本科时就开始给行行色色的公司写各种稀奇古怪的编译器挣外快了。他卖给别人时收一两千美元,那些公司拿了 code,加工一下卖出去就是上万上十万。不过也没见高爷爷不过,学者本色的说。想想那可是60年代初啊,高爷爷写编译器写多了,顺带就搞出了个         Attribute Grammar和LR(k),大大地造福后人啊。至于高爷爷在CalTech的编程比赛(有Alan Kay得众多高高手参加)总是第一,写的Tex到86年就code freeze,还附带2^n美分奖励等等都是耳熟能详的,偶就不饶舌乐。顺便说一下,高老大爷是无可争议的写作高手。他给Concrete Mathematics 写的前言可谓字字铿锵,堪为前言的典范。他的技术文章也是一绝,文风细致,解释精当,而且没有学究气,不失轻快跳脱。记得几年前读Concrete Mathemathics,时不时开怀大笑,让老妈极其郁闷,觉得我nerdy到家,不可救药。其实呢,子非鱼,安知鱼之乐,更不知那完全是高爷爷的功劳。说到写作高手,不能不提Stephen A. Cook。他的文章当年就被我们的写作老师极力推荐,号称典雅文风的样本。库爷爷一头银发,身材颀长,总是面带谦和的微笑,颇有仙风道骨,正好和他的仙文相配的说。高爷爷其实还是开源运动的先驱。虽然他没有象Richard Stallman那样八方奔走,但他捐献了好多作品,都可以在网上看到,比如著名的Mathematical Writing,MMIXWare,The Tex Book等,更不用说足以让他流芳百世的Tex.

Ken Thompson,C语言前身B语言的作者,Unix的发明人之一(另一个是Dennis M. Riche老大,被尊为DMR),Belle(一个厉害的国际象棋程序)的作者之一, 操作系统Plan 9的主要作者(另一个是大牛人Rob Pike, 前不久被google挖走了)。Ken爷爷也算是计算机历史上开天辟地的人物了。1969年还是计算机史前时代,普通人都认为只有大型机才能运行通用的操作系统,小型机只有高山仰止的份儿。至于用高级语言来写操作系统,更是笑谈。Ken爷爷自然不是池中物,于是他和DMR怒了,在1969年到1970间用汇编在PDP-7上写出了UNIX的第一个版本。他们并不知道,一场轰轰烈烈的UNIX传奇由此拉开了序幕。Ken爷爷在1971年又把 UNIX用C重写,于是C在随后20年成就了不知多少豪杰的梦想和光荣。Ken爷爷还有段佳话: 装了UNIX的PDP-11最早被安装在Bell Lab里供大家日常使用。很快大家就发现Ken爷爷总能进入他们的帐户,获得最高权限。Bell Lab里的科学家都心比,当然被搞得郁闷无比。于是有高手怒了,跳出来分析了UNIX代码,找到后门,修改代码,然后重新编译了整个UNIX。就在大家都以为“这个世界清净了”的时候,他们发现Ken爷爷还是轻而易举地拿到他们的帐户权限,百思不解后,只好继续郁闷。谁知道这一郁闷,就郁闷了14年,直到Ken爷爷道出个中缘由。原来,代码里的确有后门,但后门不在Unix代码里,而在编译Unix代码的C编译器里。每次C编译器编译UNIX的代码,就自动生成后门代码。而整个Bell Lab的人,都是用Ken爷爷的C编译器。

Rob Pike, AT&T Bell Lab前Member of Technical Staff ,现在google研究操作系统 。罗伯伯是Unix的先驱,是贝尔实验室最早和Ken Thompson以及Dennis M. Ritche开发 Unix的猛人,UTF-8的设计人。他还在美国名嘴David Letterman的晚间节目上露了一小脸,一脸憨厚地帮一胖子吹牛搞怪。让偶佩服不已的是,罗伯伯还是1980年奥运会射箭的银牌得主。他还是个颇为厉害的业余天文学家,设计的珈玛射线望远镜差点被NASA用在航天飞机上。他还是两本经典,The Unix Programming Environment 和 The Practice of Programming 的作者之一。如果初学者想在编程方面精益求精,实在该好好读读这两本书。它们都有中文版的说。罗伯伯还写出了Unix下第一个基于位图的窗口系统,并且是著名的blit 终端的作者。当然了,罗伯伯还是号称锐意革新的操作系统,Plan9,的主要作者。可惜的是,Plan9并没有引起多少人的注意。罗伯伯一怒之下,写出了振聋发聩的雄文 Systems Software      Research is Irrelevant,痛斥当下系统开发的不思进取,固步自封的弊病。虽然这篇文章是罗伯伯含忿出手,颇有偏激之词,但确实道出了系统开发的无奈:开发周期越来越长,代价越来越大,用户被统一到少数几个系统上,结果越来越多的活动是测量和修补,而真正的革新越来越少。就在罗伯伯郁闷之极的时候,google登门求贤来乐。如果说现在还有一家大众公司在不遗余力地把系统开发推向极致的话,也就是google乐。随便看看google的成果就知道了。具有超强容错和负载平衡能力的分布式文件系统GFS (现在能够用100,000台廉价PC搭起一个巨型分布系统,并且高效便宜地进行管理的系统也不多哈),大规模机器学习系统(拼写检查,广告匹配,拼音搜寻。。。哪个都很牛的说),更不用说处理海量并行计算的各式google服务了。Rob在System Software Research is Irrelevant里萧瑟地说现在没有人再关心系统研究的前沿成果了。想不到他错了,应为google关心。google网络了大批功成总是试图吸取系统研究的最新成果。想必Rob Pike在google很幸福。愿他做出更棒的系统。

Dennis M. Ritchie, 既然Ken Thompson是我的偶像,新闻组上人称DMR的Dennis M. Ritchie自然也是,毕竟两人共同缔造了UNIX,而Dennis几乎独力把C搞大(当然,C的前身是B,而B是Ken Thompson一手做出来的)。J 两人1983年分享图灵奖,是有史以来少数几个因工程项目得奖的工程师(本来是唯一的一对儿,但Alan Kay才因为SmallTalk得奖,所以就成了唯二的乐) 。一个人一生能做出一个卓越的系统已经不易,DMR的C和UNIX长盛不衰近30年,至今生机勃勃,DMR此生可以无憾的说。D爷爷也算有家学渊源:他老爸在AT&T贝尔实验室工作了一辈子,并在电路设计方面卓有成就,还出了本颇有影响的The Design of Switching Circuits,据说在交换理论和逻辑设计方面有独到的论述。当然,D爷爷和他老爸是不同时代的人:他老爸的研究成形于晶体管发明之前,而D爷爷的工作离了晶体管就玩儿不转乐。:-D不要看D爷爷搞出了C,其实他最爱的编程语言是Alef,在Plan9上运行,支持并行编程。Alef的语法和C相似,但数据类型和执行方式都和 C大大不同。说到语言,D爷爷对后来人有非常中肯的建议:抱着学习的目的来开发你自己的语言,不要冀望于它被众人接受。这个建议不光对语言开发有用,也适用于其它大型系统的开发。别的不说,DMR后来领导自己的团队在1995年和 1996分别推出了Plan9和Inferno操作系统,又用多少人知道呢?其实,D爷爷当初也没想过C会风行世界。他开发C的初衷和Eric S. Raymond在Cathedral and Bazaar里阐述的一样,就是要消除自己对现有工具的不爽之处。谁知D爷爷无心插柳,C竟然受到众多程序员的狂热拥戴,连D爷爷自己都大惑不解。在一次采访中D爷爷说大概那是因为C的抽象程度碰巧既满足了程序员的要求, 又容易实现。当然C一度是Unix上的通用语言也是原因。但不管怎么说,D爷爷对编程语言出色的审美意识奠定了C广为流传的基础。最后八卦一下。D爷爷的业余爱好和NBA大牛Karl Malone一样:开卡车。不过D爷爷更喜欢开NASCAR,而KM独爱巨无霸。J D爷爷自称心中不供偶像,如果一定要说一个,那就是Ken Thompson了。现在Ken爷爷退休当飞机教练去了,而D爷爷当了贝尔实验室系统开发部的头,整日忙于开支票。他俩合作20年,屡屡创造历史。这段令人神往的佳话,也就长留你我心中乐。P.S., 很多人都以为Brian W. Kernighan是C的作者。其实BWK只是写了那本经典K&R C。据D爷爷说,他,Ken, 和Kernighan三人中,Kernighan最能写文章,他次之,而Ken写得最少;但说到编程,Ken爷爷才是当之无愧的老大Edsger Wybe Dijkstra, 对,就是E.W. Dijkstra. 一提到EWD,很多人就会想起找最短路径的Dijkstra Algorithm,就好像一提到Sir. Tony Hoare,就想起Quick Sort一样。其实这些个算法不过是两个牛人在他们职业生涯中最琐碎的贡献。比如Dijkstra算法,无非是戴爷爷在1956年为了展示新计算机 ARMAC的计算能力,初试身手的成果,属于他的算法处。据戴爷爷自述,他搞出最短路径算法的时候连纸笔都没用。当时他和他老婆在阿姆斯特一家咖啡厅的阳台上晒太阳喝咖啡,突然就把这个算法想出来乐。而且当时的算法研究还比较原始,牛人们忙着用计算机搞数值计算,对离散算法不屑一顾。那时连一个象样的专注于离散算法的专业期刊都没有。戴爷爷于是推迟发表这个算法。直到1959年,他才把这个算法发表在Numerische Mathematik的创刊号上,权为捧场。:-) EWD在多个领域牛气冲天,端的是理论和编程两手硬的高手。只不过他的很多工作比较深刻,学校的老先生们觉得本科生接
受不了,不给本科生讲而已.戴爷爷大概因为最短路径算法一战成名,于是有人请他参加另一台计算机X1的设计工作,并且把设计实时中断系统的任务派给了他。现在看来实时中断也许不算什么,但要知到,X1前根本就没有实时中断的概念。实现它简直就是一场豪赌。戴爷爷起初还不情愿,但经不住项目负责人Bram和Carel的轮番 “吹捧”:我们知道实时中断让您工作变得非常困难,但象您这样的牛人肯定能做出来的说。结果戴爷爷被糖衣炮弹彻底击穿,接下了这个烫手山芋。两三年后,他不仅搞出了实时中断,还围绕这个写出了自己的博士论文,顺利戴上博士帽。让戴爷爷真正成名立万的还是在X1上开发的Algo60,最早的高级语言之一。戴爷爷没日夜地工作了8个月,就搞出了Algo60,也因此获得了 1972年的图灵奖。因为Algo60,戴爷爷发表了一篇石破天惊的文章:Recursive Programming,于是人们才知道,原来高级语言也可以高效地实现递归,原来从此以后,所有程序员都不可避免地和戴爷爷发明的一个词(应该说是概念)打交道:堆栈。而且Algo60还让戴爷爷深入地思考多道程序设计的问题,最终发明了每个系统程序员都绕不开的概念:semaphore。当然,戴爷爷总是把他发明的概念严
格形式化,极具科学家本色的说。和这些成就想比,他提出的吃饭的哲学家问题,也就没什么好说的了。说来好笑,当时的大学(忘了哪所了)还是觉得戴爷爷没有受过正统的数学训练,也不是专门搞数值分析的,所以最后不太情愿地给了他一个教职。这种小挫折并不能妨碍象戴爷爷这样的牛人创造历史。他一边教数值分析(:-D) ,一边开始开发一个新的操作系统,并培养计
算机科学家。几年后,THE Multiprogramming System横空出世。THE是第一个支持松散耦合,显式同步的进程并由此使得严格证明系统没有死锁变得容易的操作系统。可惜戴爷爷任职的系不识货,还强行解散了他的研究小组(1972年戴爷爷给他的系主任说他得了图灵奖,系主任的第一反应是你们搞计算机就喜欢乱发奖)。这让戴爷爷相当郁闷,得了抑郁症。在极度郁闷之中,戴爷爷决定用写作来治疗自己的抑郁症。于是经典就诞生乐:Notes on Structured Programming。戴爷爷从此被尊为结构化编程的奠基人,而且他的抑郁症也被治好乐。EWD太牛,结果他的故事也太多。先到这里吧。1973起,他的故事就在美国发生了。

Anders Hejlsberg,微软.NET的首席架构师,编程语言设计和实现的顶尖高手。他一手做出了 Turbo Pascal, 也是Delphi, J++(尤其是WFC),C#, 和.NET的主要作者。这些作品的名字足以为他立传。作为一个程序员,我在这样的大师面前实在无语。生子当如Anders的说。李维的里已详细讲述了Anders的传奇故事,我就不用费舌了:http: //java.mblogger.cniexploiter/posts/1505.aspx 。Artima上有Anders谈C#的系列访谈。MSDN上有一段Anders导游的录像 。有兴趣可以去看看牛人的丰采。

使用yum 代替up2date 自动更新升级RedHat AS3

Posted in [Linux] on 六月 1, 2005 by maximliu

最近装了一台RedHat AS3U2 服务器,AS3U2是从网上免费下载的,没有购买RedHat的服务,所以不能使用rhn up2date升级系统;虽说U2已经满新的了,但linux补丁不断,不能升级非常郁闷!所以这几天一直在找升级方法。

 开始时想从ftp.redhat.com下载源码包进行rebulid然后升级,但rebulid时经常说少很多开发包,又要找光盘安装,太麻烦,而且还不能自动完成更新。没办法,我是个懒人,在找其他办法。

 一直用apt做redhat7.2的升级,感觉还行,然后在网上看到可以用apt for Redhat EL3的升级as3(见http://www.linuxeden.com/edu/doctext.php?docid=3219),进行了一下测试,发apt for el3提供的升级包太少,没法用,我也没发现好的as3 apt升级服务器。

 最后看到了一篇关于CentOS Linux 的,CentOS Linux 是一种 RedHat El3 的ReBulild版本(利用RedHat El3重新编译),使用yum作为升级管理器。由于手头没有CentOS Linux ,就到yum的老家(http://linux.duke.edu/projects/yum/)下载了一个,我分析了一下yum的管理方式,发现其主要是利用发行版本中的headers文件,和rhn的up2date很类似,感觉可以用在as3上。经过测试一切ok,下面是相关的一些内容说明

1.什么是yum?
 yum : (Yellow dog Updater, Modified) 是黄狗LINUX的包管理器,用它可以安装、升级 软件包及整个系统。只要是基于rpm方式管理的系统都可以用!

2.RedHat AS3 升级资源 (RH src rebuild)
 CentOS Linux
 WhiteBoxLinux
 TaoLinux
 这里只用到了CentOS Linux,它的更新还是比较快的,他们一般在Redhat的SRPMS出来几个小时后就跟着出补丁了

3.下载安装配置yum
 从http://linux.duke.edu/projects/yum/download/2.0/yum-2.0.7-1.noarch.rpm 下载,并安装yum
 安装后要注意的是一下三个文件
  /etc/cron.daily/yum.cron #每日进行yum 及 其他软件包定时升级
  /etc/init.d/yum  #yum服务? 具体什么作用没有研究
  /etc/yum.conf  #yum配置文件
 接下来修改/etc/yum.conf
 vi /etc/yum.conf
 将
  [base]
  name=Red Hat Linux $releasever – $basearch – Base
  baseurl=http://mirror.dulug.duke.edu/pub/yum-repository/redhat/$releasever/$basearch/

  [updates]
  name=Red Hat Linux $releasever – Updates
  baseurl=http://mirror.dulug.duke.edu/pub/yum-repository/redhat/updates/$releasever/
 改为
  [base]
   name=CentOS Linux 3.1 for RHEL3 – Base #随便取名字
  baseurl=http://mirror.aelix.com/pub/cAos/centos-3/3.1/os/i386

  [updates]
  name=CentOS Linux 3.1 for RHEL3 – Updates #随便取名字
  baseurl=http://mirror.aelix.com/pub/cAos/centos-3/3.1/updates/i386

 存盘.完成配置

4. 升级系统
  输入命令
   yum update
 剩下的就是等着收获吧,就是这么简单 🙂

5. 其他
 编辑/etc/yum.conf 在[main] 中加入 exclude=kernel kernel-source 这样可以不升级kernel
 安装新软件包,如mc : yum install mc
 还有就是研究man 吧:man yum

6.附录(引自 bash99@unknown)

 如果你喜欢自由软件的精神,希望成为一名True Hacker,而且已经决定用一个Real Operate System了,那就去选一个Real Distribution吧,不要用RedHat。Gentoo,Debian都是好选择,也可以从Slackware开始。

 如果你是想做正式商业运用,而又希望用所谓的RHEL的话,去向RedHat买一个吧,这样你可以得到一年的升级支持(你不知道升级意味什么!天哪,愿神保佑你),并且建议你继续购买Redhat的服务(subscription on rhn.redhat.com),这样可以继续获得4年的升级支持。
因为:
  1.没有安全升级的服务器是非常危险的。
  2.RHN作为一个大的系统管理来说,是个不错的平台。
  3.Redhat在Opensource方面做得不错,应该支持。

 唯一建议装这个免费的as3的对象是,作为个人试验用途,或者需要以RHEL作为目标平台开发软件的开发人员。仍然建议你处于足够好的防火墙和安全策略保护之下。顺便说一句,RHEL AS3.0和RH9基本兼容,在RH9上编译的大部分binary都不会有问题,另外用一些RHEL Rebuild的发行版(CentOS/Whitebox/TaoLinux)也不会有问题。

 如果你的Boss,Teammate等等就是认定RHEL了,但是就是不想从口袋里掏钱给Redhat公司。他们说:“Linux不是免费的吗?”尽力说服他们吧。否则,作为最后一个解决办法,用第三方的各种RHEL Rebuild发行版的updates,CentOS(centos.org)似乎是最及时的,了解一下yum的配置。无论如何,确保你是能够自动升级各种安全补丁的。感谢GPL及Redhat的公司的策略,安全补丁的Src是可以免费得到的。

关于Redhat的Extras盘,了解一下内容,自己决定是否下载吧。
 盘一是IBM的JDK和JRE,还有一个jrockit的J2SE,87M。
 盘二是Eclipse,Src和i386,faint,难道这个还需要放到extras里面,而且只有167M,还自称Developer Suite。
 盘三是Cluster Suite,faint,委实狡诈,ipvsadm这种包居然也放到extras里面,faint,这个又不是rh开发的。10M
 盘四是文档,7xxM。

其实RH的License方面一直做得不错,于是只好在发行版本上做文章了。文档的License也是开源的。

Linux内核解读入门

Posted in [Linux] on 六月 1, 2005 by maximliu

Linux内核解读入门

针对好多Linux 爱好者对内核很有兴趣却无从下口,本文旨在介绍一种解读linux内核源码的入门方法,而不是解说linux复杂的内核机制; 

一.核心源程序的文件组织: 

1.Linux核心源程序通常都安装在/usr/src/linux下,而且它有一个非常简单的编号约定:任何偶数的核心(例如2.0.30)都是一个稳定地发行的核心,而任何奇数的核心(例如2.1.42)都是一个开发中的核心。本文基于稳定的2.2.5源代码,第二部分的实现平台为 Redhat Linux 6.0。

 
2.核心源程序的文件按树形结构进行组织,在源程序树的最上层你会看到这样一些目录: 
●Arch :arch子目录包括了所有和体系结构相关的核心代码。它的每一个子目录都代表一种支持的体系结构,例如i386就是关于intel cpu及与之相兼容体系结构的子目录。PC机一般都基于此目录; 
●Include: include子目录包括编译核心所需要的大部分头文件。与平台无关的头文件在 include/linux 
子目录下,与 intel cpu相关的头文件在include/asm-i386子目录下,而include/scsi目录则是有关 scsi设备的头文件目录; 
●Init: 这个目录包含核心的初始化代码(注:不是系统的引导代码),包含两个文件main.c和Version.c,这是研究核心如何工作的一个非常好的起点。 
●Mm :这个目录包括所有独立于 cpu 体系结构的内存管理代码,如页式存储管理内存的分配和释放等;而和体系结构相关的内存管理代码则位于arch/*/mm/,例如arch/i386/mm/Fault.c 
●Kernel:主要的核心代码,此目录下的文件实现了大多数linux系统的内核函数,其中最重要的文件当属 sched.c;同样,和体系结构相关的代码在arch/*/kernel中; 
●Drivers: 放置系统所有的设备驱动程序;每种驱动程序又各占用一个子目录:如,/block 下为块设备驱动程序,比如ide(ide.c)。如果你希望查看所有可能包含文件系统的设备是如何初始化的,你可以看drivers/block/genhd.c中的device_setup()。它不仅初始化硬盘,也初始化网络,因为安装nfs文件系统的时候需要网络其他: 如, Lib放置核心的库代码; Net,核心与网络相关的代码; Ipc,这个目录包含核心的进程间通讯的代码; Fs ,所有的文件系统代码和各种类型的文件操作代码,它的每一个子目录支持一个文件系统,例如fat和ext2; Scripts, 此目录包含用于配置核心的脚本文件等。一般,在每个目录下,都有一个 .depend 文件和一个 Makefile 文件,这两个文件都是编译时使用的辅助文件,仔细阅读这两个文件对弄清各个文件这间的联系和依托关系很有帮助;而且,在有的目录下还有Readme 文件,它是对该目录下的文件的一些说明,同样有利于我们对内核源码的理解; 

二.解读实战

为你的内核增加一个系统调用 
虽然,Linux 的内核源码用树形结构组织得非常合理、科学,把功能相关联的文件都放在同一个子目录下,这样使得程序更具可读性。然而,Linux 的内核源码实在是太大而且非常复杂,即便采用了很合理的文件组织方法,在不同目录下的文件之间还是有很多的关联,分析核心的一部分代码通常会要查看其它的几个相关的文件,而且可能这些文件还不在同一个子目录下。体系的庞大复杂和文件之间关联的错综复杂,可能就是很多人对其望而生畏的主要原因。当然,这种令人生畏的劳动所带来的回报也是非常令人着迷的:你不仅可以从中学到很多的计算机的底层的知识(如下面将讲到的系统的引导),体会到整个操作系统体系结构的精妙和在解决某个具体细节问题时,算法的巧妙;而且更重要的是:在源码的分析过程中,你就会被一点一点地、潜移默化地专业化;甚至,只要分析十分之一的代码后,你就会深刻地体会到,什么样的代码才是一个专业的程序员写的,什么样的代码是一个业余爱好者写的。 
为了使读者能更好的体会到这一特点,下面举了一个具体的内核分析实例,希望能通过这个实例,使读者对 Linux的内核的组织有些具体的认识,从中读者也可以学到一些对内核的分析方法。 
以下即为分析实例: 
【一】操作平台: 
硬件:cpu intel Pentium II ; 
软件:Redhat Linux 6.0; 内核版本2.2.5 
【二】相关内核源代码分析: 
1.系统的引导和初始化:Linux 系统的引导有好几种方式:常见的有 Lilo, Loadin引导和Linux的自举引导(bootsect-loader),而后者所对应源程序为arch/i386/boot/bootsect.S,它为实模式的汇编程序,限于篇幅在此不做分析;无论是哪种引导方式,最后都要跳转到 arch/i386/Kernel/setup.S, setup.S主要是进行时模式下的初始化,为系统进入保护模式做准备;此后,系统执行 arch/i386/kernel/head.S (对经压缩后存放的内核要先执行 arch/i386/boot/compressed/head.S); head.S 中定义的一段汇编程序setup_idt ,它负责建立一张256项的 idt 表(Interrupt Descriptor Table),此表保存着所有自陷和中断的入口地址;其中包括系统调用总控程序 system_call 的入口地址;当然,除此之外,head.S还要做一些其他的初始化工作; 
2.系统初始化后运行的第一个内核程序asmlinkage void __init start_kernel(void) 定义在 /usr/src/linux/init/main.c中,它通过调用usr/src/linux/arch/i386/kernel/traps.c 中的一个函数 void __init trap_init(void) 把各自陷和中断服务程序的入口地址设置到 idt 表中,其中系统调用总控程序 system_cal就是中断服务程序之一;void __init trap_init(void) 函数则通过调用一个宏 set_system_gate(SYSCALL_VECTOR,&system_call); 把系统调用总控程序的入口挂在中断0x80上; 其中SYSCALL_VECTOR是定义在 /usr/src/linux/arch/i386/kernel/irq.h中的一个常量0x80; 而 system_call 即为中断总控程序的入口地址;中断总控程序用汇编语言定义在/usr/src/linux/arch/i386/kernel/entry.S中; 
3.中断总控程序主要负责保存处理机执行系统调用前的状态,检验当前调用是否合法, 并根据系统调用向量,使处理机跳转到保存在 sys_call_table 表中的相应系统服务例程的入口; 从系统服务例程返回后恢复处理机状态退回用户程序; 而系统调用向量则定义在/usr/src/linux/include/asm-386/unistd.h 中;sys_call_table 表定义在 /usr/src/linux/arch/i386 kernel/entry.S 中; 同时在 /usr/src/linux/include/asm-386/unistd.h 中也定义了系统调用的用户编程接口; 
4.由此可见 , linux 的系统调用也象 dos 系统的 int 21h 中断服务, 它把0x80 中断作为总的入口, 然后转到保存在 sys_call_table 表中的各种中断服务例程的入口地址 , 形成各种不同的中断服务; 由以上源代码分析可知, 要增加一个系统调用就必须在 sys_call_table 表中增加一项 , 并在其中保存好自己的系统服务例程的入口地址,然后重新编译内核,当然,系统服务例程是必不可少的。 由此可知在此版linux内核源程序<2。2。5>中,与系统调用相关的源程序文件就包括以下这些: 
1.arch/i386/boot/bootsect.S 
2.arch/i386/Kernel/setup.S 
3.arch/i386/boot/compressed/head.S 
4.arch/i386/kernel/head.S 
5.init/main.c 
6.arch/i386/kernel/traps.c 
7.arch/i386/kernel/entry.S 
8.arch/i386/kernel/irq.h 
9.include/asm-386/unistd.h 

当然,这只是涉及到的几个主要文件。而事实上,增加系统调用真正要修改文件只有include/asm-386/unistd.h 
和arch/i386/kernel/entry.S两个; 

【三】 对内核源码的修改: 
1.在kernel/sys.c中增加系统服务例程如下:

 
asmlinkage int sys_addtotal(int numdata) 

int i=0,enddata=0; 
while(i<=numdata) 
enddata+=i++; 
return enddata; 

该函数有一个 int 型入口参数 numdata , 并返回从 0 到 numdata 的累加值; 当然也可以把系统服务例程放在一个自己定义的文件或其他文件中,只是要在相应文件中作必要的说明; 
2.把 asmlinkage int sys_addtotal( int) 的入口地址加到sys_call_table表中: 
arch/i386/kernel/entry.S 中的最后几行源代码修改前为: 
… … 
.long SYMBOL_NAME(sys_sendfile) 
.long SYMBOL_NAME(sys_ni_syscall) /* streams1 */ 
.long SYMBOL_NAME(sys_ni_syscall) /* streams2 */ 
.long SYMBOL_NAME(sys_vfork) /* 190 */ 
.rept NR_syscalls-190 
.long SYMBOL_NAME(sys_ni_syscall) 
.endr 
修改后为: … … 
.long SYMBOL_NAME(sys_sendfile) 
.long SYMBOL_NAME(sys_ni_syscall) /* streams1 */ 
.long SYMBOL_NAME(sys_ni_syscall) /* streams2 */ 
.long SYMBOL_NAME(sys_vfork) /* 190 */ 
/* add by I */ 
.long SYMBOL_NAME(sys_addtotal) 
.rept NR_syscalls-191 
.long SYMBOL_NAME(sys_ni_syscall) 
.endr 
3. 把增加的 sys_call_table 表项所对应的向量,在include/asm-386/unistd.h 中进行必要申明,以供用户进程和其他系统进程查询或调用: 
增加后的部分 /usr/src/linux/include/asm-386/unistd.h 文件如下: 
… … 
#define __NR_sendfile 187 
#define __NR_getpmsg 188 
#define __NR_putpmsg 189 
#define __NR_vfork 190 
/* add by I */ 
#define __NR_addtotal 191 
4.测试程序(test.c)如下: 
#include 
#include 

_syscall1(int,addtotal,int, num) 

main() 

int i,j; 

do 
printf("Please input a numbern"); 
while(scanf("%d",&i)==EOF); 
if((j=addtotal(i))==-1) 
printf("Error occurred in syscall-addtotal();n"); 
printf("Total from 0 to %d is %d n",i,j); 

对修改后的新的内核进行编译,并引导它作为新的操作系统,运行几个程序后可以发现一切正常;在新的系统下对测试程序进行编译(*注:由于原内核并未提供此系统调用,所以只有在编译后的新内核下,此测试程序才能可能被编译通过),运行情况如下: 
$gcc -o test test.c 
$./test 
Please input a number 
36 
Total from 0 to 36 is 666 
可见,修改成功; 
而且,对相关源码的进一步分析可知,在此版本的内核中,/usr/src/linux/arch/i386/kernel/entry.S 
文件中对 sys_call_table 表的设置可以看出,有好几个系统调用的服务例程都是定义在 
/usr/src/linux/kernel/sys.c 中的同一个函数: 
asmlinkage int sys_ni_syscall(void) 

return -ENOSYS; 

例如第188项和第189项就是如此: 
… … 
.long SYMBOL_NAME(sys_sendfile) 
.long SYMBOL_NAME(sys_ni_syscall) /* streams1 */ 
.long SYMBOL_NAME(sys_ni_syscall) /* streams2 */ 
.long SYMBOL_NAME(sys_vfork) /* 190 */ 
… … 
而这两项在文件 /usr/src/linux/include/asm-386/unistd.h 中却申明如下: 
… … 
#define __NR_sendfile 187 
#define __NR_getpmsg 188 /* some people actually want streams */ 
#define __NR_putpmsg 189 /* some people actually want streams */ 
#define __NR_vfork 190 
由此可见,在此版本的内核源代码中,由于asmlinkage int sys_ni_syscall(void) 函数并不进行任何操作, 所以包括 getpmsg, putpmsg 在内的好几个系统调用都是不进行任何操作的,即有待扩充的空调用; 但它们却仍然占用着sys_call_table表项,估计这是设计者们为了方便扩充系统调用而安排的; 所以只需增加相应服务例程(如增加服务例程getmsg或putpmsg),就可以达到增加系统调用的作用。 
结语:当然对于庞大复杂的 linux 内核而言,一篇文章远远不够,而且与系统调用相关的代码也只是内核中极其微小的一部分;但重要的是方法、掌握好的分析方法;所以上的分析只是起个引导的作用,而正真的分析还有待于 读者自己的努力。