一、引言一般地,在使用虚拟内存技术的多任务系统上,内核和应用有不同的地址空间,因此,在内核和应用之间以及在应用与应用之间进行数据交换需要专门的机制来实现,众所周知,进程间通信(IPC)机制就是为实现应用与应用之间的数据交换而专门实现的,大部分读者可能对进程间通信比较了解,但对应用与内核之间的数据交换机制可能了解甚少,本文将详细介绍Linux系统下内核与应用进行数据交换的各种方式,包括内核启动参数、模块参数与sysfs、sysctl、系统调用、netlink、procfs、seq_file、debugfs和relayfs。回页首二、内核启动参数Linux提供了一种通过bootloader向其传输启动参数的功能,内核开发者可以通过这种方式来向内核传输数据,从而控制内核启动行为。通常的使用方式是,定义一个分析参数的函数,而后使用内核提供的宏__setup把它注册到内核中,该宏定义在linux/init.h中,因此要使用它必须包含该头文件:__setup(para_name=,parse_func)para_name为参数名,parse_func为分析参数值的函数,它负责把该参数的值转换成相应的内核变量的值并设置那个内核变量。内核为整数参数值的分析提供了函数get_option和get_options,前者用于分析参数值为一个整数的情况,而后者用于分析参数值为逗号分割的一系列整数的情况,对于参数值为字符串的情况,需要开发者自定义相应的分析函数。在源代码包中的内核程序kern-boot-params.c说明了三种情况的使用。该程序列举了参数为一个整数、逗号分割的整数串以及字符串三种情况,读者要想测试该程序,需要把该程序拷贝到要使用的内核的源码目录树的一个目录下,为了避免与内核其他部分混淆,作者建议在内核源码树的根目录下创建一个新目录,如examples,然后把该程序拷贝到examples目录下并重新命名为setup_example.c,并且为该目录创建一个Makefile文件:obj-y=setup_example.oMakefile仅许这一行就足够了,然后需要修改源码树的根目录下的Makefile文件的一行,把下面行core-y:=usr/修改为core-y:=usr/examples/注意:如果读者创建的新目录和重新命名的文件名与上面不同,需要修改上面所说Makefile文件相应的位置。做完以上工作就可以按照内核构建步骤去构建新的内核,在构建好内核并设置好lilo或grub为该内核的启动条目后,就可以启动该内核,然后使用lilo或grub的编辑功能为该内核的启动参数行增加如下参数串:setup_example_int=1234setup_example_int_array=100,200,300,400setup_example_string=Thisisatest当然,该参数串也可以直接写入到lilo或grub的配置文件中对应于该新内核的内核命令行参数串中。读者可以使用其它参数值来测试该功能。下面是作者系统上使用上面参数行的输出:setup_example_int=1234setup_example_int_array=100,200,300,400setup_example_int_arrayincludes4intergerssetup_example_string=Thisisatest读者可以使用dmesg|grepsetup来查看该程序的输出。回页首三、模块参数与sysfs内核子系统或设备驱动可以直接编译到内核,也可以编译成模块,如果编译到内核,可以使用前一节介绍的方法通过内核启动参数来向它们传递参数,如果编译成模块,则可以通过命令行在插入模块时传递参数,或者在运行时,通过sysfs来设置或读取模块数据。Sysfs是一个基于内存的文件系统,实际上它基于ramfs,sysfs提供了一种把内核数据结构,它们的属性以及属性与数据结构的联系开放给用户态的方式,它与kobject子系统紧密地结合在一起,因此内核开发者不需要直接使用它,而是内核的各个子系统使用它。用户要想使用sysfs读取和设置内核参数,仅需装载sysfs就可以通过文件操作应用来读取和设置内核通过sysfs开放给用户的各个参数:$mkdir-p/sysfs$mount-tsysfssysfs/sysfs注意,不要把sysfs和sysctl混淆,sysctl是内核的一些控制参数,其目的是方便用户对内核的行为进行控制,而sysfs仅仅是把内核的kobject对象的层次关系与属性开放给用户查看,因此sysfs的绝大部分是只读的,模块作为一个kobject也被出口到sysfs,模块参数则是作为模块属性出口的,内核实现者为模块的使用提供了更灵活的方式,允许用户设置模块参数在sysfs的可见性并允许用户在编写模块时设置这些参数在sysfs下的访问权限,然后用户就可以通过sysfs来查看和设置模块参数,从而使得用户能在模块运行时控制模块行为。对于模块而言,声明为static的变量都可以通过命令行来设置,但要想在sysfs下可见,必须通过宏module_param来显式声明,该宏有三个参数,第一个为参数名,即已经定义的变量名,第二个参数则为变量类型,可用的类型有byte,short,ushort,int,uint,long,ulong,charp和bool或invbool,分别对应于c类型char,short,unsignedshort,int,unsignedint,long,unsignedlong,char*和int,用户也可以自定义类型XXX(如果用户自己定义了param_get_XXX,param_set_XXX和param_check_XXX)。该宏的第三个参数用于指定访问权限,如果为0,该参数将不出现在sysfs文件系统中,允许的访问权限为S_IRUSR,S_IWUSR,S_IRGRP,S_IWGRP,S_IROTH和S_IWOTH的组合,它们分别对应于用户读,用户写,用户组读,用户组写,其他用户读和其他用户写,因此用文件的访问权限设置是一致的。在源代码包中的内核模块module-param-exam.c是一个利用模块参数和sysfs来进行用户态与内核态数据交互的例子。该模块有三个参数可以通过命令行设置,下面是作者系统上的运行结果示例:$insmod./module-param-exam.komy_invisible_int=10my_visible_int=20mystring=Hello,Worldmy_invisible_int=10my_visible_int=20mystring='Hello,World'$ls/sys/module/module_param_exam/parameters/mystringmy_visible_int$cat/sys/module/module_param_exam/parameters/mystringHello,World$cat/sys/module/module_param_exam/parameters/my_visible_int20$echo2000/sys/module/module_param_exam/parameters/my_visible_int$cat/sys/module/module_param_exam/parameters/my_visible_int2000$echoabc/sys/module/module_param_exam/parameters/mystring$cat/sys/module/module_param_exam/parameters/mystringabc$rmmodmodule_param_exammy_invisible_int=10my_visible_int=2000mystring='abc'回页首四、sysctlSysctl是一种用户应用来设置和获得运行时内核的配置参数的一种有效方式,通过这种方式,用户应用可以在内核运行的任何时刻来改变内核的配置参数,也可以在任何时候获得内核的配置参数,通常,内核的这些配置参数也出现在proc文件系统的/proc/sys目录下,用户应用可以直接通过这个目录下的文件来实现内核配置的读写操作,例如,用户可以通过Cat/proc/sys/net/ipv4/ip_forward来得知内核IP层是否允许转发IP包,用户可以通过echo1/proc/sys/net/ipv4/ip_forward把内核IP层设置为允许转发IP包,即把该机器配置成一个路由器或网关。一般地,所有的Linux发布也提供了一个系统工具sysctl,它可以设置和读取内核的配置参数,但是该工具依赖于proc文件系统,为了使用该工具,内核必须支持proc文件系统。下面是使用sysctl工具来获取和设置内核配置参数的例子:$sysctlnet.ipv4.ip_forwardnet.ipv4.ip_forward=0$sysctl-wnet.ipv4.ip_forward=1net.ipv4.ip_forward=1$sysctlnet.ipv4.ip_forwardnet.ipv4.ip_forward=1注意,参数net.ipv4.ip_forward实际被转换到对应的proc文件/proc/sys/net/ipv4/ip_forward,选项-w表示设置该内核配置参数,没有选项表示读内核配置参数,用户可以使用sysctl-a来读取所有的内核配置参数,对应更多的sysctl工具的信息,请参考手册页sysctl(8)。但是proc文件系统对sysctl不是必须的,在没有proc文件系统的情况下,仍然可以,这时需要使用内核提供的系统调用sysctl来实现对内核配置参数的设置和读取。在源代码包中给出了一个实际例子程序,它说明了如何在内核和用户态使用sysctl。头文件sysctl-exam.h定义了sysctl条目ID,用户态应用和内核模块需要这些ID来操作和注册sysctl条目。内核模块在文件sysctl-exam-kern.c中实现,在该内核模块中,每一个sysctl条目对应一个structctl_table结构,该结构定义了要注册的sysctl条目的ID(字段ctl_name),在proc下的名称(字段procname),对应的内核变量(字段data,注意该该字段的赋值必须是指针),条目允许的最大长度(字段maxlen,它主要用于字符串内核变量,以便在对该条目设置时,对超过该最大长度的字符串截掉后面超长的部分),条目在proc文件系统下的访问权限(字段mode),在通过proc设置时的处理函数(字段proc_handler,对于整型内核变量,应当设置为&proc_dointvec,而对于字符串内核变量,则设置为&proc_dostring),字符串处理策略(字段strategy,一般这是为&sysctl_string)。Sysctl条目可以是目录,此时mode字段应当设置为0555,否则通过sysctl系统调用将无法访问它下面的sysctl条目,child则指向该目录条目下面的所有条目,对于在同一目录下的多个条目,不必一一注册,用户可以把它们组织成一个structctl_table类型的数组,然后一次注册就可以,但此时必须把数组的最后一个结构设置为NULL,即{.ctl_name=0}注册sysctl条目使用函数register_sysctl_table(structctl_table*,int),第一个参数为定义的structctl_table结构的sysctl条目或条目数组指针,第二个参数为插入到sysctl条目表中的位置,如果插入到末尾,应当为0,如果插入到开头,则为非0。内核把所有的sysctl条目都组织成sysctl表。当模块卸载时,需要使用函数unregister_sysctl_table(structctl_table_h