linux设备驱动模型一字符设备open系统调用流程
文章目錄
- 前言
- 一、open概述
- 二、字符設(shè)備的注冊(cè)
- 二、創(chuàng)建inode
- 四、打開文件流程
- 4.1 數(shù)據(jù)結(jié)構(gòu)
- 4.2 處理流程
- 4.2.1 open系統(tǒng)調(diào)用
前言
要解決的問題:
一、open概述
使用open函數(shù)打開設(shè)備文件,到底做了些什么工作?下圖中列出了open函數(shù)執(zhí)行的大致過程。
二、字符設(shè)備的注冊(cè)
??linux內(nèi)核cdev_init系列函數(shù)。
??內(nèi)核中每個(gè)字符設(shè)備都對(duì)應(yīng)一個(gè) cdev 結(jié)構(gòu)的變量,下面是它的定義:
??一個(gè) cdev 一般它有兩種定義初始化方式:靜態(tài)的和動(dòng)態(tài)的。
靜態(tài)內(nèi)存定義初始化:
struct cdev my_cdev; cdev_init(&my_cdev, &fops); my_cdev.owner = THIS_MODULE;動(dòng)態(tài)內(nèi)存定義初始化:
struct cdev *my_cdev = cdev_alloc(); my_cdev->ops = &fops; my_cdev->owner = THIS_MODULE;??兩種使用方式的功能是一樣的,只是使用的內(nèi)存區(qū)不一樣,一般視實(shí)際的數(shù)據(jù)結(jié)構(gòu)需求而定。
??下面貼出了兩個(gè)函數(shù)的代碼,以具體看一下它們之間的差異。
struct cdev *cdev_alloc(void) {struct cdev *p = kzalloc(sizeof(struct cdev), GFP_KERNEL);if (p) {INIT_LIST_HEAD(&p->list);kobject_init(&p->kobj, &ktype_cdev_dynamic);}return p; }void cdev_init(struct cdev *cdev, const struct file_operations *fops) {memset(cdev, 0, sizeof *cdev);INIT_LIST_HEAD(&cdev->list);kobject_init(&cdev->kobj, &ktype_cdev_default);cdev->ops = fops; }??由此可見,兩個(gè)函數(shù)完成都功能基本一致,只是 cdev_init() 還多賦了一個(gè) cdev->ops 的值。
??初始化 cdev 后,需要把它添加到系統(tǒng)中去。為此可以調(diào)用 cdev_add() 函數(shù)。傳入 cdev 結(jié)構(gòu)的指針,起始設(shè)備編號(hào),以及設(shè)備編號(hào)范圍。
??內(nèi)核中所有都字符設(shè)備都會(huì)記錄在一個(gè) kobj_map 結(jié)構(gòu)的 cdev_map 變量中。這個(gè)結(jié)構(gòu)的變量中包含一個(gè)散列表用來(lái)快速存取所有的對(duì)象。kobj_map() 函數(shù)就是用來(lái)把字符設(shè)備編號(hào)和 cdev 結(jié)構(gòu)變量一起保存到 cdev_map 這個(gè)散列表里。當(dāng)后續(xù)要打開一個(gè)字符設(shè)備文件時(shí),通過調(diào)用 kobj_lookup() 函數(shù),根據(jù)設(shè)備編號(hào)就可以找到 cdev 結(jié)構(gòu)變量,從而取出其中的 ops 字段。
??kobj_map函數(shù)中哈希表的實(shí)現(xiàn)原理和前面注冊(cè)分配設(shè)備號(hào)中的幾乎完全一樣,通過要加入系統(tǒng)的設(shè)備的主設(shè)備號(hào)major(major=MAJOR(dev))來(lái)獲得probes數(shù)組的索引值i(i = major % 255),然后把一個(gè)類型為struct probe的節(jié)點(diǎn)對(duì)象加入到probes[i]所管理的鏈表中,如圖2-6所示。其中struct probe所在的矩形塊中的深色部分是我們重點(diǎn)關(guān)注的內(nèi)容,記錄了當(dāng)前正在加入系統(tǒng)的字符設(shè)備對(duì)象的有關(guān)信息。其中,dev是它的設(shè)備號(hào),range是從次設(shè)備號(hào)開始連續(xù)的設(shè)備數(shù)量,data是一void *變量,指向當(dāng)前正要加入系統(tǒng)的設(shè)備對(duì)象指針p。圖2-6展示了兩個(gè)滿足主設(shè)備號(hào)major % 255 = 2的字符設(shè)備通過調(diào)用cdev_add之后,cdev_map所展現(xiàn)出來(lái)的數(shù)據(jù)結(jié)構(gòu)狀態(tài)。
??所以,簡(jiǎn)單地說(shuō),設(shè)備驅(qū)動(dòng)程序通過調(diào)用cdev_add把它所管理的設(shè)備對(duì)象的指針嵌入到一個(gè)類型為struct probe的節(jié)點(diǎn)之中,然后再把該節(jié)點(diǎn)加入到cdev_map所實(shí)現(xiàn)的哈希鏈表中。
??對(duì)系統(tǒng)而言,當(dāng)設(shè)備驅(qū)動(dòng)程序成功調(diào)用了cdev_add之后,就意味著一個(gè)字符設(shè)備對(duì)象已經(jīng)加入到了系統(tǒng),在需要的時(shí)候,系統(tǒng)就可以找到它。對(duì)用戶態(tài)的程序而言,cdev_add調(diào)用之后,就已經(jīng)可以通過文件系統(tǒng)的接口呼叫到我們的驅(qū)動(dòng)程序。
??當(dāng)一個(gè)字符設(shè)備驅(qū)動(dòng)不再需要的時(shí)候(比如模塊卸載),就可以用 cdev_del() 函數(shù)來(lái)釋放 cdev 占用的內(nèi)存。
??其中 cdev_unmap() 調(diào)用 kobj_unmap() 來(lái)釋放 cdev_map 散列表中的對(duì)象。kobject_put() 釋放 cdev 結(jié)構(gòu)本身。
二、創(chuàng)建inode
??設(shè)備文件通常在開機(jī)啟動(dòng)時(shí)自動(dòng)創(chuàng)建的,不過,我們?nèi)匀豢梢允褂妹頼knod來(lái)創(chuàng)建一個(gè)新的設(shè)備文件,命令的基本語(yǔ)法如下:
mknod 設(shè)備名 設(shè)備類型 主設(shè)備號(hào) 次設(shè)備號(hào)
??當(dāng)我們使用上述命令,創(chuàng)建了一個(gè)字符設(shè)備文件時(shí),實(shí)際上就是創(chuàng)建了一個(gè)設(shè)備節(jié)點(diǎn)inode結(jié)構(gòu)體,并且將該設(shè)備的設(shè)備編號(hào)記錄在成員i_rdev,將成員i_fop指針指向了def_chr_fops結(jié)構(gòu)體。這就是mknod負(fù)責(zé)的工作內(nèi)容,具體代碼見如
命令mknod最終會(huì)調(diào)用init_special_inode函數(shù),由于我們創(chuàng)建的是字符設(shè)備,因此,會(huì)執(zhí)行第22~23行的代碼。這樣就完成了上圖的內(nèi)容。
四、打開文件流程
??當(dāng)應(yīng)用層通過open api打開一個(gè)文件,內(nèi)核中究竟如何處理? 本身用來(lái)描述內(nèi)核中對(duì)應(yīng)open 系統(tǒng)調(diào)用的處理流程。
4.1 數(shù)據(jù)結(jié)構(gòu)
??struct fdtable 一個(gè)進(jìn)程可以打開很多文件, 內(nèi)核用fdtable來(lái)管理這些文件。
include/linux/fdtable.h struct fdtable {unsigned int max_fds;struct file __rcu **fd; /* current fd array */unsigned long *close_on_exec;unsigned long *open_fds;unsigned long *full_fds_bits;struct rcu_head rcu; }; fd: 文件描述符數(shù)組 open_fds: 為方便查找數(shù)組中的空閑項(xiàng), 為該數(shù)組建立的位圖 close_on_exec: 在打開的文件中, 有些文件時(shí)用于執(zhí)行目的, 在執(zhí)行完成之后應(yīng)該自動(dòng)關(guān)閉??struct files_struct 對(duì)于大多數(shù)進(jìn)程, 打開文件的數(shù)量是有限的,一種優(yōu)化的設(shè)計(jì)方式是為每個(gè)進(jìn)程內(nèi)置分配少量數(shù)目的文件描述符指針數(shù)組, 但進(jìn)程需要更多的指針時(shí), 再動(dòng)態(tài)擴(kuò)展。 為此, 進(jìn)程并不直接使用fdtable, 而是使用files_struct結(jié)構(gòu)體, 作為task_struct的一個(gè)域.fdt指向進(jìn)程實(shí)際使用的fdtable。 對(duì)于大多數(shù)進(jìn)程來(lái)說(shuō), 打開文件的梳理并不會(huì)很多, 這時(shí)候無(wú)需另外分配空間, 直接指向內(nèi)嵌的結(jié)構(gòu), 即fdtab域。
/** Open file table structure*/ struct files_struct {/** read mostly part*/atomic_t count;bool resize_in_progress;wait_queue_head_t resize_wait;struct fdtable __rcu *fdt;struct fdtable fdtab;/** written part on a separate cache line in SMP*/spinlock_t file_lock ____cacheline_aligned_in_smp;unsigned int next_fd;unsigned long close_on_exec_init[1];unsigned long open_fds_init[1];unsigned long full_fds_bits_init[1];struct file __rcu * fd_array[NR_OPEN_DEFAULT]; };??struct file每個(gè)打開的文件都會(huì)對(duì)應(yīng)一個(gè)file結(jié)構(gòu)體, 進(jìn)程通過它對(duì)文件進(jìn)行操作。
include/linux/fs.h struct file {union {struct llist_node fu_llist;struct rcu_head fu_rcuhead;} f_u;struct path f_path;struct inode *f_inode; /* cached value */const struct file_operations *f_op;/** Protects f_ep_links, f_flags.* Must not be taken from IRQ context.*/spinlock_t f_lock;enum rw_hint f_write_hint;atomic_long_t f_count;unsigned int f_flags;fmode_t f_mode;struct mutex f_pos_lock;loff_t f_pos;struct fown_struct f_owner;const struct cred *f_cred;struct file_ra_state f_ra;u64 f_version; #ifdef CONFIG_SECURITYvoid *f_security; #endif/* needed for tty driver, and maybe others */void *private_data;#ifdef CONFIG_EPOLL/* Used by fs/eventpoll.c to link all the hooks to this file */struct list_head f_ep_links;struct list_head f_tfile_llink; #endif /* #ifdef CONFIG_EPOLL */struct address_space *f_mapping;errseq_t f_wb_err;errseq_t f_sb_err; /* for syncfs */ } __randomize_layoutf_path: 文件路徑 f_op: 指向文件操作表, read/write等操作都會(huì)調(diào)用這里的回調(diào) f_mapping: 指向文件地址空間描述符 f_pos: 當(dāng)前文件的偏移值struct inode
??VFS inode包含文件訪問權(quán)限、屬主、組、大小、生成時(shí)間、訪問時(shí)間、最后修改時(shí)間等信息。它是linux管理文件系統(tǒng)的最基本單位,也是文件系統(tǒng)連接任何子目錄、文件的橋梁。inode結(jié)構(gòu)中的靜態(tài)信息取自物理設(shè)備上的文件系統(tǒng),由文件系統(tǒng)指定的函數(shù)填寫,它只存在于內(nèi)存中,可以通過inode緩存訪問。雖然每個(gè)文件都有相應(yīng)的inode結(jié)點(diǎn),但是只有在需要的時(shí)候系統(tǒng)才會(huì)在內(nèi)存中為其建立相應(yīng)的inode數(shù)據(jù)結(jié)構(gòu),建立的inode結(jié)構(gòu)將形成一個(gè)鏈表,我們可以通過遍歷這個(gè)鏈表去得到我們需要的文件結(jié)點(diǎn),VFS也為已分配的inode構(gòu)造緩存和哈希表,以提 高系統(tǒng)性能。inode結(jié)構(gòu)中的struct inode_operations *i_op為我們提供了一個(gè)inode操作列表,通過這個(gè)列表提供的函數(shù)我們可以對(duì)VFS inode結(jié)點(diǎn)進(jìn)行各種操作。每個(gè)inode結(jié)構(gòu)都有一個(gè)i結(jié)點(diǎn)號(hào)i_ino,在同一個(gè)文件系統(tǒng)中每個(gè)i結(jié)點(diǎn)號(hào)是唯一的
4.2 處理流程
4.2.1 open系統(tǒng)調(diào)用
??整體調(diào)用棧
#3 0xffffffff81218174 in do_filp_open (dfd=dfd@entry=-100, pathname=pathname@entry=0xffff888004950000, op=op@entry=0xffffc90000173ee4) at fs/namei.c:3396 #4 0xffffffff81203cfd in do_sys_openat2 (dfd=-100, filename=<optimized out>, how=how@entry=0xffffc90000173f20) at fs/open.c:1168 #5 0xffffffff81205135 in do_sys_open (dfd=<optimized out>, filename=<optimized out>, flags=<optimized out>, mode=<optimized out>) at fs/open.c:1184 #6 0xffffffff819bf903 in do_syscall_64 (nr=<optimized out>, regs=0xffffc90000173f58) at arch/x86/entry/common.c:46 #7 0xffffffff81a0007c in entry_SYSCALL_64 () at arch/x86/entry/entry_64.S:120??當(dāng)我們?cè)谟脩艨臻g調(diào)用open之后,會(huì)產(chǎn)生一個(gè)軟中斷,然后通過系統(tǒng)調(diào)用進(jìn)入內(nèi)核空間。通過系統(tǒng)調(diào)用號(hào),我們就可以跳轉(zhuǎn)到該中斷例程的入口地址
SYSCALL_DEFINE3(open, const char __user *, filename, int, flags, int, mode) {long ret;/*檢查是否應(yīng)該不考慮用戶層傳遞的標(biāo)志、總是強(qiáng)行設(shè)置O_LARGEFILE標(biāo)志。如果底層處理器的字長(zhǎng)不是32位,就是這種情況*/if (force_o_largefile())flags |= O_LARGEFILE;/*實(shí)際工作*/ret = do_sys_open(AT_FDCWD, filename, flags, mode);/* avoid REGPARM breakage on x86: */asmlinkage_protect(3, ret, filename, flags, mode);return ret; }??我們看下*SYSCALL_DEFINE3(open, const char __user , filename, int, flags, int, mode) 展開是怎么樣的
#define SYSCALL_DEFINE3(name, ...) SYSCALL_DEFINEx(3, _##name, __VA_ARGS__)再看下SYSCALL_DEFINEx #define SYSCALL_DEFINEx(x, sname, ...) \ __SYSCALL_DEFINEx(x, sname, __VA_ARGS__)再看下__SYSCALL_DEFINEx #define __SYSCALL_DEFINEx(x, name, ...) \ asmlinkage long sys##name(__SC_DECL##x(__VA_ARGS__))這里對(duì)對(duì)應(yīng)__SC_DECL3 #define __SC_DECL1(t1, a1) t1 a1 #define __SC_DECL2(t2, a2, ...) t2 a2, __SC_DECL1(__VA_ARGS__) #define __SC_DECL3(t3, a3, ...) t3 a3, __SC_DECL2(__VA_ARGS__) 這們一步步展開SYSCALL_DEFINE3(open, const char __user *, filename, int, flags, int, mode)代替進(jìn)去,可以得到 SYSCALL_DEFINE3(open, const char __user *, filename, int, flags, int, mode) = SYSCALL_DEFINEx(3, _##name, __VA_ARGS__) =asmlinkage long sys_open(__SC_DECL3(__VA_ARGS__)) =asmlinkage long sys_open(const char __user* filename, int flags, int mode) 這個(gè)才是真正的函數(shù)原型??在sys_open里面繼續(xù)調(diào)用do_sys_open完成 open操作
long do_sys_open(int dfd, const char __user *filename, int flags, int mode) {/*從進(jìn)程地址空間讀取該文件的路徑名*/char *tmp = getname(filename);int fd = PTR_ERR(tmp);if (!IS_ERR(tmp)) {/*在內(nèi)核中,每個(gè)打開的文件由一個(gè)文件描述符表示該描述符在特定于進(jìn)程的數(shù)組中充當(dāng)位置索引(數(shù)組是task_struct->files->fd_arry),該數(shù)組的元素包含了file結(jié)構(gòu),其中包括每個(gè)打開文件的所有必要信息。因此,調(diào)用下面函數(shù)查找一個(gè)未使用的文件描述符,返回的是上面說(shuō)的數(shù)組的下標(biāo)*/fd = get_unused_fd_flags(flags);if (fd >= 0) {/*fd獲取成功則開始打開文件,此函數(shù)是主要完成打開功能的函數(shù)*///如果分配fd成功,則創(chuàng)建一個(gè)file對(duì)象struct file *f = do_filp_open(dfd, tmp, flags, mode, 0);if (IS_ERR(f)) {put_unused_fd(fd);fd = PTR_ERR(f);}}} } else {/*文件如果打開成功,調(diào)用fsnoTIfy_open()函數(shù),根據(jù)inode所指定的信息進(jìn)行打開函數(shù)(參數(shù)為f)將該文件加入到文件監(jiān)控的系統(tǒng)中。該系統(tǒng)是用來(lái)監(jiān)控文件被打開,創(chuàng)建,讀寫,關(guān)閉,修改等操作的*/fsnotify_open(f->f_path.dentry);/*將文件指針安裝在fd數(shù)組中將struct file *f加入到fd索引位置處的數(shù)組中。如果后續(xù)過程中,有對(duì)該文件描述符的操作的話,就會(huì)通過查找該數(shù)組得到對(duì)應(yīng)的文件結(jié)構(gòu),而后在進(jìn)行相關(guān)操作。*/fd_install(fd, f);} }putname(tmp);return fd; }該函數(shù)主要分為如下幾個(gè)步驟來(lái)完成打開文件的操作:
1.將文件名參數(shù)從用戶態(tài)拷貝至內(nèi)核,調(diào)用函數(shù)get_name();
2.從進(jìn)程的文件表中找到一個(gè)空閑的文件表指針,調(diào)用了函數(shù)get_unused_fd_flgas();
3.完成真正的打開操作,調(diào)用函數(shù)do_filp_open();
4.將打開的文件添加到進(jìn)程的文件表數(shù)組中,調(diào)用函數(shù)fd_install();
??getname函數(shù)主要的任務(wù)是將文件名filename從用戶態(tài)拷貝至內(nèi)核態(tài)
?? get_unused_fd_flags實(shí)際調(diào)用的是alloc_fd
#define get_unused_fd_flags(flags) alloc_fd(0, (flags)) /* * allocate a file descriptor, mark it busy. */ int alloc_fd(unsigned start, unsigned flags) {struct files_struct *files = current->files;//獲得當(dāng)前進(jìn)程的files_struct 結(jié)構(gòu)unsigned int fd;int error;struct fdtable *fdt;spin_lock(&files->file_lock);repeat:fdt = files_fdtable(files);fd = start;if (fd next_fd) //從上一次打開的fd的下一個(gè)fd開始搜索空閑的fdfd = files->next_fd;if (fd max_fds)//尋找空閑的fd,返回值為空閑的fdfd = find_next_zero_bit(fdt->open_fds->fds_bits,fdt->max_fds, fd);//如果有必要,即打開的fd超過max_fds,則需要expand當(dāng)前進(jìn)程的fd表;//返回值error<0表示出錯(cuò),error=0表示無(wú)需expand,error=1表示進(jìn)行了expand;error = expand_files(files, fd);if (error)goto out;/** If we needed to expand the fs array we* might have blocked - try again.*///error=1表示進(jìn)行了expand,那么此時(shí)需要重新去查找空閑的fd;if (error)goto repeat;//設(shè)置下一次查找的起始fd,即本次找到的空閑的fd的下一個(gè)fd,記錄在files->next_fd中;if (start <= files->next_fd)files->next_fd = fd + 1;FD_SET(fd, fdt->open_fds);if (flags & O_CLOEXEC)FD_SET(fd, fdt->close_on_exec);elseFD_CLR(fd, fdt->close_on_exec);error = fd; #if 1 /* Sanity check */ if (rcu_dereference(fdt->fd[fd]) != NULL) {printk(KERN_WARNING "alloc_fd: slot %d not NULL!\n", fd);rcu_assign_pointer(fdt->fd[fd], NULL); } #endif out:spin_unlock(&files->file_lock);return error; }??該函數(shù)為需要打開的文件在當(dāng)前進(jìn)程內(nèi)分配一個(gè)空閑的文件描述符fd,該fd就是open()系統(tǒng)調(diào)用的返回值
??do_filp_open函數(shù)的一個(gè)重要作用就是根據(jù)傳遞近來(lái)的權(quán)限進(jìn)行分析,并且分析傳遞近來(lái)的路徑名字,根據(jù)路徑名逐個(gè)解析成dentry,并且通過dentry找到inode,inode就是記錄著該文件相關(guān)的信息, 包括文件的創(chuàng)建時(shí)間和文件屬性所有者等等信息,根據(jù)這些信息就可以找到對(duì)應(yīng)的文件操作方法。在這個(gè)過程當(dāng)中有一個(gè)臨時(shí)的結(jié)構(gòu)體用于保存在查找過程中的相關(guān)信息
??do_file_open 函數(shù)的處理如下, 主要調(diào)用了path_openat 函數(shù)去執(zhí)行真正的open 流程:
??path_openat: 執(zhí)行open的核心流程
fs/namei.cdo_sys_open->do_sys_openat2->do_filp_open->path_openatstatic struct file *path_openat(struct nameidata *nd,const struct open_flags *op, unsigned flags) {struct file *file;int error;file = alloc_empty_file(op->open_flag, current_cred()); /* 1 */if (IS_ERR(file))return file;if (unlikely(file->f_flags & __O_TMPFILE)) {error = do_tmpfile(nd, flags, op, file);} else if (unlikely(file->f_flags & O_PATH)) {error = do_o_path(nd, flags, file);} else {const char *s = path_init(nd, flags);while (!(error = link_path_walk(s, nd)) && /* 2 */(s = open_last_lookups(nd, file, op)) != NULL) /* 3 */;if (!error)error = do_open(nd, file, op); /* 4 */terminate_walk(nd);}if (likely(!error)) {if (likely(file->f_mode & FMODE_OPENED))return file;WARN_ON(1);error = -EINVAL;}fput(file);if (error == -EOPENSTALE) {if (flags & LOOKUP_RCU)error = -ECHILD;elseerror = -ESTALE;}return ERR_PTR(error); } (1) 申請(qǐng) file 結(jié)構(gòu)體, 并做初始化 (2) 找到路徑的最后一個(gè)分量 (3) 對(duì)于最后一個(gè)分量進(jìn)行處理, 這里面會(huì)去查找文件是否存在,如果不存在則看條件創(chuàng)建 (4) 執(zhí)行open的最后步驟, 例如調(diào)用open 回調(diào)??我們使用的open函數(shù)在內(nèi)核中對(duì)應(yīng)的是sys_open函數(shù),sys_open函數(shù)又會(huì)調(diào)用do_sys_open函數(shù)。在do_sys_open函數(shù)中,首先調(diào)用函數(shù)get_unused_fd_flags來(lái)獲取一個(gè)未被使用的文件描述符fd,該文件描述符就是我們最終通過open函數(shù)得到的值。緊接著,又調(diào)用了do_filp_open函數(shù),該函數(shù)通過調(diào)用函數(shù)get_empty_filp得到一個(gè)新的file結(jié)構(gòu)體,之后的代碼做了許多復(fù)雜的工作,如解析文件路徑,查找該文件的文件節(jié)點(diǎn)inode等,直接來(lái)到了函do_dentry_open函數(shù),如下所示
fs/open.cdo_sys_open->do_sys_openat2->do_filp_open->path_openat->do_open->vfs_openint vfs_open(const struct path *path, struct file *file) {file->f_path = *path;return do_dentry_open(file, d_backing_inode(path->dentry), NULL); }static int do_dentry_open(struct file *f,struct inode *inode,int (*open)(struct inode *, struct file *)) {static const struct file_operations empty_fops = {};int error;path_get(&f->f_path);f->f_inode = inode;f->f_mapping = inode->i_mapping;f->f_wb_err = filemap_sample_wb_err(f->f_mapping);f->f_sb_err = file_sample_sb_err(f); /* 1 */if (unlikely(f->f_flags & O_PATH)) {f->f_mode = FMODE_PATH | FMODE_OPENED;f->f_op = &empty_fops;return 0;}if (f->f_mode & FMODE_WRITE && !special_file(inode->i_mode)) {error = get_write_access(inode);if (unlikely(error))goto cleanup_file;error = __mnt_want_write(f->f_path.mnt);if (unlikely(error)) {put_write_access(inode);goto cleanup_file;}f->f_mode |= FMODE_WRITER;}/* POSIX.1-2008/SUSv4 Section XSI 2.9.7 */if (S_ISREG(inode->i_mode) || S_ISDIR(inode->i_mode))f->f_mode |= FMODE_ATOMIC_POS;f->f_op = fops_get(inode->i_fop); /*取該文件節(jié)點(diǎn)inode的成員變量i_fop*/if (WARN_ON(!f->f_op)) {error = -ENODEV;goto cleanup_all;}error = security_file_open(f);if (error)goto cleanup_all;error = break_lease(locks_inode(f), f->f_flags);if (error)goto cleanup_all;/* normally all 3 are set; ->open() can clear them if needed */f->f_mode |= FMODE_LSEEK | FMODE_PREAD | FMODE_PWRITE;if (!open)open = f->f_op->open;if (open) {error = open(inode, f); /* 3 */if (error)goto cleanup_all;}f->f_mode |= FMODE_OPENED;if ((f->f_mode & (FMODE_READ | FMODE_WRITE)) == FMODE_READ)i_readcount_inc(inode);if ((f->f_mode & FMODE_READ) &&likely(f->f_op->read || f->f_op->read_iter))f->f_mode |= FMODE_CAN_READ;if ((f->f_mode & FMODE_WRITE) &&likely(f->f_op->write || f->f_op->write_iter))f->f_mode |= FMODE_CAN_WRITE;f->f_write_hint = WRITE_LIFE_NOT_SET;f->f_flags &= ~(O_CREAT | O_EXCL | O_NOCTTY | O_TRUNC);file_ra_state_init(&f->f_ra, f->f_mapping->host->i_mapping);/* NB: we're sure to have correct a_ops only after f_op->open */if (f->f_flags & O_DIRECT) {if (!f->f_mapping->a_ops || !f->f_mapping->a_ops->direct_IO)return -EINVAL;}/** XXX: Huge page cache doesn't support writing yet. Drop all page* cache for this file before processing writes.*/if ((f->f_mode & FMODE_WRITE) && filemap_nr_thps(inode->i_mapping))truncate_pagecache(inode, 0);return 0;cleanup_all:if (WARN_ON_ONCE(error > 0))error = -EINVAL;fops_put(f->f_op);if (f->f_mode & FMODE_WRITER) {put_write_access(inode);__mnt_drop_write(f->f_path.mnt);} cleanup_file:path_put(&f->f_path);f->f_path.mnt = NULL;f->f_path.dentry = NULL;f->f_inode = NULL;return error; }def_chr_fops結(jié)構(gòu)體(位于內(nèi)核源碼/fs/char_dev.c文件) const struct file_operations def_chr_fops = {.open = chrdev_open,.llseek = noop_llseek, }; (1) (2) 設(shè)置file結(jié)構(gòu)體的一些成員 (3) 找到open 回調(diào), 并執(zhí)行 以上代碼中的使用fops_get函數(shù)來(lái)獲取該文件節(jié)點(diǎn)inode的成員變量i_fop,在上圖中我們使用mknod創(chuàng)建字符設(shè)備文件時(shí),將def_chr_fops結(jié)構(gòu)體賦值給了該設(shè)備文件inode的i_fop成員。到了這里,我們新建的file結(jié)構(gòu)體的成員f_op就指向了def_chr_fops。最終,會(huì)執(zhí)行def_chr_fops中的open函數(shù),也就是chrdev_open函數(shù),可以理解為一個(gè)字符設(shè)備的通用初始化函數(shù),根據(jù)字符設(shè)備的設(shè)備號(hào),找到相應(yīng)的字符設(shè)備,從而得到操作該設(shè)備的方法,代碼實(shí)現(xiàn)如下。
chrdev_open函數(shù)(位于內(nèi)核源碼/fs/char_dev.c文件)
??在Linux內(nèi)核中,使用結(jié)構(gòu)體cdev來(lái)描述一個(gè)字符設(shè)備。在以上代碼中的第14行,inode->i_rdev中保存了字符設(shè)備的設(shè)備編號(hào),通過函數(shù)kobj_lookup函數(shù)便可以找到該設(shè)備文件cdev結(jié)構(gòu)體的kobj成員,再通過函數(shù)container_of便可以得到該字符設(shè)備對(duì)應(yīng)的結(jié)構(gòu)體cdev。函數(shù)container_of的作用就是通過一個(gè)結(jié)構(gòu)變量中一個(gè)成員的地址找到這個(gè)結(jié)構(gòu)體變量的首地址。同時(shí),將cdev結(jié)構(gòu)體記錄到文件節(jié)點(diǎn)inode中的i_cdev,便于下次打開該文件。繼續(xù)閱讀第36~45行代碼,我們可以發(fā)現(xiàn),函數(shù)chrdev_open最終將該文件結(jié)構(gòu)體file的成員f_op替換成了cdev對(duì)應(yīng)的ops成員,并執(zhí)行ops結(jié)構(gòu)體中的open函數(shù)。
??最后,調(diào)用上圖的fd_install函數(shù),完成文件描述符和文件結(jié)構(gòu)體file的關(guān)聯(lián),之后我們使用對(duì)該文件描述符fd調(diào)用read、write函數(shù),最終都會(huì)調(diào)用file結(jié)構(gòu)體對(duì)應(yīng)的函數(shù),實(shí)際上也就是調(diào)用cdev結(jié)構(gòu)體中ops結(jié)構(gòu)體內(nèi)的相關(guān)函數(shù)
總結(jié)
以上是生活随笔為你收集整理的linux设备驱动模型一字符设备open系统调用流程的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Matpower软件简介和参数介绍
- 下一篇: 关于Matpower用于攻击检测仿真方法