摘要:采集稅源數(shù)據(jù),對加強稅務(wù)監(jiān)控有著重要意義。本文基于稅控收款機標準GB18240.1~GB18240.6,以使用Linux 操作系統(tǒng)、并口打印機的電子收款機為平臺,以采集銷售明細數(shù)據(jù)并在打印***上增加稅控碼為目的,提出了一種利用內(nèi)核打印驅(qū)動模塊修改和netlink socket 技術(shù)實現(xiàn)的稅源數(shù)據(jù)采集方案。
1. 引言
稅收是國家財政的重要組成部分,但是在稅收領(lǐng)域依法納稅意識淡薄,偷稅逃稅現(xiàn)象依然比較嚴重,尤其是對財務(wù)核算不健全的*,稅務(wù)機關(guān)難以實施有效監(jiān)控。這種現(xiàn)狀不但嚴重擾亂正常的經(jīng)濟秩序,而且導(dǎo)致國家稅收大量流失。為了進一步加強稅源監(jiān)控,堵塞稅收漏洞,減少稅收流失,國家先后出臺了稅控收款機標準GB18240.1~GB18240.6 等六個部分,建立了以電子收款機+稅控器+稅控IC 卡+稅控收款機管理系統(tǒng)的基本工作模式,明確了以票控稅的基本原則。要求每當電子收款機上完成一筆銷售時,收集其銷售明細數(shù)據(jù),將其交由稅控器記錄統(tǒng)計,并將稅控器依據(jù)銷售明細數(shù)據(jù)生成的稅控碼添加到銷售小票上,以此來表示此筆銷售已被稅務(wù)機關(guān)記錄。本文所討論的便是一種從電子收款機采集稅源數(shù)據(jù)即銷售明細數(shù)據(jù)的解決方案。
因為電子收款機使用的操作系統(tǒng)有很多種,對于不同操作系統(tǒng)采集稅源數(shù)據(jù)的方案都有所不同。本文具體討論Linux 操作系統(tǒng)下使用并口打印機的電子收款機的稅源數(shù)據(jù)采集方案,使用串口打印機的情形亦可參照。Windows 操作系統(tǒng)下的采集方案請查閱參考文獻。
2 方案設(shè)計
Linux 系統(tǒng)將打印機設(shè)備視為文件,通過對該文件的寫操作來實現(xiàn)打印功能。通常情況下,對文件系統(tǒng)的監(jiān)控是通過系統(tǒng)調(diào)用劫持來實現(xiàn)的。但是1) Linux 2.6 版本之后的內(nèi)核,系統(tǒng)調(diào)用表的地址已經(jīng)不能導(dǎo)出,系統(tǒng)調(diào)用劫持的實現(xiàn)難度加大;2) 劫持 sys_write 系統(tǒng)調(diào)用后,所有的文件寫入操作都會被劫持,對系統(tǒng)的性能有較大影響;3) 修改后的打印數(shù)據(jù)必須存入銷售軟件進程的用戶內(nèi)存空間,才能調(diào)用文件驅(qū)動模塊write 函數(shù)將其打印出來。而侵入銷售軟件進程將大大降低系統(tǒng)的獨立性和可靠性。
基于以上考慮,選擇了通過修改內(nèi)核打印驅(qū)動模塊來實現(xiàn)對電子收款機上銷售小票打印數(shù)據(jù)的截獲。
然而設(shè)備驅(qū)動運行于內(nèi)核態(tài),具有很大的局限性,如不能在終端上打印、不能做大延時的操作、不能使用C 的庫函數(shù)等等,難以滿足稅源數(shù)據(jù)采集系統(tǒng)的功能需要。所以需要一個用戶態(tài)的守護進程常駐內(nèi)存,對內(nèi)核態(tài)采集到的數(shù)據(jù)進行處理。
這樣整個稅源數(shù)據(jù)采集系統(tǒng)可以分為如下兩個部分:
1)內(nèi)核空間
在 Linux 并口打印驅(qū)動模塊中增加一個攔截函數(shù),替換原有的lp_write 函數(shù),負責(zé)將打印數(shù)據(jù)發(fā)送給用戶態(tài)的守護進程,并在收到守護進程返回的新的打印數(shù)據(jù)之后,將其打印出來。
2)用戶空間
實現(xiàn)一個常駐內(nèi)存的用戶態(tài)守護進程,負責(zé)接收內(nèi)核截取到的打印數(shù)據(jù),并在進行處理后回送給內(nèi)核。
圖 1 Linux 電子收款機稅源數(shù)據(jù)采集系統(tǒng)框架圖
3 關(guān)鍵實現(xiàn)技術(shù)
實現(xiàn)上述設(shè)計的關(guān)鍵在于解決“內(nèi)核態(tài)與用戶態(tài)的進程間通信”、“攔截并口打印驅(qū)動的write 操作”、“打印進程的阻塞及喚醒”三個問題。
3.1 內(nèi)核態(tài)與用戶態(tài)的進程間通信
本方案這種分為內(nèi)核空間和用戶空間兩部分的結(jié)構(gòu)設(shè)計,首先需要解決的就是內(nèi)核態(tài)與用戶態(tài)的進程間通信(interprocess communicatiON, IPC)。而在各種IPC 方法中,最適合此處設(shè)計需要的就是netlink socket 技術(shù)。
Netlink socket 最早出現(xiàn)于Linux 2.2 版的內(nèi)核中,并在2. 4 版以后的版本中作為主要的內(nèi)核與用戶空間的通信方式而被廣泛使用。相對于系統(tǒng)調(diào)用、ioctl 以及proc 文件系統(tǒng)等IPC方法而言,它具有簡單易用、異步通信(適合大數(shù)據(jù)傳輸)、無編譯依賴(可模塊實現(xiàn))、支持多播、支持內(nèi)核發(fā)起會話等優(yōu)點。其中“異步通信、無編譯依賴、支持內(nèi)核發(fā)起會話”
這三點正是本系統(tǒng)需要的關(guān)鍵特性,也是選用該技術(shù)的最主要原因。
Netlink socket 的通信依據(jù)是一個對應(yīng)于進程的標識,一般定為該進程的ID。當通信的一端處于中斷過程時,該標識為0。當使用netlink socket 進行通信,通信的雙方都是用戶態(tài)進程,則使用方法類似于消息隊列。但通信雙方有一端是中斷過程,使用方法則不同。Netlinksocket 的最大特點是對中斷過程的支持,它在內(nèi)核空間接收用戶空間數(shù)據(jù)時不再需要用戶自行啟動一個內(nèi)核線程,而是通過另一個軟中斷調(diào)用用戶事先指定的接收函數(shù),這樣就可以保證數(shù)據(jù)接收的實時性。
當 netlink socket 用于內(nèi)核空間與用戶空間的通信時,在用戶空間的創(chuàng)建方法和一般套接字使用類似,但內(nèi)核空間的創(chuàng)建方法則不同。在內(nèi)核模塊中使用 netlink_kernel_create()函數(shù)創(chuàng)建socket 時需要指明接收函數(shù)。之后用戶空間進程創(chuàng)建socket,并將通信標識(一般是該進程的ID)發(fā)送到內(nèi)核空間。這樣內(nèi)核空間獲得了用戶空間進程的通信標識后就可以進行通信了。
3.2 攔截并口打印驅(qū)動的write 操作
Linux 操作系統(tǒng)將設(shè)備看作文件,每個Linux 的設(shè)備驅(qū)動程序都定義了一個 file_operation結(jié)構(gòu),結(jié)構(gòu)中的各個成員是驅(qū)動模塊中定義函數(shù)的指針, 通過這些函數(shù)具體實現(xiàn)對文件的open, read, write 等操作。因此,只要將并口打印驅(qū)動模塊的file_operation 結(jié)構(gòu)常量——lp_fops的write 成員的值由lp_write 替換為指向攔截函數(shù)的指針就能實時地攔截并口打印機的打印操作。
這里需要實現(xiàn)兩個關(guān)鍵函數(shù):
1)lp_write_from_kernellp_write_from_kernel 函數(shù)實現(xiàn)內(nèi)核空間的緩沖區(qū)數(shù)據(jù)的打印功能。來自守護進程的修改后打印數(shù)據(jù)是保存在內(nèi)核空間的,因此不能調(diào)用原有的lp_write 函數(shù)進行打印。具體的實現(xiàn)可依照lp_write,只要將調(diào)用copy_from_user 函數(shù)的地方改為調(diào)用memcpy 函數(shù)即可。
2)lp_interceptlp_intercept 函數(shù)函數(shù)用于替換lp_write,攔截并口打印驅(qū)動的write 操作,實現(xiàn)打印數(shù)據(jù)截取與修改:當電子收款機的銷售軟件調(diào)用并口打印驅(qū)動的write 函數(shù)時,將寫緩沖區(qū)的打印數(shù)據(jù)發(fā)送給守護進程;待守護進程返回修改后的打印數(shù)據(jù)(附加了稅控碼),調(diào)用lp_write_from_kernel 將其打印出來。
3.3 打印進程的阻塞及喚醒
當收到電子收款機的銷售軟件向并口打印機發(fā)出的打印請求時,內(nèi)核態(tài)的并口打印模塊需在將數(shù)據(jù)發(fā)送給用戶態(tài)的守護進程之后阻塞打印請求進程。并且,當且僅當接收到守護進程的返回數(shù)據(jù)時,才會喚醒打印請求進程完成打印。
如何實現(xiàn)打印進程的阻塞及喚醒就是最后一個關(guān)鍵技術(shù)點。因為電子收款機只配備一個打印機、不需要復(fù)雜的互斥技術(shù),所以只要使用“簡單睡眠”就可以達到這個目標——通過使用下面的宏或函數(shù):
4 小結(jié)
本文詳細說明了如何修改可加載的內(nèi)核驅(qū)動模塊實現(xiàn)并口打印數(shù)據(jù)的攔截與修改,如何運用netlink socket 技術(shù)實現(xiàn)內(nèi)核與用戶進程的通訊,以及進程的阻塞及喚醒技術(shù)。并在此基礎(chǔ)上提出了一種利用上述技術(shù)實現(xiàn)的Linux 電子收款機稅源數(shù)據(jù)采集方案。此方案在無需改變電子收款機原有設(shè)計架構(gòu)的條件下,實現(xiàn)了稅源數(shù)據(jù)采集及***稅控碼添加功能,經(jīng)實際環(huán)境測試可行,符合對稅源數(shù)據(jù)采集系統(tǒng)的整體要求。