7 python linecache 模塊讀取文件用法詳解

linecache 模塊允許從任何文件裡得到任何的行,並且使用緩存進行優化,常見的情況是從單個文件讀取多行。

linecache.getlines(filename)
從名為 filename 的文件中得到全部內容,輸出為列表格式,以文件每行為列表中的一個元素,並以 linenum-1 為元素在列表中的位置存儲

linecache.getline(filename,lineno)
從名為 filename 的文件中得到第 lineno 行。這個函數從不會拋出一個異常–產生錯誤時它將返回」(換行符將包含在找到的行裡)。
如果文件沒有找到,這個函數將會在 sys.path 搜索。

linecache.clearcache
清除緩存。如果你不再需要先前從 getline 中得到的行

linecache.checkcache(filename)
檢查緩存的有效性。如果在緩存中的文件在硬盤上發生了變化,並且你需要更新版本,使用這個函數。如果省略 filename,將檢查緩存裡的所有條目。

linecache.updatecache(filename)
更新文件名為 filename 的緩存。如果 filename 文件更新了,使用這個函數可以更新 linecache.getlines(filename)返回的列表。

用法舉例:

 # cat a.txt1a2b3c4d5e6f7g  

1、獲取 a.txt 文件的內容

>>> a=linecache.getlines('a.txt')>>> a['1a\n', '2b\n', '3c\n', '4d\n', '5e\n', '6f\n', '7g\n']  

2、獲取 a.txt 文件中第 1-4 行的內容

>>> a=linecache.getlines('a.txt')[0:4]>>> a['1a\n', '2b\n', '3c\n', '4d\n']  

3、獲取 a.txt 文件中第4行的內容

>>> a=linecache.getline('a.txt',4)>>> a'4d\n'  

注意:使用 linecache.getlines('a.txt') 打開文件的內容之後,如果 a.txt 文件發生了改變,如你再次用 linecache.getlines 獲取的內容,不是文件的最新內容,還是之前的內容,此時有兩種方法:

  1. 使用 linecache.checkcache(filename) 來更新文件在硬盤上的緩存,然後在執行 linecache.getlines('a.txt') 就可以獲取到 a.txt 的最新內容;
  2. 直接使用 linecache.updatecache('a.txt'),即可獲取最新的 a.txt 的最新內容

另:讀取文件之後你不需要使用文件的緩存時需要在最後清理一下緩存,使 linecache.clearcache 清理緩存,釋放緩存。

這個模塊是使用內存來緩存你的文件內容,所以需要耗費內存,打開文件的大小和打開速度和你的內存大小有關係。

《Python實戰-從菜鳥到大牛的進階之路》