5 python 計算文件的行數和讀取某一行內容的實現方法

一、計算文件的行數

最簡單的辦法是把文件讀入一個大的列表中,然後統計列表的長度.如果文件的路徑是以參數的形式filepath傳遞的,那麼只用一行代碼就可以完成我們的需求了:

count = len(open(filepath,'rU').readlines)  

如果是非常大的文件,上面的方法可能很慢,甚至失效.此時,可以使用循環來處理:

count = -1for count, line in enumerate(open(thefilepath, 'rU')):    passcount += 1  

另外一種處理大文件比較快的方法是統計文件中換行符的個數 '\n '(或者包含 '\n' 的字串,如在 windows 系統中):

count = 0thefile = open(thefilepath, 'rb')while True:    buffer = thefile.read(8192*1024)    if not buffer:break    count += buffer.count('\n')thefile.close( )  

參數 'rb' 是必須的,否則在 windows 系統上,上面的代碼會非常慢.

linecache 是專門支持讀取大文件,而且支持行式讀取的函數庫。 linecache 預先把文件讀入緩存起來,後面如果你訪問該文件的話就不再從硬盤讀取

二、讀取文件某一行的內容(測試過 1 G 大小的文件,效率還可以)

import linecachecount = linecache.getline(filename,linenum)  

三、用 linecache 讀取文件內容(測試過 1 G 大小的文件,效率還可以)

str = linecache.getlines(filename)  

str 為列表形式,每一行為列表中的一個元素

《Python實戰-從菜鳥到大牛的進階之路》