一、計算文件的行數
最簡單的辦法是把文件讀入一個大的列表中,然後統計列表的長度.如果文件的路徑是以參數的形式filepath傳遞的,那麼只用一行代碼就可以完成我們的需求了:
count = len(open(filepath,'rU').readlines)
如果是非常大的文件,上面的方法可能很慢,甚至失效.此時,可以使用循環來處理:
count = -1for count, line in enumerate(open(thefilepath, 'rU')): passcount += 1
另外一種處理大文件比較快的方法是統計文件中換行符的個數 '\n '(或者包含 '\n' 的字串,如在 windows 系統中):
count = 0thefile = open(thefilepath, 'rb')while True: buffer = thefile.read(8192*1024) if not buffer:break count += buffer.count('\n')thefile.close( )
參數 'rb' 是必須的,否則在 windows 系統上,上面的代碼會非常慢.
linecache 是專門支持讀取大文件,而且支持行式讀取的函數庫。 linecache 預先把文件讀入緩存起來,後面如果你訪問該文件的話就不再從硬盤讀取
二、讀取文件某一行的內容(測試過 1 G 大小的文件,效率還可以)
import linecachecount = linecache.getline(filename,linenum)
三、用 linecache 讀取文件內容(測試過 1 G 大小的文件,效率還可以)
str = linecache.getlines(filename)
str 為列表形式,每一行為列表中的一個元素