文章詳情頁

java - 讀取大于內(nèi)存的大文件怎么讀？

瀏覽：124日期：2023-12-28 16:57:06

問題描述

參考：有一個1G大小的一個文件，內(nèi)存限制大小是10M，有序返回頻數(shù)最高的50個詞，該怎么做？

網(wǎng)上有很多該問題的解決方案，都是用分而治之的思想，提到了遍歷整個文件。

那么我的問題是：如果單純地逐行讀取大文件，算是把1G文件全都加載進(jìn)內(nèi)存嗎？或者說是讀取大于內(nèi)存的文件應(yīng)該怎么讀？

問題解答

回答1：

在這里內(nèi)存就像一條管道，逐行讀是把1G文件在內(nèi)存里過一遍而已，10M表示管道的粗細(xì)。所以，逐行讀是把1G文件加載進(jìn)去過內(nèi)存。

回答2：

try (BufferedReader in = new BufferedReader(new FileReader(file))) { String line; while ((line = in.readLine()) != null) {// parse line }}

file再大，只要每一行的長度有限，整個文件讀完會需要不少的時間，但不會占用太大的內(nèi)存。

回答3：

分塊讀，每讀一個塊一個結(jié)果集，最后對結(jié)果集聚合處理文本的話，知道行數(shù)會更好

回答4：

linux上面有個指令叫做split可以并發(fā)快速把大文本分割成小的文件,然后處理就方便了呀,這種算法叫做外排序

回答5：

內(nèi)存就好比草稿紙，寫滿一篇就翻篇。用過、沒用的數(shù)據(jù)就扔掉了。

簡單舉例，創(chuàng)建一個變量 buff,設(shè)定好它的大小，打開文件流往里填，填滿以后查你要的內(nèi)容，查到就統(tǒng)計到另外一個變量里計數(shù)。然后清空buff,繼續(xù)之前讀取的位置再次裝載內(nèi)容…… 直到讀取完畢，統(tǒng)計也就完成了。

回答6：

針對不同的系統(tǒng)，都會提供一個API來操作大于內(nèi)存的文件，也就是將文件當(dāng)做內(nèi)存來處理：

內(nèi)存映射

mmap

CreateFileMapping

java

上一條：javascript - ant-design中的table組件怎么清空里面所有的數(shù)據(jù)(包括別的組件比如input)下一條：java返回java.lang.NumberFormatException異常

相關(guān)文章：

1. 如何解決docker宿主機(jī)無法訪問容器中的服務(wù)？2. javascript - Web微信聊天輸入框解決方案3. javascript - 如何使用nodejs 將.html 文件轉(zhuǎn)化成canvas4. angular.js - 輸入郵箱地址之后，如何使其自動在末尾添加分號？5. javascript - 后臺管理系統(tǒng)左側(cè)折疊導(dǎo)航欄數(shù)據(jù)較多，怎么樣直接通過搜索去定位到具體某一個菜單項(xiàng)位置，并展開當(dāng)前菜單6. javascript - 螞蟻金服里的react Modal方法，是怎么把元素插入到頁面最后的7. python - Scrapy存在內(nèi)存泄漏的問題。8. 如何用筆記本上的apache做微信開發(fā)的服務(wù)器9. java如何生成token？10. android - rxjava merge 返回Object對象數(shù)據(jù)如何緩存

排行榜

					
					如何解決docker宿主機(jī)無法訪問容器中的服務(wù)？
angular.js - 輸入郵箱地址之后， 如何使其自動在末尾添加分號？
javascript - 如何使用nodejs 將.html 文件轉(zhuǎn)化成canvas
javascript - Web微信聊天輸入框解決方案
javascript - 后臺管理系統(tǒng)左側(cè)折疊導(dǎo)航欄數(shù)據(jù)較多，怎么樣直接通過搜索去定位到具體某一個菜單項(xiàng)位置，并展開當(dāng)前菜單
docker-compose中volumes的問題
在mac下出現(xiàn)了兩個docker環(huán)境
angular.js - $stateChangeSuccess事件在狀態(tài)跳轉(zhuǎn)的時候不執(zhí)行？
CSS3 畫如下圖形
android - rxjava merge 返回Object對象數(shù)據(jù)如何緩存
如何用筆記本上的apache做微信開發(fā)的服務(wù)器
				

熱門標(biāo)簽

久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

java - 讀取大于內(nèi)存的大文件怎么讀？

java - 讀取大于內(nèi)存的大文件怎么讀？