久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術(shù)文章
文章詳情頁

python - 對於不同文件夾的特徵提取策略問題

瀏覽:117日期:2022-08-11 08:43:16

問題描述

問題描述:

有很多文件夾,一個(gè)文件夾下有很多文件。目的是將每個(gè)文件夾的特徵提取出來,特徵規(guī)定是該文件夾下的一個(gè)或少量文件(名,內(nèi)容hash及相對位置)。有什麼較好的算法或策略來解決該問題嗎?

我想的是暴力求解,但這效率低下。直接把該文件夾下的文件與其它文件夾下所有的文件做比較,如果有相同的,則該文件夾的下一個(gè)文件又去比較其它所有的,如果不同,則說明這個(gè)文件可以表達(dá)出該文件夾的特征。然后每個(gè)文件夾都這么做。

統(tǒng)計(jì)方法。按順序?qū)⒚總€(gè)文件夾的文件排序,選最大最小及中位數(shù)文件來作每個(gè)文件夾的特徵。但會(huì)出現(xiàn)這麼個(gè)問題,兩個(gè)文件夾可能就只有一個(gè)或少量文件不同,使用這種策略會(huì)產(chǎn)生遺漏,無法準(zhǔn)確提取出所有文件夾的特徵。

因此,我希望是在既能保證效率又能保證準(zhǔn)確率的情況下來對這問題進(jìn)行求解。希望各位表哥能隨便提提建議或意見,指導(dǎo)指導(dǎo)。thx。

問題解答

回答1:

將當(dāng)前文件夾隨機(jī)取固定數(shù)目個(gè)文件,將他們的文件名、大小、修改時(shí)間、權(quán)限等組合起來做個(gè)哈希,然后判重,一般重復(fù)率是不會(huì)很高的,因?yàn)榧词刮募痛笮∫粯樱薷臅r(shí)間一般是不一樣的。

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 永仁县| 天祝| 南宁市| 定边县| 上林县| 海丰县| 平塘县| 怀来县| 灌云县| 江孜县| 丁青县| 交城县| 新河县| 益阳市| 孟连| 子长县| 泗阳县| 南昌县| 新密市| 黄大仙区| 龙岩市| 宜都市| 通辽市| 康平县| 英吉沙县| 辛集市| 鹤山市| 栾川县| 焦作市| 文山县| 渝北区| 军事| 界首市| 长垣县| 井冈山市| 将乐县| 广南县| 北宁市| 襄城县| 沅江市| 永寿县|