文章詳情頁
java字符串搜索匹配問題?
瀏覽:152日期:2024-01-16 14:46:25
問題描述
我有三萬多個詞匯和它們的詞性(就是動詞,名詞,形容詞或者副詞之類的),我想寫個函數把以參數的方式傳遞進來的單詞進行詞性分析,然后返回它的詞性。
public int analyze(String word){ // 這個地方應該用什么來保存那三萬個詞匯 // 這個地方應該用怎樣的數據結構或算法來判斷word到底在不在我那個三萬個詞匯里面 // 怎么做才能功效地判斷出word的詞性 return wordType;}
詞匯-詞性表目前是單純的以行為單位的txt文件
word1 tword2 nword3 a
就這樣,我該怎么做呢,應該用什么來存儲我的三萬行數據,txt,json,xml,或者寫到代碼里面放到數組里面去呢?哪一個循環起來快一些,有什么好的建議?
問題解答
回答1:你的具體用途是怎樣的,經常用到,注重查詢效率?可以用map放內存吧
如果不經常使用,可以按首字母將詞分割成幾個文件,每次查詢都可以定位到某個文件,更快一點。說實話,三萬其實挺小的,讀起來應該不慢,再夸張點你可以放數據庫。
如果有更好的想法再回復你
回答2:可以試下hadoop的 map reduce 哦
標簽:
java
相關文章:
1. angular.js - 輸入郵箱地址之后, 如何使其自動在末尾添加分號?2. 管理員信息修改時的密碼問題3. javascript - JS 里面的 delete object.key 到底刪除了什么?4. android - RxJava 中有根據條件執行不同函數的操作符嗎?5. mysql - 電商如何存儲營業額數據6. javascript - 后臺管理系統左側折疊導航欄數據較多,怎么樣直接通過搜索去定位到具體某一個菜單項位置,并展開當前菜單7. javascript - html5的data屬性怎么指定一個function函數呢?8. javascript - 如何使用nodejs 將.html 文件轉化成canvas9. html5 - 為什么使使用vue cli 腳手架,post-css 沒有自動對css3屬性自動添加瀏覽器前綴呢?10. java如何生成token?
排行榜
