數(shù)據(jù)分析 - java 數(shù)據(jù)挖掘分析求思路
問(wèn)題描述
先說(shuō)說(shuō)我的想法吧:同時(shí)監(jiān)控淘寶上很多物品的價(jià)格,然后獲取價(jià)格走勢(shì)(這個(gè)我打算自己寫爬蟲獲取,然后存在數(shù)據(jù)庫(kù)里),但是問(wèn)題來(lái)了
我該怎么存儲(chǔ)數(shù)據(jù),使我能分析哪些物品在最近2天或7天的價(jià)格波動(dòng)最大(最好是任意天數(shù)),這個(gè)地方該怎么實(shí)現(xiàn)比較好。總不能說(shuō)每天我都要遍歷一次數(shù)據(jù)庫(kù)來(lái)求價(jià)格的差值吧,能不能有經(jīng)驗(yàn)的大師指點(diǎn)下。
問(wèn)題解答
回答1:總不能說(shuō)每天我都要遍歷一次數(shù)據(jù)庫(kù)來(lái)求價(jià)格的差值吧 是覺(jué)得開銷過(guò)大嗎?那就把熱點(diǎn)數(shù)據(jù)放Cache,過(guò)了這段熱點(diǎn)時(shí)間就持久化到數(shù)據(jù)庫(kù)。
熱點(diǎn)數(shù)據(jù)可以是但不限于:
這幾天剛采集的數(shù)據(jù)
最常常分析的日期段,比如2天、7天、1個(gè)月
回答2:這個(gè)和java沒(méi)關(guān)系吧
回答3:數(shù)據(jù)分析的方法和java不是強(qiáng)相關(guān)的,java從某種角度說(shuō)只是一種工具,可以將你的想法交給計(jì)算完成,可以實(shí)現(xiàn)你與計(jì)算機(jī)的交流,有基于java相關(guān)的haoop生態(tài),可以了解一哈
回答4:需要分析的變動(dòng)快的 --> 熱數(shù)據(jù) --> redis , 放在內(nèi)存;長(zhǎng)期的歷史數(shù)據(jù) --> 冷數(shù)據(jù) --> mysql / oracle ,放在磁盤。
相關(guān)文章:
1. css - 如何使用 vue transition 實(shí)現(xiàn) ios 按鈕一樣的平滑切換效果2. angular.js - 關(guān)于$apply()3. mysql - 把一個(gè)表中的數(shù)據(jù)count更新到另一個(gè)表里?4. 網(wǎng)絡(luò)傳輸協(xié)議 - 以下三種下載方式有什么不同?如何用python模擬下載器下載?5. mysql數(shù)據(jù)庫(kù)做關(guān)聯(lián)一般用id還是用戶名6. 關(guān)于python切片的問(wèn)題7. linux - 升級(jí)到Python3.6后GDB無(wú)法正常運(yùn)行?8. mysql 里邊,自增長(zhǎng)id,寫數(shù)據(jù)時(shí),是先把數(shù)據(jù)寫進(jìn)去,然后再給這條數(shù)據(jù)一個(gè)id,還是先給id,然后再把要插入的數(shù)據(jù)寫進(jìn)去9. 多維數(shù)組如何在視圖中渲染10. javascript - 前端怎樣實(shí)現(xiàn)圖片剪切一部分上傳呢?像微信或者QQ上傳那樣呢?用的啥技術(shù)
