數(shù)據(jù)分析 - java 數(shù)據(jù)挖掘分析求思路
問題描述
先說說我的想法吧:同時(shí)監(jiān)控淘寶上很多物品的價(jià)格,然后獲取價(jià)格走勢(這個(gè)我打算自己寫爬蟲獲取,然后存在數(shù)據(jù)庫里),但是問題來了
我該怎么存儲(chǔ)數(shù)據(jù),使我能分析哪些物品在最近2天或7天的價(jià)格波動(dòng)最大(最好是任意天數(shù)),這個(gè)地方該怎么實(shí)現(xiàn)比較好。總不能說每天我都要遍歷一次數(shù)據(jù)庫來求價(jià)格的差值吧,能不能有經(jīng)驗(yàn)的大師指點(diǎn)下。
問題解答
回答1:總不能說每天我都要遍歷一次數(shù)據(jù)庫來求價(jià)格的差值吧 是覺得開銷過大嗎?那就把熱點(diǎn)數(shù)據(jù)放Cache,過了這段熱點(diǎn)時(shí)間就持久化到數(shù)據(jù)庫。
熱點(diǎn)數(shù)據(jù)可以是但不限于:
這幾天剛采集的數(shù)據(jù)
最常常分析的日期段,比如2天、7天、1個(gè)月
回答2:這個(gè)和java沒關(guān)系吧
回答3:數(shù)據(jù)分析的方法和java不是強(qiáng)相關(guān)的,java從某種角度說只是一種工具,可以將你的想法交給計(jì)算完成,可以實(shí)現(xiàn)你與計(jì)算機(jī)的交流,有基于java相關(guān)的haoop生態(tài),可以了解一哈
回答4:需要分析的變動(dòng)快的 --> 熱數(shù)據(jù) --> redis , 放在內(nèi)存;長期的歷史數(shù)據(jù) --> 冷數(shù)據(jù) --> mysql / oracle ,放在磁盤。
相關(guān)文章:
1. mysql優(yōu)化 - mysql count(id)查詢速度如何優(yōu)化?2. mysql主從 - 請教下mysql 主動(dòng)-被動(dòng)模式的雙主配置 和 主從配置在應(yīng)用上有什么區(qū)別?3. angular.js - angularjs 用ng-reapt渲染的dom 怎么獲取上面的屬性4. 主從備份 - 跪求mysql 高可用主從方案5. css3 - [CSS] 動(dòng)畫效果 3D翻轉(zhuǎn)bug6. node.js - node_moduls太多了7. angular.js - Angular路由和express路由的組合使用問題8. python如何不改動(dòng)文件的情況下修改文件的 修改日期9. python - django 里自定義的 login 方法,如何使用 login_required()10. angular.js - 不適用其他構(gòu)建工具,怎么搭建angular1項(xiàng)目
![css3 - [CSS] 動(dòng)畫效果 3D翻轉(zhuǎn)bug](http://www.aoyou183.cn/attached/image/news/202304/110831f073.png)