python:HDF和CSV存儲優(yōu)劣對比分析
小數(shù)據(jù)用csv,大數(shù)據(jù)用h5
結(jié)論1:幾百KB以上的數(shù)據(jù)都用h5比較好
結(jié)論2:幾KB的數(shù)據(jù)h5反而很慢
程序
import pandas as pdimport numpy as npfrom wja.wja_tool import test_time as ttfrom wja import wja_tool as tooldf = tool.generate_sampleDF(row, col)tt().run()df.to_csv(’try.csv’)tt().end()tt().run()df.to_hdf(’try.h5’,’df’,mode=’w’)tt().end() tt().run()df1 = pd.read_csv(’try.csv’)tt().end()tt().run()df2 = pd.read_hdf(’try.h5’)tt().end()
對比1:數(shù)據(jù)10*1
df = tool.generate_sampleDF(10,1)
# csv保存# hdf保存# csv讀取# hdf讀取程序用時:0.015程序用時:0.9985程序用時:0.009程序用時:0.0369
對比2:數(shù)據(jù)100*10
df = tool.generate_sampleDF(100,10)
# csv保存# hdf保存# csv讀取# hdf讀取程序用時:0.017程序用時:1.1016程序用時:0.01程序用時:0.013
對比3:數(shù)據(jù)1000*100
df = tool.generate_sampleDF(1000,100)
# csv保存# hdf保存# csv讀取# hdf讀取程序用時:0.2383程序用時:1.0308程序用時:0.0499程序用時:0.016
對比4:數(shù)據(jù)10000*100
df = tool.generate_sampleDF(10000,100)
# csv保存# hdf保存# csv讀取# hdf讀取程序用時:2.0895程序用時:1.0073程序用時:0.4055程序用時:0.0169
對比5:數(shù)據(jù)10000*1000
# csv保存# hdf保存# csv讀取# hdf讀取df = tool.generate_sampleDF(10000,1000)
# csv保存# hdf保存# csv讀取# hdf讀取程序用時:23.5693程序用時:2.2057程序用時:3.3697程序用時:0.0619
補充知識:python:n個點m條邊有權(quán)無向圖
n個點:有個位置
m條邊:兩點之間存在m條邊有權(quán)值
有權(quán):每條邊代表一個數(shù)值
無向:沒有規(guī)定行進方向
規(guī)定:
1、兩點之間的行進路線,最終權(quán)值為所經(jīng)過的邊的權(quán)值的最大值
2、兩點之間走法不止一個,最終取最小值為最終走法
問:
兩點之間的最終權(quán)值為多少
如上圖,我們可以將其寫為列表形式,前兩位是從小到大的的兩個點,最后一個代表權(quán)值,如[1, 2, 2] 代表1和2之間的權(quán)值是2,以此類推
n,m = 5, 10road = [[1, 2, 2], [1, 3, 3], [1, 4, 7], [1, 5, 2], [2, 3, 4], [2, 4, 9], [2, 5, 5], [3, 4, 4], [3, 5, 5], [4, 5, 3]]def hold(list1, list2): jiaoji = list(set(list1)&set(list2)) need = [i for i in set(list1+list2) if i not in jiaoji] need.sort() return needdef get(road): option = {} for i in range (m): option[(road[i][0],road[i][1])] = [road[i][2]] for i in range (m): for j in range(i+1,m): dot = hold(road[i][:2], road[j][:2]) if len(dot)==2:if (dot[0],dot[1]) in option.keys(): option[(dot[0],dot[1])].append(max([road[i][2],road[j][2]]))else: option[(dot[0],dot[1])] = [] option[(dot[0],dot[1])].append(max([road[i][2],road[j][2]])) road_new = [] for i in option.items(): road_new.append(list(i[0])+[min(i[1])]) if road==road_new: print(road_new) return road_new return get(road_new)
輸出結(jié)果
所有可能的走法如下,并且最后一位輸出最短的權(quán)值路徑。
例如 [2, 3, 3]:代表 從2走到3最短的權(quán)值路徑是3,對應(yīng)路徑從圖中可以到是2-1-3
例如 [3, 5, 3]:代表 從3走到5最短的權(quán)值路徑是3,對應(yīng)路徑從圖中可以到是3-1-5
[[1, 2, 2], [1, 3, 3], [1, 4, 3], [1, 5, 2], [2, 3, 3], [2, 4, 3], [2, 5, 2], [3, 4, 3], [3, 5, 3], [4, 5, 3]]
以上這篇python:HDF和CSV存儲優(yōu)劣對比分析就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. html中的form不提交(排除)某些input 原創(chuàng)2. ASP動態(tài)網(wǎng)頁制作技術(shù)經(jīng)驗分享3. vue使用moment如何將時間戳轉(zhuǎn)為標(biāo)準(zhǔn)日期時間格式4. jsp文件下載功能實現(xiàn)代碼5. 開發(fā)效率翻倍的Web API使用技巧6. ASP常用日期格式化函數(shù) FormatDate()7. js select支持手動輸入功能實現(xiàn)代碼8. CSS3中Transition屬性詳解以及示例分享9. asp.net core項目授權(quán)流程詳解10. CSS3實現(xiàn)動態(tài)翻牌效果 仿百度貼吧3D翻牌一次動畫特效
