java - 判斷數據在數據庫中是否已存在.
問題描述
今天下午和同事發生因為判斷數據是否在數據庫中已存在產生分歧.簡易代碼如下:
//觀點一,先取出數據庫中已存在ID存入內存,再進行判斷 //數據太多情況,內存爆炸 DateTable dt = ExcuteSQL(’SELECT ID FROM TABLE’);//List為數據集,已經去重 foreach(var item in List){//觀點二,在for循環中根據ID查詢是否已存在//for循環執行數據庫?沒這么干過DateTable dt = ExcuteSQL(string.format(’SELECT ID FROM TABLE WHERE ID = {0}’,item.ID));//判斷是否在dt中存在...bool ISContain...//不存在 if(!ISContain){ //加入事物SQL列表 SQLList.Add(’INSERT INTO ........’); } }//執行事物 ....
問題解答
回答1:其實第一個你要拿實際數據量來估算,如果ID是Long類型,數據量100W,也才只有 8byte * 100W = 7.629 megabytes。
第二個肯定要不得,在循環中對每個ID去查詢。
回答2:推薦方法二,但這樣做查詢會比較快:
SELECT id FROM table WHERE id IN (?, ?, ?, ...)
注意,不同的數據庫對參數是有限制的,?最好不要超過1千個。如果你需要判斷1萬個id,就用10次這樣的查詢。
回答3:利用 @auntyellow 同學所說的方法應該比較好,批量查詢。當ID比較多時,考慮是否可以按其它的批量方式去查?比如一次拿一段時間的所有id,把方法一稍加改進來實現。感覺不管是方法一還是方法二都走了極端,所以好的解決方法應該是中合兩者的結果。
回答4:https://www.zhihu.com/questio...
回答5:建議是使用先把id從數據庫中取出來,然后在內存中比較的方法,這樣可以減少數據庫的訪問。
回答6:可不可以分段 取到內存里 這樣能減輕內存占用
相關文章:
1. python的文件讀寫問題?2. javascript - jquery hide()方法無效3. mysql里的大表用mycat做水平拆分,是不是要先手動分好,再配置mycat4. 怎么用css截取字符?5. css - 定位為absolute的父元素中的子元素 如何設置在父元素的下面?6. python - 獲取到的數據生成新的mysql表7. CSS3可否做出這個效果?8. window下mysql中文亂碼怎么解決??9. javascript - 圖片鏈接請求一直是pending狀態,導致頁面崩潰,怎么解決?10. javascript - 請問 chrome 為什么會重復加載圖片資源?
