文章詳情頁

sharding - 數據庫分庫切表后Java后端代碼實現以及最佳實踐

瀏覽：120日期：2023-10-30 14:46:42

問題描述

現在業務中由于一些表越來越大，read的時候壓力很大（write的需求比較小），所以在數據庫端決定把一些數據量特別大的表切表，但是在后端代碼中有很多代碼／query需要做join這些表，請問這樣的情況下大家是怎么樣解決的？

比如我們現在有 SampleTable 有大概1億條數據，我們根據邏輯切成了大概16個不同的表：SampleTable 1,SampleTable2...SampleTable31,以前代碼中有query 類似于:

select * from SampleTable join test_table

現在需要執行這樣的query 多次然后把數據聚合起來做為返回結果嗎?

select * from SampleTable1 join test_table

有沒有更好的方法或者library推薦?有沒有什么beset practice或者sample code？

如果之后我們要多個表拆分到不同的database server上,是否在后端代碼得加上不同db 的數據庫連接?

數據庫Sharding的基本思想和切分策略這篇文章更多的是數據庫切分的策略,是否有人能提供下實際的項目code sample?Database sharding and JPAwhat-to-do-instead-of-sql-joins-while-scaling-horizontally

stackoverflow 上的一些答案

問題解答

回答1：

可以考慮引入數據庫中間件sharding-jdbc client級別mycat-server server級別

回答2：

朋友介紹 Spark 不錯，支持 SQl 式的查詢，1 億條數據 0.5 秒左右返回結果

回答3：

只針對目前我們項目中的情況：在分表時根據hash算法落到特定表，然后取的時候先根據算法獲取數據的分布位置，然后就是正常的select了

回答4：

不建議連表查詢1.數據庫資源比較寶貴，連表查詢會占用大量的內存，導致數據庫性能下降2.不支持數據在多個數據庫實例，分庫情況無法處理，擴展性較差

通用做法是將連表查詢，查分成多個單表查詢，然后將結果在應用中匯總。1.能夠上述連表查詢的問題2.多次查詢也可以在程序中對每一次查詢的中間結果做處理，這是一個靈活性。3.應用也可以隨時擴展，更加靈活

如果是離線場景，建議使用MR(mapreduce)框架來處理，例如：hadoop等，相應的，需要將數據寫入到hdfs上。

回答5：

http://blog.csdn.net/tianyale...詳解分庫分表

java

上一條：java - idea git update project 里面的參數是什么意思下一條：java - 關于設計模式的選擇

相關文章：

1. 數據庫 - mysql中有沒查看數據大小的函數??2. 老師我是一個沒有學過php語言的準畢業生我希望您能幫我一下3. PHP單例模式4. nginx 504 Gateway Time-out 請問如何設置5. python - flask _sqlalchemy 能否用中文作為索引條件6. 導入數據庫不成功7. Thinkphp 下載地址找不到了？8. mysql如何配置遠程php外網鏈接數據庫9. index.php錯誤，求指點10. mysql如何判斷數據不存在則插入呢？

排行榜

					
					angular.js - 下圖的函數有什么作用？
macos - mac下docker如何設置代理
index.php錯誤，求指點
javascript - web網頁版app返回上一頁按鈕在ios設備失效怎么辦？安卓上可以，代碼如下，請大神幫助，萬分感謝。
node.js - vue express 前后端分離 登錄驗證 與 權限控制問題
angular.js - 全站用的angular，但是像下面描述的這樣強交互的功能用angular該用什么思路去做呢？
android - Apk 中找不到r類文件
PHP單例模式
java - idea創建多modules項目后，tomcat啟動失敗
angular.js - Angular為什么我的版本換了下就不能用了呢？
android百度地圖定位問題
				

熱門標簽

久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

sharding - 數據庫分庫切表后Java后端代碼實現以及最佳實踐