并发 - redis队列里每天有超过一亿条数据，使用python如何高效的将其写入sql数据库?-PHP中文網路問答

文章專題學習下載問答程式設計字典遊戲最近更新

简体中文(ZH-CN) English(EN) 繁体中文(ZH-TW) 日本語(JA) 한국어(KO) Melayu(MS) Français(FR) Deutsch(DE)

并发 - redis队列里每天有超过一亿条数据，使用python如何高效的将其写入sql数据库?

PHPz 2017-04-17 18:01:11

0

6

794

使用python拉redis队列里的数据，如何确保完整高效不阻塞的把每天上亿条的数据写入mysql/oracle数据库？

PHPz

学习是最好的投资！

全部回覆 (6)

刘奇2017-04-17 18:03:11 6樓

整個就是個隊列+消費隊列的流程。

給個思路系列：

使用monitor指令監聽redis事件，或升級redis版本(>=2.8)，監聽redis改動事件。
多進程/執行緒/協程處理事件(例如放入緩衝區)
緩衝區資料批次插入資料庫。 (mysql似乎最多一次插入5000條，不確定，可能是9999或4999，但是有上限)，依靠SQL資料庫事務功能，失敗即回溯。

侃大山系列：

4.這麼大的資料可以考慮列資料庫，hbase之類。

不負責任系列：

5.似乎有人說mongodb資料量大會就有問題，包括國外國內，以及身邊的人測試過之後的結論

點贊+0

新增回覆

伊谢尔伦2017-04-17 18:03:11 5樓

用的是什麼資料庫，MySQL和SQL Server單機版效能差很多。 SQL Server / Oracle /DB2的效能是一個等級的，開源的MySQL效能不是很好，考慮集群，postgresql要好點
這麼大的資料量要想遷入到資料庫裡，要考慮
1）合適的索引，能大大提高寫入效能。
2）資料庫如果沒有設計主從，那就考慮上RAID或SSD，性能跟普通的機械硬碟差的不是一點半點。
3）採用不同的資料庫引擎，以MySQL為例，InnoDB和MyISAM還是有效能差異。
4）不要每筆記錄都commit，集中commit效能會好10倍以上。
5）讀寫分離，否則你會發現寫入資料阻塞了資料的讀取。

如果每天的資料量都這麼大的話，那SQL就不適合了，考慮上Hadoop + HBase吧。
其實你採用什麼資料庫更多的取決於你的資料格式，有些資料庫對特定格式的資料是比較友善的，例如HDF5對二進位和空間資料就更友善一點

點贊+0

新增回覆

PHPzhong2017-04-17 18:03:11 4樓

這麼大的資料量用mongodb會快一點

點贊+0

新增回覆

伊谢尔伦2017-04-17 18:03:11 3樓

mysql 沒怎麼用過，不過SQL Server 有批次匯入功能一秒輕鬆過萬。
我想Mysql也有批次插入的功能吧，插入過後，後製就要考慮分庫分錶主從這類的了。

點贊+0

新增回覆

迷茫2017-04-17 18:03:11 2樓

每天插1億條資料到mysql。。。分析查詢都是個問題。。不過應該只是歷史數據吧

點贊+0

新增回覆

PHPzhong2017-04-17 18:03:11 1樓

1.【完整】：使用校驗機制。

2.【高效率】：使用批次讀取、大量寫入的方式或專用介面。

3.【不阻塞】：不可能完全不阻塞，只能做到阻塞時間盡量短而無法引起感知。這需要使用任務切分與分時處理兩種機制。甚至還可以引入基於機器學習的效能曲線預估，以及即時負載平衡兩種高階處理辦法。

點贊+0

新增回覆

熱門專題

更多>

熱門文章

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1394833
php入門教程之一週學會PHP

4206548
JAVA 初級入門影片教學

2349315

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板

關於我們免責聲明 Sitemap: PHP中文網：公益線上PHP培訓，幫助PHP學習者快速成長！