使用mysql处理非常大的数据

MysqL可以合理地对数十亿行执行查询吗？-MysqL可以“处理”数十亿行。“合理地”取决于查询；让我们看看他们。

InnoDB（MysqL 5.5.8）是数十亿行的正确选择吗？-5.7进行了一些改进，但是5.5很好，尽管它 ~~已经有6年~~ 8年历史了，并且几乎不再受到支持。

数十亿行的最佳数据存储-如果您指的是“ Engine”，则为InnoDB。

在性能开始下降之前，MysqL 数据库能达到多大？再次，这取决于查询。我可以向您展示一个将崩溃的1K行表。我已经处理了十亿行表格。

为什么使用大表的MysqL可能会变慢？-范围扫描导致I / O，这是最慢的部分。

MysqL可以处理将容纳约3亿条记录的表吗？-再说一次。限制大约在一万亿行。

（对于我的情况是innoDB表）增加innodb_buffer_pool_size（例如，最多80％的RAM）。另外，我在percona博客中找到了其他一些MysqL 性能调整设置-是的

在表上有适当的索引（对查询使用EXPLAN）-好，让我们来看一下。在此关键区域中可能会犯很多错误。

分区表-“分区不是万能的！” 我在 我的博客中 竖琴 __

MysqL分片-目前是DIY

MysqL集群-当前最好的答案是一些基于Galera的选项（PXC，MariaDB 10，带有Oracle的DIY）。Oracle的“组复制”是一个可行的竞争者。

分区不支持FOREIGN KEY或“全局” UNIQUE。

您所谈论的UUID不仅会减慢系统速度，而且实际上会杀死它。 类型1 UUID 可能是一种@R_502_1911@。

插入和建立索引的速度-太多的变化无法给出一个答案。让我们看看您的初步想法CREATE TABLE以及打算如何输入数据。

许多联接-“规范化，但不要过度规范化”。特别是，请勿标准化日期时间或浮点数或其他“连续”值。

做 汇总表

每天230万笔交易-如果那是230万次插入（30 /秒），则不会有太大的性能问题。如果更复杂，则可能需要RAID，SSD，批处理等。

处理这样的数据量-如果大多数活动都与“最近”的行有关，则buffer_pool将很好地“缓存”该活动，从而避免了I / O。如果活动是“随机的”，则MysqL（或 其他任何 人）将遇到I / O问题。

缩小数据类型有助于像您这样的表。我怀疑您是否需要4个字节来指定fuel_type。有多种1字节方法。

MySQL 2022/1/1 18:15:45 有477人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

使用mysql处理非常大的数据

撰写回答

推荐问题

Greasemonkey 1.0中的jQuery与使用jQuery的网站冲突

如何使用JSON-LD标记面包屑列表中的最后一个非链接项目

如何在Spring MVC中使用AJAX渲染视图

使用动态where子句休眠

如何使用jQuery访问父窗口对象？

使用Curl和PHP使会话保持活动状态

如何建立一个动态查询，该查询增加了迄今为止的天数，并使用标准API比较该日期与另一个日期？

使用LESS构建选择器列表

如何使用CSS将跨度更改为类似pre？

在mysql sproc中使用变量作为表名

如何使用C＃获取两个DateTime对象之间的时差？

我可以在php中的SESSION数组上使用array_push吗？

Django-如何使用South重命名模型字段？

使用Spring Functional Web Framework的REST端点的背压

使用GhostDriver时如何设置屏幕/窗口大小

如何使用最新版本的jQuery并在RichFaces中为jQuery取回“ $”？

我可以使用BeautifulSoup删除脚本标签吗？

多态对象的JSON使用者

我如何重新连接使用selenium的webdriver打开的浏览器？

如何使用Servlet和Ajax？

分类汇总

您的鼓励是对我最大的支持