iotdb How to load history data to IoTDB without impacting query history（历史数据导入会导致IoTDB查询变慢）

当进行大量的历史数据导入时（TB级），IoTDB会出现明显的查询变慢问题，同时CPU的使用率明显上升。以目前我们的使用场景为例，导入80000个测点两年以上的历史数据，数据量大概在7-8TB。导入前，IoTDB中测点最新值查询耗时在10ms以下，在导入历史数据的过程中发现：同样的最新值查询竟花费了9秒，对应用的数据查询体验造成了较大影响。希望IoTDB团队优化历史数据导入处理流程，降低对查询的影响。此外，希望能给出历史数据导入过程的制约因素，指导用户进行数据库参数配置或者硬件资源的升级。

Mar 23 '22 02:03 PaulFungcn

是导入过程中变慢，还是导入完成后依然慢？

Mar 23 '22 11:03 jixuan1989

导入过程和导入完成后都会变慢

Apr 01 '22 01:04 PaulFungcn

多谢反馈，

能否给一下机器配置（IoTDB可用内存大小）。
另，目前iotdb的历史数据导入，在某些Schema建模下，会把数据都写入乱序区（data目录下的unsequence），有可能会影响查询效率。
有不便公开的信息的话，可以加一下微信 tietouqiao，备注 github issue 5321

Apr 11 '22 14:04 jixuan1989

您好，黄老师，机器配置：CPU ：16核，内存：32GB。好的。

在 2022-04-11 22:09:46，"Xiangdong Huang" @.***> 写道：

多谢反馈，

能否给一下机器配置（IoTDB可用内存大小）。另，目前iotdb的历史数据导入，在某些Schema建模下，会把数据都写入乱序区（data目录下的unsequence），有可能会影响查询效率。有不便公开的信息的话，可以加一下微信 tietouqiao，备注 github issue 5321

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

Apr 13 '22 15:04 PaulFungcn

在 0.13.0 及以前的版本，

假如当前写入的 IoTDB 是 A，可以将历史数据导入到另一个 IoTDB B（B 放在另一台服务器），导入完 B 会自动处理乱序数据，等 B 将乱序数据合并完之后（data/data/unsequence 文件夹为空或数据很少之后），再把 B 里的 TsFile 导入到 A 中，用 TsFile Load 工具导入（https://github.com/apache/iotdb/blob/master/docs/zh/UserGuide/Write-And-Delete-Data/Load-External-Tsfile.md ），对 A 的影响最小。

Load 工具的资源占用比程序写入数据低很多。

Apr 16 '22 06:04 qiaojialin

收到，谢谢乔博！

在 2022-04-16 14:59:37，"Jialin Qiao" @.***> 写道：

在 0.13.0 及以前的版本，

假如当前写入的 IoTDB 是 A，可以将历史数据导入到另一个 IoTDB B（B 放在另一台服务器），导入完 B 会自动处理乱序数据，等 B 将乱序数据合并完之后（data/data/unsequence 文件夹为空或数据很少之后），再把 B 里的 TsFile 导入到 A 中，用 TsFile Load 工具导入（https://github.com/apache/iotdb/blob/master/docs/zh/UserGuide/Write-And-Delete-Data/Load-External-Tsfile.md），对 A 的影响最小。

Load 工具的资源占用比程序写入数据低很多。

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

Apr 18 '22 03:04 PaulFungcn

黄老师，导入过程和导入完成后一段时间内都会慢。

在 2022-03-23 19:49:22，"Xiangdong Huang" @.***> 写道：

是导入过程中变慢，还是导入完成后依然慢？

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

Oct 11 '22 07:10 PaulFungcn