已解决,感谢Konstantin V. Salikhov。
每次elasticsearch服务启动时,它都会使用提供给_river的SQL查询数据库并获取数据(请参见前面的“查询oracle和索引数据:”)。如果数据中没有“ _id”列,则_river无法确定其已加载了哪些记录,并且每次都重复数据。为了避免重复,我在数据库中编辑了我的“ all_specimens_data”表(实际上是避免修改数据库的视图),并将“ O_OCCURRENCEID”重命名为“ _id”,“ O_OCCURRENCEID”是我的主键UUID。
希望这对其他人有帮助