Apache Fluo 是 Google Percolator(搜索索引)的開源實現,允許用戶對存儲在 Apache Accumulo 中的大型數據集進行增量更新,而無需重新處理所有的數據。與批處理和流處理框架不同的是,Fluo 提供了更低的延遲,並且可以在極大的數據集上運行。

在將新數據與現有數據相結合時,與批處理框架(例如 Spark,MapReduce)相比,Fluo 可明顯減少延遲。其增量更新是使用事務實現的,允許數千個更新同時發生而不會破壞數據。
Fluo 已於 2017 年 7 月孵化成功,畢業成為 Apache 頂級項目。
閱讀更多 HELLO開源 的文章