hai 2 semanas · 9256c706c7
--- a/db/db.md
+++ b/db/db.md
@@ -1,14 +1,18 @@
 
				 # RaftDB Storage Engine Documentation
			
 
				 
			
 
				-RaftDB 内置了一个高性能、线程安全的嵌入式键值存储引擎。该引擎专为 Raft 状态机设计，经过深度优化，采用 Radix Tree（基数树）作为核心索引结构。
			
 
				+RaftDB 内置了一个高性能、线程安全的嵌入式键值存储引擎。该引擎专为 Raft 状态机设计，经过深度优化，采用 **Radix Tree (基数树)** 作为核心索引结构，并结合了 **倒排索引 (Inverted Index)** 以支持极速全文/模糊检索。
			
 
				 
			
 
				 ## 1. 核心特性
			
 
				 
			
 
				-*   **极速读写 (Blazing Fast)**: 基于 Radix Tree 的内存索引，支持数十万 QPS 的读写。
			
 
				-*   **高级查询 (Advanced Query)**: 支持前缀搜索、范围扫描，以及 `LIMIT/OFFSET` 下推优化。
			
 
				-*   **空间复用 (Disk Reuse)**: 内置 Best-Fit 策略的 FreeList，自动回收磁盘空间。
			
 
				-*   **热点缓存 (Hot Cache)**: 内置 LRU-style 缓存，加速热点数据读取。
			
 
				-*   **全文本支持 (Full Text)**: 基础的倒排索引架构（可扩展）。
			
 
				+*   **极速读写 (Blazing Fast)**: 
			
 
				+    *   **Point Lookup**: ~23万 QPS (Radix Tree 内存索引)。
			
 
				+    *   **Insert/Update**: ~40-56万 QPS (Append-only Log + FreeList)。
			
 
				+*   **高级查询 (Advanced Query)**: 
			
 
				+    *   **Prefix/Range**: 基于 Radix Tree 的结构化扫描，性能随数据量增长极慢 (O(K))。
			
 
				+    *   **Full Text Search**: 针对 `value like` 查询引入倒排索引，性能提升 **20倍**。
			
 
				+    *   **Limit Pushdown**: 查询执行器支持 `LIMIT/OFFSET` 下推，扫描满足即停止。
			
 
				+*   **空间复用 (Disk Reuse)**: 内置 Best-Fit 策略的 FreeList，自动回收磁盘空间，无需手动 Compaction。
			
 
				+*   **热点缓存 (Hot Cache)**: 内置 LRU-style 缓存，减少 Syscall。
			
 
				 
			
 
				 ## 2. 架构设计 (Architecture)
			
 
				 
			
@@ -16,40 +20,40 @@ RaftDB 内置了一个高性能、线程安全的嵌入式键值存储引擎。
 
				 摒弃了传统的 Hash Map + Sharding 方案，采用单体 **Radix Tree**。
			
 
				 *   **优势**: 
			
 
				     *   **有序性**: 天然支持 Key 的字典序遍历，无需排序。
			
 
				-    *   **前缀压缩**: 节省大量内存，特别适合 Key 具有公共前缀的场景（如 `user.1`, `user.2`）。
			
 
				-    *   **范围查询**: `WalkPrefix` 操作复杂度仅为 O(K)，与总数据量无关。
			
 
				+    *   **前缀压缩**: 节省大量内存，特别适合 Key 具有公共前缀的场景。
			
 
				+    *   **范围查询**: `WalkPrefix` 操作复杂度仅为 O(K)。
			
 
				 
			
 
				-### 2.2 存储层 (Storage Layer)
			
 
				+### 2.2 辅助索引: Inverted Index (Memory)
			
 
				+针对 `value like "*token*"` 等模糊查询场景，引擎维护了一个轻量级的倒排索引 (Token -> Keys)。
			
 
				+*   **查询优化**: 当检测到查询包含特定 Token 时，查询规划器会跳过全表扫描，直接通过倒排索引定位 Candidate Keys。
			
 
				+
			
 
				+### 2.3 存储层 (Storage Layer)
			
 
				 *   **Append-only Log**: 数据追加写入，保证崩溃恢复能力。
			
 
				 *   **In-Place Update**: 尝试原地更新（若空间足够），减少碎片。
			
 
				 *   **FreeList**: 维护空闲槽位，优先复用。
			
 
				 *   **Page Cache**: 简单的内存缓存层，减少系统调用。
			
 
				 
			
 
				-### 2.3 查询引擎 (Query Engine)
			
 
				-*   **Early Termination**: 支持 `LIMIT` 下推。一旦扫描满足数量，立即停止 IO 和遍历。
			
 
				-*   **Lazy Loading**: 仅在必要时（如过滤 Value 或返回结果）才从磁盘读取 Value。
			
 
				-
			
 
				 ## 3. 性能测试报告 (Benchmark Report)
			
 
				 
			
 
				 测试环境: macOS, 10 并发 Workers, 本地磁盘 IO。
			
 
				 
			
 
				 ### 3.1 综合吞吐量 (Throughput)
			
 
				 
			
 
				-| 操作类型 | 数量 | 耗时 | QPS (Ops/sec) | 提升幅度 (vs Hash版) |
			
 
				+| 操作类型 | 数量 | 耗时 | QPS (Ops/sec) | 说明 |
			
 
				 | :--- | :--- | :--- | :--- | :--- |
			
 
				-| **Insert** | 100,000 | ~0.23s | **~436,000** | **9x** |
			
 
				-| **Update** | 10,000 | ~0.04s | **~250,000** | **2.5x** |
			
 
				-| **Insert (Reuse)** | 5,000 | ~0.01s | **~471,000** | **25x** |
			
 
				-| **Delete** | 10,000 | ~0.03s | **~382,000** | 持平 |
			
 
				+| **Insert** | 100,000 | ~0.25s | **~399,000** | 写入性能极强 |
			
 
				+| **Insert (Reuse)** | 5,000 | ~0.01s | **~560,000** | 空间复用路径极快 |
			
 
				+| **Update** | 10,000 | ~0.04s | **~252,000** | 原地更新优化生效 |
			
 
				+| **Delete** | 10,000 | ~0.02s | **~420,000** | 标记删除 |
			
 
				 
			
 
				 ### 3.2 查询性能 (Query Performance)
			
 
				 
			
 
				-| 查询类型 | QPS (Ops/sec) | 说明 |
			
 
				-| :--- | :--- | :--- |
			
 
				-| **Point Lookup** | **~238,000** | 精确查询 `key="..."`。受限于 Radix 深度，略低于 Hash 但依然极快。 |
			
 
				-| **Meta Query** | **~80,000** | 前缀查询 `key like "prefix*"`。利用 Radix Tree 极速定位子树。**提升 33 倍**。 |
			
 
				-| **Limit Query** | **~290,000** | 分页查询 `LIMIT 10`。利用 Early Termination 立即返回。 |
			
 
				-| **Full Query** | ~26 | 全表扫描 `value like "*..."`。受限于单线程 IO 扫描 (优化空间所在)。 |
			
 
				+| 查询类型 | QPS (Ops/sec) | 提升幅度 | 说明 |
			
 
				+| :--- | :--- | :--- | :--- |
			
 
				+| **Point Lookup** | **~228,000** | - | 基准性能，极快。 |
			
 
				+| **Meta Query** | **~78,000** | **2x (vs SkipList)** | 前缀查询 `key like "prefix*"`。Radix Tree 核心优势。 |
			
 
				+| **Limit Query** | **~287,000** | **1.6x (vs SkipList)** | `LIMIT` 下推优化，扫描极少数据即返回。 |
			
 
				+| **Full Scan (Val)**| **~581** | **21.5x (vs Scan)** | **倒排索引生效**。从全表 IO 扫描变为内存索引查找。 |
			
 
				 
			
 
				 ## 4. 使用说明
			
 
				 
			
@@ -63,16 +67,14 @@ if err != nil { panic(err) }
 
				 defer e.Close()
			
 
				 ```
			
 
				 
			
 
				-### 4.2 查询与分页
			
 
				+### 4.2 查询示例
			
 
				 
			
 
				 ```go
			
 
				-// 极速前缀分页查询
			
 
				-// 引擎会自动识别 "user.*" 前缀，在 Radix Tree 上定位，并只扫描前 20 条
			
 
				+// 1. 极速前缀分页
			
 
				+// 引擎在 Radix Tree 上定位 "user." 子树，扫描前 20 条即停止
			
 
				 results, _ := e.Query(`key like "user.*" LIMIT 20`)
			
 
				-```
			
 
				 
			
 
				-## 5. 优化路线图 (Roadmap)
			
 
				-
			
 
				-目前的版本在 Key 操作上已经达到了极致。下一步的优化方向：
			
 
				-1.  **并发 Radix Tree**: 引入 `ART` (Adaptive Radix Tree) 或实现并发安全的 Radix Tree (CoW 或 Fine-grained locks) 以支持更高的并发读。
			
 
				-2.  **全文索引集成**: 将 `FullTextIndex` 深度集成到 `Query` 流程中，解决 `value like` 查询慢的问题。
			
 
				+// 2. 高性能全文检索
			
 
				+// 引擎利用倒排索引直接定位包含 "error" 的记录，无需扫描全表
			
 
				+results, _ := e.Query(`value like "*error*"`)
			
 
				+```
			
--- a/db/engine.go
+++ b/db/engine.go
@@ -1072,7 +1072,13 @@ func (e *Engine) Query(sql string) ([]QueryResult, error) {
 
				 				Value:       valStr,
			
 
				 				CommitIndex: entry.CommitIndex,
			
 
				 			})
			
 
				-			if limit > 0 && offset == 0 && len(results) >= limit {
			
 
				+			// Optimization: Early termination for LIMIT
			
 
				+			// Current Logic: Only optimizes if offset == 0
			
 
				+			// Improvement: Optimize for Offset too.
			
 
				+			// If we have collected enough results (Limit + Offset), we can stop.
			
 
				+			// Radix Walk is ordered.
			
 
				+			needed := limit + offset
			
 
				+			if limit > 0 && len(results) >= needed {
			
 
				 				mu.Unlock()
			
 
				 				return false
			
 
				 			}
			
--- a/example/database/benchmark.go
+++ b/example/database/benchmark.go
@@ -225,7 +225,7 @@ func main() {
 
				 	printStats("Query(Meta)", qMetaCount, duration, qps, 0)
			
 
				 
			
 
				 	// 5.3 Query with Pagination (LIMIT/OFFSET)
			
 
				-	// We use the same Meta query but with LIMIT 10 to test pagination speedup
			
 
				+	// We use the same Meta query but with LIMIT 10 OFFSET 20 to test pagination speedup
			
 
				 	start = time.Now()
			
 
				 	qPageCount := 50000
			
 
				 	var pageHits int64
			
@@ -238,10 +238,8 @@ func main() {
 
				 		go func() {
			
 
				 			defer wg.Done()
			
 
				 			for i := 0; i < chunkSize; i++ {
			
 
				-				// Query with LIMIT 10.
			
 
				-				// Note: Currently Engine scans fully then truncates. 
			
 
				-				// Optimization would be to push down Limit, but Sharding makes it hard.
			
 
				-				res, _ := e.Query(`key like "bench.key.999*" LIMIT 10`)
			
 
				+				// Query with LIMIT 10 OFFSET 20
			
 
				+				res, _ := e.Query(`key like "bench.key.999*" LIMIT 10 OFFSET 20`)
			
 
				 				atomic.AddInt64(&pageHits, int64(len(res)))
			
 
				 			}
			
 
				 		}()
			
@@ -249,7 +247,7 @@ func main() {
 
				 	wg.Wait()
			
 
				 	duration = time.Since(start)
			
 
				 	qps = float64(qPageCount) / duration.Seconds()
			
 
				-	printStats("Query(Limit10)", qPageCount, duration, qps, 0)
			
 
				+	printStats("Query(Lim10Off20)", qPageCount, duration, qps, 0)
			
 
				 
			
 
				 	// 5.4 Query Value (Needs IO)
			
 
				 	start = time.Now()