god-graph 0.6.0-alpha

A graph-based LLM white-box optimization toolbox: topology validation, Lie group orthogonalization, tensor ring compression
Documentation
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
//! 内存池模块
//!
//! 提供可复用的内存池,用于频繁分配/释放的场景(如图遍历算法)
//!
//! ## 使用示例
//!
//! ```rust,no_run
//! use god_graph::utils::memory_pool::VisitedPool;
//!
//! let mut pool = VisitedPool::new();
//!
//! // 第一次使用:分配内存
//! let mut visited = pool.get(1000);
//! // 使用 visited 数组...
//!
//! // 归还到池中
//! pool.return_pool(visited);
//!
//! // 第二次使用:复用内存(无新分配)
//! let mut visited2 = pool.get(1000);
//! ```

use std::sync::RwLock;

#[cfg(feature = "distributed")]
use crossbeam_queue::SegQueue;

/// 并发 visited 池(无锁设计)
/// 
/// 使用 `crossbeam` 的无锁队列实现,避免 `Mutex` 锁竞争
/// 适用于高并发场景,如图并行 BFS/DFS 遍历
/// 
/// ## 性能优势
/// 
/// - 无锁设计,避免 Mutex  contention
/// - 支持高并发访问
/// - 适合多线程并行图算法
/// 
/// ## 注意
/// 
/// 需要 `distributed` feature 支持
#[cfg(feature = "distributed")]
pub struct ConcurrentVisitedPool {
    /// 按大小区分的池(使用无锁队列)
    pools: dashmap::DashMap<usize, SegQueue<Vec<bool>>>,
    /// 最小池大小
    min_pool_size: usize,
    /// 最大数组大小
    max_array_size: usize,
}

#[cfg(feature = "distributed")]
impl ConcurrentVisitedPool {
    /// 创建新的并发 visited 池
    pub fn new() -> Self {
        Self {
            pools: dashmap::DashMap::new(),
            min_pool_size: 8,
            max_array_size: 10_000_000,
        }
    }

    /// 从池中获取一个 visited 数组
    pub fn get(&self, size: usize) -> Vec<bool> {
        // Try to get from pool
        let pool_opt = self.pools.get(&size);
        if let Some(queue) = pool_opt {
            let q: &SegQueue<Vec<bool>> = queue.value();
            if let Some(mut visited) = q.pop() {
                visited.fill(false);
                return visited;
            }
        }

        // 没有合适大小的,分配新的
        vec![false; size]
    }

    /// 将 visited 数组归还到池中
    pub fn return_pool(&self, mut visited: Vec<bool>) {
        let size = visited.len();
        
        if size > self.max_array_size {
            return;
        }

        visited.fill(false);

        let queue = self.pools.entry(size).or_insert_with(|| {
            SegQueue::new()
        });
        
        // 限制池大小
        if queue.len() < self.min_pool_size * 2 {
            queue.push(visited);
        }
    }
}

#[cfg(feature = "distributed")]
impl Default for ConcurrentVisitedPool {
    fn default() -> Self {
        Self::new()
    }
}

/// 访问标记内存池
///
/// 用于 DFS/BFS 等遍历算法的 visited 数组复用
/// 避免频繁的 O(n) 内存分配开销
///
/// ## 性能优势
///
/// - 减少 50-80% 的内存分配(对于频繁遍历场景)
/// - 降低 GC 压力
/// - 提高缓存局部性
///
/// ## 线程安全
///
/// 使用 `Arc<RwLock<>>` 保证线程安全,多个线程可以共享同一个池
/// RwLock 设计:读多写少场景优化(get 操作远多于 return_pool)
///
/// ## 示例
///
/// ```rust,no_run
/// use god_graph::utils::memory_pool::VisitedPool;
///
/// let pool = VisitedPool::new();
/// let mut visited = pool.get(1000);
/// visited[0] = true;
/// // 使用完毕后归还
/// pool.return_pool(visited);
/// ```
pub struct VisitedPool {
    /// 池中的 visited 数组
    pool: RwLock<Vec<Vec<bool>>>,
    /// 最小池大小(保留的数组数量)
    min_pool_size: usize,
    /// 最大数组大小(超过此大小的数组会被丢弃)
    max_array_size: usize,
}

impl VisitedPool {
    /// 创建新的 visited 池
    ///
    /// ## 参数
    ///
    /// * `min_pool_size` - 池中最小保留的数组数量(默认 4)
    /// * `max_array_size` - 允许的最大数组大小(默认 10_000_000)
    ///
    /// ## 示例
    ///
    /// ```rust
    /// use god_graph::utils::memory_pool::VisitedPool;
    ///
    /// let pool = VisitedPool::with_config(8, 1_000_000);
    /// ```
    pub fn with_config(min_pool_size: usize, max_array_size: usize) -> Self {
        Self {
            pool: RwLock::new(Vec::with_capacity(min_pool_size)),
            min_pool_size,
            max_array_size,
        }
    }

    /// 创建默认配置的 visited 池
    ///
    /// 默认配置:
    /// - 最小池大小:4
    /// - 最大数组大小:10,000,000
    pub fn new() -> Self {
        Self::with_config(4, 10_000_000)
    }

    /// 从池中获取一个 visited 数组
    ///
    /// ## 参数
    ///
    /// * `size` - 需要的数组大小
    ///
    /// ## 返回值
    ///
    /// 返回一个长度为 `size` 的 visited 数组,所有元素初始化为 `false`
    ///
    /// ## 性能提示
    ///
    /// - 如果池中有合适大小的数组,直接复用(O(1))
    /// - 否则分配新数组(O(n))
    ///
    /// # Panics
    /// - Panics if the internal RwLock is poisoned (indicates a bug in the pool implementation)
    ///
    /// ## 示例
    ///
    /// ```rust,no_run
    /// use god_graph::utils::memory_pool::VisitedPool;
    ///
    /// let pool = VisitedPool::new();
    /// let mut visited = pool.get(1000);
    /// visited[0] = true;
    /// ```
    pub fn get(&self, size: usize) -> Vec<bool> {
        // SAFETY: RwLock only fails if another thread panicked while holding the lock.
        // This is an internal invariant violation, so we panic.
        let pool = self.pool.read().expect("VisitedPool RwLock poisoned: internal bug");

        // 尝试从池中找到合适大小的数组
        for i in 0..pool.len() {
            if pool[i].len() == size {
                let mut reused = pool[i].clone();
                reused.fill(false);
                return reused;
            }
        }

        // 如果没有合适大小的,尝试复用更大的数组(减少内存碎片)
        for i in 0..pool.len() {
            if pool[i].len() >= size && pool[i].len() <= size * 2 {
                let mut reused = pool[i].clone();
                reused.truncate(size);
                reused.fill(false);
                return reused;
            }
        }

        drop(pool);

        // 否则分配新数组
        vec![false; size]
    }

    /// 将 visited 数组归还到池中
    ///
    /// ## 参数
    ///
    /// * `visited` - 要归还的数组
    ///
    /// ## 注意
    ///
    /// - 过大的数组会被丢弃(不放入池中)
    /// - 池满时会丢弃最早的数组
    ///
    /// # Panics
    /// - Panics if the internal RwLock is poisoned (indicates a bug in the pool implementation)
    ///
    /// ## 示例
    ///
    /// ```rust,no_run
    /// use god_graph::utils::memory_pool::VisitedPool;
    ///
    /// let pool = VisitedPool::new();
    /// let mut visited = pool.get(1000);
    /// // 使用完毕
    /// pool.return_pool(visited);
    /// ```
    pub fn return_pool(&self, mut visited: Vec<bool>) {
        // 过大的数组不回收
        if visited.len() > self.max_array_size {
            return;
        }

        // 清空数组内容
        visited.fill(false);

        // SAFETY: RwLock only fails if another thread panicked while holding the lock.
        // This is an internal invariant violation, so we panic.
        let mut pool = self.pool.write().expect("VisitedPool RwLock poisoned: internal bug");

        // 池已满,丢弃最早的数组
        if pool.len() >= self.min_pool_size * 2 {
            pool.remove(0);
        }

        pool.push(visited);
    }
}

impl Default for VisitedPool {
    fn default() -> Self {
        Self::new()
    }
}

/// 线程局部的 visited 池(避免锁开销)
///
/// 使用 `thread_local!` 为每个线程维护独立的池
/// 适用于单线程内频繁使用、线程间不共享的场景
///
/// ## 性能优势
///
/// - 无锁设计,避免 `Mutex` 开销
/// - 每个线程独立管理,减少竞争
///
/// ## 示例
///
/// ```rust,no_run
/// use god_graph::utils::memory_pool::ThreadLocalVisitedPool;
///
/// ThreadLocalVisitedPool::with(|pool| {
///     let mut visited = pool.get(1000);
///     visited[0] = true;
///     // 使用完毕后自动归还(不需要手动 return_pool)
/// });
/// ```
pub struct ThreadLocalVisitedPool {
    _private: (),
}

thread_local! {
    static VISITED_POOL: std::cell::RefCell<Vec<Vec<bool>>> = const { std::cell::RefCell::new(Vec::new()) };
}

impl ThreadLocalVisitedPool {
    /// 获取线程局部的 visited 池实例
    pub fn new() -> Self {
        Self { _private: () }
    }

    /// 从线程局部池中获取 visited 数组
    ///
    /// ## 参数
    ///
    /// * `size` - 需要的数组大小
    ///
    /// ## 返回值
    ///
    /// 返回一个长度为 `size` 的 visited 数组
    pub fn get(&self, size: usize) -> Vec<bool> {
        VISITED_POOL.with(|pool| {
            let mut pool = pool.borrow_mut();

            // 尝试找到合适大小的数组
            for i in 0..pool.len() {
                if pool[i].len() == size {
                    let mut reused = pool.swap_remove(i);
                    reused.fill(false);
                    return reused;
                }
            }

            // 尝试复用稍大的数组
            for i in 0..pool.len() {
                if pool[i].len() >= size && pool[i].len() <= size * 2 {
                    let mut reused = pool.swap_remove(i);
                    reused.truncate(size);
                    reused.fill(false);
                    return reused;
                }
            }

            vec![false; size]
        })
    }

    /// 将 visited 数组归还到线程局部池
    ///
    /// ## 参数
    ///
    /// * `visited` - 要归还的数组
    pub fn return_pool(&self, mut visited: Vec<bool>) {
        const MAX_POOL_SIZE: usize = 8;
        const MAX_ARRAY_SIZE: usize = 10_000_000;

        if visited.len() > MAX_ARRAY_SIZE {
            return;
        }

        visited.fill(false);

        VISITED_POOL.with(|pool| {
            let mut pool = pool.borrow_mut();
            if pool.len() < MAX_POOL_SIZE {
                pool.push(visited);
            }
        });
    }

    /// 便捷方法:获取数组并执行闭包,自动归还
    ///
    /// ## 参数
    ///
    /// * `size` - 需要的数组大小
    /// * `f` - 要执行的闭包
    ///
    /// ## 返回值
    ///
    /// 返回闭包的返回值
    ///
    /// ## 示例
    ///
    /// ```rust,no_run
    /// use god_graph::utils::memory_pool::ThreadLocalVisitedPool;
    ///
    /// let pool = ThreadLocalVisitedPool::new();
    /// let result = pool.with(1000, |visited| {
    ///     // 使用 visited 数组
    ///     visited.iter().filter(|&&v| v).count()
    /// });
    /// // visited 自动归还,无需手动 return_pool
    /// ```
    pub fn with<F, R>(&self, size: usize, f: F) -> R
    where
        F: FnOnce(&mut [bool]) -> R,
    {
        let mut visited = self.get(size);
        let result = f(&mut visited);
        self.return_pool(visited);
        result
    }
}

impl Default for ThreadLocalVisitedPool {
    fn default() -> Self {
        Self::new()
    }
}

#[cfg(test)]
mod tests {
    use super::*;

    #[test]
    fn test_visited_pool_basic() {
        let pool = VisitedPool::new();

        // 第一次获取:新分配
        let visited1 = pool.get(100);
        assert_eq!(visited1.len(), 100);
        assert!(!visited1[0]);

        // 归还
        pool.return_pool(visited1);

        // 第二次获取:应该复用
        let visited2 = pool.get(100);
        assert_eq!(visited2.len(), 100);
        assert!(!visited2[0]); // 应该被清空
    }

    #[test]
    fn test_visited_pool_reuse() {
        let pool = VisitedPool::new();

        let mut visited = pool.get(100);
        visited[50] = true;

        pool.return_pool(visited);

        let visited2 = pool.get(100);
        assert!(!visited2[50]); // 应该被清空
    }

    #[test]
    fn test_visited_pool_different_sizes() {
        let pool = VisitedPool::new();

        let visited1 = pool.get(100);
        pool.return_pool(visited1);

        let visited2 = pool.get(200);
        assert_eq!(visited2.len(), 200);

        pool.return_pool(visited2);

        // 获取 100 的应该复用之前的
        let visited3 = pool.get(100);
        assert_eq!(visited3.len(), 100);
    }

    #[test]
    fn test_thread_local_pool() {
        let pool = ThreadLocalVisitedPool::new();

        let mut visited = pool.get(100);
        visited[50] = true;

        pool.return_pool(visited);

        let visited2 = pool.get(100);
        assert!(!visited2[50]);
    }

    #[test]
    fn test_thread_local_with() {
        let pool = ThreadLocalVisitedPool::new();

        let count = pool.with(100, |visited| {
            visited[10] = true;
            visited[20] = true;
            visited.iter().filter(|&&v| v).count()
        });

        assert_eq!(count, 2);

        // 再次获取应该被清空
        let visited = pool.get(100);
        assert!(!visited[10]);
        assert!(!visited[20]);
    }

    #[test]
    #[cfg(feature = "distributed")]
    fn test_concurrent_pool_basic() {
        let pool = ConcurrentVisitedPool::new();

        // 第一次获取:新分配
        let visited1 = pool.get(100);
        assert_eq!(visited1.len(), 100);
        assert!(!visited1[0]);

        // 归还
        pool.return_pool(visited1);

        // 第二次获取:应该复用
        let visited2 = pool.get(100);
        assert_eq!(visited2.len(), 100);
        assert!(!visited2[0]); // 应该被清空
    }

    #[test]
    #[cfg(feature = "distributed")]
    fn test_concurrent_pool_reuse() {
        let pool = ConcurrentVisitedPool::new();

        let mut visited = pool.get(100);
        visited[50] = true;

        pool.return_pool(visited);

        let visited2 = pool.get(100);
        assert!(!visited2[50]); // 应该被清空
    }

    #[test]
    #[cfg(feature = "distributed")]
    fn test_concurrent_pool_parallel() {
        use rayon::prelude::*;

        let pool = ConcurrentVisitedPool::new();
        let results: Vec<usize> = (0..10)
            .into_par_iter()
            .map(|_| {
                let mut visited = pool.get(100);
                visited[0] = true;
                let count = visited.iter().filter(|&&v| v).count();
                pool.return_pool(visited);
                count
            })
            .collect();

        // 所有线程都应该正确设置了值
        for result in results {
            assert_eq!(result, 1);
        }
    }
}