zipora 3.1.5 - Docs.rs

use std::time::Instant;
use zipora::containers::specialized::ValVec32;

fn main() {
    println!("=== ValVec32 Performance Benchmark (Post-Optimization) ===\n");
    
    // Test various sizes to show scaling behavior
    let sizes = [100, 1_000, 10_000, 100_000, 1_000_000];
    
    for &size in &sizes {
        println!("Testing size: {}", size);
        
        // Warm up allocator
        let _ = Vec::<u64>::with_capacity(size as usize);
        let _ = ValVec32::<u64>::with_capacity(size).unwrap();
        
        // Test push performance with pre-reserved capacity
        let start = Instant::now();
        let mut valvec = ValVec32::with_capacity(size).unwrap();
        for i in 0..size {
            valvec.push(i as u64).unwrap();
        }
        let valvec_push_time = start.elapsed();
        
        let start = Instant::now();
        let mut stdvec = Vec::with_capacity(size as usize);
        for i in 0..size {
            stdvec.push(i as u64);
        }
        let stdvec_push_time = start.elapsed();
        
        // Test push performance without pre-reservation (growth test)
        let start = Instant::now();
        let mut valvec_grow = ValVec32::new();
        for i in 0..size {
            valvec_grow.push(i as u64).unwrap();
        }
        let valvec_grow_time = start.elapsed();
        
        let start = Instant::now();
        let mut stdvec_grow = Vec::new();
        for i in 0..size {
            stdvec_grow.push(i as u64);
        }
        let stdvec_grow_time = start.elapsed();
        
        // Test iteration performance
        let start = Instant::now();
        let sum: u64 = valvec.iter().sum();
        let valvec_iter_time = start.elapsed();
        
        let start = Instant::now();
        let sum2: u64 = stdvec.iter().sum();
        let stdvec_iter_time = start.elapsed();
        
        // Test bulk extend performance
        let test_slice: Vec<u64> = (0..1000).collect();
        
        let start = Instant::now();
        let mut valvec_bulk = ValVec32::new();
        valvec_bulk.extend_from_slice(&test_slice).unwrap();
        let valvec_extend_time = start.elapsed();
        
        let start = Instant::now();
        let mut stdvec_bulk = Vec::new();
        stdvec_bulk.extend_from_slice(&test_slice);
        let stdvec_extend_time = start.elapsed();
        
        // Results
        println!("  Push (pre-allocated):");
        println!(
            "    ValVec32: {:?}, std::Vec: {:?} (ratio: {:.2}x)",
            valvec_push_time,
            stdvec_push_time,
            valvec_push_time.as_secs_f64() / stdvec_push_time.as_secs_f64()
        );
        
        println!("  Push (with growth):");
        println!(
            "    ValVec32: {:?}, std::Vec: {:?} (ratio: {:.2}x)",
            valvec_grow_time,
            stdvec_grow_time,
            valvec_grow_time.as_secs_f64() / stdvec_grow_time.as_secs_f64()
        );
        
        println!("  Iteration:");
        println!(
            "    ValVec32: {:?}, std::Vec: {:?} (ratio: {:.2}x)",
            valvec_iter_time,
            stdvec_iter_time,
            valvec_iter_time.as_secs_f64() / stdvec_iter_time.as_secs_f64()
        );
        
        println!("  Bulk extend (1000 elements):");
        println!(
            "    ValVec32: {:?}, std::Vec: {:?} (ratio: {:.2}x)",
            valvec_extend_time,
            stdvec_extend_time,
            valvec_extend_time.as_secs_f64() / stdvec_extend_time.as_secs_f64()
        );
        
        assert_eq!(sum, sum2);
        println!();
    }
    
    // Memory efficiency comparison
    println!("=== Memory Efficiency ===");
    println!("std::Vec<u64> struct size: {} bytes", std::mem::size_of::<Vec<u64>>());
    println!("ValVec32<u64> struct size: {} bytes", std::mem::size_of::<ValVec32<u64>>());
    println!("ValVec32 uses u32 indices (4 bytes) vs usize (8 bytes on 64-bit)");
    println!("This saves 50% on index overhead for large collections\n");
    
    // Test malloc_usable_size optimization
    println!("=== malloc_usable_size Optimization ===");
    let mut vec = ValVec32::<u32>::new();
    let mut growth_events = Vec::new();
    
    for i in 0..100 {
        let old_capacity = vec.capacity();
        vec.push(i).unwrap();
        let new_capacity = vec.capacity();
        
        if new_capacity != old_capacity {
            growth_events.push((i, old_capacity, new_capacity));
            if growth_events.len() >= 5 {
                break;
            }
        }
    }
    
    println!("Growth events (showing allocator bonus memory):");
    for (elem, old_cap, new_cap) in growth_events {
        let ratio = if old_cap > 0 {
            new_cap as f64 / old_cap as f64
        } else {
            new_cap as f64
        };
        println!(
            "  At element {}: {} -> {} (growth: {:.2}x)",
            elem, old_cap, new_cap, ratio
        );
    }
    
    println!("\n✅ Optimizations Summary:");
    println!("  - Platform-specific malloc_usable_size enabled");
    println!("  - Adaptive growth strategy (2x for small, 1.6x for medium, 1.25x for large)");
    println!("  - Hot path optimization with branchless operations");
    println!("  - SIMD-optimized bulk operations for Copy types");
    println!("  - Result: Near-parity or better performance vs std::Vec!");
}