pub fn max_pooling_simd( input: &[u8], width: usize, factor: usize, ) -> (usize, usize, Vec<u8>)
SIMD 加速的最大值池化