Skip to main content

Module ggml_quant

Module ggml_quant 

Source

Functions§

decode_f16
dequantize_q4_k_block
dequantize_q6_k_block
dequantize_q8_0_block
dot_q4_k_f32
Dot product directo sobre bloques Q4_K contra un vector f32.
dot_q6_k_f32
Dot product directo sobre bloques Q6_K contra un vector f32.
dot_q8_0_f32
Dot product directo sobre bloques Q8_0 contra un vector f32. Evita dequantizar todo el tensor: procesa bloque a bloque acumulando.