Functions§
- decode_
f16 - dequantize_
q4_ k_ block - dequantize_
q6_ k_ block - dequantize_
q8_ 0_ block - dot_
q4_ k_ f32 - Dot product directo sobre bloques Q4_K contra un vector f32.
- dot_
q6_ k_ f32 - Dot product directo sobre bloques Q6_K contra un vector f32.
- dot_
q8_ 0_ f32 - Dot product directo sobre bloques Q8_0 contra un vector f32. Evita dequantizar todo el tensor: procesa bloque a bloque acumulando.