List of all items
Structs
- common::CommonParams
- common::common_params
- common::common_sampler_params
- context::LlamaContext
- context::params::LlamaContextParams
- context::perf::PerfContextData
- context::tensor_capture::CapturedTensor
- context::tensor_capture::TensorCapture
- ggml::GgmlAllocr
- ggml::GgmlBackend
- ggml::GgmlContext
- ggml::GgmlGraph
- ggml::GgmlTensor
- llama_backend::InvalidNumaStrategy
- llama_backend::LlamaBackend
- llama_batch::LlamaBatch
- model::LlamaChatMessage
- model::LlamaLoraAdapter
- model::LlamaModel
- model::LlamaVocab
- model::params::LlamaModelParams
- model::params::kv_overrides::KvOverrideValueIterator
- model::params::kv_overrides::KvOverrides
- mtmd::MtmdBitmap
- mtmd::MtmdContext
- mtmd::MtmdContextParams
- mtmd::MtmdImageTokens
- mtmd::MtmdInputChunk
- mtmd::MtmdInputChunks
- mtmd::MtmdInputText
- sampling::LlamaSampler
- sampling::LlamaSamplerParams
- token::LlamaToken
- token::data::LlamaTokenData
- token::data_array::LlamaTokenDataArray
- token_type::LlamaTokenAttrs
Enums
- ApplyChatTemplateError
- ChatTemplateError
- DecodeError
- EmbeddingsError
- EncodeError
- LLamaCppError
- LlamaContextLoadError
- LlamaLoraAdapterInitError
- LlamaLoraAdapterRemoveError
- LlamaLoraAdapterSetError
- LlamaModelLoadError
- NewLlamaChatMessageError
- StringFromModelError
- StringToTokenError
- TokenToStringError
- context::kv_cache::KvCacheConversionError
- context::params::LlamaPoolingType
- context::params::RopeScalingType
- context::session::LoadSessionError
- context::session::SaveSessionError
- llama_backend::NumaStrategy
- llama_batch::BatchAddError
- model::AddBos
- model::LlamaTokenTypeFromIntError
- model::Special
- model::VocabType
- model::params::kv_overrides::ParamOverrideValue
- mtmd::MtmdError
- mtmd::MtmdInputChunkType
- token_type::LlamaTokenAttr
- token_type::LlamaTokenTypeFromIntError
Functions
- flash_attn_type_name
- ggml::buffer_free
- ggml::graph_overhead
- ggml::is_quantized
- ggml::tensor_get
- ggml::tensor_overhead
- ggml::tensor_set
- ggml::type_name
- ggml_time_us
- llama_supports_mlock
- llama_time_us
- log_get
- log_set
- max_devices
- max_parallel_sequences
- max_tensor_buft_overrides
- mlock_supported
- mmap_supported
- model_meta_key_str
- model_quantize
- model_quantize_default_params
- opt_epoch
- opt_init
- opt_param_filter_all
- params_fit
- print_system_info
- supports_gpu_offload
- supports_rpc
- token::from_vec_token_sys
- token::to_vec_token_sys
Type Aliases
Constants
- common::COMMON_SAMPLER_TYPE_DRY
- common::COMMON_SAMPLER_TYPE_INFILL
- common::COMMON_SAMPLER_TYPE_MIN_P
- common::COMMON_SAMPLER_TYPE_NONE
- common::COMMON_SAMPLER_TYPE_TEMPERATURE
- common::COMMON_SAMPLER_TYPE_TFS_Z
- common::COMMON_SAMPLER_TYPE_TOP_K
- common::COMMON_SAMPLER_TYPE_TOP_P
- common::COMMON_SAMPLER_TYPE_TYPICAL_P
- common::COMMON_SAMPLER_TYPE_XTC