Crate llm_kit_groq

Expand description

Groq provider implementation for the LLM Kit.

This crate provides a provider implementation for Groq’s chat models, supporting ultra-fast inference with open-source models.

§Features

Chat completions with Llama, Gemma, and other open-source models
Ultra-fast inference speeds
Streaming support
Tool calling
Whisper transcription support
Groq-specific metadata (cached tokens)
Image URL support

§Examples

§Basic Usage with Client Builder (Recommended)

use llm_kit_groq::GroqClient;

// Create a provider using the client builder
let provider = GroqClient::new()
    .api_key("your-api-key")
    .build();

let model = provider.chat_model("llama-3.1-8b-instant");

§Alternative: Direct Instantiation

use llm_kit_groq::{GroqProvider, GroqProviderSettings};

// Create a provider using settings
let provider = GroqProvider::new(
    GroqProviderSettings::new()
        .with_api_key("your-api-key")
);

let model = provider.chat_model("llama-3.3-70b-versatile");

§Chained Usage

use llm_kit_groq::GroqClient;

let model = GroqClient::new()
    .api_key("your-api-key")
    .build()
    .chat_model("llama-3.1-8b-instant");

§Environment Variable

use llm_kit_groq::GroqClient;

// API key will be read from GROQ_API_KEY environment variable
let provider = GroqClient::new()
    .load_api_key_from_env()
    .build();

let model = provider.chat_model("llama-3.1-8b-instant");

§Text Generation

use llm_kit_groq::GroqClient;
use llm_kit_provider::LanguageModel;
use llm_kit_provider::language_model::call_options::LanguageModelCallOptions;
use llm_kit_provider::language_model::prompt::LanguageModelMessage;

let provider = GroqClient::new()
    .api_key("your-api-key")
    .build();

let model = provider.chat_model("llama-3.1-8b-instant");

let prompt = vec![LanguageModelMessage::user_text(
    "Explain quantum computing in simple terms"
)];

let options = LanguageModelCallOptions::new(prompt)
    .with_temperature(0.7)
    .with_max_output_tokens(500);

let result = model.do_generate(options).await?;

// Extract text from content
let text = result.content.iter()
    .filter_map(|c| match c {
        llm_kit_provider::language_model::content::LanguageModelContent::Text(t) => Some(t.text.clone()),
        _ => None,
    })
    .collect::<Vec<_>>()
    .join("");

println!("Response: {}", text);

§Streaming

use llm_kit_groq::GroqClient;
use llm_kit_provider::LanguageModel;
use llm_kit_provider::language_model::call_options::LanguageModelCallOptions;
use llm_kit_provider::language_model::prompt::LanguageModelMessage;
use llm_kit_provider::language_model::stream_part::LanguageModelStreamPart;
use futures_util::StreamExt;

let provider = GroqClient::new()
    .api_key("your-api-key")
    .build();

let model = provider.chat_model("llama-3.1-8b-instant");

let prompt = vec![LanguageModelMessage::user_text("Tell me a story")];
let options = LanguageModelCallOptions::new(prompt);

let result = model.do_stream(options).await?;
let mut stream = result.stream;

// Stream text deltas
while let Some(part) = stream.next().await {
    if let LanguageModelStreamPart::TextDelta(delta) = part {
        print!("{}", delta.delta);
    }
}

§Tool Calling

Groq supports tool/function calling. See the examples/chat_tool_calling.rs and examples/stream_tool_calling.rs examples for complete working implementations.

§Groq-Specific Metadata

Groq provides cached token statistics in the metadata:

use llm_kit_groq::GroqClient;
use llm_kit_provider::LanguageModel;
use llm_kit_provider::language_model::call_options::LanguageModelCallOptions;
use llm_kit_provider::language_model::prompt::LanguageModelMessage;

let provider = GroqClient::new()
    .api_key("your-api-key")
    .build();

let model = provider.chat_model("llama-3.1-8b-instant");

let prompt = vec![LanguageModelMessage::user_text("Hello")];
let options = LanguageModelCallOptions::new(prompt);

let result = model.do_generate(options).await?;

// Access Groq-specific metadata
if let Some(provider_metadata) = &result.provider_metadata {
    if let Some(groq) = provider_metadata.get("groq") {
        println!("Cached tokens: {:?}", groq.get("cachedTokens"));
    }
}

§Transcription (Whisper)

Groq provides ultra-fast Whisper transcription:

use llm_kit_groq::{GroqClient, GroqTranscriptionOptions};
use llm_kit_provider::transcription_model::call_options::TranscriptionModelCallOptions;
use llm_kit_provider::TranscriptionModel;

let provider = GroqClient::new()
    .api_key("your-api-key")
    .build();

let model = provider.transcription_model("whisper-large-v3");

// Read audio file
let audio_data = std::fs::read("audio.mp3")?;

// Configure options
let mut provider_options = std::collections::HashMap::new();
let mut groq_opts_map = std::collections::HashMap::new();
let groq_options = GroqTranscriptionOptions::new()
    .with_language("en")
    .with_verbose_json();

// Convert to nested structure
let groq_value = serde_json::to_value(&groq_options)?;
if let serde_json::Value::Object(map) = groq_value {
    for (k, v) in map {
        groq_opts_map.insert(k, v);
    }
}
provider_options.insert("groq".to_string(), groq_opts_map);

let options = TranscriptionModelCallOptions::mp3(audio_data)
    .with_provider_options(provider_options);

let result = model.do_generate(options).await?;
println!("Transcription: {}", result.text);

Re-exports§

pub use chat::GroqChatLanguageModel;
pub use chat::GroqChatModelId;
pub use chat::GroqMetadataExtractor;
pub use chat::GroqProviderOptions;
pub use chat::GroqUsage;
pub use chat::ReasoningFormat;
pub use chat::ServiceTier;
pub use client::GroqClient;
pub use error::GroqError;
pub use provider::GroqProvider;
pub use settings::GroqProviderSettings;
pub use speech::GroqSpeechConfig;
pub use speech::GroqSpeechModel;
pub use speech::GroqSpeechOptions;
pub use transcription::GroqTranscriptionConfig;
pub use transcription::GroqTranscriptionModel;
pub use transcription::GroqTranscriptionModelId;
pub use transcription::GroqTranscriptionOptions;

Modules§

chat: Chat completion implementation for Groq models.
client: Client builder for creating Groq providers.
error: Error types for Groq provider operations.
provider: Provider implementation and creation functions.
settings: Settings and configuration for Groq providers.
speech: Speech synthesis implementation for Groq text-to-speech models.
transcription: Transcription implementation for Groq Whisper models.

Structs§

GroqChatConfig: Configuration for an OpenAI-compatible chat language model
GroqErrorData: Groq-specific error data from API responses.

Crate llm_kit_groq

Crate llm_kit_groq Copy item path

§Features

§Examples

§Basic Usage with Client Builder (Recommended)

§Alternative: Direct Instantiation

§Chained Usage

§Environment Variable

§Text Generation

§Streaming

§Tool Calling

§Groq-Specific Metadata

§Transcription (Whisper)

Re-exports§

Modules§

Structs§

Crate llm_kit_groq