modo-rs 0.8.0 - Docs.rs

# modo::embed

Text-to-vector embeddings via LLM provider APIs.

Uses `reqwest` for HTTP calls.

## Key types

| Type | Purpose |
|------|---------|
| `EmbeddingProvider` | Concrete wrapper around any `EmbeddingBackend`; cheap to clone (`Arc` internally) |
| `EmbeddingBackend` | Trait for embedding providers (built-in or custom) |
| `OpenAIEmbedding` | OpenAI embedding provider |
| `GeminiEmbedding` | Google Gemini embedding provider |
| `MistralEmbedding` | Mistral embedding provider |
| `VoyageEmbedding` | Voyage AI embedding provider |
| `OpenAIConfig` / `GeminiConfig` / `MistralConfig` / `VoyageConfig` | Provider configuration structs |
| `to_f32_blob` / `from_f32_blob` | Vector-to-blob conversion helpers for libsql `F32_BLOB` columns |
| `test::InMemoryBackend` | Deterministic in-memory backend for unit tests |

## Providers

| Provider | Struct | Config | Default model | Default dims |
|----------|--------|--------|---------------|--------------|
| OpenAI | `OpenAIEmbedding` | `OpenAIConfig` | `text-embedding-3-small` | 1536 |
| Gemini | `GeminiEmbedding` | `GeminiConfig` | `gemini-embedding-001` | 768 |
| Mistral | `MistralEmbedding` | `MistralConfig` | `mistral-embed` | 1024 |
| Voyage AI | `VoyageEmbedding` | `VoyageConfig` | `voyage-4` | 1024 |

## Usage

```rust,ignore
use modo::embed::{EmbeddingProvider, OpenAIEmbedding, OpenAIConfig};

// Build provider
let http_client = reqwest::Client::new();
let config = OpenAIConfig {
    api_key: "sk-...".into(),
    ..Default::default()
};
let embedder = EmbeddingProvider::new(
    OpenAIEmbedding::new(http_client, &config)?,
);

// Embed text → f32 blob for libsql
let blob = embedder.embed("hello world").await?;

// Store in libsql
db.conn().execute_raw(
    "INSERT INTO documents (id, content, embedding) VALUES (?1, ?2, ?3)",
    libsql::params![id::ulid(), "hello world", blob],
).await?;
```

## Configuration

```yaml
# OpenAI
embedding:
  api_key: "${OPENAI_API_KEY}"
  model: "text-embedding-3-small"   # optional, default shown
  dimensions: 1536                  # optional, default shown
  base_url: "https://custom.endpoint.com"  # optional, for Azure or proxies

# Gemini
embedding:
  api_key: "${GEMINI_API_KEY}"
  model: "gemini-embedding-001"     # optional, default shown
  dimensions: 768                   # optional, default shown

# Mistral (no dimensions parameter — always 1024)
embedding:
  api_key: "${MISTRAL_API_KEY}"
  model: "mistral-embed"            # optional, default shown

# Voyage AI
embedding:
  api_key: "${VOYAGE_API_KEY}"
  model: "voyage-4"                 # optional, default shown
  dimensions: 1024                  # optional, default shown
```

All configs validate at construction time via `validate()`. Empty `api_key` or `model`
is rejected with `Error::bad_request`.

## Custom providers

Implement `EmbeddingBackend` and wrap with `EmbeddingProvider::new()`:

```rust,ignore
use modo::embed::{EmbeddingBackend, EmbeddingProvider};

struct MyProvider { /* ... */ }

impl EmbeddingBackend for MyProvider {
    fn embed(&self, input: &str)
        -> Pin<Box<dyn Future<Output = Result<Vec<u8>>> + Send + '_>>
    {
        Box::pin(async move {
            let floats: Vec<f32> = my_api_call(input).await?;
            Ok(modo::embed::to_f32_blob(&floats))
        })
    }

    fn dimensions(&self) -> usize { 768 }
    fn model_name(&self) -> &str { "my-model" }
}

let embedder = EmbeddingProvider::new(MyProvider { /* ... */ });
```

## Vector helpers

- `to_f32_blob(&[f32]) -> Vec<u8>` — encode floats to LE blob
- `from_f32_blob(&[u8]) -> Result<Vec<f32>>` — decode blob back to floats

## Testing

Use `embed::test::InMemoryBackend` for tests:

```rust,ignore
use modo::embed::{EmbeddingProvider, test::InMemoryBackend};

let embedder = EmbeddingProvider::new(InMemoryBackend::new(768));
let blob = embedder.embed("test").await?;
assert_eq!(blob.len(), 768 * 4);
```

`InMemoryBackend` is available under `#[cfg(test)]` or when the `test-helpers` feature is enabled.