Expand description
Piper-Plus 推論コアライブラリ
VITS ベースのニューラル TTS 推論エンジン。 ONNX Runtime を使用し、7 言語 (JA/EN/ZH/KO/ES/FR/PT) に対応。
Phase 4 追加機能:
- ストリーミング合成 (
streaming) - リアルタイム再生 (
playback, feature-gated) - 音素タイミング (
timing) - GPU 推論 (
gpu) - WASM 互換 API (
wasm) - モデルダウンロード (
model_download) - 音声フォーマット変換 (
audio_format) - テキスト分割 (
text_splitter) - バッチ合成 (
batch) - デバイス列挙 (
device)
Re-exports§
pub use config::PhonemeIdMap;pub use config::PhonemeType;pub use config::VoiceConfig;pub use engine::ModelCapabilities;pub use engine::OnnxEngine;pub use engine::SynthesisRequest;pub use engine::SynthesisResult;pub use error::PiperError;pub use phonemize::ProsodyFeature;pub use phonemize::ProsodyInfo;pub use voice::PiperVoice;
Modules§
- audio
- audio_
format - Audio format conversion and resampling utilities.
- batch
- Batch synthesis for processing multiple texts.
- config
- device
- High-level compute device enumeration and selection.
- dictionary_
manager - OpenJTalk dictionary download manager.
- engine
- ONNX 推論エンジン
- error
- gpu
- Low-level GPU inference support via ONNX Runtime ExecutionProviders.
- input
- JSONL 入力パーサー (Python infer_onnx.py 互換)
- model_
download - Model download and management utilities.
- phonemize
- Phonemizer trait, language registry, and language-specific implementations.
- playback
- Real-time audio playback via rodio
- streaming
- Streaming synthesis pipeline
- text_
splitter - Text splitting for streaming synthesis.
- timing
- Phoneme timing extraction from ONNX model duration output.
- voice
- PiperVoice — テキストから音声への高レベル API
- wasm
- WASM-compatible synthesis API