Module learn

Expand description

Learn Module - 学習系 Domain の分離

§設計思想

Engine (Core) と Learn の責務を明確に分離する。

Core (Engine): ActionEvent を発行、基本統計を管理
Learn: ActionEvent を受け取り、学習パターンを分析

§Model Layer

Model (base)
  ├── Scorable      → 行動選択に使用（UCB1, Thompson, Greedy）
  └── Parametric    → 戦略設定に使用（Orchestrator初期化）

§モデル種類

モデル	責務	生存期間
LearnedModel	行動選択スコア（遷移、N-gram等）	1セッション
OptimalParamsModel	パラメータ最適化（ucb1_c等）	複数セッション

§LoRA

LoRA学習・適用は lora モジュールで管理。

LoraTrainer: LoRA学習の実行
TrainedModel: 学習済みLoRAアダプタ
ModelApplicator: llama-server への適用

Modules§

daemon: Learning Daemon - 継続的学習プロセス
episode: Episode - 学習の基本単位
learn_model: LearnModel - 学習の統合モデル
lora: LoRA Module - LoRA学習・適用
offline: Offline Learning - セッション間学習の分析・最適化
record: Record - 生イベントの抽象化
snapshot: Learning Snapshot - 学習データの永続化システム
stats_model: Stats Model Layer - 行動選択用統計モデル
store: Store Module - 永続化レイヤーの Clean Architecture 実装
training: TrainingData - LoRA 学習用データ形式
trigger: TrainTrigger - 学習開始条件の判定

Structs§

ActionRecord: アクション実行の記録
AlwaysTrigger: 常に true（テスト用）
AndTrigger: 全ての Trigger が true なら発火
Applier: 学習済みモデルの適用を担当
ApplierConfig: Applier の設定
ConfidenceMapProvider: HashMap<String, f64> ベースの静的 Provider
ContextualActionStats: コンテキスト条件付きアクション統計
ConversationData: 会話形式の学習データ（JSONL 出力用）
ConversationTurn: 会話のターン
CountTrigger: N 件の新規 Episode が蓄積されたら発火
DaemonBuilder: LearningDaemon のビルダー
DaemonConfig: Daemon の設定
DaemonStats: Daemon の統計情報
DataSink: Record/Episode の永続化を担当
DataSinkStats: DataSink の統計情報
DefaultEpisodeRepository: RecordStore + EpisodeStore を組み合わせた Repository 実装
DependencyGraphLearnModel: DependencyGraph 推論の学習モデル
DependencyGraphRecord: DependencyGraph 推論の記録
DpoConfig: DPO LearnModel の設定
DpoLearnModel: 汎用 DPO LearnModel
DpoPair: DPO 学習用の比較ペア
Episode: Episode - 学習の基本単位（汎用実装）
EpisodeBuilder: Episode を構築するためのビルダー
EpisodeContext: エピソードのコンテキスト
EpisodeDto: Episode の永続化用 DTO
EpisodeFilter: Episode 検索用フィルタ
EpisodeId: Episode ID - 一意識別子
EpisodeMeta: Episode のメタ情報（軽量版、リスト表示用）
EpisodeMetadata: エピソードのメタデータ
EpisodeTransitions: エピソード遷移統計
FileEpisodeStore: JSONL ファイルベースの EpisodeStore 実装
FileLoraStore: ファイルベースの LoraModelStore 実装
FileRecordStore: JSONL ファイルベースの RecordStore 実装
FileSystemStorage: ファイルシステムベースのストレージ実装
InMemoryEpisodeStore: インメモリの EpisodeStore 実装（テスト用）
InMemoryLoraStore: インメモリの LoraModelStore 実装（テスト用）
InMemoryRecordStore: インメモリの RecordStore 実装（テスト用）
LearnStats: 学習用統計の集約
LearnStatsProvider: LearnStats と ScoreModel を一体管理する Provider
LearnedActionOrder: 学習済みアクション順序
LearningDaemon: 継続的学習プロセス
LearningSnapshot: 学習データのスナップショット（永続化単位）
LearningStore: 学習データの永続化マネージャ（Facade）
LlamaServerApplicator: llama-server へのモデル適用
LlamaServerConfig: llama-server の設定
LlmCallRecord: LLM呼び出しの記録
LoraModelId: LoRA モデル ID
LoraTrainer: LoRA 学習を実行する
LoraTrainerConfig: LoRA Trainer の設定
ManualTrigger: 常に false を返す（手動実行時は Trigger をバイパス）
ModelFilter: TrainedModel 検索フィルタ
ModelMeta: TrainedModel の軽量メタ情報
ModelMetadata: モデルメタデータ
ModelVersion: モデルバージョン
NeverTrigger: 常に false（自動学習無効化用）
NgramStats: N-gram 統計（3-gram, 4-gram パターン学習）
NoOpApplicator: 何もしない Applicator（テスト用）
NullProvider: ボーナスを返さない Null Provider
OfflineAnalyzer: Offline 分析器
OfflineModel: Offline 学習モデル
OptimalParameters: 最適化されたパラメータ
OptimalParamsModel: パラメータ最適化モデル
OrTrigger: いずれかの Trigger が true なら発火
Processor: 学習処理を実行
ProcessorConfig: Processor の設定
QualityTrigger: 成功率が閾値を下回ったら発火
RecommendedPath: 推奨アクションパス
RecordFilter: Record 検索用フィルタ
RecordId: Record の一意識別子
RecordMeta: Record のメタ情報（軽量版、リスト表示用）
RecordStream: Record のストリームを操作するためのヘルパー
ScoreContext: スコア計算のコンテキスト
ScoreModel: 行動選択スコアモデル
ScoreModelProvider: ScoreModel を使った Provider 実装
SelectionPerformance: Selection 戦略効果測定（Meta-learning）
SessionId: セッションID（タイムスタンプベース）
SnapshotMetadata: スナップショットのメタデータ
StatsModelId: 統計モデル識別子
StrategyConfig: Selection 戦略設定
StrategyStats: 戦略ごとの統計
StrategySwitchEvent: 戦略切り替えイベント
TimeTrigger: 前回学習から N 秒経過したら発火
TrainedModel: 学習済みモデル
TrainedModelDto: TrainedModel の永続化用 DTO
TrainingData: LoRA 学習用データ形式
TrainingMetadata: 学習データのメタデータ
TrainingMetrics: 学習メトリクス
TrainingMetricsDto: TrainingMetrics の DTO
TriggerBuilder: Trigger を構築するためのファクトリ
TriggerContext: Trigger 判定のためのコンテキスト
TriggerMetrics: 品質メトリクス
WorkerDecisionSequenceLearn: Worker Decision 学習モデル（シーケンスベース）
WorkerTaskLearn: Worker タスク完了ベースの LearnModel

Enums§

ActionOrderSource: アクション順序の生成元
ApplicatorError: Applicator エラー
ApplierError: Applier のエラー型
ApplyMode: 適用モード
ApplyResult: 適用結果
ConversationRole: 発話者の役割
DaemonError: Daemon のエラー型
DataSinkError: DataSink のエラー型
LearnError: LearnModel のエラー型
LearningQuery: 学習データへのクエリ
LearningResult: クエリ結果
LoraTrainerError: LoRA Trainer エラー
MergeStrategy: マージ戦略
ModelType: モデルの種類
Outcome: エピソードの結果
OutcomeFilter: Outcome フィルタ
ParamValue: パラメータ値
ProcessResult: 処理結果
ProcessorError: Processor のエラー型
ProcessorMode: 処理モード
Record: 生イベントから変換された Record
RecordStoreError: RecordStore のエラー型
ScoreQuery: スコアクエリ
SnapshotKey: スナップショットのキー（階層的）
StoreError: EpisodeStore のエラー型
TrainingFormat: 学習形式
TriggerError: Trigger 判定エラー

Constants§

SNAPSHOT_VERSION: フォーマットバージョン

Traits§

EpisodeRepository: Domain 層に公開する Episode の Repository インターフェース
EpisodeStore: Episode の永続化を担う Trait
EpisodeTrait: Episode trait - 学習の基本単位を表すインターフェース
FromRecord: Record から特定の型を抽出するための Trait
LearnModel: 学習の統合モデル
LearnedProvider: 学習済みデータへのアクセス Provider
LoraModelStore: TrainedModel の永続化を担う Trait
Model: 全ての学習済みモデルが実装する基本 trait
ModelApplicator: モデル適用 trait（非同期）
Parametric: パラメータを提供できるモデル（戦略設定に使用）
RecordStore: Record の永続化を担う Trait
Scorable: スコアを提供できるモデル（行動選択に使用）
SnapshotStorage: スナップショットの永続化（CRUD）
TimeSeriesQuery: 時系列クエリ
TrainTrigger: 学習開始条件を判定する trait

Functions§

merge_snapshots: 複数のスナップショットをマージ

Type Aliases§

SharedLearnedProvider: Provider の共有参照型
Timestamp: タイムスタンプ（Unix seconds）

Module learn

Module learn Copy item path

§設計思想

§Model Layer

§モデル種類

§LoRA

Modules§

Structs§

Enums§

Constants§

Traits§

Functions§

Type Aliases§

Module learn