Module learn

Expand description

Learn Module - 学習系 Domain の分離

§設計思想

Engine (Core) と Learn の責務を明確に分離する。

Core (Engine): ActionEvent を発行、基本統計を管理
Learn: ActionEvent を受け取り、学習パターンを分析

§Model Layer

Model (base)
  ├── Scorable      → 行動選択に使用（UCB1, Thompson, Greedy）
  └── Parametric    → 戦略設定に使用（Orchestrator初期化）

§モデル種類

モデル	責務	生存期間
LearnedModel	行動選択スコア（遷移、N-gram等）	1セッション
OptimalParamsModel	パラメータ最適化（ucb1_c等）	複数セッション

§LoRA

LoRA学習・適用は lora モジュールで管理。

LoraTrainer: LoRA学習の実行
TrainedModel: 学習済みLoRAアダプタ
ModelApplicator: llama-server への適用

Modules§

component_learners: ComponentLearner 具体実装
daemon: Learning Daemon - 継続的学習プロセス
episode: Episode - 学習の基本単位
facade: Learnable Swarm Facade - 学習機能付き Swarm の統合ファサード
learn_model: LearnModel - 学習の統合モデル
learned_component: LearnedComponent - 学習結果の型安全な抽象化
lora: LoRA Module - LoRA学習・適用
offline: Offline Learning - セッション間学習の分析・最適化
profile_adapter: ProfileAdapter - ScenarioProfile と OfflineModel の統合
profile_store: ProfileStore - ScenarioProfile の永続化
record: Record - 生イベントの抽象化
scenario_profile: ScenarioProfile - 永続的に改善されるシナリオの実体
scenario_registry: ScenarioRegistry - マルチシナリオ管理
session_group: Session Group - 複数セッションをまとめる単位
snapshot: Learning Snapshot - 学習データの永続化システム
stats_model: Stats Model Layer - 行動選択用統計モデル
store: Store Module - 永続化レイヤーの Clean Architecture 実装
training: TrainingData - LoRA 学習用データ形式
trigger: TrainTrigger - 学習開始条件の判定

Structs§

ActionEventSubscriber: ActionEvent を受信して LearningDaemon に Record を送信
ActionRecord: アクション実行の記録
AlwaysTrigger: 常に true（テスト用）
AndTrigger: 全ての Trigger が true なら発火
Applier: 学習済みモデルの適用を担当
ApplierConfig: Applier の設定
BootstrapData: Bootstrap 完了時のデータ
ConfidenceMapProvider: HashMap<String, f64> ベースの静的 Provider
ContextualActionStats: コンテキスト条件付きアクション統計
ConversationData: 会話形式の学習データ（JSONL 出力用）
ConversationTurn: 会話のターン
CountTrigger: N 件の新規 Episode が蓄積されたら発火
DaemonBuilder: LearningDaemon のビルダー
DaemonConfig: Daemon の設定
DaemonStats: Daemon の統計情報
DataSink: Record/Episode の永続化を担当
DataSinkStats: DataSink の統計情報
DefaultEpisodeRepository: RecordStore + EpisodeStore を組み合わせた Repository 実装
DepGraphLearner: 依存グラフ学習器
DependencyGraphLearnModel: DependencyGraph 推論の学習モデル
DependencyGraphRecord: DependencyGraph 推論の記録
DpoConfig: DPO LearnModel の設定
DpoLearnModel: 汎用 DPO LearnModel
DpoPair: DPO 学習用の比較ペア
Episode: Episode - 学習の基本単位（汎用実装）
EpisodeBuilder: Episode を構築するためのビルダー
EpisodeContext: エピソードのコンテキスト
EpisodeDto: Episode の永続化用 DTO
EpisodeFilter: Episode 検索用フィルタ
EpisodeId: Episode ID - 一意識別子
EpisodeMeta: Episode のメタ情報（軽量版、リスト表示用）
EpisodeMetadata: エピソードのメタデータ
EpisodeTransitions: エピソード遷移統計
EventSubscriberConfig: Event Subscriber の共通設定
ExplorationLearner: 探索パラメータ学習器
FileEpisodeStore: JSONL ファイルベースの EpisodeStore 実装
FileLoraStore: ファイルベースの LoraModelStore 実装
FileRecordStore: JSONL ファイルベースの RecordStore 実装
FileSystemStorage: ファイルシステムベースのストレージ実装
InMemoryEpisodeStore: インメモリの EpisodeStore 実装（テスト用）
InMemoryLoraStore: インメモリの LoraModelStore 実装（テスト用）
InMemoryRecordStore: インメモリの RecordStore 実装（テスト用）
LearnStats: 学習用統計の集約
LearnStatsProvider: LearnStats と ScoreModel を一体管理する Provider
LearnStatsRecord: LearnStats スナップショット記録
LearnableSwarm: 学習機能付き Swarm
LearnableSwarmBuilder: 学習機能付き Swarm のビルダー
LearnableSwarmConfig: 学習機能付き Swarm の設定
LearnedActionOrder: 学習済みアクション順序
LearnedDepGraph: 学習済み依存グラフ
LearnedExploration: 学習済み探索パラメータ
LearnedStrategy: 学習済み戦略設定
LearningDaemon: 継続的学習プロセス
LearningEventSubscriber: LearningEvent を受信して LearningDaemon に Record を送信
LearningSnapshot: 学習データのスナップショット（永続化単位）
LearningStore: 学習データの永続化マネージャ（Facade）
LlamaServerApplicator: llama-server へのモデル適用
LlamaServerConfig: llama-server の設定
LlmCallRecord: LLM呼び出しの記録
LoraModelId: LoRA モデル ID
LoraTrainer: LoRA 学習を実行する
LoraTrainerConfig: LoRA Trainer の設定
ManualTrigger: 常に false を返す（手動実行時は Trigger をバイパス）
ModelFilter: TrainedModel 検索フィルタ
ModelMeta: TrainedModel の軽量メタ情報
ModelMetadata: モデルメタデータ
ModelVersion: モデルバージョン
NeverTrigger: 常に false（自動学習無効化用）
NgramStats: N-gram 統計（3-gram, 4-gram パターン学習）
NoOpApplicator: 何もしない Applicator（テスト用）
NullProvider: ボーナスを返さない Null Provider
OfflineAnalyzer: Offline 分析器
OfflineModel: Offline 学習モデル
OptimalParameters: 最適化されたパラメータ
OptimalParamsModel: パラメータ最適化モデル
OrTrigger: いずれかの Trigger が true なら発火
Processor: 学習処理を実行
ProcessorConfig: Processor の設定
ProfileStats: Profile の統計情報
ProfileStore: ScenarioProfile の永続化ストア
QualityTrigger: 成功率が閾値を下回ったら発火
RecommendedPath: 推奨アクションパス
RecordFilter: Record 検索用フィルタ
RecordId: Record の一意識別子
RecordMeta: Record のメタ情報（軽量版、リスト表示用）
RecordStream: Record のストリームを操作するためのヘルパー
ScenarioProfile: 永続的に改善されるシナリオの実体
ScenarioProfileId: ScenarioProfile 識別子
ScenarioRegistry: マルチシナリオ管理
ScoreContext: スコア計算のコンテキスト
ScoreModel: 行動選択スコアモデル
ScoreModelProvider: ScoreModel を使った Provider 実装
SelectionPerformance: Selection 戦略効果測定（Meta-learning）
SessionGroup: セッショングループ
SessionGroupId: セッショングループ ID
SessionGroupMetadata: セッショングループのメタデータ
SessionId: セッションID（タイムスタンプベース）
SnapshotMetadata: スナップショットのメタデータ
StatsModelId: 統計モデル識別子
StrategyAdviceRecord: LLM 戦略アドバイス記録
StrategyConfig: Selection 戦略設定
StrategyLearner: 戦略設定学習器
StrategyStats: 戦略ごとの統計
StrategySwitchEvent: 戦略切り替えイベント
TaskMatcher: Task → Scenario マッチング設定
TimeTrigger: 前回学習から N 秒経過したら発火
TrainedModel: 学習済みモデル
TrainedModelDto: TrainedModel の永続化用 DTO
TrainingData: LoRA 学習用データ形式
TrainingMetadata: 学習データのメタデータ
TrainingMetrics: 学習メトリクス
TrainingMetricsDto: TrainingMetrics の DTO
TriggerBuilder: Trigger を構築するためのファクトリ
TriggerContext: Trigger 判定のためのコンテキスト
TriggerMetrics: 品質メトリクス
WorkerDecisionSequenceLearn: Worker Decision 学習モデル（シーケンスベース）
WorkerTaskLearn: Worker タスク完了ベースの LearnModel

Enums§

ActionOrderSource: アクション順序の生成元
ApplicatorError: Applicator エラー
ApplierError: Applier のエラー型
ApplyMode: 適用モード
ApplyResult: 適用結果
ConversationRole: 発話者の役割
DaemonError: Daemon のエラー型
DataSinkError: DataSink のエラー型
LearnError: LearnModel のエラー型
LearningPhase: 学習フェーズ
LearningQuery: 学習データへのクエリ
LearningResult: クエリ結果
LoraTrainerError: LoRA Trainer エラー
MergeStrategy: マージ戦略
ModelType: モデルの種類
Outcome: エピソードの結果
OutcomeFilter: Outcome フィルタ
ParamValue: パラメータ値
ProcessResult: 処理結果
ProcessorError: Processor のエラー型
ProcessorMode: 処理モード
ProfileState: Profile のライフサイクル状態
ProfileStoreError: ProfileStore のエラー型
Record: 生イベントから変換された Record
RecordStoreError: RecordStore のエラー型
RegistryError: ScenarioRegistry のエラー型
ScenarioSource: シナリオのソース参照
ScoreQuery: スコアクエリ
SnapshotKey: スナップショットのキー（階層的）
StoreError: EpisodeStore のエラー型
TrainingFormat: 学習形式
TriggerError: Trigger 判定エラー

Constants§

SNAPSHOT_VERSION: フォーマットバージョン

Traits§

ComponentLearner: ScenarioProfile コンポーネントの学習プロセス
EpisodeRepository: Domain 層に公開する Episode の Repository インターフェース
EpisodeStore: Episode の永続化を担う Trait
EpisodeTrait: Episode trait - 学習の基本単位を表すインターフェース
FromRecord: Record から特定の型を抽出するための Trait
LearnModel: 学習の統合モデル
LearnedComponent: 学習結果コンポーネントの共通 trait
LearnedProvider: 学習済みデータへのアクセス Provider
LoraModelStore: TrainedModel の永続化を担う Trait
Model: 全ての学習済みモデルが実装する基本 trait
ModelApplicator: モデル適用 trait（非同期）
Parametric: パラメータを提供できるモデル（戦略設定に使用）
ProfileToOfflineModel: ScenarioProfile から OfflineModel を取得する trait
RecordStore: Record の永続化を担う Trait
Scorable: スコアを提供できるモデル（行動選択に使用）
SnapshotStorage: スナップショットの永続化（CRUD）
TimeSeriesQuery: 時系列クエリ
TrainTrigger: 学習開始条件を判定する trait

Functions§

merge_snapshots: 複数のスナップショットをマージ
migrate_offline_model_to_profile: OfflineModel から ScenarioProfile を構築
offline_model_to_components: OfflineModel から ScenarioProfile のコンポーネントを抽出
profile_to_offline_model: ScenarioProfile から OfflineModel を生成

Type Aliases§

SharedLearnedProvider: Provider の共有参照型
Timestamp: タイムスタンプ（Unix seconds）

Module learn

Module learn Copy item path

§設計思想

§Model Layer

§モデル種類

§LoRA

Modules§

Structs§

Enums§

Constants§

Traits§

Functions§

Type Aliases§

Module learn