Skip to main content

Module learn

Module learn 

Source
Expand description

Learn Module - 学習系 Domain の分離

§設計思想

Engine (Core) と Learn の責務を明確に分離する。

  • Core (Engine): ActionEvent を発行、基本統計を管理
  • Learn: ActionEvent を受け取り、学習パターンを分析

§Model Layer

Model (base)
  ├── Scorable      → 行動選択に使用(UCB1, Thompson, Greedy)
  └── Parametric    → 戦略設定に使用(Orchestrator初期化)

§モデル種類

モデル責務生存期間
LearnedModel行動選択スコア(遷移、N-gram等)1セッション
OptimalParamsModelパラメータ最適化(ucb1_c等)複数セッション

§LoRA

LoRA学習・適用は lora モジュールで管理。

  • LoraTrainer: LoRA学習の実行
  • TrainedModel: 学習済みLoRAアダプタ
  • ModelApplicator: llama-server への適用

Modules§

component_learners
ComponentLearner 具体実装
daemon
Learning Daemon - 継続的学習プロセス
episode
Episode - 学習の基本単位
facade
Learnable Swarm Facade - 学習機能付き Swarm の統合ファサード
learn_model
LearnModel - 学習の統合モデル
learned_component
LearnedComponent - 学習結果の型安全な抽象化
lora
LoRA Module - LoRA学習・適用
offline
Offline Learning - セッション間学習の分析・最適化
profile_adapter
ProfileAdapter - ScenarioProfile と OfflineModel の統合
profile_store
ProfileStore - ScenarioProfile の永続化
record
Record - 生イベントの抽象化
scenario_profile
ScenarioProfile - 永続的に改善されるシナリオの実体
scenario_registry
ScenarioRegistry - マルチシナリオ管理
session_group
Session Group - 複数セッションをまとめる単位
snapshot
Learning Snapshot - 学習データの永続化システム
stats_model
Stats Model Layer - 行動選択用統計モデル
store
Store Module - 永続化レイヤーの Clean Architecture 実装
training
TrainingData - LoRA 学習用データ形式
trigger
TrainTrigger - 学習開始条件の判定

Structs§

ActionEventSubscriber
ActionEvent を受信して LearningDaemon に Record を送信
ActionRecord
アクション実行の記録
AlwaysTrigger
常に true(テスト用)
AndTrigger
全ての Trigger が true なら発火
Applier
学習済みモデルの適用を担当
ApplierConfig
Applier の設定
BootstrapData
Bootstrap 完了時のデータ
ConfidenceMapProvider
HashMap<String, f64> ベースの静的 Provider
ContextualActionStats
コンテキスト条件付きアクション統計
ConversationData
会話形式の学習データ(JSONL 出力用)
ConversationTurn
会話のターン
CountTrigger
N 件の新規 Episode が蓄積されたら発火
DaemonBuilder
LearningDaemon のビルダー
DaemonConfig
Daemon の設定
DaemonStats
Daemon の統計情報
DataSink
Record/Episode の永続化を担当
DataSinkStats
DataSink の統計情報
DefaultEpisodeRepository
RecordStore + EpisodeStore を組み合わせた Repository 実装
DepGraphLearner
依存グラフ学習器
DependencyGraphLearnModel
DependencyGraph 推論の学習モデル
DependencyGraphRecord
DependencyGraph 推論の記録
DpoConfig
DPO LearnModel の設定
DpoLearnModel
汎用 DPO LearnModel
DpoPair
DPO 学習用の比較ペア
Episode
Episode - 学習の基本単位(汎用実装)
EpisodeBuilder
Episode を構築するためのビルダー
EpisodeContext
エピソードのコンテキスト
EpisodeDto
Episode の永続化用 DTO
EpisodeFilter
Episode 検索用フィルタ
EpisodeId
Episode ID - 一意識別子
EpisodeMeta
Episode のメタ情報(軽量版、リスト表示用)
EpisodeMetadata
エピソードのメタデータ
EpisodeTransitions
エピソード遷移統計
EventSubscriberConfig
Event Subscriber の共通設定
ExplorationLearner
探索パラメータ学習器
FileEpisodeStore
JSONL ファイルベースの EpisodeStore 実装
FileLoraStore
ファイルベースの LoraModelStore 実装
FileRecordStore
JSONL ファイルベースの RecordStore 実装
FileSystemStorage
ファイルシステムベースのストレージ実装
InMemoryEpisodeStore
インメモリの EpisodeStore 実装(テスト用)
InMemoryLoraStore
インメモリの LoraModelStore 実装(テスト用)
InMemoryRecordStore
インメモリの RecordStore 実装(テスト用)
LearnStats
学習用統計の集約
LearnStatsProvider
LearnStats と ScoreModel を一体管理する Provider
LearnStatsRecord
LearnStats スナップショット記録
LearnableSwarm
学習機能付き Swarm
LearnableSwarmBuilder
学習機能付き Swarm のビルダー
LearnableSwarmConfig
学習機能付き Swarm の設定
LearnedActionOrder
学習済みアクション順序
LearnedDepGraph
学習済み依存グラフ
LearnedExploration
学習済み探索パラメータ
LearnedStrategy
学習済み戦略設定
LearningDaemon
継続的学習プロセス
LearningEventSubscriber
LearningEvent を受信して LearningDaemon に Record を送信
LearningSnapshot
学習データのスナップショット(永続化単位)
LearningStore
学習データの永続化マネージャ(Facade)
LlamaServerApplicator
llama-server へのモデル適用
LlamaServerConfig
llama-server の設定
LlmCallRecord
LLM呼び出しの記録
LoraModelId
LoRA モデル ID
LoraTrainer
LoRA 学習を実行する
LoraTrainerConfig
LoRA Trainer の設定
ManualTrigger
常に false を返す(手動実行時は Trigger をバイパス)
ModelFilter
TrainedModel 検索フィルタ
ModelMeta
TrainedModel の軽量メタ情報
ModelMetadata
モデルメタデータ
ModelVersion
モデルバージョン
NeverTrigger
常に false(自動学習無効化用)
NgramStats
N-gram 統計(3-gram, 4-gram パターン学習)
NoOpApplicator
何もしない Applicator(テスト用)
NullProvider
ボーナスを返さない Null Provider
OfflineAnalyzer
Offline 分析器
OfflineModel
Offline 学習モデル
OptimalParameters
最適化されたパラメータ
OptimalParamsModel
パラメータ最適化モデル
OrTrigger
いずれかの Trigger が true なら発火
Processor
学習処理を実行
ProcessorConfig
Processor の設定
ProfileStats
Profile の統計情報
ProfileStore
ScenarioProfile の永続化ストア
QualityTrigger
成功率が閾値を下回ったら発火
RecommendedPath
推奨アクションパス
RecordFilter
Record 検索用フィルタ
RecordId
Record の一意識別子
RecordMeta
Record のメタ情報(軽量版、リスト表示用)
RecordStream
Record のストリームを操作するためのヘルパー
ScenarioProfile
永続的に改善されるシナリオの実体
ScenarioProfileId
ScenarioProfile 識別子
ScenarioRegistry
マルチシナリオ管理
ScoreContext
スコア計算のコンテキスト
ScoreModel
行動選択スコアモデル
ScoreModelProvider
ScoreModel を使った Provider 実装
SelectionPerformance
Selection 戦略効果測定(Meta-learning)
SessionGroup
セッショングループ
SessionGroupId
セッショングループ ID
SessionGroupMetadata
セッショングループのメタデータ
SessionId
セッションID(タイムスタンプベース)
SnapshotMetadata
スナップショットのメタデータ
StatsModelId
統計モデル識別子
StrategyAdviceRecord
LLM 戦略アドバイス記録
StrategyConfig
Selection 戦略設定
StrategyLearner
戦略設定学習器
StrategyStats
戦略ごとの統計
StrategySwitchEvent
戦略切り替えイベント
TaskMatcher
Task → Scenario マッチング設定
TimeTrigger
前回学習から N 秒経過したら発火
TrainedModel
学習済みモデル
TrainedModelDto
TrainedModel の永続化用 DTO
TrainingData
LoRA 学習用データ形式
TrainingMetadata
学習データのメタデータ
TrainingMetrics
学習メトリクス
TrainingMetricsDto
TrainingMetrics の DTO
TriggerBuilder
Trigger を構築するためのファクトリ
TriggerContext
Trigger 判定のためのコンテキスト
TriggerMetrics
品質メトリクス
WorkerDecisionSequenceLearn
Worker Decision 学習モデル(シーケンスベース)
WorkerTaskLearn
Worker タスク完了ベースの LearnModel

Enums§

ActionOrderSource
アクション順序の生成元
ApplicatorError
Applicator エラー
ApplierError
Applier のエラー型
ApplyMode
適用モード
ApplyResult
適用結果
ConversationRole
発話者の役割
DaemonError
Daemon のエラー型
DataSinkError
DataSink のエラー型
LearnError
LearnModel のエラー型
LearningPhase
学習フェーズ
LearningQuery
学習データへのクエリ
LearningResult
クエリ結果
LoraTrainerError
LoRA Trainer エラー
MergeStrategy
マージ戦略
ModelType
モデルの種類
Outcome
エピソードの結果
OutcomeFilter
Outcome フィルタ
ParamValue
パラメータ値
ProcessResult
処理結果
ProcessorError
Processor のエラー型
ProcessorMode
処理モード
ProfileState
Profile のライフサイクル状態
ProfileStoreError
ProfileStore のエラー型
Record
生イベントから変換された Record
RecordStoreError
RecordStore のエラー型
RegistryError
ScenarioRegistry のエラー型
ScenarioSource
シナリオのソース参照
ScoreQuery
スコアクエリ
SnapshotKey
スナップショットのキー(階層的)
StoreError
EpisodeStore のエラー型
TrainingFormat
学習形式
TriggerError
Trigger 判定エラー

Constants§

SNAPSHOT_VERSION
フォーマットバージョン

Traits§

ComponentLearner
ScenarioProfile コンポーネントの学習プロセス
EpisodeRepository
Domain 層に公開する Episode の Repository インターフェース
EpisodeStore
Episode の永続化を担う Trait
EpisodeTrait
Episode trait - 学習の基本単位を表すインターフェース
FromRecord
Record から特定の型を抽出するための Trait
LearnModel
学習の統合モデル
LearnedComponent
学習結果コンポーネントの共通 trait
LearnedProvider
学習済みデータへのアクセス Provider
LoraModelStore
TrainedModel の永続化を担う Trait
Model
全ての学習済みモデルが実装する基本 trait
ModelApplicator
モデル適用 trait(非同期)
Parametric
パラメータを提供できるモデル(戦略設定に使用)
ProfileToOfflineModel
ScenarioProfile から OfflineModel を取得する trait
RecordStore
Record の永続化を担う Trait
Scorable
スコアを提供できるモデル(行動選択に使用)
SnapshotStorage
スナップショットの永続化(CRUD)
TimeSeriesQuery
時系列クエリ
TrainTrigger
学習開始条件を判定する trait

Functions§

merge_snapshots
複数のスナップショットをマージ
migrate_offline_model_to_profile
OfflineModel から ScenarioProfile を構築
offline_model_to_components
OfflineModel から ScenarioProfile のコンポーネントを抽出
profile_to_offline_model
ScenarioProfile から OfflineModel を生成

Type Aliases§

SharedLearnedProvider
Provider の共有参照型
Timestamp
タイムスタンプ(Unix seconds)