Module policy_gradient

Expand description

Advanced Policy Gradient Optimization with Meta-Gradient Learning

Implementation of cutting-edge policy gradient methods with meta-learning capabilities:

Structs§

AdvancedAdvancedPolicyGradientOptimizer: Advanced Policy Gradient Optimizer with Meta-Learning
CurriculumController: Curriculum learning controller
LearningMetrics: Learning metrics for meta-learning
MetaExperienceBuffer: Meta-experience buffer for higher-order learning
MetaGradients: Meta-gradients for higher-order optimization
MetaLearningStats: Meta-learning statistics
MetaPolicyNetwork: Advanced Neural Network with Meta-Learning Capabilities
MetaTrajectory: Enhanced trajectory with meta-learning information

advanced_advanced_policy_gradient_optimize: Convenience function for advanced meta-learning policy gradient optimization
placeholder
policy_gradient_optimize: Legacy convenience function for backward compatibility