Reward Modeling

AI/ML Fundamentals

Learning a reward function from human feedback

Used in RLHF (Reinforcement Learning from Human Feedback) to align generative models with human preferences.

Learn more about concepts related to Reward Modeling

RLHF

Reinforcement Learning from Human Feedback

Reinforcement Learning

Learning through trial and error with rewards/penalties