DeepSeek R1 Theory Overview - From GRPO to Reinforcement Learning and Supervised Fine-Tuning

Yacine Mahdid via YouTube Direct link

- Cold start supervised fine-tuning: 15:30

6

of 11

6 of 11

- Cold start supervised fine-tuning: 15:30

Class Central Classrooms beta

YouTube videos curated by Class Central.

Classroom Contents

DeepSeek R1 Theory Overview - From GRPO to Reinforcement Learning and Supervised Fine-Tuning