Lecture 13: Post-training | CMSC 25700/35100 NLP

Lecture Outline

Lecture maintenance
Perplexity notebook
Post-training recipe
Reward optimization

Lecture Outline

Lecture maintenance
Perplexity notebook
Post-training recipe
Reward optimization

Lecture Outline

Lecture maintenance
Perplexity notebook
Post-training recipe
Reward optimization