PyDigger - unearthing stuff about Python

Found 4 out of 307,267. Showing 4 on page 0. Total pages: 1.

Name	Version	Summary	date
trl	0.21.0	Train transformer language models with reinforcement learning.	2025-08-05 16:51:08
trl-fpo	0.0.14	Train transformer language models with reinforcement learning.	2025-01-18 04:51:57
nemo-aligner	0.6.0	NeMo-Aligner - a toolkit for model alignment	2025-01-07 23:05:48
shtec-rlhf	1.0.5	shtec-rlhf: Safe Reinforcement Learning from Human Feedback	2024-06-24 05:55:07

Found 4 out of 307,267. Showing 4 on page 0. Total pages: 1.