by Hugging Face
Treine modelos com TRL: conversão SFT, DPO, GRPO, GGUF
Utilizamos cookies para melhorar sua navegação, servir conteúdo personalizado e analisar nosso tráfego.
Necesarias para el funcionamiento
Ayudan a mejorar rastreando el uso
Usadas para publicidad dirigida
cookie_policy