¡Únete a la quinta edición del mayor hackathon open-source de PLN para iberoamérica!
Antes de registrarte / Before registration:
- Discord: https://discord.com/invite/my8w7JUxZR
- Hugging Face: https://huggingface.co/organizations/somosnlp-hackathon-2026/share/DNcqoZrtSmEkyLLOiSYTQCzkcrquceDoVY
ES: Antes de registrarte, necesitas tener cuenta en Discord (canal de comunicación) y en Hugging Face (hub de datasets y modelos de IA).
PT: Antes de se cadastrar, você precisa ter uma conta no Discord (canal de comunicação) e no Hugging Face (hub de datasets e modelos de IA).
EN: Before registering, you need an account on Discord (communication channel) and on Hugging Face (AI datasets and models hub).
---------------------------------------------------------------------------------------------------
Elenco
Sergio Paniego
Información útil
Puntos destacados
- Online
Ubicación
Evento en línea
Agenda
-
Post-entrenamiento de LLMs
El hackathon dará comienzo con esta charla en la que Sergio nos presentará su trabajo en Hugging Face. Más allá de la plataforma, destacan librerías como TRL, centrada en el post-entrenamiento de modelos de lenguaje. A través de técnicas como SFT (Supervised Fine-Tuning) y GRPO (Group Relative Policy Optimization), se pueden superar las limitaciones del fine-tuning tradicional y desarrollar modelos mejor alineados con preferencias humanas y con mayores capacidades de razonamiento. También se abordarán estrategias para entrenar modelos de gran tamaño con recursos limitados, así como su escalado mediante herramientas como vLLM, Accelerate y DeepSpeed. Por último, se introducirá OpenEnv, un framework diseñado para integrar entornos interactivos que facilita el entrenamiento de agentes capaces de tomar decisiones en escenarios complejos.