Explore AI Boosters

Skill

trl

This skill should be used when users want to train or fine-tune language models using TRL (Transformer Reinforcement Learning) on Hugging Face Jobs infrastructure. Covers SFT, DPO, GRPO and reward modeling training methods, plus GGUF conversion for local deployment. Includes guidance on the TRL Jobs package, UV scripts with PEP 723 format, dataset preparation and validation, hardware selection, cost estimation, Trackio monitoring, Hub authentication, and model persistence. Should be invoked for tasks involving cloud GPU training, GGUF conversion, or when users mention training on Hugging Face Jobs without local GPU setup.

by majiayu000

aiskill

11920

Autonomous Optimization Architect

Infrastructure Maintainer

huggingface-llm-trainer

huggingface-vision-trainer

huggingface-jobs

hugging-face-jobs

hugging-face-model-trainer

yieldingbear

btc-bottom-model

nano-banana-2-skill-marketplace

claudetop

trl

pinocchio-engineer

Harness Mcp V2 MCP Server

claude-context-optimizer

pinocchio-engineer

woz

HiveMind-Actions — Copilot Instructions

HiveMind-Actions — Copilot Instructions

Markdown Agents

codesession-marketplace

finance-tracker

Heor Agent Mcp MCP Server

mica