How do I install hugging-face-model-trainer?

hugging-face-model-trainer is a Skill hosted on GitHub at https://github.com/huggingface/skills. Visit the ImAiFox page at https://imaifox.com/boosters/huggingface-skills-hugging-face-model-trainer for the AI-ready install prompt you can copy directly into Claude Code, Cursor, or Windsurf.

How popular is hugging-face-model-trainer?

hugging-face-model-trainer has 8,500 GitHub stars and 502 forks. The repository has not had recent commits.

Is hugging-face-model-trainer free?

Yes — hugging-face-model-trainer is open source and free to use under the Apache-2.0 license. The source code is publicly available on GitHub at https://github.com/huggingface/skills.

Skill

hugging-face-model-trainer

Name: hugging-face-model-trainer
Author: huggingface

by huggingface

AI Summary

A skill for fine-tuning and training language models on Hugging Face's cloud GPU infrastructure using TRL, supporting SFT, DPO, GRPO methods and GGUF conversion for local deployment. Developers and ML engineers working with cloud-based model training benefit from this comprehensive guidance.

Install

Copy this and paste it into Claude Code, Cursor, or any AI assistant:

I want to install the "hugging-face-model-trainer" skill in my project.

Please run this command in my terminal:
# Install skill into the correct directory (17 files)
mkdir -p .claude/skills/hugging-face-model-trainer && curl --retry 3 --retry-delay 2 --retry-all-errors -o .claude/skills/hugging-face-model-trainer/SKILL.md "https://raw.githubusercontent.com/huggingface/skills/main/skills/hugging-face-model-trainer/SKILL.md" && mkdir -p .claude/skills/hugging-face-model-trainer/references && curl --retry 3 --retry-delay 2 --retry-all-errors -o .claude/skills/hugging-face-model-trainer/references/gguf_conversion.md "https://raw.githubusercontent.com/huggingface/skills/main/skills/hugging-face-model-trainer/references/gguf_conversion.md" && mkdir -p .claude/skills/hugging-face-model-trainer/references && curl --retry 3 --retry-delay 2 --retry-all-errors -o .claude/skills/hugging-face-model-trainer/references/hardware_guide.md "https://raw.githubusercontent.com/huggingface/skills/main/skills/hugging-face-model-trainer/references/hardware_guide.md" && mkdir -p .claude/skills/hugging-face-model-trainer/references && curl --retry 3 --retry-delay 2 --retry-all-errors -o .claude/skills/hugging-face-model-trainer/references/hub_saving.md "https://raw.githubusercontent.com/huggingface/skills/main/skills/hugging-face-model-trainer/references/hub_saving.md" && mkdir -p .claude/skills/hugging-face-model-trainer/references && curl --retry 3 --retry-delay 2 --retry-all-errors -o .claude/skills/hugging-face-model-trainer/references/reliability_principles.md "https://raw.githubusercontent.com/huggingface/skills/main/skills/hugging-face-model-trainer/references/reliability_principles.md" && mkdir -p .claude/skills/hugging-face-model-trainer/references && curl --retry 3 --retry-delay 2 --retry-all-errors -o .claude/skills/hugging-face-model-trainer/references/trackio_guide.md "https://raw.githubusercontent.com/huggingface/skills/main/skills/hugging-face-model-trainer/references/trackio_guide.md" && mkdir -p .claude/skills/hugging-face-model-trainer/references && curl --retry 3 --retry-delay 2 --retry-all-errors -o .claude/skills/hugging-face-model-trainer/references/training_methods.md "https://raw.githubusercontent.com/huggingface/skills/main/skills/hugging-face-model-trainer/references/training_methods.md" && mkdir -p .claude/skills/hugging-face-model-trainer/references && curl --retry 3 --retry-delay 2 --retry-all-errors -o .claude/skills/hugging-face-model-trainer/references/training_patterns.md "https://raw.githubusercontent.com/huggingface/skills/main/skills/hugging-face-model-trainer/references/training_patterns.md" && mkdir -p .claude/skills/hugging-face-model-trainer/references && curl --retry 3 --retry-delay 2 --retry-all-errors -o .claude/skills/hugging-face-model-trainer/references/troubleshooting.md "https://raw.githubusercontent.com/huggingface/skills/main/skills/hugging-face-model-trainer/references/troubleshooting.md" && mkdir -p .claude/skills/hugging-face-model-trainer/references && curl --retry 3 --retry-delay 2 --retry-all-errors -o .claude/skills/hugging-face-model-trainer/references/unsloth.md "https://raw.githubusercontent.com/huggingface/skills/main/skills/hugging-face-model-trainer/references/unsloth.md" && mkdir -p .claude/skills/hugging-face-model-trainer/scripts && curl --retry 3 --retry-delay 2 --retry-all-errors -o .claude/skills/hugging-face-model-trainer/scripts/convert_to_gguf.py "https://raw.githubusercontent.com/huggingface/skills/main/skills/hugging-face-model-trainer/scripts/convert_to_gguf.py" && mkdir -p .claude/skills/hugging-face-model-trainer/scripts && curl --retry 3 --retry-delay 2 --retry-all-errors -o .claude/skills/hugging-face-model-trainer/scripts/dataset_inspector.py "https://raw.githubusercontent.com/huggingface/skills/main/skills/hugging-face-model-trainer/scripts/dataset_inspector.py" && mkdir -p .claude/skills/hugging-face-model-trainer/scripts && curl --retry 3 --retry-delay 2 --retry-all-errors -o .claude/skills/hugging-face-model-trainer/scripts/estimate_cost.py "https://raw.githubusercontent.com/huggingface/skills/main/skills/hugging-face-model-trainer/scripts/estimate_cost.py" && mkdir -p .claude/skills/hugging-face-model-trainer/scripts && curl --retry 3 --retry-delay 2 --retry-all-errors -o .claude/skills/hugging-face-model-trainer/scripts/train_dpo_example.py "https://raw.githubusercontent.com/huggingface/skills/main/skills/hugging-face-model-trainer/scripts/train_dpo_example.py" && mkdir -p .claude/skills/hugging-face-model-trainer/scripts && curl --retry 3 --retry-delay 2 --retry-all-errors -o .claude/skills/hugging-face-model-trainer/scripts/train_grpo_example.py "https://raw.githubusercontent.com/huggingface/skills/main/skills/hugging-face-model-trainer/scripts/train_grpo_example.py" && mkdir -p .claude/skills/hugging-face-model-trainer/scripts && curl --retry 3 --retry-delay 2 --retry-all-errors -o .claude/skills/hugging-face-model-trainer/scripts/train_sft_example.py "https://raw.githubusercontent.com/huggingface/skills/main/skills/hugging-face-model-trainer/scripts/train_sft_example.py" && mkdir -p .claude/skills/hugging-face-model-trainer/scripts && curl --retry 3 --retry-delay 2 --retry-all-errors -o .claude/skills/hugging-face-model-trainer/scripts/unsloth_sft_example.py "https://raw.githubusercontent.com/huggingface/skills/main/skills/hugging-face-model-trainer/scripts/unsloth_sft_example.py"

Then restart Claude Code (or reload the window in Cursor) so the skill is picked up.

ai skill

Description

This skill should be used when users want to train or fine-tune language models using TRL (Transformer Reinforcement Learning) on Hugging Face Jobs infrastructure. Covers SFT, DPO, GRPO and reward modeling training methods, plus GGUF conversion for local deployment. Includes guidance on the TRL Jobs package, UV scripts with PEP 723 format, dataset preparation and validation, hardware selection, cost estimation, Trackio monitoring, Hub authentication, and model persistence. Should be invoked for tasks involving cloud GPU training, GGUF conversion, or when users mention training on Hugging Face Jobs without local GPU setup.

Overview

Train language models using TRL (Transformer Reinforcement Learning) on fully managed Hugging Face infrastructure. No local GPU setup required—models train on cloud GPUs and results are automatically saved to the Hugging Face Hub. TRL provides multiple training methods: • SFT (Supervised Fine-Tuning) - Standard instruction tuning • DPO (Direct Preference Optimization) - Alignment from preference data • GRPO (Group Relative Policy Optimization) - Online RL training • Reward Modeling - Train reward models for RLHF For detailed TRL method documentation: `python hf_doc_search("your query", product="trl") hf_doc_fetch("https://huggingface.co/docs/trl/sft_trainer") # SFT hf_doc_fetch("https://huggingface.co/docs/trl/dpo_trainer") # DPO

Prerequisites Checklist

Before starting any training job, verify:

✅ Dataset Requirements

• Dataset must exist on Hub or be loadable via datasets.load_dataset() • Format must match training method (SFT: "messages"/text/prompt-completion; DPO: chosen/rejected; GRPO: prompt-only) • ALWAYS validate unknown datasets before GPU training to prevent format failures (see Dataset Validation section below) • Size appropriate for hardware (Demo: 50-100 examples on t4-small; Production: 1K-10K+ on a10g-large/a100-large)

etc.

` See also: references/training_methods.md for method overviews and selection guidance

Discussion

0/2000

Loading comments...

Health Signals

MaintenanceCommitted 3mo ago

◐ Stale

Adoption1K+ stars on GitHub

8.5k ★ · Popular

DocsREADME + description

Well-documented

GitHub Signals

Stars8.5k

Forks502

Issues21

Updated3mo ago

View on GitHub

Apache-2.0 License

My Fox Den

Community Rating

Works With

Claude Code

Related Skills

Infrastructure Maintainer

Agent

Weibo Strategist

Agent

DevOps Automator

Agent

vercel-deploy

Skill

View all Skills →

hugging-face-model-trainer

Install

Description

Overview

Prerequisites Checklist

✅ **Dataset Requirements**

etc.

Discussion

Health Signals

GitHub Signals

My Fox Den

Community Rating

Works With

Related Skills

✅ Dataset Requirements