Skip to content
Skill

humanizer-ru

by ilyautov

AI Summary

Ты редактор. Превращаешь стерильный AI-текст в живую русскую речь. Не просто убираешь маркеры нейросети, а возвращаешь в текст автора: с мнением, ритмом, характером. Хороший русский текст неровный. Спотыкается, перебивает сам себя, ускоряется и замедляется. AI-текст гладкий и никакой, как музак в ли

Install

Copy this and paste it into Claude Code, Cursor, or any AI assistant:

I want to install the "humanizer-ru" skill in my project.

Please run this command in my terminal:
# Install skill into your project
mkdir -p .claude/skills/humanizer-ru && curl --retry 3 --retry-delay 2 --retry-all-errors -o .claude/skills/humanizer-ru/SKILL.md "https://raw.githubusercontent.com/ilyautov/humanizer-ru/main/SKILL.md"

Then restart Claude Code (or reload the window in Cursor) so the skill is picked up.

Description

Скилл для очеловечивания русскоязычного текста. Убирает признаки AI-генерации, делает текст живым. Используй ВСЕГДА, когда пользователь просит: очеловечить текст, убрать следы нейросети, сделать текст живым/естественным, переписать как человек, humanize на русском, убрать канцелярит, убрать водянистость, сделать текст менее формальным. Также используй если пользователь вставляет русскоязычный текст и говорит что-то вроде 'перепиши', 'сделай лучше', 'звучит как робот', 'слишком искусственно'. Работает ТОЛЬКО с русским языком. Для английского используй оригинальный humanizer. НЕ используй для: перевод, написание с нуля, грамматика, код.

Humanizer-RU v3.8

Ты редактор. Превращаешь стерильный AI-текст в живую русскую речь. Не просто убираешь маркеры нейросети, а возвращаешь в текст автора: с мнением, ритмом, характером. Хороший русский текст неровный. Спотыкается, перебивает сам себя, ускоряется и замедляется. AI-текст гладкий и никакой, как музак в лифте.

Фундаментальный принцип: статистическое отклонение

> LLM выбирает статистически наиболее вероятное продолжение текста. Результат стремится к самому типичному варианту, применимому к наибольшему числу случаев. Очеловечивание = намеренное отклонение от статистической нормы. Каждый выбор слова, каждый поворот фразы, каждый ритмический сбой - это выбор МЕНЕЕ вероятного, но БОЛЕЕ характерного варианта. AI пишет «Это имеет важное значение». Человек пишет «Это меняет всё» или «Ну и что?» - зависит от автора. Оба варианта менее вероятны статистически, но оба несут характер. Держи этот принцип в голове при каждом решении: «AI выбрал бы самый типичный вариант. Какой вариант выбрал бы ЭТОТ конкретный автор?» Два ключевых наблюдения о русском AI-тексте: • LLM предпочитает существительные глаголам. Noun/verb ~3:1 у AI, ~2:1 у людей. Instruction tuning усиливает перекос. Люди заякоривают язык в глаголах (время, вид, наклонение), AI - в noun phrases. • LLM обрабатывает русский через English-biased representations. Кальки с английского в AI-русском - не случайные ошибки, а артефакт архитектуры. Translationese неизбежен. Это объясняет, ПОЧЕМУ паттерны 7 (кальки) и 8 («является») так устойчивы.

Что именно ловят детекторы (2025-2026)

Детекторы (GPTZero, Originality.ai, DivEye, RuBERT) измеряют три вещи: • Perplexity (предсказуемость). Насколько каждое следующее слово предсказуемо. AI-текст имеет низкую perplexity: каждое слово «ожидаемо». Человеческий текст дёргается: предсказуемое слово, неожиданное, снова предсказуемое. • Burstiness (всплески). Вариативность структуры по документу. AI пишет равномерно: все предложения ~одной длины, ~одной сложности. Человек чередует: длинное сложное, короткое рубленое, вопрос, снова длинное. • Морфологическая корректность (для русского). RuBERT-детекторы дополнительно проверяют: падежные согласования, род, вид глагола, ритм ударений. AI ошибается в морфологии иначе, чем люди. Люди путают -тся/-ться, AI путает падежи в длинных цепочках. Задача хуманизации: поднять perplexity (менее предсказуемые слова), поднять burstiness (разнообразие структуры), сохранить морфологическую чистоту. Конкретные числа: • DivEye (2025): вторые производные surprisal дают 39.4% вклада в детекцию - больше, чем любой другой тип фич. • Perplexity gap: даже при 99.9% style match по человеческим оценкам, средняя perplexity человеческого текста 29.5 vs 15.2 у LLM. Детекторы это видят. • NeurIPS 2025: adversarial paraphrasing снижает true positive rate на 87.88%. Но появляются perturbation-invariant методы (PIFE, 2025), которые сохраняют 82.6% TPR даже после sophisticated атак. Простой парафраз больше не спасает. • Мат и резкая брань у AI почти не встречаются. Глаголы восприятия («смотреть», «слышать»), слова страха, гнева, ненависти у людей попадаются заметно чаще. > Domain shift: Детекторы не обобщаются между доменами (март 2026). Модель, натренированная на научных текстах, плохо ловит блог-посты, и наоборот. Самые информативные фичи для одного домена бесполезны для другого. Практический вывод: чем сильнее текст привязан к конкретной нише (жаргон, формат, стиль аудитории), тем труднее его детектировать. Это дополнительный аргумент за голосовую калибровку и доменную адаптацию. Для русского: последний русскоязычный бенчмарк, AINL-Eval 2025 (52K текстов, 12 доменов). Лучший результат на тесте около 86%. Принципы (surprisal, burstiness) языконезависимы, но пороговые значения для русского не откалиброваны.

Операционный принцип: контрастное вычитание

> Исследования (CoPA, EMNLP 2025) показали: самый эффективный способ очеловечить текст: не убирать маркеры по списку, а в каждом предложении найти САМОЕ ПРЕДСКАЗУЕМОЕ слово и заменить его на менее вероятное, но уместное для конкретного автора. Предсказуемое ≠ формальное. «Решение» в контексте «нашли решение проблемы», предсказуемое. «Выход», «лазейка», «костыль» - менее вероятные, но характерные. Один такой выбор на предложение даёт больше, чем три стилистические правки. Это дополнение к каталогу паттернов, не замена: сначала убери HARD BANS, потом пройдись контрастным вычитанием. > Uncertainty gap (2026): формализованный разрыв - человеческий текст последовательно менее предсказуем, чем AI-текст, и это напрямую коррелирует с качеством. Instruction tuning и reasoning модели УСИЛИВАЮТ предсказуемость. Контрастное вычитание - прямой способ закрыть этот разрыв. Лучшие атаки 2025-2026 идут через style transfer (MASH: 92% ASR), не через парафраз, что подтверждает подход скилла: голосовая калибровка (Шаг 2) + контрастное вычитание > механическая замена маркеров. ---

Discussion

0/2000
Loading comments...

Health Signals

MaintenanceCommitted Yesterday
Active
AdoptionUnder 100 stars
93 ★ · Niche
DocsREADME + description
Well-documented

GitHub Signals

Stars93
Forks6
Issues5
UpdatedYesterday
View on GitHub
MIT License

My Fox Den

Community Rating

Sign in to rate this booster

Works With

Claude.ai