TinyZero — это модель искусственного интеллекта, разработанная исследователями Калифорнийского университета в Беркли под руководством Джаи Пана. Проект представляет собой попытку воссоздать ключевые принципы работы DeepSeek R1-Zero с минимальными затратами — всего за $30.

Как работает TinyZero?
Модель использует метод обучения с подкреплением (reinforcement learning), но в отличие от традиционных моделей, она:
- обучается без использования мощных облачных серверов и дорогих вычислительных ресурсов;
- работает на основе небольшой языковой модели, простого текстового запроса и системы вознаграждений;
- способна проверять свои ответы, находить ошибки и улучшать их без внешнего вмешательства.
Эксперимент и результаты
Исследователи протестировали TinyZero на игре Countdown, где нужно достичь заданного числа, используя базовые математические операции.
- Модели с 500 млн параметров угадывали наугад и не улучшали результаты.
- Модели от 1,5 млрд параметров и выше начали самостоятельно проверять свои решения, корректировать ошибки и повышать точность ответов.

По сути, TinyZero показала, что даже малобюджетные ИИ-модели могут обучаться сложным навыкам рассуждения.
Доступность и перспективы
TinyZero — открытый проект, доступный на GitHub. Любой разработчик может скачать код, экспериментировать и адаптировать его для собственных целей.
Как отметил автор проекта Джаи Пан в соцсети X* (Twitter): «Вы можете испытать момент «Ага!» сами — менее чем за $30».
Хотя TinyZero пока тестировалась только на одной задаче, исследователи надеются, что их подход сделает изучение ИИ доступнее, а разработка умных алгоритмов перестанет быть прерогативой только крупных технологических компаний.
* X (Twitter) заблокирован в России по решению Генпрокуратуры от 24 февраля 2022 г.