TinyZero: революция в мире доступного ИИ

TinyZero — это модель искусственного интеллекта, разработанная исследователями Калифорнийского университета в Беркли под руководством Джаи Пана. Проект представляет собой попытку воссоздать ключевые принципы работы DeepSeek R1-Zero с минимальными затратами — всего за $30.

TinyZero
TinyZero. Фото: AINews.

Как работает TinyZero?

Модель использует метод обучения с подкреплением (reinforcement learning), но в отличие от традиционных моделей, она:

  • обучается без использования мощных облачных серверов и дорогих вычислительных ресурсов;
  • работает на основе небольшой языковой модели, простого текстового запроса и системы вознаграждений;
  • способна проверять свои ответы, находить ошибки и улучшать их без внешнего вмешательства.

Эксперимент и результаты

Исследователи протестировали TinyZero на игре Countdown, где нужно достичь заданного числа, используя базовые математические операции.

  1. Модели с 500 млн параметров угадывали наугад и не улучшали результаты.
  2. Модели от 1,5 млрд параметров и выше начали самостоятельно проверять свои решения, корректировать ошибки и повышать точность ответов.
TinyZero
TinyZero. Фото: Соцсети.

По сути, TinyZero показала, что даже малобюджетные ИИ-модели могут обучаться сложным навыкам рассуждения.

Доступность и перспективы

TinyZero — открытый проект, доступный на GitHub. Любой разработчик может скачать код, экспериментировать и адаптировать его для собственных целей.

Как отметил автор проекта Джаи Пан в соцсети X* (Twitter): «Вы можете испытать момент «Ага!» сами — менее чем за $30».

Хотя TinyZero пока тестировалась только на одной задаче, исследователи надеются, что их подход сделает изучение ИИ доступнее, а разработка умных алгоритмов перестанет быть прерогативой только крупных технологических компаний.

* X (Twitter) заблокирован в России по решению Генпрокуратуры от 24 февраля 2022 г.

Новости-Ру - Главные новости сегодня | Последние новости России
Добавить комментарий