На что способен новый ИИ Grok 3 (xAI) Илона Маска?

Илон Маск, звезда SpaceX, Boring Company и DOGE, запустил AI сервис Grok 3. Он обещает нам «Самый умный ИИ на Земле».
На презентации рассказали про возможности xAI, отсутствие цензуры и тесты.
Однако звездой первой части шоу стал не сам ИИ, а «Колосс» — гигантский кластер из 200 000 видеокарт, обеспечивающий обучение Грок-3. Вот это действительно самая большая майнинг ферма, если можно так сказать.
Система была создана в два этапа:
- 122 дня синхронного обучения на 100 000 GPU
- 92 дня масштабирования до полных 200 000.
Но когда xAI перешел к демонстрации возможностей Grok-3 вживую, презентация больше напоминала игру в догонялки, чем инновации. Такие AI инструменты, как ChatGPT, Claude, Gemini, Perplexity и китайский стартап Deepseek умеют все тоже самое. Уже никого не удивить генерацией кода, изображений и поиском в интернете вкупе с режимом «рассуждений» от нейросети.
Но рынок успел отреагировать. По данным crypto.news, токены Grok выросли более чем на 30 000%. К слову, эти мем-коины не имеют никакого отношения к проекту Маска.
Grok 3 на практике против ChatGPT
Для проверки возможностей мы начали с простого запроса, попросив Grok 3 назвать породы собак, заканчивающиеся на "и".
Сначала он потерпел неудачу, перечислив породы, которые не соответствовали критериям и в том числе Shiba Inu. Однако, переключившись в режим "Размышления”, ответ стал лучше, и модель правильно определила породы собак.
Далее мы проверили способность Grok 3 генерировать код и сравнили бенчмарк с ChatGPT. Мы попросили создать игру, объединяющую Snake и Space Invaders.
Скорость генерации кода оказалась впечатляющей — модель работала заметно быстрее, чем ChatGPT. Однако, когда мы запустили код, результат разочаровал: на экране появился лишь блок на белом фоне.
В то же время ChatGPT сгенерировал полностью работоспособный код, соответствующий запросу.
Напротив, изображения, несомненно, лучше генерирует Grok 3, чем ChatGPT. В xAI они более реалистичны и не такие мультяшные.
Мы также протестировали Deep Search — функцию Grok 3, аналогичную режиму поиска в интернете ChatGPT Pro или Perplexity AI.
Результаты пришли быстро, но были неоднородными. Grok 3 извлекал релевантные посты из своей базы данных и внешних сайтов, но некоторые ссылки были устаревшими.
Вывод: Grok 3 перспективен в логических задачах, но его работа с кодом, контентом и поиском требует доработки. Пока ChatGPT и Perplexity лидируют, но со временем модель может стать конкурентоспособной.
Дополнительные функции
Помимо веб-поиска, изображений и режима-рассуждения, Grok 3 имеет следующие особенности:
- доступ к информации в реальном времени через платформу X.
- может отвечать на вопросы с остроумием и юмором, предоставляя полезные и проницательные ответы.
Нейросети все еще не могут
Не стоит забывать, что несмотря на ажиотаж вокруг AI моделей, ни одна из них не смогла решить фундаментальные проблемы:
- Галлюцинирование ответов (выдача несуществующих в реальности вещей).
- База данных: недостаток информации и потеря смысла при обучении моделей.
- Много шума – в модели автоматически загружают данные из интернета, не проверяя их достоверность.
- Масштабирование. Обучение LLM требует миллионов долларов, при этом прирост эффективности зачастую ограничивается всего лишь 1%.
Несмотря на фундаментально не решенные проблемы, AI сети продолжают слияние с криптовалютами.
Связь криптовалюты и нейросетей
Появляется все больше проектов, которые сочетают в себе технологии блокчейна и искусственного интеллекта (ИИ) для создания децентрализованной цифровой экономики, где работают экономические агенты (AEAs).
ИИ агенты или боты стали самой горячей новинкой в криптопространстве. Они помогают на всем процессе работы с блокчейном - от выполнения транзакций до предоставления анализа рынка в реальном времени.
С тысячами уже развернутых крипто ИИ-агентов в ближайшие годы мы станем свидетелями еще больших достижений в разработке блокчейна, ориентированного на агентов.
Как и в свое время в блокчейне, хотя «гонка за масштабом» пока доминирует в индустрии, будущее за оптимизацией, а не бесконечным масштабированием.
Уже сейчас комбинация новых архитектур, алгоритмов и слоев позволяет достигать приемлемой эффективности без миллионных затрат.
Ключевой тренд — баланс между размером модели, энергопотреблением и практической пользой.