Grok 3: "самый умный" ИИ с 17 февраля

lisa99 · 16.02.2025

Чат-бот Grok 3 от компании xAI американского бизнесмена Илона Маска будет представлен в США в понедельник, 17 февраля.
«Grok 3 выйдет вместе с лайв-презентацией в понедельник вечером в 07:00 по московскому времени. Самый умный ИИ на Земле», – написал Илон Маск в Х

Grok 3 – искусственный интеллект от компании xAI, которой владеет Илон Маск.
По словам предпринимателя, ИИ будет превосходить ChatGPT и Gemini.
Grok 3 умеет обрабатывать данные и учиться на собственных ошибках. Также чат-бот будет бесплатным и в нем не будет цензуры.

Маск рассказал о планируемом запуске чат-бота Grok 3 во время видеоконференции на Всемирном правительственном саммите в Дубае в четверг, назвав его моделью искусственного интеллекта, которая превзойдет все конкурирующие инструменты, выпущенные до сих пор.Модель была разработана на основе синтетических данных и способна анализировать ошибки, которые она допускает, просматривая данные для достижения логической последовательности.

Запуск Grok 3 происходит в связи с тем, что страны спешат внедрить чат-ботов с искусственным интеллектом, которые являются более сложными и дешевыми в изготовлении. Китайский стартап DeepSeek, который ошеломил рынки моделью, сравнимой с ChatGPT от OpenAI, активно набирает специалистов в знак своих быстро растущих амбиций.Маск и Сэм Альтман, которые вместе в 2015 году стали соучредителями некоммерческой организации OpenAI, также долгое время враждовали из—за направления деятельности компании.

weaver · 17.02.2025

Видимо надавили (на Маска, а может не только на него...) и спросили, есть ли у нас что-то в противовес DeepSeek вот и Grok 3 раньше времени ~~вылез~~ показался... А еще пока эта тема ловит хайп её и заабузить можно, сами понимаете grok3.exe

JamesKing · 18.02.2025

Маск много всего говорил и многое оказывалось просто пиаром, так что отношусь со скепсисом.

lisa99 · 18.02.2025

Вышли обзоры после презентации.
- никакой бесплатности, и даже никакой масовой платности, если я правильно поняла (премиум+)
- голосовой модуль не подключен

Посему степень ума оценить трудно.
Конечно, со временем, этак, через годик все прояснится.

Немного в сторону - отдельный топик не завожу.
Пока мой личный выбор - скромный китаец Qwen (технарь от Алибаба). Код пишет лучше чем ДипСик, имхо и чем Гигачат, и Chatgpt. Посоветовала зайти им на рынок РФ в качестве бесплатного репетитора по китайскому языку и обучению программированию.

Как тестируют ИИ? Квен предложил для тестирования выбрать
- запрещенную\спорную тему
- написание кода
- плохо сформулированное задание, которое требует уточнений от ИИ.
и что-то еще.

А правда, как объективно потестировать ИИ?

Xowak · 18.02.2025

lisa99 сказал(а):

А правда, как объективно потестировать ИИ?

У "ученых умов" есть там какие-то свои тесты. Я для себя для написания кода сравнивал gpt-4o, claude 3.5 sonnet, deepseek r1.
С простым кодом они все справляются, claude чуть лучше.
Если какой-то сложный код или алгоритм, то для меня лучше claude и deepseek. Claude выдает более правильное/чистое решение, deepseek (именно r1) за счет размышлений может навести на какую-то интересную мысль.

lisa99 · 18.02.2025

Xowak сказал(а):

У "ученых умов" есть там какие-то свои тесты. Я для себя для написания кода сравнивал gpt-4o, claude 3.5 sonnet, deepseek r1.
С простым кодом они все справляются, claude чуть лучше.
Если какой-то сложный код или алгоритм, то для меня лучше claude и deepseek. Claude выдает более правильное/чистое решение, deepseek (именно r1) за счет размышлений может навести на какую-то интересную мысль.

можно попросить потестировать написание кода Квеном? https://chat.qwenlm.ai/
интересно послушать мнение

shrekushka · 18.02.2025

JamesKing сказал(а):

Маск много всего говорил и многое оказывалось просто пиаром, так что отношусь со скепсисом.

For a guy who’s so into electric cars, you’d think he’d consider an electric vasectomy. He’s got more kids in the pipeline than SpaceX has rockets.
And his ‘free speech revolution’ is just free advertising for his ego, and it’s not exactly raising the IQ of political + scientific discourse.
Fuck him.

Xowak · 18.02.2025

lisa99 сказал(а):

можно попросить потестировать написание кода Квеном? https://chat.qwenlm.ai/
интересно послушать мнение

"500: Internal Error", благо у меня есть доступ к апи через аггрегаторы.
Посмотрел бегло.
По ощущениям - qwen разбивает задачу на шаги (как и deepseek), в переделах каждого шага код правильный, но вместе он не связан.
То есть если взять код из каждого шага по отдельности, то суммарный код имеет логические ошибки. Deepseek и Claude в этом отношении лучше.
В итоге я бы поставил qwen в один ряд с gpt-4o, пользоваться можно, но сложные задачи надо внимательнее проверять.

PS: это только мое мнение и только на примере одной конкретной задачи. В дальнешем буду дальше пробовать тоже.

antikrya · 18.02.2025

lisa99 сказал(а):

можно попросить потестировать написание кода Квеном? https://chat.qwenlm.ai/

квен при длинной переписке забывает часть кода, и фокусируется на том месте где происходит ошибка, варианты решения предлагает по кругу.
универсального решения пока нет, когда один ИИ не справляется, тогда я просто иду к другому и он подсказывает

bigheadguy · 18.02.2025

Илон Маск выпустил Grok 3 — он утверждает, что это «самый умнейший ИИ на Земле»: новая модель стала в 10 раз мощнее своего предшественника Grok 2.

Что умеет:

— Нейросеть клепает играбельные проекты: на стриме она создала «Тетрис», но с фишками «три в ряд»;
— В области математики, научных исследований и программирования нейросеть превзошла GPT-4o, Gemini-2 Pro и Claude 3.5 Sonnet.
— В прямом эфире бот смоделировал полёт людей на Марс и их обратное возвращение на Землю - с учётом всех нюансов;
— Подвезли фичу DeepSearch: инструмент прочёсывает весь интернет в поисках данных и выдаёт чёткий, структурированный ответ;
— Grok 3 умеет анализировать и может подобрать оптимальный билд для онлайн-игры, учитывая актуальную мету;
— Обучение модели происходило на суперкомпьютере Colossus, состоящем из 200 000 чипов NVIDIA H100;
— Первые тестеры остались довольны результатами.

Grok 3 уже раскатали на юзеров X с подпиской Premium+. Потестить бесплатно можно — здесь. (https://lmarena.ai/)

reydenm1 · 18.02.2025

Как будто бы, релиз собран тупо из соображений выхода GPT-5. Обещания про увеличения компьюта для трейна в 5 раз для следующей модели, тупо маркетинг. Хорошо, если выдадут Грок 2 в опенсорс.

shrekushka · 18.02.2025

weaver сказал(а):

.exe

I believed we were on the same side.(

weaver · 18.02.2025

shrekushka сказал(а):

I believed we were on the same side.(

I don't spread malware, these are just thoughts out loud. I'm interested in thinking about what can be abused. This is the right way of thinking, which the snort team also talked about. And I don't distribute it for only one reason. Because it's not interesting, and not for ethical reasons.

shrekushka · 18.02.2025

weaver сказал(а):

I don't spread malware, these are just thoughts out loud. I'm interested in thinking about what can be abused. This is the right way of thinking, which the snort team also talked about. And I don't distribute it for only one reason. Because it's not interesting, and not for ethical reasons.

Lol... I wasn't goinf for the color of our hats... Haha
I meant.. .exe as in Windows vs *nix

oxx2235 · 20.02.2025

Ну что как GROK?

TROUBLE · 20.02.2025

lisa99 сказал(а):

По словам предпринимателя, ИИ будет превосходить ChatGPT и Gemini.

АГА

httpstop · 21.02.2025

antikrya сказал(а):

квен при длинной переписке забывает часть кода, и фокусируется на том месте где происходит ошибка, варианты решения предлагает по кругу.
универсального решения пока нет, когда один ИИ не справляется, тогда я просто иду к другому и он подсказывает

А я пишу только с ChatGPT когда начинает тупить открываю новый чат наработки закидываю в проект или работаем дальше, обычно их хватает на пол часика и они начинают путаться в показаниях.
Пробовал дипсик но она на втором запросе падает, qwen хорошая штука, но тоже что то не очень стабильно работает.

DimmuBurgor · 21.02.2025

shrekushka сказал(а):

For a guy who’s so into electric cars, you’d think he’d consider an electric vasectomy. He’s got more kids in the pipeline than SpaceX has rockets.
And his ‘free speech revolution’ is just free advertising for his ego, and it’s not exactly raising the IQ of political + scientific discourse.
Fuck him.

Peter Thiel is not far behind him, too

shrekushka · 21.02.2025

DimmuBurgor сказал(а):

Peter Thiel is not far behind him, too

"Centrists"

DimmuBurgor · 22.02.2025

shrekushka сказал(а):

"Centrists"

because... when CPClear and Peoplemap isn't bad enough: Palantir?

Grok 3: "самый умный" ИИ с 17 февраля

Мисс Марпл

31 c0 bb ea 1b e6 77 66 b8 88 13 50 ff d3

RAID-массив

Мисс Марпл

HDD-drive

Мисс Марпл

(L1) cache

HDD-drive

(L2) cache

TPU unit

RAM

(L1) cache

31 c0 bb ea 1b e6 77 66 b8 88 13 50 ff d3

(L1) cache

RAM

OLD SCHOOL

HDD-drive

CPU register

(L1) cache

CPU register