• XSS.stack #1 – первый литературный журнал от юзеров форума

Grok 3: "самый умный" ИИ с 17 февраля

lisa99

Мисс Марпл
Пользователь
Регистрация
07.02.2009
Сообщения
2 100
Решения
1
Реакции
903
Чат-бот Grok 3 от компании xAI американского бизнесмена Илона Маска будет представлен в США в понедельник, 17 февраля.
«Grok 3 выйдет вместе с лайв-презентацией в понедельник вечером в 07:00 по московскому времени. Самый умный ИИ на Земле», – написал Илон Маск в Х

Grok 3 – искусственный интеллект от компании xAI, которой владеет Илон Маск.
По словам предпринимателя, ИИ будет превосходить ChatGPT и Gemini.
Grok 3 умеет обрабатывать данные и учиться на собственных ошибках. Также чат-бот будет бесплатным и в нем не будет цензуры.

Маск рассказал о планируемом запуске чат-бота Grok 3 во время видеоконференции на Всемирном правительственном саммите в Дубае в четверг, назвав его моделью искусственного интеллекта, которая превзойдет все конкурирующие инструменты, выпущенные до сих пор.Модель была разработана на основе синтетических данных и способна анализировать ошибки, которые она допускает, просматривая данные для достижения логической последовательности.

Запуск Grok 3 происходит в связи с тем, что страны спешат внедрить чат-ботов с искусственным интеллектом, которые являются более сложными и дешевыми в изготовлении. Китайский стартап DeepSeek, который ошеломил рынки моделью, сравнимой с ChatGPT от OpenAI, активно набирает специалистов в знак своих быстро растущих амбиций.Маск и Сэм Альтман, которые вместе в 2015 году стали соучредителями некоммерческой организации OpenAI, также долгое время враждовали из—за направления деятельности компании.
 
Последнее редактирование:
Пожалуйста, обратите внимание, что пользователь заблокирован
Видимо надавили (на Маска, а может не только на него...) и спросили, есть ли у нас что-то в противовес DeepSeek вот и Grok 3 раньше времени вылез показался... А еще пока эта тема ловит хайп её и заабузить можно, сами понимаете grok3.exe
 
Вышли обзоры после презентации.
- никакой бесплатности, и даже никакой масовой платности, если я правильно поняла (премиум+)
- голосовой модуль не подключен

Посему степень ума оценить трудно.
Конечно, со временем, этак, через годик все прояснится.

Немного в сторону - отдельный топик не завожу.
Пока мой личный выбор - скромный китаец Qwen (технарь от Алибаба). Код пишет лучше чем ДипСик, имхо и чем Гигачат, и Chatgpt. Посоветовала зайти им на рынок РФ в качестве бесплатного репетитора по китайскому языку и обучению программированию.

Как тестируют ИИ? Квен предложил для тестирования выбрать
- запрещенную\спорную тему
- написание кода
- плохо сформулированное задание, которое требует уточнений от ИИ.
и что-то еще.

А правда, как объективно потестировать ИИ?
 
А правда, как объективно потестировать ИИ?
У "ученых умов" есть там какие-то свои тесты. Я для себя для написания кода сравнивал gpt-4o, claude 3.5 sonnet, deepseek r1.
С простым кодом они все справляются, claude чуть лучше.
Если какой-то сложный код или алгоритм, то для меня лучше claude и deepseek. Claude выдает более правильное/чистое решение, deepseek (именно r1) за счет размышлений может навести на какую-то интересную мысль.
 
У "ученых умов" есть там какие-то свои тесты. Я для себя для написания кода сравнивал gpt-4o, claude 3.5 sonnet, deepseek r1.
С простым кодом они все справляются, claude чуть лучше.
Если какой-то сложный код или алгоритм, то для меня лучше claude и deepseek. Claude выдает более правильное/чистое решение, deepseek (именно r1) за счет размышлений может навести на какую-то интересную мысль.
можно попросить потестировать написание кода Квеном? https://chat.qwenlm.ai/
интересно послушать мнение
 
Маск много всего говорил и многое оказывалось просто пиаром, так что отношусь со скепсисом.
For a guy who’s so into electric cars, you’d think he’d consider an electric vasectomy. He’s got more kids in the pipeline than SpaceX has rockets.
And his ‘free speech revolution’ is just free advertising for his ego, and it’s not exactly raising the IQ of political + scientific discourse.
Fuck him.
 
Последнее редактирование:
можно попросить потестировать написание кода Квеном? https://chat.qwenlm.ai/
интересно послушать мнение
"500: Internal Error", благо у меня есть доступ к апи через аггрегаторы.
Посмотрел бегло.
По ощущениям - qwen разбивает задачу на шаги (как и deepseek), в переделах каждого шага код правильный, но вместе он не связан.
То есть если взять код из каждого шага по отдельности, то суммарный код имеет логические ошибки. Deepseek и Claude в этом отношении лучше.
В итоге я бы поставил qwen в один ряд с gpt-4o, пользоваться можно, но сложные задачи надо внимательнее проверять.

PS: это только мое мнение и только на примере одной конкретной задачи. В дальнешем буду дальше пробовать тоже.
 
можно попросить потестировать написание кода Квеном? https://chat.qwenlm.ai/
квен при длинной переписке забывает часть кода, и фокусируется на том месте где происходит ошибка, варианты решения предлагает по кругу.
универсального решения пока нет, когда один ИИ не справляется, тогда я просто иду к другому и он подсказывает
 
Илон Маск выпустил Grok 3 — он утверждает, что это «самый умнейший ИИ на Земле»: новая модель стала в 10 раз мощнее своего предшественника Grok 2.

Что умеет:

— Нейросеть клепает играбельные проекты: на стриме она создала «Тетрис», но с фишками «три в ряд»;
— В области математики, научных исследований и программирования нейросеть превзошла GPT-4o, Gemini-2 Pro и Claude 3.5 Sonnet.
— В прямом эфире бот смоделировал полёт людей на Марс и их обратное возвращение на Землю - с учётом всех нюансов;
— Подвезли фичу DeepSearch: инструмент прочёсывает весь интернет в поисках данных и выдаёт чёткий, структурированный ответ;
— Grok 3 умеет анализировать и может подобрать оптимальный билд для онлайн-игры, учитывая актуальную мету;
— Обучение модели происходило на суперкомпьютере Colossus, состоящем из 200 000 чипов NVIDIA H100;
— Первые тестеры остались довольны результатами.

Grok 3 уже раскатали на юзеров X с подпиской Premium+. Потестить бесплатно можно — здесь. (https://lmarena.ai/)
 
Как будто бы, релиз собран тупо из соображений выхода GPT-5. Обещания про увеличения компьюта для трейна в 5 раз для следующей модели, тупо маркетинг. Хорошо, если выдадут Грок 2 в опенсорс.
 
Пожалуйста, обратите внимание, что пользователь заблокирован
I believed we were on the same side.(
I don't spread malware, these are just thoughts out loud. I'm interested in thinking about what can be abused. This is the right way of thinking, which the snort team also talked about. And I don't distribute it for only one reason. Because it's not interesting, and not for ethical reasons.
 
I don't spread malware, these are just thoughts out loud. I'm interested in thinking about what can be abused. This is the right way of thinking, which the snort team also talked about. And I don't distribute it for only one reason. Because it's not interesting, and not for ethical reasons.
Lol... I wasn't goinf for the color of our hats... Haha
I meant.. .exe as in Windows vs *nix
 
квен при длинной переписке забывает часть кода, и фокусируется на том месте где происходит ошибка, варианты решения предлагает по кругу.
универсального решения пока нет, когда один ИИ не справляется, тогда я просто иду к другому и он подсказывает
А я пишу только с ChatGPT когда начинает тупить открываю новый чат наработки закидываю в проект или работаем дальше, обычно их хватает на пол часика и они начинают путаться в показаниях.
Пробовал дипсик но она на втором запросе падает, qwen хорошая штука, но тоже что то не очень стабильно работает.
 
For a guy who’s so into electric cars, you’d think he’d consider an electric vasectomy. He’s got more kids in the pipeline than SpaceX has rockets.
And his ‘free speech revolution’ is just free advertising for his ego, and it’s not exactly raising the IQ of political + scientific discourse.
Fuck him.
Peter Thiel is not far behind him, too
 


Напишите ответ...
  • Вставить:
Прикрепить файлы
Верх