• XSS.stack #1 – первый литературный журнал от юзеров форума

Как выбрать модель ИИ в 2025 году

MaFio

(L2) cache
Пользователь
Регистрация
23.02.2021
Сообщения
324
Реакции
321
Гарант сделки
2
Это мини-заметка для дедов и прадедов, которые тусуются на форуме со времен динозавров, но до сих пор не пользуются новыми технологиями ИИ, а также для всех тех, кто выбирает ИИ для конкретной работы.

В 2025 году выбор модели искусственного интеллекта зависит от ваших задач. В выборе вам поможет эта таблица:

AI.png


Если коротко, то:

  • ChatGPT лидирует в многозадачности: анализ данных, голосовое общение и глубокие исследования с функцией Deep Research делают его универсальным инструментом.
  • Claude - в написании кода и редактировании текстов, предлагая точность для рабочих процессов.
  • Gemini - хорош для длинных контекстов и мультимодален с рождения. Кстати, Google легко догнал лидеров и временами их опережает.
  • Grok - новый игрок, мощный конкурент от Илон Маска, сильный поиск и раскрепощённый подход.

- Perplexity - менее популярен у нас, но выигрывает в поиске фактов, заменяя классические поисковики.

Всё можно протестировать бесплатно (с ограничениями). Выбор зависит от баланса между стоимостью, функционалом и вашими целями — от творчества до аналитики.

Технологии ИИ развиваются стремительно, так что держите руку на пульсе!
 
вот бы ещё такую же таблицу, только с локальными БЯМ, которых можно попросить накодить шкафчик, нагенерировать голых баб, и рассказать рецепт приготовления метамфетамина дома на кухне.

пример для счастливых обладателей Nvidia 3090, отсюда: h t t p s : / / old.reddit.com/r/LocalLLaMA/comments/1jchrro/top_5_model_recommendations_for_newbie_with_24gb/
Here’s my top 5 recommendation for a beginner with 24GB VRAM (32GB for Mac) to try out. The list is from smallest to biggest.
...
Gemma 3 27B q4 for general use
Qwen2.5 Coder 32B q4 for coding (older than rest but still best)
QWQ 32B q4 for reasoning (better than distilled deepseek-r1-qwen-32b)
 
БЯМ, которых можно попросить накодить шкафчик, нагенерировать голых баб, и рассказать рецепт приготовления метамфетамина дома на кухне.

Зависит от того, как эти компактные модельки или даже опенсорс монстр вроде DeepSeek R1 671М были обучены и какие ограничения в них встроены изначально, а не от внешней установки вдали от api разработчиков. И если модель не курила данные по изготовлению мета на кухне, то такие данные она выдать не сможет, априори. Да и фильтры на "этичность" в локальных версиях есть.

Если хочется, а хочется, чтобы модель гарантированно генерировала такой контент, то надо либо ее дообучивать, либо с нуля обучать новую модель. Возьмем тот же условный DeepSeek R1 671М, библиотечку вроде Transformers или PyTorch, датасет из даркнет форумов, мощное железо и некоторые навыки в ML. И вот на выходе у нас уже способная на что угодно моделька и ваши любимые голые бабы.
 
нагенерировать голых баб
на голосовых моделях это делают только законченные романтики, которым "не посмотреть, а поговорить" :)
 
обратился с этим же запросом к этой же модели, не понимаю почему перешло то ли на польский, то ли на чешский, но рецепт какой-то написало )))
изначалбно эта инфа для обучения была на том языке
 
Чтобы понять, кто сейчас реально задает планку среди больших языковых моделей, заглядываем на Chatbot Arena, проект от LMSYS.

Это, по сути, живой рейтинг, основанный на слепых "дуэлях": пользователи сравнивают ответы двух анонимных моделей на свои запросы и выбирают лучшего. На основе тысяч таких голосов формируется динамический Elo-рейтинг, который показывает, какие ИИ-модели на данный момент воспринимаются людьми как наиболее качественные и способные.

Так что, если хочешь видеть не маркетинговую шумиху, а реальную расстановку сил на "арене" чат-ботов — тебе сюда.

ai_leader.png
 
Пожалуйста, обратите внимание, что пользователь заблокирован
Ребят давайте без рецептов. Сообщения удалил. Там ведь просто это завуалированно в юмор. Лучше сиськи генерируйте. Сиськи форуму вреда не нанесут. =)

Правила раздела обновлены.
 
Последнее редактирование:
Ребят давайте без рецептов. Сообщения удалил. Там ведь просто это завуалированно в юмор. Лучше сиськи генерируйте. Сиськи форуму вреда не нанесут. =)

Правила раздела обновлены.
На скринах всё запрещённое было же зарисовано.
 
Пожалуйста, обратите внимание, что пользователь заблокирован
На скринах всё запрещённое было же зарисовано.
Да это понятно . Но все равно, нам лучше обходить стороной на форуме такие темы. Я в теме джаилбрейках тоже подобные сообщения чистил. Это уже на тенденцию похоже ((. Мы же не хотим чтобы толпа нарков к нам пришла... Мы там с командой форума не много правила обновили и выделили их жирным шрифтом в списке запрещенных. Если возникнут какие то вопросы стучите в лс.
 
Новые данные и исследования показывают, что Chatbot Arena не обеспечивает объективной оценки моделей ИИ.

12.png


Исследование от Cohere, Принстона, Стэнфорда, MIT, Ai2 и др. выявило, что крупные компании, такие как Meta, OpenAI и Google, получают привилегированный доступ к закрытому тестированию, позволяя оптимизировать модели для лидерборда. Например, Meta протестировала 27 вариантов Llama 4, но публиковала только лучшие результаты, искажая рейтинг. Мелкие лаборатории лишены таких возможностей, что подрывает заявленную «справедливость» платформы.

Методика Chatbot Arena страдает от субъективности и отсутствия научной строгости. Оценки зависят от предпочтений узкой группы энтузиастов, которые ценят стилистические уловки, вроде эмодзи или списков, а не реальные способности моделей. Лидерборд отражает не качество, а умение угождать толпе. Более того, непрозрачность платформы - включая непостоянство версий моделей и коммерциализацию проекта - усиливает сомнения в ее независимости. Партнерства с крупными лабораториями и планы по привлечению инвестиций указывают на потенциальные конфликты интересов.

Альтернативы, такие как стандартизированные бенчмарки (MMLU) или независимые многоуровневые оценки, предлагают более прозрачный подход. Подробнее в отчёте: The Leaderboard Illusion

Теперь имейте это ввиду, если кто-то скажет "Да она на первом месте в Chatbot Arena"
 


Напишите ответ...
  • Вставить:
Прикрепить файлы
Верх