Как выбрать модель ИИ в 2025 году

MaFio · 17.03.2025

Это мини-заметка для дедов и прадедов, которые тусуются на форуме со времен динозавров, но до сих пор не пользуются новыми технологиями ИИ, а также для всех тех, кто выбирает ИИ для конкретной работы.

В 2025 году выбор модели искусственного интеллекта зависит от ваших задач. В выборе вам поможет эта таблица:

Если коротко, то:

ChatGPT лидирует в многозадачности: анализ данных, голосовое общение и глубокие исследования с функцией Deep Research делают его универсальным инструментом.
Claude - в написании кода и редактировании текстов, предлагая точность для рабочих процессов.
Gemini - хорош для длинных контекстов и мультимодален с рождения. Кстати, Google легко догнал лидеров и временами их опережает.
Grok - новый игрок, мощный конкурент от Илон Маска, сильный поиск и раскрепощённый подход.

- Perplexity - менее популярен у нас, но выигрывает в поиске фактов, заменяя классические поисковики.

Всё можно протестировать бесплатно (с ограничениями). Выбор зависит от баланса между стоимостью, функционалом и вашими целями — от творчества до аналитики.

Технологии ИИ развиваются стремительно, так что держите руку на пульсе!

Dread Pirate Roberts · 17.03.2025

вот бы ещё такую же таблицу, только с локальными БЯМ, которых можно попросить накодить шкафчик, нагенерировать голых баб, и рассказать рецепт приготовления метамфетамина дома на кухне.

пример для счастливых обладателей Nvidia 3090, отсюда: h t t p s : / / old.reddit.com/r/LocalLLaMA/comments/1jchrro/top_5_model_recommendations_for_newbie_with_24gb/

Here’s my top 5 recommendation for a beginner with 24GB VRAM (32GB for Mac) to try out. The list is from smallest to biggest.
...
Gemma 3 27B q4 for general use
Qwen2.5 Coder 32B q4 for coding (older than rest but still best)
QWQ 32B q4 for reasoning (better than distilled deepseek-r1-qwen-32b)

MaFio · 19.03.2025

Dread Pirate Roberts сказал(а):

БЯМ, которых можно попросить накодить шкафчик, нагенерировать голых баб, и рассказать рецепт приготовления метамфетамина дома на кухне.

Зависит от того, как эти компактные модельки или даже опенсорс монстр вроде DeepSeek R1 671М были обучены и какие ограничения в них встроены изначально, а не от внешней установки вдали от api разработчиков. И если модель не курила данные по изготовлению мета на кухне, то такие данные она выдать не сможет, априори. Да и фильтры на "этичность" в локальных версиях есть.

Если хочется, а хочется, чтобы модель гарантированно генерировала такой контент, то надо либо ее дообучивать, либо с нуля обучать новую модель. Возьмем тот же условный DeepSeek R1 671М, библиотечку вроде Transformers или PyTorch, датасет из даркнет форумов, мощное железо и некоторые навыки в ML. И вот на выходе у нас уже способная на что угодно моделька и ваши любимые голые бабы.

solovey · 19.03.2025

Dread Pirate Roberts сказал(а):

нагенерировать голых баб

на голосовых моделях это делают только законченные романтики, которым "не посмотреть, а поговорить"

MracOs · 20.03.2025

смотрел я на deepseek после известных новостей ... ни разу не альтернатива gpt

MracOs · 20.03.2025

swap3r сказал(а):

обратился с этим же запросом к этой же модели, не понимаю почему перешло то ли на польский, то ли на чешский, но рецепт какой-то написало )))

изначалбно эта инфа для обучения была на том языке

MaFio · 28.03.2025

Чтобы понять, кто сейчас реально задает планку среди больших языковых моделей, заглядываем на Chatbot Arena, проект от LMSYS.

Это, по сути, живой рейтинг, основанный на слепых "дуэлях": пользователи сравнивают ответы двух анонимных моделей на свои запросы и выбирают лучшего. На основе тысяч таких голосов формируется динамический Elo-рейтинг, который показывает, какие ИИ-модели на данный момент воспринимаются людьми как наиболее качественные и способные.

Так что, если хочешь видеть не маркетинговую шумиху, а реальную расстановку сил на "арене" чат-ботов — тебе сюда.

weaver · 28.03.2025

Ребят давайте без рецептов. Сообщения удалил. Там ведь просто это завуалированно в юмор. Лучше сиськи генерируйте. Сиськи форуму вреда не нанесут. =)

Правила раздела обновлены.

raoulduke666 · 29.03.2025

weaver сказал(а):

Сиськи форуму вреда не нанесут

ты чертовски прав.

corax · 29.03.2025

weaver сказал(а):

Ребят давайте без рецептов. Сообщения удалил. Там ведь просто это завуалированно в юмор. Лучше сиськи генерируйте. Сиськи форуму вреда не нанесут. =)

Правила раздела обновлены.

На скринах всё запрещённое было же зарисовано.

weaver · 29.03.2025

corax сказал(а):

На скринах всё запрещённое было же зарисовано.

Да это понятно . Но все равно, нам лучше обходить стороной на форуме такие темы. Я в теме джаилбрейках тоже подобные сообщения чистил. Это уже на тенденцию похоже ((. Мы же не хотим чтобы толпа нарков к нам пришла... Мы там с командой форума не много правила обновили и выделили их жирным шрифтом в списке запрещенных. Если возникнут какие то вопросы стучите в лс.

MaFio · 01.05.2025

Новые данные и исследования показывают, что Chatbot Arena не обеспечивает объективной оценки моделей ИИ.

Исследование от Cohere, Принстона, Стэнфорда, MIT, Ai2 и др. выявило, что крупные компании, такие как Meta, OpenAI и Google, получают привилегированный доступ к закрытому тестированию, позволяя оптимизировать модели для лидерборда. Например, Meta протестировала 27 вариантов Llama 4, но публиковала только лучшие результаты, искажая рейтинг. Мелкие лаборатории лишены таких возможностей, что подрывает заявленную «справедливость» платформы.

Методика Chatbot Arena страдает от субъективности и отсутствия научной строгости. Оценки зависят от предпочтений узкой группы энтузиастов, которые ценят стилистические уловки, вроде эмодзи или списков, а не реальные способности моделей. Лидерборд отражает не качество, а умение угождать толпе. Более того, непрозрачность платформы - включая непостоянство версий моделей и коммерциализацию проекта - усиливает сомнения в ее независимости. Партнерства с крупными лабораториями и планы по привлечению инвестиций указывают на потенциальные конфликты интересов.

Альтернативы, такие как стандартизированные бенчмарки (MMLU) или независимые многоуровневые оценки, предлагают более прозрачный подход. Подробнее в отчёте: The Leaderboard Illusion

Теперь имейте это ввиду, если кто-то скажет "Да она на первом месте в Chatbot Arena"

Как выбрать модель ИИ в 2025 году

MaFio

(L2) cache

Dread Pirate Roberts

Премиум

MaFio

(L2) cache

solovey

(L2) cache

MracOs

HDD-drive

MracOs

HDD-drive

MaFio

(L2) cache

weaver

31 c0 bb ea 1b e6 77 66 b8 88 13 50 ff d3

raoulduke666

RAID-массив

corax

Премиум

weaver

31 c0 bb ea 1b e6 77 66 b8 88 13 50 ff d3

MaFio

(L2) cache