• XSS.stack #1 – первый литературный журнал от юзеров форума

Интересно будет сделать ии и обучить его на базах ?)

NEMO

(L3) cache
Пользователь
Регистрация
06.02.2024
Сообщения
237
Реакции
55
Гарант сделки
1
Щас работаю с llm моделями в частности llama и если вам вдруг интересно могу написать статью и ради эксперимента обучить модель на слитых данных, если у вас есть другие интересные идеи что можно сделать с моделью то интересно будет почитать может напишу статью
 
А что модель будет уметь? Какие то примеры использования приведи.
Но так то да, очень интересно. Анонсируй требования к железу что бы было ясно на чем это можно будет повторить.
 
А что модель будет уметь? Какие то примеры использования приведи.
Но так то да, очень интересно. Анонсируй требования к железу что бы было ясно на чем это можно будет повторить.
вопрос тут только один должен быть, на каких базах и какую линию поведения будет задавать эта база, только и всего, на базах можно затренить её так что она станет невменяема
 
Последнее редактирование:
вопрос тут только один должен быть, на каких базах и какую линиюповедения будет задавать эта база, только и всего, на базах можно затренить её так что она станет невменяема
Вот потому я и спросил сразу про то какие профиты он может продемонстрировать.
Я хочу уже с уровня статьи увидеть как чел сделал нечно реальное годное к использованию а не коня в вакууме. Допустим он может предложить 10 разных по профиту примеров, выберем 1 для статьи.
Мне теория интересна но не настолько что бы возится но е сли покажет профит то это повод повторить все что в статье и думать как улучшить.
 
Щас работаю с llm моделями в частности llama и если вам вдруг интересно могу написать статью и ради эксперимента обучить модель на слитых данных, если у вас есть другие интересные идеи что можно сделать с моделью то интересно будет почитать может напишу статью
Конечно, будет круто узнать как ты это делаешь и твой подробный мануал про создании, обучение и разворот, в особенности механизмы работы. Я написал крайнюю статью, где делюсь своими мысли про то как создать ВормГпт личного, буду благодарен за техническую информацию.
 
Щас работаю с llm моделями в частности llama и если вам вдруг интересно могу написать статью и ради эксперимента обучить модель на слитых данных, если у вас есть другие интересные идеи что можно сделать с моделью то интересно будет почитать может напишу статью
Давай. Не хватает подобного контента. Но, пожалуйста, напиши подробно обо всем: какое железо использовал, сколько вложил в это, какой датасет и что в него входит, как и где развернул свой проект и какой результат получил, а также какие цели и задачи были для создания своего проекта и как планируешь его монетизировать.
 
Щас работаю с llm моделями в частности llama и если вам вдруг интересно могу написать статью и ради эксперимента обучить модель на слитых данных, если у вас есть другие интересные идеи что можно сделать с моделью то интересно будет почитать может напишу статью
Тема безусловно интересная. Я вот думаю какую из опенсурсных взять и как её тренить чтобы туда запихнуть всю MITRE ATT&CK, все cve, все репорты ресерчеров с TTP всех ATP и все слитые инструментарии.
Пока смотрю на фреймфорк нвидии для этого (который называется как твой ник) и deepseek-coder-33B (но смущает его тренинг на непонятных китайских текстах, не ассоциированных с кодингом, а то они больно любят бэкдоры).
 
хм, мне кажеться лучше смотерть в сторону star coder
на него тоже смотрел, но если верить бенчмаркам то он уступает.
Скрытый контент для зарегистрированных пользователей.
github. com/deepseek-ai/DeepSeek-Coder?tab=readme-ov-file#6-detailed-evaluation-results
 
Пожалуйста, обратите внимание, что пользователь заблокирован
Я бы с огромным удовольствием прочитал твою грамотно и подробно расписаную статью.
Прикольно было бы если не только работа с базами, а различные ещё методики использования ии в данных направлениях, например ии сортер, валидатор

Жду! :)
 
как вариант обучи ее ломать хэши тот же мд5 и нтмл
Я помню, как пробовал так развлекаться еще, когда вышла ГПТ 3.5. Она вообще не тянет это. А в профильных журналах по криптографии на эту тему больше теории и описательной философии, чем практики.
 
на него тоже смотрел, но если верить бенчмаркам то он уступает.
Скрытое содержимое
Как на счет рассмотреть недавнюю модель от Майкрософта orca-math которая выполняет сложные математические задачи? Например план создать две модели - одна из недавней Claude 3 Opus которая уже превосходит всех LLM и тот же orca-math, чтобы настроить между ними ауториверсивную-рекурсионную оркестрацию? Одна модель ЛЛМ объясняет подробно задачу, потому что она прекрасно понимает твои слова и твой язык и дает эту задачу на исполнительного ИИ, который чисто по коду, а не ЛЛМ. Обратная связь от кодера поступает обратно ЛЛМ, она это декодирует, проводит поиск по своим базам, если нужно в интернете и конфигурирует задачу путем детального технического объяснение ошибки и ее решения - отдавая команду исполнительной модели.

Так до тех пор, пока задача не будет выполнена.
 
Как на счет рассмотреть недавнюю модель от Майкрософта orca-math которая выполняет сложные математические задачи? Например план создать две модели - одна из недавней Claude 3 Opus которая уже превосходит всех LLM и тот же orca-math, чтобы настроить между ними ауториверсивную-рекурсионную оркестрацию? Одна модель ЛЛМ объясняет подробно задачу, потому что она прекрасно понимает твои слова и твой язык и дает эту задачу на исполнительного ИИ, который чисто по коду, а не ЛЛМ. Обратная связь от кодера поступает обратно ЛЛМ, она это декодирует, проводит поиск по своим базам, если нужно в интернете и конфигурирует задачу путем детального технического объяснение ошибки и ее решения - отдавая команду исполнительной модели.

Так до тех пор, пока задача не будет выполнена.
Claude 3 Opus, к сожалению, не найти чтобы запустить локально. Хотя 2 версия есть на huggingface.
Для "взаимодействий" между ллм (можно хоть десятки ллм между собой связывать для совместной работы):
https:// www. camel-ai.org
 


Напишите ответ...
  • Вставить:
Прикрепить файлы
Верх