Интересно будет сделать ии и обучить его на базах ?)

NEMO · 06.03.2024

Щас работаю с llm моделями в частности llama и если вам вдруг интересно могу написать статью и ради эксперимента обучить модель на слитых данных, если у вас есть другие интересные идеи что можно сделать с моделью то интересно будет почитать может напишу статью

Whisper · 06.03.2024

А что модель будет уметь? Какие то примеры использования приведи.
Но так то да, очень интересно. Анонсируй требования к железу что бы было ясно на чем это можно будет повторить.

Tr3kzzz · 06.03.2024

Whisper сказал(а):

А что модель будет уметь? Какие то примеры использования приведи.
Но так то да, очень интересно. Анонсируй требования к железу что бы было ясно на чем это можно будет повторить.

вопрос тут только один должен быть, на каких базах и какую линию поведения будет задавать эта база, только и всего, на базах можно затренить её так что она станет невменяема

Whisper · 06.03.2024

Tr3kzzz сказал(а):

вопрос тут только один должен быть, на каких базах и какую линиюповедения будет задавать эта база, только и всего, на базах можно затренить её так что она станет невменяема

Вот потому я и спросил сразу про то какие профиты он может продемонстрировать.
Я хочу уже с уровня статьи увидеть как чел сделал нечно реальное годное к использованию а не коня в вакууме. Допустим он может предложить 10 разных по профиту примеров, выберем 1 для статьи.
Мне теория интересна но не настолько что бы возится но е сли покажет профит то это повод повторить все что в статье и думать как улучшить.

panda404 · 06.03.2024

NEMO сказал(а):

Щас работаю с llm моделями в частности llama и если вам вдруг интересно могу написать статью и ради эксперимента обучить модель на слитых данных, если у вас есть другие интересные идеи что можно сделать с моделью то интересно будет почитать может напишу статью

Конечно, будет круто узнать как ты это делаешь и твой подробный мануал про создании, обучение и разворот, в особенности механизмы работы. Я написал крайнюю статью, где делюсь своими мысли про то как создать ВормГпт личного, буду благодарен за техническую информацию.

ktpm23 · 06.03.2024

NEMO сказал(а):

Щас работаю с llm моделями в частности llama и если вам вдруг интересно могу написать статью и ради эксперимента обучить модель на слитых данных, если у вас есть другие интересные идеи что можно сделать с моделью то интересно будет почитать может напишу статью

Давай. Не хватает подобного контента. Но, пожалуйста, напиши подробно обо всем: какое железо использовал, сколько вложил в это, какой датасет и что в него входит, как и где развернул свой проект и какой результат получил, а также какие цели и задачи были для создания своего проекта и как планируешь его монетизировать.

Shaurmist25 · 07.03.2024

Любой движ - круто, жду на конкурсе.

jonni960 · 07.03.2024

как вариант обучи ее ломать хэши тот же мд5 и нтмл

DOBrovolec · 07.03.2024

О,если есть инетерс сделать модель за валюту- пиши в лс(достаточно примитивная задача для ии)!

TROUBLE · 07.03.2024

NEMO сказал(а):

Щас работаю с llm моделями в частности llama и если вам вдруг интересно могу написать статью и ради эксперимента обучить модель на слитых данных, если у вас есть другие интересные идеи что можно сделать с моделью то интересно будет почитать может напишу статью

Тема безусловно интересная. Я вот думаю какую из опенсурсных взять и как её тренить чтобы туда запихнуть всю MITRE ATT&CK, все cve, все репорты ресерчеров с TTP всех ATP и все слитые инструментарии.
Пока смотрю на фреймфорк нвидии для этого (который называется как твой ник) и deepseek-coder-33B (но смущает его тренинг на непонятных китайских текстах, не ассоциированных с кодингом, а то они больно любят бэкдоры).

NEMO · 07.03.2024

хм, мне кажеться лучше смотерть в сторону star coder

TROUBLE · 07.03.2024

NEMO сказал(а):

хм, мне кажеться лучше смотерть в сторону star coder

на него тоже смотрел, но если верить бенчмаркам то он уступает.

gatmos · 07.03.2024

Я бы с огромным удовольствием прочитал твою грамотно и подробно расписаную статью.
Прикольно было бы если не только работа с базами, а различные ещё методики использования ии в данных направлениях, например ии сортер, валидатор

Жду!

grandir · 07.03.2024

Давай про модель для разведки с кодингом и использованием инструментов.)

ktpm23 · 07.03.2024

jonni960 сказал(а):

как вариант обучи ее ломать хэши тот же мд5 и нтмл

Я помню, как пробовал так развлекаться еще, когда вышла ГПТ 3.5. Она вообще не тянет это. А в профильных журналах по криптографии на эту тему больше теории и описательной философии, чем практики.

Tr3kzzz · 07.03.2024

Просто оставлю это тут: https://xss.pro/threads/102439/

panda404 · 07.03.2024

kehor сказал(а):

на него тоже смотрел, но если верить бенчмаркам то он уступает.
Скрытое содержимое

Как на счет рассмотреть недавнюю модель от Майкрософта orca-math которая выполняет сложные математические задачи? Например план создать две модели - одна из недавней Claude 3 Opus которая уже превосходит всех LLM и тот же orca-math, чтобы настроить между ними ауториверсивную-рекурсионную оркестрацию? Одна модель ЛЛМ объясняет подробно задачу, потому что она прекрасно понимает твои слова и твой язык и дает эту задачу на исполнительного ИИ, который чисто по коду, а не ЛЛМ. Обратная связь от кодера поступает обратно ЛЛМ, она это декодирует, проводит поиск по своим базам, если нужно в интернете и конфигурирует задачу путем детального технического объяснение ошибки и ее решения - отдавая команду исполнительной модели.

Так до тех пор, пока задача не будет выполнена.

TROUBLE · 08.03.2024

panda404 сказал(а):

Как на счет рассмотреть недавнюю модель от Майкрософта orca-math которая выполняет сложные математические задачи? Например план создать две модели - одна из недавней Claude 3 Opus которая уже превосходит всех LLM и тот же orca-math, чтобы настроить между ними ауториверсивную-рекурсионную оркестрацию? Одна модель ЛЛМ объясняет подробно задачу, потому что она прекрасно понимает твои слова и твой язык и дает эту задачу на исполнительного ИИ, который чисто по коду, а не ЛЛМ. Обратная связь от кодера поступает обратно ЛЛМ, она это декодирует, проводит поиск по своим базам, если нужно в интернете и конфигурирует задачу путем детального технического объяснение ошибки и ее решения - отдавая команду исполнительной модели.

Так до тех пор, пока задача не будет выполнена.

Claude 3 Opus, к сожалению, не найти чтобы запустить локально. Хотя 2 версия есть на huggingface.
Для "взаимодействий" между ллм (можно хоть десятки ллм между собой связывать для совместной работы):
https:// www. camel-ai.org

Интересно будет сделать ии и обучить его на базах ?)

NEMO

(L3) cache

Whisper

TPU unit

Tr3kzzz

(L2) cache

Whisper

TPU unit

panda404

CD-диск

ktpm23

(L1) cache

Shaurmist25

hello world

jonni960

(L3) cache

DOBrovolec

HDD-drive

TROUBLE

OLD SCHOOL

NEMO

(L3) cache

TROUBLE

OLD SCHOOL

gatmos

ripper

grandir

(L3) cache

ktpm23

(L1) cache

Tr3kzzz

(L2) cache

panda404

CD-диск

TROUBLE

OLD SCHOOL