Статья Глобальная сеть искусственного интеллекта YOLO11 регистрирующая пиксельные объекты. Упадочно и порочно.

raoulduke666 · 08.02.2025

redbull302 сказал(а):

очень сомневаюсь что есть сервисы совмещающие STT (транскрибирование) и фонетический анализ спича для определения эмоциональности.. т.е. интонация/эмоции и в целом общий анализ голоса произносящего конкретный спич | видел комбинацию конечно давненько IBM Watson Speech to Text + Tone Analyzer , но там нет поддержки русского языка у анализатора тона (только английский и французский). да и в принципе непонятно что по условиям предоставления апишки на STT/Tone Analytics у них;

поэтому наверное придётся использовать разные решения под транскрибирование и анализ эмоциональности; по транскрибированию решений много, а вот по анализу эмоционального фона у голосовых как глянул audEERING – devAIce & openSMILE самое натренерованное опенсурс решение сейчас (конечно не особо изучал особенности работы и без понятия будет ли проблема на практике учитывая русский язык+сленговую/диалектическую речь+не всегда потрясающее качество голосовых.. но вот как-раз под фонетический анализ голоса)

само собой это надо исследовать и это чисто мысли вслух, но вообще оч интересная штука (https://www.audeering.com/research/open-source/) Посмотреть вложение 103512

во первых вот как-раз таки решение для анализа экспрессивности голоса в спиче, ну эмоций короче говоря:
-Модель выражения На основе wav2vec 2.

Модель ожидает необработанного аудиосигнала в качестве входных и выходов прогнозов для возбуждения, доминирования и валентности в диапазоне приблизительно 0… 1. Кроме того, он также обеспечивает объединенные состояния последнего трансформаторного слоя. Он был создан с помощью тонкой настройки WAV2VEC2-Robust на MSP-Podcast (v1.7). Обрезка уменьшила модель с 24 до 12 трансформаторов. Экспорт модели ONNX доступен от DOI: 10.5281/Zenodo.6221127. Более подробная информация приведена в связанной статье - закрытие валентного разрыва - и учебник.

а во вторых, прикольная и полезная вот эта штука для анализа голосовых самок:
-Возраст и признание пола На основе WAV2VEC 2.0

Эта модель ожидает необработанного аудиосигнала в качестве входных и выходов прогнозов для возраста в диапазоне приблизительно 0… 1 (0… 100 лет), а пол выражает вероятность того, что быть ребенком, женщинами или мужчинами. Кроме того, он также обеспечивает объединенные состояния последнего трансформаторного слоя. Он был создан с помощью тонкой настройки WAV2VEC2-Large-Robust на Agender, Mozilla Common Voice, Timit и Voxceleb 2. Для этой версии модели мы обучили все 24 слоя трансформатора. Экспорт модели ONNX доступен от DOI: 10.5281/Zenodo.7761387. Более подробная информация приведена в связанной статье и учебном пособии.

но опять же, нужно исследовать, чисто быстрый взгляд на эти решения; само собой есть наверное некоторые нюансы, хотя вроде не должно быть.. решения то опенсурс

сейчас нашел пару моделей обученных на русском
wav2vec2 для аудио ту эмоции и rubert-tiny2 тоже на русском для текст ту эмоции.

vosk + wav2vec2 + rubert-tiny2 + YOLO11 + python + golang. Примерно так можно понять женщину. Осталось придумать как эти данные обработать чтобы языковая можель могла ориентироваться в этом… Чуть не забыл нужна еще сама языковая модель.

Я думаю что можно подкрутить сюда генеративную модель. чтобы я мог генерировать кружки будто я за рулем «своего» порше зову принцессу на свидание.

redbull302 · 08.02.2025

raoulduke666 сказал(а):

Осталось придумать как эти данные обработать чтобы языковая можель могла ориентироваться в этом… Чуть не забыл нужна еще сама языковая модель.

конечно не знаю хватит ли интеллекта GPT-2 , но вон в AI/ML ветке публиковали 3кб модель GPT2, со всей работой которую провели над ней.. она выдает ответ за ~2 секунды | в принципе для работы с женским интеллектом этого должно быть достаточно, но для полноты картины можно взять какую-нить версию llama и обучить флиртовать.

а после этого система цифрового альфонса будет готова.. интернет ещё не видел такой мощи

касаемо генеративного ИИ, ну можно просто найти базовые кружки и синтезировать спич с помощью того-же elevenlabs, накладывая как-бы поверх базового кружка.. я ведь правильно понимаю что ты не хочешь генерировать сами кружки (генерация по факту видео-контента, что в современных реалиях довольно трудное дело.. но не такое уж прям невозможное) ?

raoulduke666 · 08.02.2025

redbull302 сказал(а):

конечно не знаю хватит ли интеллекта GPT-2 , но вон в AI/ML ветке публиковали 3кб модель GPT2, со всей работой которую провели над ней.. она выдает ответ за ~2 секунды | в принципе для работы с женским интеллектом этого должно быть достаточно, но для полноты картины можно взять какую-нить версию llama и обучить флиртовать.

а после этого система цифрового альфонса будет готова.. интернет ещё не видел такой мощи

касаемо генеративного ИИ, ну можно просто найти базовые кружки и синтезировать спич с помощью того-же elevenlabs, накладывая как-бы поверх базового кружка.. я ведь правильно понимаю что ты не хочешь генерировать сами кружки (генерация по факту видео-контента, что в современных реалиях довольно трудное дело.. но не такое уж прям невозможное) ?

насчет llm мне кажется сперва будет хорошо научиться писать сообщение подходящее под контекст анкеты женщины. нужно работать над первым впечатлением. то есть если нейронка напишет откровенно х#йню, то смысла с этим работать с дальнейшими возражениями нет.

то есть найти какой нибудь таргет, мне например нравится когда баба напрямую пишет что хочет рандеву, с такой проще всего, значит нужно учить нейронку искать такие анкеты в первую очередь, потому что они на рандеву очень хорошо соглашаются.

по такой логике. я должен просто каждую бабу звать почти с нулевой на свидание и оценивать их ответы взависимости от описания их анкет + учитывать время суток (очень сильно роляет, утром звать на свидание это бред = проебать)

в целом план выстраивается, это уже не кажется чем то невозможным.

и скорее всего нужно придумать какую то одну или две легенды, от которых нейронка будет отталкиваться каждый раз при общении с новой девушкой.

то есть брать будем не качеством а количеством с упором на первое впечатление и как можно быстрым согласием на свидание.

по итогу всего обучения нейронка должна оценить анкету, время суток, день недели. и позвать на свидание или как то ахуенно пошутить если такая возможность есть в контексте ее анкеты + позвать на свидание.

опять же позвать на свидание можно по разному. можно альтушке написать «стой на коленях и кричи виу виу крузак 200v8 прокуратура» и она согласится с вероятностью 60% если попасть в нужный тайминг.

а можно найти какую то неформалку типа с закосом на какую то «милость» и любовь к природе и позвать ее с нулевой с контактный зоопарк с альпаками.

и обе они с большой долей вероятности согласятся если сделать это во время.

возможно стоит сделать женскую анкету и посмотреть че там мэны пишут, чтобы знать как обыграть кокурентов + что то спиздеть мб, но для этого нужен оператор на женщине чтобы она объективнее могла оценить че лучше или че хуже.

redbull302 · 08.02.2025

raoulduke666 сказал(а):

насчет llm мне кажется сперва будет хорошо научиться писать сообщение подходящее под контекст анкеты женщины. нужно работать над первым впечатлением. то есть если нейронка напишет откровенно х#йню, то смысла с этим работать с дальнейшими возражениями нет.

то есть найти какой нибудь таргет, мне например нравится когда баба напрямую пишет что хочет рандеву, с такой проще всего, значит нужно учить нейронку искать такие анкеты в первую очередь, потому что они на рандеву очень хорошо соглашаются.

по такой логике. я должен просто каждую бабу звать почти с нулевой на свидание и оценивать их ответы взависимости от описания их анкет + учитывать время суток (очень сильно роляет, утром звать на свидание это бред = проебать)

в целом план выстраивается, это уже не кажется чем то невозможным.

и скорее всего нужно придумать какую то одну или две легенды, от которых нейронка будет отталкиваться каждый раз при общении с новой девушкой.

то есть брать будем не качеством а количеством с упором на первое впечатление и как можно быстрым согласием на свидание.

по итогу всего обучения нейронка должна оценить анкету, время суток, день недели. и позвать на свидание или как то ахуенно пошутить если такая возможность есть в контексте ее анкеты + позвать на свидание.

опять же позвать на свидание можно по разному. можно альтушке написать «стой на коленях и кричи виу виу крузак 200v8 прокуратура» и она согласится с вероятностью 60% если попасть в нужный тайминг.

а можно найти какую то неформалку типа с закосом на какую то «милость» и любовь к природе и позвать ее с нулевой с контактный зоопарк с альпаками.

и обе они с большой долей вероятности согласятся если сделать это во время.

возможно стоит сделать женскую анкету и посмотреть че там мэны пишут, чтобы знать как обыграть кокурентов + что то спиздеть мб, но для этого нужен оператор на женщине чтобы она объективнее могла оценить че лучше или че хуже.

надо надо, ждём продолжения всем форумом.. ну по крайней мере я жду

crucial · 09.02.2025

raoulduke666 сказал(а):

насчет llm мне кажется сперва будет хорошо научиться писать сообщение подходящее под контекст анкеты женщины. нужно работать над первым впечатлением. то есть если нейронка напишет откровенно х#йню, то смысла с этим работать с дальнейшими возражениями нет.

то есть найти какой нибудь таргет, мне например нравится когда баба напрямую пишет что хочет рандеву, с такой проще всего, значит нужно учить нейронку искать такие анкеты в первую очередь, потому что они на рандеву очень хорошо соглашаются.

по такой логике. я должен просто каждую бабу звать почти с нулевой на свидание и оценивать их ответы взависимости от описания их анкет + учитывать время суток (очень сильно роляет, утром звать на свидание это бред = проебать)

в целом план выстраивается, это уже не кажется чем то невозможным.

и скорее всего нужно придумать какую то одну или две легенды, от которых нейронка будет отталкиваться каждый раз при общении с новой девушкой.

то есть брать будем не качеством а количеством с упором на первое впечатление и как можно быстрым согласием на свидание.

по итогу всего обучения нейронка должна оценить анкету, время суток, день недели. и позвать на свидание или как то ахуенно пошутить если такая возможность есть в контексте ее анкеты + позвать на свидание.

опять же позвать на свидание можно по разному. можно альтушке написать «стой на коленях и кричи виу виу крузак 200v8 прокуратура» и она согласится с вероятностью 60% если попасть в нужный тайминг.

а можно найти какую то неформалку типа с закосом на какую то «милость» и любовь к природе и позвать ее с нулевой с контактный зоопарк с альпаками.

и обе они с большой долей вероятности согласятся если сделать это во время.

возможно стоит сделать женскую анкету и посмотреть че там мэны пишут, чтобы знать как обыграть кокурентов + что то спиздеть мб, но для этого нужен оператор на женщине чтобы она объективнее могла оценить че лучше или че хуже.

неплохой такой "стартап" намечается) бедные девочки... )

redbull302 · 10.02.2025

crucial сказал(а):

неплохой такой "стартап" намечается) бедные девочки... )

да тут один инженер балуется, но балуется с пользой чтоли..

merdock · 10.02.2025

Буквально месяц назад баловался с этими моделями и обучением, наткнулся на то что везде повально устаревшие примеры обучения сети, создания моделей и их использования, пришлось самому переписывать примеры. А все началось с того что отпрыск попросил помочь с курсовой где на питоне эта пакость написана и не работает на свежем питоне. Думал написать статейку для тех кто хочет начать и попробовать с примерами, и датасетами. Так вот к чему я это, не понимаю зачем эта статья в КОНКУРНОМ разделе? Но самое важное когда - для всех создание моделей - это черный ящик для работы с которым все строго используют АПИ заготовленное сторонники разработчиками - инди формат для программиста, НО есть минус, если захотите большего, а не ширпотреб - устанете искать, делать, понимать.

Вообще примитивная базовая "ИИ" которую для обучения студентам представляют очень примитивна и по факту является матричными массивами с весами которые формируются через аппроксимацию(функция которая по нескольким точкам выстраивает наиболее вероятный график - используется для нахождения точки которая не входит в заданный массив).

Если немного разобраться то окажется все очень примитивно и просто, за пару десятилетий ничего не изменилось до того момента пока не стали использовать GPU и огромные датасеты - это и дало по факту серьезный качественный результат, кстати самая большая проблема которая у меня возникла для понимания методики работы с моделями на питоне - это собрать данные и привести их к единому формату, и сформировать датасет для обучения - как оказалось(специально или нет) в интернете очень сложно найти базы данных с категориями для обучения. Единственное пока что я не смог понять как работает с точки зрения логики и математики - это генеративные сети (времени не хватает).

Что касается моего понимания - все это связанное с ИИ(хотя так назвать нельзя, там даже близко не пахнет интеллектом), шибко мир это не изменит. Считаю самая важная сфера в ближайшие 30-80 лет это медицина+генетика, а не ИТ и робототехника.

redbull302 · 10.02.2025

merdock сказал(а):

Что касается моего понимания - все это связанное с ИИ(хотя так назвать нельзя, там даже близко не пахнет интеллектом), шибко мир это не изменит. Считаю самая важная сфера в ближайшие 30-80 лет это медицина+генетика, а не ИТ и робототехника.

ну знаешь, одно другому не мешает; тут скорее энтузиасты собираются, которые что-то практическое делают для своих забав и потребностей)

тут дело не в том чтобы мир изменить, а в первую очередь это коммерция и личные интересы; если так посмотреть в этом разделе по значимости и близко нет артиклей которые должны находиться в этом разделе.. по такой логике.

raoulduke666 · 10.02.2025

merdock сказал(а):

Так вот к чему я это, не понимаю зачем эта статья в КОНКУРНОМ разделе?

Шутка про матрицу хорошо вписывается просто. Изначально хотел гайд сделать по обучению и как составить датасэт на примере порнопарсера, но в итоге очень много времени ушло на парсер и не успел ничего написать. Поэтому просто забавное чтиво, которое справедливо лидирует с конца. Вообще я думал что статья не пройдет, но силы свыше распорядились иначе.

merdock сказал(а):

Что касается моего понимания - все это связанное с ИИ(хотя так назвать нельзя, там даже близко не пахнет интеллектом), шибко мир это не изменит. Считаю самая важная сфера в ближайшие 30-80 лет это медицина+генетика, а не ИТ и робототехника.

В любом случае ИИ это интересный инструмент.

merdock · 11.02.2025

raoulduke666 сказал(а):

Шутка про матрицу хорошо вписывается просто. Изначально хотел гайд сделать по обучению и как составить датасэт на примере порнопарсера, но в итоге очень много времени ушло на парсер и не успел ничего написать. Поэтому просто забавное чтиво, которое справедливо лидирует с конца. Вообще я думал что статья не пройдет, но силы свыше распорядились иначе.

В любом случае ИИ это интересный инструмент.

Безусловно интересный, сам залип на пару месяцев, просто сразу вспомнил про VR шлемы/очки - было пару лет прям ссались все кипятком, такое будущее предрекли - а в итоге оказалось все дорого и не удобно. У меня есть такой один полноценный VR шлем с поддержкой подключения через стороyнюю GPU - вполне тема очень удобная и увлекательная, один минус - качественного контента просто нет, пару игр не в счет. Так и тут с ии - инструмент интересный вроде как есть места где его можно применить и давно применяют, но не более. Один из плюсов которые считаю важными - проявили интерес молодежи к этой тематики, а то долго время прям тишина в паблике была по этому поводу, а тут на тебе - картинки с тремя сисками - легко, написать оду на голую соседку - легко, отличить фалоэмитатор от фламестера - легко. Думаю пару лет и тоже тема затихнет, но останутся те у кого она вызвала интерес. Кстати я тут прикинул по факту - уже вполне можно создать робота который на слух определяет кто от него хотят, визуально может определять предметы и взаимодействовать с ними, а так же выражать свои уникальные вопрос на приказы которые ему дал хозяин (правда до сих пор не пойму на кой хрен такой робот - ради фана и патроны подносить если). Самое большое будущее у таких роботов предрекаю в порно сфере - кто сделает от будет миллиардером.

raoulduke666 · 11.02.2025

merdock сказал(а):

робот - ради фана и патроны подносить

все правильно. робот с ИИ будет подносить патроны для турели с ИИ.

эх вот были бы модели ИИ в образе женщины робота… было бы круто их обучать чему захочется… а чтобы было не скучно можно сделать их более непредсказуемыми…

Статья Глобальная сеть искусственного интеллекта YOLO11 регистрирующая пиксельные объекты. Упадочно и порочно.

raoulduke666

RAID-массив

redbull302

RAID-массив

raoulduke666

RAID-массив

redbull302

RAID-массив

crucial

RAID-массив

redbull302

RAID-массив

merdock

X-pert

redbull302

RAID-массив

raoulduke666

RAID-массив

merdock

X-pert

raoulduke666

RAID-массив