Теория и практика создания нейросетей и ИИ

ktpm23 · 03.08.2023

Powder Whlyapa сказал(а):

Ты меня немного не так понял)
Модель ты делаешь сначала на питоне,с ограниченной выборкой,ну дававй 100к строк возьмем,
Модель научил,метрики восхитительные,и тебе ее надо в продакшен запускать....Представь объемы хранящиеся у крупной компании?Соответственно ,переносят на более быстрые языки,питон туповат,а С сразу на железом идет,по этому вычислительная мощность и скорость на питоне будет гораздо слабее чем у другого любого компилятора
Ты прав,модели строятся в питоне- потому что он супер простой!
Что бы быть МЛ-щиком,не нужно учить Сomputer science,
Достаточно хорошо понимать в высшей математике и тервере..Посмотреть вложение 62619
*https://career.habr.com/vacancies/1000128661*
Не реклама

Ок понял спс.

ktpm23 · 04.08.2023

ktpm23 · 05.08.2023

larryalcina · 06.08.2023

Почему вся тема вокруг ИИ и нейронок выглядит так - появился chat gpt, нашумел и после этого резко повылезало огромное количество нейронок на любой вкус и цвет?

Guron_18 · 06.08.2023

larryalcina сказал(а):

Почему вся тема вокруг ИИ и нейронок выглядит так - появился chat gpt, нашумел и после этого резко повылезало огромное количество нейронок на любой вкус и цвет?

Как должно быть по твоему? Только крупные компании имеют право выпускать сомнительные проекты без ущерба себе в случае провала. На этот раз зашло.

larryalcina · 06.08.2023

Guron_18 сказал(а):

Как должно быть по твоему? Только крупные компании имеют право выпускать сомнительные проекты без ущерба себе в случае провала. На этот раз зашло.

Я к тому, что это совершило некий прорыв и должно быть чем-то сложным итд. А по факту щас все кто лень создают нейронки.

Guron_18 · 06.08.2023

larryalcina сказал(а):

некий прорыв

Обычная автоматизация. Нейроны да. Интеллекта там нуль.

larryalcina · 06.08.2023

Guron_18 сказал(а):

Обычная автоматизация. Нейроны да. Интеллекта там нуль.

То есть это и раньше не представляло что-то сложное просто никто не делал так как думал что это не выстрелит?

alex778 · 06.08.2023

larryalcina сказал(а):

Почему вся тема вокруг ИИ и нейронок выглядит так - появился chat gpt, нашумел и после этого резко повылезало огромное количество нейронок на любой вкус и цвет?

Наверное потому, что ты чайник-обыватель, не следящий за темой. В реальности всё не совсем так. GPT-1 появился 5 лет назад. в 2018-м году. А архитектуру трансформер изобрели в 2017-м, до того были в моде LSTM и GRU сети. Найм учёных, подготовка датасетов и тренировка моделей по прежнему стоят миллионы долларов. Никакого "огромного количества нейронок" за 6 прошедших лет просто нет. На данный момент есть ОДНА популярная модель, случайно и полулегально утёкшая в паблик, на базе которой наделали разных поделок, не требующих капитальных вложений. И вторая версия той же модели, которую фейсбук уже намеренно выложил в рамках конкуренции с мелкософтом. И вокруг них крутится разная шушера, типа Яндекса, которая что-то своё выкладывает, но лучше бы не выкладывала, не позорилась. Вот тут список: https://en.wikipedia.org/wiki/Large_language_model#List Где-то 10 моделей в паблике за 6 лет, из них хорошая, годная - одна. Это что касается текста. С графикой, аудио, видео - в целом ситуация похожая.

alex778 · 06.08.2023

larryalcina сказал(а):

Я к тому, что это совершило некий прорыв и должно быть чем-то сложным итд. А по факту щас все кто лень создают нейронки.

"Всем кому не лень" это самому распальцованному и богатому арабскому универу в мире. Стоимость обучения модели 2700 петафлопс-дней.

sikidok · 08.08.2023

Такая тема возникла сегодня.
Типа антиботы всё лучше и лучше.
Закручивают краны боттинга.

И у меня как то внезапно появилась мысль / идея в голове.

А что если научит свой AI как раз обходит защиту от ботов?

реально такое ?
Типа в кавычках: иди туда на сайт и изучай все антибот системы там.
Или смотри за что ты получил бан от сайта и "подумай и анализируй" как это можно обойти.

Крутая идея же?

Типо не тупо там бот на Питоне а бот с мозгами который делает все правильно или как человек. Не получая баны или очень мало банов.

ktpm23 · 08.08.2023

sikidok сказал(а):

Такая тема возникла сегодня.
Типа антиботы всё лучше и лучше.
Закручивают краны боттинга.

И у меня как то внезапно появилась мысль / идея в голове.

А что если научит свой AI как раз обходит защиту от ботов?

реально такое ?
Типа в кавычках: иди туда на сайт и изучай все антибот системы там.
Или смотри за что ты получил бан от сайта и "подумай и анализируя" как это можно обойти.

Крутая идея же?

Насколько знаю проекты типа антикапча уже не редкость, но их возможности ограниченные, гугл капчу или другую мудреную они не обойдут, даже порой ошибаются с буквами и цифрами.

Если брать нейронки, то есть тип который классифицирует изображения распознает что изображено на картинке, думаю можно такое сделать, но нейросетку надо учить как это обходить. Но подводные это затратно и точность распознания низкая.

sikidok · 08.08.2023

Я не про каптчу вообще то говорю.
Каптча Ерунда (почти ).

Просто сайты имеют антибот системы, которая смотрит и анализирует поведение человека на сайте.
Слишком быстро клик или системной, значит бот: БАН
одно и те же движения, бот: в Бан.

Короче всякие разные методы есть.
Тот же самый Tinder, Facebook, Snapchat и другие сайты.

Там с ботами очень строго.
Не говоря уже о Twitter, instagram итд.

И в ручную не понять за что ты получил бан.
Пускай это анализирует AI.

Типа 50000 - 500000 раз логин на сайт, движуха любая и с каждым разом все меньше банов.

ktpm23 · 08.08.2023

sikidok сказал(а):

Я не про каптчу вообще то говорю.
Каптча Ерунда (почти ).

Просто сайты имеют антибот системы, которая смотрит и анализирует поведение человека на сайте.
Слишком быстро клик или системной, значит бот: БАН
одно и те же движения, бот: в Бан.

Короче всякие разные методы есть.
Тот же самый Tinder, Facebook, Snapchat и другие сайты.

Там с ботами очень строго.
Не говоря уже о Twitter, instagram итд.

И в ручную не понять за что ты получил бан.
Пускай это анализирует AI.

Типа 50000 - 500000 раз логин на сайт, движуха любая и с каждым разом все меньше банов.

Понял спс, ну слушай самое основное думаю нужно подумать, на чем нейросеть обучать вообще? Какая методология и способы обхода есть этих вещей, далее как научить нейронку обходить это все и выдавать себя за человека.

sikidok · 08.08.2023

Можно спросит у гпт. Ну тут надо gpt без цензуры.
Так как обычный будет отказывать отвечать.
Слишком он корректный..

Потом попробую.
Надо спросить по хитрому может и ответит.

Я пару раз спрашивал про боты, он мне стал печатать кодекс закона по нелегальных действии)

ktpm23 · 08.08.2023

sikidok сказал(а):

Можно спросит у гпт. Ну тут надо gpt без цензуры.
Так как обычный будет отказывать отвечать.
Слишком он корректный..

Потом попробую.
Надо спросить по хитрому может и ответит.

Я пару раз спрашивал про боты, он мне стал печатать кодекс закона по нелегальных действии)

Я у барда спросил он говорит открыто на эту тему, вот см
Чтобы обойти систему антиботов на разных сайтах, нейросети нужно обучить на большом наборе данных, который включает в себя как примеры трафика, которые антиботы могут заблокировать, так и примеры трафика, который антиботы не могут заблокировать. Набор данных должен быть как можно более разнообразным, чтобы нейросеть могла научиться распознавать различные типы трафика.

Некоторые из источников данных, которые можно использовать для обучения нейросети, включают:

Логи веб-серверов
Данные о сетевом трафике
Данные о пользовательском поведении
Данные о поисковых запросах

После того, как нейросеть будет обучена, ее можно использовать для обнаружения и обхода систем антиботов. Нейросеть можно использовать для создания трафика, который похож на трафик, который не заблокирует система антиботов. Это позволит нейросети получить доступ к сайтам, которые были бы заблокированы для обычных пользователей.

Однако важно отметить, что системы антиботов постоянно обновляются, поэтому нейросеть должна постоянно обновляться, чтобы оставаться эффективной. Кроме того, нейросеть может быть использована для других целей, кроме обхода систем антиботов, поэтому важно использовать ее ответственно.

вот еще

Нейросеть может обходить системы антиботов, используя различные методы. Один из методов - это использование набора данных, который включает в себя как примеры трафика, которые антиботы могут заблокировать, так и примеры трафика, который антиботы не могут заблокировать. Набор данных должен быть как можно более разнообразным, чтобы нейросеть могла научиться распознавать различные типы трафика.

Другой метод, который может использовать нейросеть, - это использование методов машинного обучения. Машинное обучение - это область искусственного интеллекта, которая позволяет компьютерным программам учиться на данных без явного программирования. Нейросеть может использовать методы машинного обучения для обучения тому, как распознавать трафик, который антиботы могут заблокировать.

После того, как нейросеть будет обучена, ее можно использовать для обнаружения и обхода систем антиботов. Нейросеть можно использовать для создания трафика, который похож на трафик, который не заблокирует система антиботов. Это позволит нейросети получить доступ к сайтам, которые были бы заблокированы для обычных пользователей.

Следующие метрологии могут быть использованы для оценки эффективности нейросети в обходе систем антиботов:

Количество заблокированных запросов
Время, за которое выполняется запрос
Количество запросов, которые могут быть выполнены без блокировки
Нейросеть может быть использована для обхода систем антиботов различными способами. Один из способов - это использование набора данных, который включает в себя как примеры трафика, которые антиботы могут заблокировать, так и примеры трафика, который антиботы не могут заблокировать. Набор данных должен быть как можно более разнообразным, чтобы нейросеть могла научиться распознавать различные типы трафика.

Другой способ, который может использовать нейросеть, - это использование методов машинного обучения. Машинное обучение - это область искусственного интеллекта, которая позволяет компьютерным программам учиться на данных без явного программирования. Нейросеть может использовать методы машинного обучения для обучения тому, как распознавать трафик, который антиботы могут заблокировать.

После того, как нейросеть будет обучена, ее можно использовать для обнаружения и обхода систем антиботов. Нейросеть можно использовать для создания трафика, который похож на трафик, который не заблокирует система антиботов. Это позволит нейросети получить доступ к сайтам, которые были бы заблокированы для обычных пользователей.

Следующие способы могут быть использованы нейросетью для обхода систем антиботов:

Использование рандомизированных IP-адресов
Использование рандомизированных заголовков HTTP
Использование рандомизированных сессионных ID
Использование рандомизированных пользовательских агентов
Использование методов социальной инженерии
Время между запросами
Количество запросов в секунду
Используемый браузер и плагины
Используемая операционная система
Используемое разрешение экрана
Используемая версия JavaScript
Используемые куки

Нейросеть может быть использована для обхода систем антиботов различными способами, но важно отметить, что системы антиботов постоянно обновляются, поэтому нейросеть должна постоянно обновляться, чтобы оставаться эффективной. Кроме того, нейросеть может быть использована для других целей, кроме обхода систем антиботов, поэтому важно использовать ее ответственно.

Нейросеть также может использовать различные методы для того, чтобы выдать себя за человека. К этим методам относятся:

Использование различных методов анализа текста
Использование различных методов распознавания изображений
Использование различных методов анализа поведения
Комбинируя различные методы, нейросеть может создать трафик, который очень сложно отличить от трафика, который создается человеком. Это позволяет нейросети обойти системы антиботов и получить доступ к сайтам, которые были бы заблокированы для обычных пользователей.

ktpm23 · 09.08.2023

larryalcina · 09.08.2023

alex778 сказал(а):

Наверное потому, что ты чайник-обыватель, не следящий за темой. В реальности всё не совсем так. GPT-1 появился 5 лет назад. в 2018-м году. А архитектуру трансформер изобрели в 2017-м, до того были в моде LSTM и GRU сети. Найм учёных, подготовка датасетов и тренировка моделей по прежнему стоят миллионы долларов. Никакого "огромного количества нейронок" за 6 прошедших лет просто нет. На данный момент есть ОДНА популярная модель, случайно и полулегально утёкшая в паблик, на базе которой наделали разных поделок, не требующих капитальных вложений. И вторая версия той же модели, которую фейсбук уже намеренно выложил в рамках конкуренции с мелкософтом. И вокруг них крутится разная шушера, типа Яндекса, которая что-то своё выкладывает, но лучше бы не выкладывала, не позорилась. Вот тут список: https://en.wikipedia.org/wiki/Large_language_model#List Где-то 10 моделей в паблике за 6 лет, из них хорошая, годная - одна. Это что касается текста. С графикой, аудио, видео - в целом ситуация похожая.

То есть всё это обилие нейронок(текстовые, графические) https://vc.ru/u/1216053-nftishka/60...ya-kazhdogo-luchshie-neyroseti-dlya-zarabotka
обращаются в конечном итоге к openai и далее из списка что ты скинул?

ktpm23 · 09.08.2023

larryalcina сказал(а):

Почему вся тема вокруг ИИ и нейронок выглядит так - появился chat gpt, нашумел и после этого резко повылезало огромное количество нейронок на любой вкус и цвет?

Ну см бум нейросетей начался примерно с того момента как гугл внедрила технологию машинного обучения в переводчик примерно 15 год. В 10-х активно развивались разные фреймворки у питона и технологии типа чипов и облачных сервисов и этим удовлетворялась потребность в мощном суперкомпьютере и железе на котором все это делается.

После создания гпт, который наделал много шума интерес к индустрии заметно вырос и люди решили вкатываться область так как видят, что в ней есть перспективы ну и сама языковая модель много что умеет делать и это по сути был прорыв в нейросетях.

Ну и еще добавлю сейчас растет роль компьютеров и информации в окружаем нас мире, ну по сути активнее всего ИИ внедряется именно в постмодернистские области работа с графикой, it, работа с текстами

RodionRaskolnikov · 09.08.2023

ktpm23 сказал(а):

Ну см бум нейросетей начался примерно с того момента как гугл внедрила технологию машинного обучения в переводчик примерно 15 год.

Google Translate не использовал глубокое обучение, он основывался на SMT. Все дело в статистическом анализе больших двуязычных текстовых корпусов. Например, если фраза "здравствуйте" часто встречается с фразой "hello" в русско-английской коллекции, то модель просто улавливает связь между ними как перевод друг друга. Конечно, это машинное обучение, но без нейронов. Хотя это был большой шаг вперед по сравнению с системами перевода на основе правил, было много недостатков, которые мы все видели. Например, длинные сложные предложения SMT часто переводило фрагментарно или теряло контекст, что приводило к курьезным переводам, особенно когда пытался переписываться с иностранными подругами в сети.
Google начал использовать NMT (Neural Machine Translation) ai[.]googleblog[.]com/2016/09/a-neural-network-for-machine.html только после 2016 года, и это система на основе глубокого обучения.
Обязательно прочти известную статью "A Logical Calculus of the Ideas Immanent in Nervous Activity" cs.cmu[.]edu/~./epxing/Class/10715/reading/McCulloch.and.Pitts.pdf 1943 года от McCulloch и Pitts. Они впервые ввели математическую модель нейронной сети. Прошло примерно 15 лет, и появился первый алгоритм, имитирующий нейрон: Перцептрон, который, собственно, и запустил эту область. Ты забыл про Алана Тьюринга и его статью "Computing Machinery and Intelligence". Конечно, он нигде в работе прямо не упоминал нейронные структуры academic[.]oup[.]com/mind/article/LIX/236/433/986238, но он заложил основы для возможности обучения машин на опыте. Да, в 1970-х годах исследования замедлились из-за книги Мински "Perceptrons" direct[.]mit[.]edu/books/book/3132/PerceptronsAn-Introduction-to-Computational, но все началось снова с метода обратного распространения ошибки Хинтона nature[.]com/articles/323533a0. Впервые были обучены многослойные перцептроны, это и есть глубокое обучение. К тому же появились алгоритмы машинного обучения типа SVM, так что это не только глубокое обучение.
И вот теперь Chat-GPT начал писать такой-то код, который практически может заменить новичков-программистов, и люди начали волноваться? На самом деле, исследования в этой области ведутся уже более 80 лет, и это всегда была прекрасная область математики и теории информации и таковой и останется.
Когда я был молодым, я начал свой путь в этой области с таких работ, которые навсегда останутся лучшими источниками и займут особое место в истории ИИ, даже если будущие поколения об этом забудут.

Теория и практика создания нейросетей и ИИ

(L1) cache

(L1) cache

(L1) cache

RAID-массив

floppy-диск

RAID-массив

floppy-диск

RAID-массив

(L1) cache

(L1) cache

(L2) cache

(L1) cache

(L2) cache

(L1) cache

(L2) cache

(L1) cache

(L1) cache

RAID-массив

(L1) cache

HDD-drive

Вложения