• XSS.stack #1 – первый литературный журнал от юзеров форума

Как сделать маску из слитых паролей?

DrSleep

(L2) cache
Пользователь
Регистрация
10.01.2020
Сообщения
396
Реакции
304
Гарант сделки
1
Хочу прогнать пару десятков GB баз слитых паролей на "маски". Например
Код:
pakistan123
abc123
RAJA@123456
yaali@123
remote@123
Видно что повторяется окончание 123.Часто бывает окончание пароля добавляют 1,!,год рождения, и тд.Кто-то в утекшем пароле меняет все о на 0, меняет прописную первую букву на заглавную и тд.
Как правильно проанализировать такую инфу и получить статистику, к примеру
Окончаний 123 - 100к в базе
Окончание ! - 50к в базе
Начало с заглавной буквы- 200к
Начало ! - 30к и тд
Пайтон по моему неплохо подойдет для этого.
 
Регулярками да можно, но тут нужно более качественно проанализировать.Пока думаю над алгоритмом...Допустим часто в password меняют а на @ в итоге p@ssword уже не прокатит по регулярке.
 
для
Окончаний 123 - 100к в базе
Окончание ! - 50к в базе
Начало с заглавной буквы- 200к
Начало ! - 30к и тд
регулярки подойдут, а для техник , назовем так, ручной обфускации, которые
часто в password меняют а на @
уже нет

в целом задача длинная и решаться может с разных концов, проще всего смотреть в сторону векторов и каких-нибудь Bag-of-words
по векторам легко сравнить с подготовленными заготовками (увы, вручную), т.е. насколько
'pakistan123' близок к '123',password близок кpassw0rd и p@ssword и т.п.

решением в лоб можно начать с проходу по строке с увеличением количества символов и нахождение получившегося слова в словаре, ну т.е.
p, pa, pas. pass. passw, passwo и т.п., затем отделение таких от тех, где слова не найдутся (т.е. по сути сгенерированных) и работа только с ними

ну а дальше сужать области кластеризации и находить общие элементы



 
Неясно сформулирована задача.

В регулярках есть переменные: $1 и так далее, в TextPipe Pro можно использовать подфильтры или передавать данные на обработку в сценарий VBScript/Jscript.
 


Напишите ответ...
  • Вставить:
Прикрепить файлы
Верх