• XSS.stack #1 – первый литературный журнал от юзеров форума

Как и какими методами вы удаляете мусор из словарей?

TOPCHEK

Bruteforce
Пользователь
Регистрация
25.12.2022
Сообщения
311
Решения
2
Реакции
314
Гарант сделки
1
У каждого брутера есть своя подборка словарей.
Хотел бы поинтересоваться как и какими методами вы из своих словарей удаляете мусор. Кроме дубликатов.
 
Пожалуйста, обратите внимание, что пользователь заблокирован
Обычно чищу регуляркой.
Если на винде то не особо большие словари в Notepad++
На линуксе всё быстрее и проще.
Что то тоже регуляркой , а дубли чищу
Отличная прога.
 
Обычно чищу регуляркой.
Если на винде то не особо большие словари в Notepad++
На линуксе всё быстрее и проще.
Что то тоже регуляркой , а дубли чищу
Отличная прога.
Ну вот я и создал тему чтобы узнать какие именно регулярки нужны для чистки словарей от мусора.
Как удалять дубликаты я уже и так знаю, поэтому и написал - кроме дубликатов.
 
Пожалуйста, обратите внимание, что пользователь заблокирован
удалить перед двоеточием
sed -i s/^.*:// input.txt
sed -i 's/.*://' input.txt
удалить после двоеточия
sed -i -r 's/:.+//' input.txt
СОРТИРОВКА В СЛУЧАЙНОМ ПОРЯДКЕ
sort -R input.txt > output.txt

Удаление пробелов в начале строки
sed -i 's/ //g' input.txt
Для удаления ":" в начале строки с помощью команды sed можно использовать следующую команду:
sed -i 's/^://' input.txt
 
удалить перед двоеточием
sed -i s/^.*:// input.txt
sed -i 's/.*://' input.txt
удалить после двоеточия
sed -i -r 's/:.+//' input.txt
СОРТИРОВКА В СЛУЧАЙНОМ ПОРЯДКЕ
sort -R input.txt > output.txt

Удаление пробелов в начале строки
sed -i 's/ //g' input.txt
Для удаления ":" в начале строки с помощью команды sed можно использовать следующую команду:
sed -i 's/^://' input.txt
Спасибо. Есть ещё информация где найти больше регулярок для удаления мусора?
 
Пожалуйста, обратите внимание, что пользователь заблокирован
Спасибо. Есть ещё информация где найти больше регулярок для удаления мусора?
 
Забыл добавить, что EmEditor также чистит дубли и есть другие полезные функции при работе со словарями. 30-50 гигов словарь обработать для этого редактора ничто. Софт платный, но если нет желания или финансы не позволяют покупать и платить разработчику за труд, трекеры никто не отменял
 
Последнее редактирование:
С очень большими словарями при работе с регулярками EmEditor в разы быстрее справится, нежели нотепад
Что за регулярки используются?
 
Что за регулярки используются?
Под твои задачи, те что скидывали выше, любые. Я в основном делаю замену, подставляю значения в тексте, удаляю дубли
 


Напишите ответ...
  • Вставить:
Прикрепить файлы
Верх