Всем привет! Хочу поделиться с вами своим маленьким скриптом, который уже неоднократно выручал меня при работе с кучей разной лабуды — базами данных, дампами, отчётами и прочими текстовыми файлами. Назову его просто — Простенький чекер баз данных.
По сути — это консольный скрипт на Питоне, который быстро и без лишних заморочек перебирает папку с файлами в формате CSV, XLS/XLSX, DOCX, SQL, TXT и ищет внутри заданный текстовый паттерн.
Да-да, именно то, что надо, когда нужно найти упоминание какого-нибудь юзера, токена, IP-адреса или ключевого слова в тоннах разных файлов, не открывая каждый по отдельности.
Поддерживаются и Excel-форматы старого и нового типа (.xls, .xlsx), Word-документы (.docx), простые текстовые файлы, CSV и даже SQL-дампы. Можно даже в одну папку скинуть кучу разных типов и всё без проблем будет просканировано.
Всё работает из консоли, никаких UI-напопок и лишнего софта. Запускаешь, кидаешь папку в кмдшник — дальше скрипт делает всю работу за тебя.
Результаты поиска пишутся в отдельный текстовый файл с именем твоего запроса в папке где находиться скрипт, так что можно потом спокойно разбираться в найденных данных и делать с ними что угодно.
Благодаря pandas и прочим специализированным библиотекам парсинг файлов идёт без косяков и тормозов, а обработка Excel и Word — на уровне профессионального инструмента.
Код открытый и прост, если нужно — можно добавить поддержку других форматов, фильтры, или изменить вывод под свои нужды.
Всё просто — качаете, ставите зависимости через
p.s. krect
Что это такое?
По сути — это консольный скрипт на Питоне, который быстро и без лишних заморочек перебирает папку с файлами в формате CSV, XLS/XLSX, DOCX, SQL, TXT и ищет внутри заданный текстовый паттерн.
Да-да, именно то, что надо, когда нужно найти упоминание какого-нибудь юзера, токена, IP-адреса или ключевого слова в тоннах разных файлов, не открывая каждый по отдельности.
Почему стоит забрать и попробовать?
1. Универсальность
Поддерживаются и Excel-форматы старого и нового типа (.xls, .xlsx), Word-документы (.docx), простые текстовые файлы, CSV и даже SQL-дампы. Можно даже в одну папку скинуть кучу разных типов и всё без проблем будет просканировано.
2. Простота использования
Всё работает из консоли, никаких UI-напопок и лишнего софта. Запускаешь, кидаешь папку в кмдшник — дальше скрипт делает всю работу за тебя.
3. Адекватный вывод и логирование
Результаты поиска пишутся в отдельный текстовый файл с именем твоего запроса в папке где находиться скрипт, так что можно потом спокойно разбираться в найденных данных и делать с ними что угодно.
4. Работает быстро и стабильно
Благодаря pandas и прочим специализированным библиотекам парсинг файлов идёт без косяков и тормозов, а обработка Excel и Word — на уровне профессионального инструмента.
5. Легко кастомизируется
Код открытый и прост, если нужно — можно добавить поддержку других форматов, фильтры, или изменить вывод под свои нужды.
Как запустить?
Всё просто — качаете, ставите зависимости через
pip install openpyxl xlrd python-docx pandas pystyle, запускаете скрипт, указываете папку и что ищете — готово.p.s. krect