• XSS.stack #1 – первый литературный журнал от юзеров форума

TXT Ищу софт для подсчета кол-во повторяемых строк в .txt

nadgafilievaliogli

HDD-drive
Пользователь
Регистрация
03.09.2019
Сообщения
45
Реакции
3
Добрый.
Ищу софт для составления брут листа, нужна функция подсчета кол-во повторяющих строк и сколько раз они повторились по убыванию.
Для составление топов 10 100 1000 и тд.
Помогите пожалуйста, файлы .тхт большие.
 
EmEditor
use emeditor professional, you can easily find the license and it has nice functions, like removing all dupes with one click :)
В emEditore нет подсчёта дубликатов строк. Удаление есть но это совсем не то.

Надо вот что:
input
Код:
aaa
bbb
aaa
bbb
bbb

output
Код:
bbb 3
aaa 2
 
Под виндой Gnu Awk может это делать вот такой командой
gawk.exe "OFS=\"\t\" {t[$0]++} END {for (var in t) print var,t[var]}" "%1"

вместо %1 нужно подставить имя файла со строками
но очень большие файлы он почему-то молча обрезает

Ещё можно поэксперементировать с SQLite GroupBy запросами
 
Пожалуйста, обратите внимание, что пользователь заблокирован
Изи,
UPD: С сортировкой по убыванию
Python:
out = {}
with open('input.txt', 'r') as inf:
    for line in inf:
        if line in out:
            out[line] = out[line] + 1
        else:
            out[line] = 1
         
out = {k: v for k, v in sorted(out.items(), key=lambda item: item[1], reverse=True)}
for line in out.keys():
    print(line.strip(), out[line])
 
Последнее редактирование:


Напишите ответ...
  • Вставить:
Прикрепить файлы
Верх