Есть >200 текстовиков по 100мб.
В них содержатся строки с инфой.
Есть необходимость со всех текстовиков:
1. Отпарсить строки, содержащие определенный текст.
Например строка - prostopisatel898989:asdasd:asdasda:123:asdsadsa
И все строки которые содержат "prostopis" мне надо в отдельный текстовый файл. Со всех 200 текстовиков.
А затем с этого текстовика удалить дубли, допустим строки:
prostopisatel898989:asdasd:asdasda:123:asdsadsa
123prostopisatel898989:asdasd:asdasda:123:asdsadsa
Не являются дублями, а вот:
prostopisatel898989:asdasd:asdasda:123:asdsadsa - это уже дубль.
Подскажите софт, или скрипт какой? Чтобы работать с большими текстовыми данными.
Спасибо!
В них содержатся строки с инфой.
Есть необходимость со всех текстовиков:
1. Отпарсить строки, содержащие определенный текст.
Например строка - prostopisatel898989:asdasd:asdasda:123:asdsadsa
И все строки которые содержат "prostopis" мне надо в отдельный текстовый файл. Со всех 200 текстовиков.
А затем с этого текстовика удалить дубли, допустим строки:
prostopisatel898989:asdasd:asdasda:123:asdsadsa
123prostopisatel898989:asdasd:asdasda:123:asdsadsa
Не являются дублями, а вот:
prostopisatel898989:asdasd:asdasda:123:asdsadsa - это уже дубль.
Подскажите софт, или скрипт какой? Чтобы работать с большими текстовыми данными.
Спасибо!