• XSS.stack #1 – первый литературный журнал от юзеров форума

Подскажите, как лучше реализовать сортировку строк в тхт

Марк

RAM
Пользователь
Регистрация
21.07.2020
Сообщения
145
Реакции
191
Необходимо обзвонить группу людей с определенными интересами. Прошелся по тематическим группам вк. Собрал ссылки на их странички в формате vk.com/id******
Имеется база вк с данными в виде *ссылка на страницу--ФИО--номер телефона*

Нет просто уже никаких вариантов как из этой большой базы отсеять строки которые я собрал с вк(строки, содержащие линки на странички) чтобы в итоге получить необходимые мне данные.
Отблагодарю каждого за инфу, которая окажется полезной.
Заранее всем хорошего вечера и спасибо.
ПС: файл крайне больших размеров и Excel не справляется. А резать и чекать каждый файл... такое.
 
Не совсем понял, по каким критериям отбирать и что в итоге должно получиться.
Могу заскриптить, если будет внятное ТЗ.
 
Не совсем понял, по каким критериям отбирать и что в итоге должно получиться.
Могу заскриптить, если будет внятное ТЗ.
Есть регион, там определённый город. Я собрал групы, которые относятся к этому городу, вбил их в программу и программа прошлась по списку участников этих групп, отобрав мне странички вк которые необходимы.
1) У меня есть список ссылок https://vk.com/id*******
2) но мне нужна база типа ФИО:Номер
3) есть слитая база вк в которой есть данные типа ссылка:фио:номер
4) Hеобходимо отобрать из базы вк строки Фио:номер соответствующие тем, страничкам, ссылки на которые были собраны мной в первом пункте.

*невольно почувствовал себя тем самым украинским боксером, пока пытался выразить эти мысли*
 
Есть регион, там определённый город. Я собрал групы, которые относятся к этому городу, вбил их в программу и программа прошлась по списку участников этих групп, отобрав мне странички вк которые необходимы.
1) У меня есть список ссылок https://vk.com/id*******
2) но мне нужна база типа ФИО:Номер
3) есть слитая база вк в которой есть данные типа ссылка:фио:номер
4) Hеобходимо отобрать из базы вк строки Фио:номер соответствующие тем, страничкам, ссылки на которые были собраны мной в первом пункте.

*невольно почувствовал себя тем самым украинским боксером, пока пытался выразить эти мысли*
Очень странно, что Excel крашится, например Технические характеристики и ограничения Excel: Размер рабочего листа 1048576 строк. Можно попробовать организовать в 2 файла Excel, в одном будет список твоих ссылок, в другом будет слитая база и решить вопрос функцией ВПР, она идеально подходит для твоего случая :zns6:
 
Очень странно, что Excel крашится, например Технические характеристики и ограничения Excel: Размер рабочего листа 1048576 строк. Можно попробовать организовать в 2 файла Excel, в одном будет список твоих ссылок, в другом будет слитая база и решить вопрос функцией ВПР, она идеально подходит для твоего случая :zns6:
ограничение в 1 048 576, а в базе 100 000 000+ строк.
Да, я сначала пытался ее использовать. Даже были абсурдные идеи о разделении на сотню файлов... но потом решил, что должен существовать гораздо менее абсурдный метод сортировки и написал сюда. Честное слово, сегодня 6 часов всячески пытался найти выход, но увы.
Notepad++ чем не устраивает?
Ну к примеру тем, что файлы больше 300 мб он открывает крайне неохотно, а данный текстовой файл 8 гб+ весит. И даже если бы он открылся, то какими инструментами в блокноте вы бы предложили орудовать?)
 
Ну к примеру тем, что файлы больше 300 мб он открывает крайне неохотно, а данный текстовой файл 8 гб+ весит. И даже если бы он открылся, то какими инструментами в блокноте вы бы предложили орудовать?)
EmEditor
 
ограничение в 1 048 576, а в базе 100 000 000+ строк.
Да, я сначала пытался ее использовать. Даже были абсурдные идеи о разделении на сотню файлов... но потом решил, что должен существовать гораздо менее абсурдный метод сортировки и написал сюда. Честное слово, сегодня 6 часов всячески пытался найти выход, но увы.

Ну к примеру тем, что файлы больше 300 мб он открывает крайне неохотно, а данный текстовой файл 8 гб+ весит. И даже если бы он открылся, то какими инструментами в блокноте вы бы предложили орудовать?)
Установи модуль PowerPivot для Excel с помощью него можно импортировать вроде как и 100 млн. строк+ и даже больше, а дальше так же через ВПР решить вопрос:smile10:
 
Никакой редактор тебе не поможет, здесь либо писать скрипт, либо загонять в sql, либо перегонять в текст и использовать что-то типа этого https://github.com/dinedal/textql
 
Здравствуйте, вновь я, вновь нуждаюсь в вашем совете и вновь буду благодарен за помощь.
Имеется Маил:Тел слева и имеются телефоны справа.

Как можно найти те почты, которые соответствуют телефонам справа?
1608584462122.png
 
Здравствуйте, вновь я, вновь нуждаюсь в вашем совете и вновь буду благодарен за помощь.
Имеется Маил:Тел слева и имеются телефоны справа.

Как можно найти те почты, которые соответствуют телефонам справа?

for phone in $(cat phones.txt); do grep $phone pairs.txt >> pairs_found.txt; done
 
Здравствуйте, вновь я, вновь нуждаюсь в вашем совете и вновь буду благодарен за помощь.
Имеется Маил:Тел слева и имеются телефоны справа.

Как можно найти те почты, которые соответствуют телефонам справа? Посмотреть вложение 18273
Друг, в Excel все та же функция =ВПР и будет тебе счастья!
 


Напишите ответ...
  • Вставить:
Прикрепить файлы
Верх