• XSS.stack #1 – первый литературный журнал от юзеров форума

ПАРСИНГ ФОТОТЕКА infourok.ru_08.2019_(372.475)

JohnRipper

CPU register
Пользователь
Регистрация
05.10.2018
Сообщения
1 049
Реакции
3 365
Парсинг страниц пользователей ресурса infourok.ru
В БД оставлены только записи с ФИО и датами рождений для однозначной идентификации лиц.
В БД присутствуют 90 тысяч фотографий - т.е. БД небольшая фототека.
Количество записей 370к.
Поля:
1565602185900.png

БД в КроносеПРО 5:

БД в тхт (фотки прилагаются):


Пароль местный (xss.pro)
 
Последнее редактирование:
Сорри, за возможный оффтоп.
А Вы сами парсите подобное? С помощью какого софта это делается?
Спасибо.
Да, это мои наколенные поделки. Сбор делаю Datacol7. Но чтобы не было рекламы, по факту то же самое умеют A-Parser, ContentDownloader, Zennoposter и др. т.н. универсальные парсеры.
 
Парсинг страниц пользователей ресурса infourok.ru
В БД оставлены только записи с ФИО и датами рождений для однозначной идентификации лиц.
В БД присутствуют 90 тысяч фотографий - т.е. БД небольшая фототека.
Количество записей 370к.
Поля:
Посмотреть вложение 4934
БД в КроносеПРО 5:
Скрытое содержимое
БД в тхт (фотки прилагаются):
Скрытое содержимое

Пароль местный (xss.pro)
На Фрикере не планируете продублировать раздачу?
 
С целью скачать оттуда. А то на этом сайте активно не сижу и не хватает репутации. :)
Ничего вам не мешает и тут быть активным участником.
 
Для новичков идельно подходит Web Content Extractor https://www.newprosoft.com/.
Визуальный интерфейс в котором можно просто кликать на типичные блоки страницы (и он находит правильный кусок html)
Потом указываешь страницы какие обойти, обычно подставить к ссылке номера страниц в excel и все.
И готово.
Так можно много баз собрать и сюда выложить. Надеюсь будет полезно кому-то.
 


Напишите ответ...
  • Вставить:
Прикрепить файлы
Верх