У вас должно быть более 25 реакций для просмотра скрытого контента.
Описание.
Скрипт на python, извлекает данные из локальных файлов баз 2Гис .dgdat (десктоп и мобайл).
На выходе создает два файла данных, csv и sqlite.
Предисловие.
"Мопед не мой, точнее не мой на 98%"
Изначально скрипт был написан на php (не мной, автор указан в исходниках php, прилагаются), потом его поудаляли отовсюду, вероятно приложила руку 2Gis (хотя не знаю). Cудя по этому https://data.2gis.com/ они на этом рубят бабло.
Поскольку, в php я не очень, решил переписать скрипт на питоне.
Для работы.
Файл базы .dgdat лучше переименовать во что-то простое.
Например, 2GISData_Kemerovo~mobile-169.12.0.dgdat переименовать в Kemerovo.dgdat
Запуск скрипта.
python3 extract_dgdat.py Kemerovo.dgdat
После окончания экспорта данных, в текущей директории создаются два файла Kemerovo.csv и Kemerovo.sqlite
Для удобства csv и sqlite
Несколько примечаний...
Файл csv в кодировке cp1251
(он изначально в базе dgdat такой, возиться с перекодировкой было лень)
В конечной базе sqlite.
1. Время работы организаций (в базе dgdat время работы хранится в xml).
Если в питоне установлена библиотека lxml, то время работы организаций распаршиватся с помощью этой библиотеки. Если не установлена, попытался привести в похожем виде с помощью манипуляций со строками.
2. Таблица sqlite, телефоны и комментарии в ним.
Соответствие столбцов phones и contant_comments в таблице sqlite.
Столбцы phones и contant_comments сделаны с разделителями | , если телефонов несколько.
Например, если телефонов несколько, например
111-22-30|111-22-31|111-22-32
А в колонке contant_comments
||факс
то факс относится к последнему(третьему) телефону.
или
111-22-30|111-22-31
а колонка contant_comments
круглосуточный|
значит первый телефон круглосуточный, второй видимо нет.
PS это вроде все нюансы, возможно я чо- еще забыл.
Скчать (пароль местный)
anonfile.com
Скрипт на python, извлекает данные из локальных файлов баз 2Гис .dgdat (десктоп и мобайл).
На выходе создает два файла данных, csv и sqlite.
Предисловие.
"Мопед не мой, точнее не мой на 98%"
Изначально скрипт был написан на php (не мной, автор указан в исходниках php, прилагаются), потом его поудаляли отовсюду, вероятно приложила руку 2Gis (хотя не знаю). Cудя по этому https://data.2gis.com/ они на этом рубят бабло.
Поскольку, в php я не очень, решил переписать скрипт на питоне.
Для работы.
Файл базы .dgdat лучше переименовать во что-то простое.
Например, 2GISData_Kemerovo~mobile-169.12.0.dgdat переименовать в Kemerovo.dgdat
Запуск скрипта.
python3 extract_dgdat.py Kemerovo.dgdat
После окончания экспорта данных, в текущей директории создаются два файла Kemerovo.csv и Kemerovo.sqlite
Для удобства csv и sqlite
Несколько примечаний...
Файл csv в кодировке cp1251
(он изначально в базе dgdat такой, возиться с перекодировкой было лень)
В конечной базе sqlite.
1. Время работы организаций (в базе dgdat время работы хранится в xml).
Если в питоне установлена библиотека lxml, то время работы организаций распаршиватся с помощью этой библиотеки. Если не установлена, попытался привести в похожем виде с помощью манипуляций со строками.
2. Таблица sqlite, телефоны и комментарии в ним.
Соответствие столбцов phones и contant_comments в таблице sqlite.
Столбцы phones и contant_comments сделаны с разделителями | , если телефонов несколько.
Например, если телефонов несколько, например
111-22-30|111-22-31|111-22-32
А в колонке contant_comments
||факс
то факс относится к последнему(третьему) телефону.
или
111-22-30|111-22-31
а колонка contant_comments
круглосуточный|
значит первый телефон круглосуточный, второй видимо нет.
PS это вроде все нюансы, возможно я чо- еще забыл.
Скчать (пароль местный)
pydgdat.7z - AnonFile
Последнее редактирование: