Техническое задание (ТЗ) на разработку парсера объявлений с сайта https://gancxadebebi.ge/ru/
Цель:
Создать парсер объявлений с сайта https://gancxadebebi.ge/ru/, который будет собирать определенные данные и передавать их по API.
Требования:
Сайт для парсинга:
URL: https://gancxadebebi.ge/ru/
Собираемые данные:
Город
Регион
Категория
Подкатегория
Номер телефона (или несколько номеров, если указаны)
Дата добавления обьявления
Формат передачи данных:
Все собранные данные должны передаваться по API.
Формат данных: JSON.
Пример структуры JSON:
jsonКопировать код{
"city": "Тбилиси",
"region": "Картли",
"category": "Недвижимость",
"subcategory": "Аренда квартир",
"phone_numbers": ["+995123456789", "+995987654321"]
}
API для передачи данных:
Указать URL API для передачи данных (будет предоставлен позже).
Метод передачи данных: POST.
Алгоритм работы парсера:
Парсер должен собирать все объявления с сайта, разбивая их на меньшие категории в случае ограничения на количество страниц (например, если отображается максимум 100 страниц по 15 объявлений на каждой, необходимо дробить на подкатегории).
После полного сбора данных, парсер должен запускаться раз в сутки для сбора новых объявлений.
Технические требования:
Поддержка многопоточности для ускорения процесса парсинга.
Возможность работы через прокси для обхода блокировок (обьявлений не много, возможно не потребуется)
Обработка ошибок и логирование (механизмы для повторной попытки в случае неудачной передачи данных или недоступности сайта).
Частота обновления данных:
Парсер должен запускаться каждые 24 часа для сбора новых данных.
Возможность ручного запуска для экстренного обновления данных.
Дополнительные требования:
Должна быть возможность расширения функционала парсера в будущем (добавление новых полей, изменение логики сбора данных).
Парсер должен работать на сервере под управлением операционной системы Linux.
Документация по установке и запуску парсера.
Комментарии в коде для лучшего понимания логики работы.
Этапы разработки:
Разработка и тестирование парсера.
Интеграция с API для передачи данных.
Тестирование полного цикла работы парсера.
Передача документации и исходного кода.
Сроки выполнения:
Разработка и тестирование парсера: [10 дней]
Интеграция с API и тестирование: [10 дней]