VanGraaf — это современный онлайн-магазин модной одежды, обуви и аксессуаров от ведущих мировых брендов. Сайт предлагает широкий ассортимент стильных товаров для мужчин и женщин, сочетая высокое качество, актуальные тренды и удобный интерфейс. VanGraaf привлекает покупателей разнообразием коллекций, регулярными акциями и комфортной системой доставки, обеспечивая приятный шопинг для ценителей моды.
Для перехода в категории и на карточку товара необходимо выполнить следующие этапы:
Мы собираем все доступные категории и подкатегории, которые нам представлены на сайте.
После выбора категории, нам доступны для сбора подкатегории, которые находятся на левой части экрана.
В карточке товара мы собираем следующие данные:
-наименование товара
-цвет
-размер
-цена
-срок доставки
Далее, спускаясь ниже по сайту мы получаем данные о:
-подробностях о товаре
-материал и уход за ним
- отзывы клиентов
-условия доставки и возврат
После сбора информации парсер объединяет всю собранную информацию и выгружает в одном структурированном виде (в формате excel, cvs, json).
Можно ли что-то дополнить или убрать в программе?
Да, перед началом сотрудничества клиент формирует список требований к парсеру. Мы со своей стороны разрабатываем индивидуальный парсер по заказу клиента.
Можно ли заказать мониторинг цен с выгрузкой ежедневно/еженедельно/ежемесячно?
Да, мы можем настроить интеграцию, по которой мы будем от вас забирать список артикулов запчастей по которым нужно мониторить цены и высылать готовый файл вам.
Часов понадобилось: 16 часов
Технологии:
Python – язык программирования
tenacity — библиотека для выполнения повторных попыток в случае ошибок
bs4 – библиотека для извлечения данных из html
requests – библиотека для работы с http запросами
lxml – библиотека используемая для обработки html, используется вместе с bs4
loguru – библиотека для логирования
tqdm – библиотека для использования прогрессбаров
openpyxl – библиотека для работы с xlsx файлами
Принимали участие:
Алексей Пушилов - разработчик Python
Дарья Артемчик - project-менеджер