1. instagram
  2. facebook
  3. whatsapp
  4. telegram
  5. bot
img
Парсер Vangraaf

Парсер Vangraaf собирает такие данные как: наименование товара, цвет, размер, цена, подробности о товаре, материал и уход за ним, отзывы клиентов, условия доставки и возврат.

Метки:

VanGraaf — это современный онлайн-магазин модной одежды, обуви и аксессуаров от ведущих мировых брендов. Сайт предлагает широкий ассортимент стильных товаров для мужчин и женщин, сочетая высокое качество, актуальные тренды и удобный интерфейс. VanGraaf привлекает покупателей разнообразием коллекций, регулярными акциями и комфортной системой доставки, обеспечивая приятный шопинг для ценителей моды.

Для перехода в категории и на карточку товара необходимо выполнить следующие этапы:

Мы собираем все доступные категории и подкатегории, которые нам представлены на сайте.

После выбора категории, нам доступны для сбора подкатегории, которые находятся на левой части экрана.

 

В карточке товара мы собираем следующие данные:
-наименование товара
-цвет
-размер
-цена
-срок доставки

 

Далее, спускаясь ниже по сайту мы получаем данные о:
-подробностях о товаре
-материал и уход за ним
- отзывы клиентов
-условия доставки и возврат

 

После сбора информации парсер объединяет всю собранную информацию и выгружает в одном структурированном виде (в формате excel, cvs, json).

 

Можно ли что-то дополнить или убрать в программе?

Да, перед началом сотрудничества клиент формирует список требований к парсеру. Мы со своей стороны разрабатываем индивидуальный парсер по заказу клиента.

Можно ли заказать мониторинг цен с выгрузкой ежедневно/еженедельно/ежемесячно?

Да, мы можем настроить интеграцию, по которой мы будем от вас забирать список артикулов запчастей по которым нужно мониторить цены и высылать готовый файл вам.

Часов понадобилось: 16 часов

Технологии:

Python – язык программирования

tenacity — библиотека для выполнения повторных попыток в случае ошибок
bs4 – библиотека для извлечения данных из html
requests – библиотека для работы с http запросами
lxml – библиотека используемая для обработки html, используется вместе с bs4
loguru – библиотека для логирования
tqdm – библиотека для использования прогрессбаров
openpyxl – библиотека для работы с xlsx файлами

Принимали участие:
Алексей Пушилов - разработчик Python
Дарья Артемчик - project-менеджер

Отправить заявку

Нажимая кнопку «Отправить заявку», вы даете согласие на обработку персональных данны