Перед нами стояла задача создать парсер, который позволяет собирать товары не только по ссылкам на товары, но и по ссылкам на категории. Цель — получить структурированные данные (название, цена, бренд, характеристики, изображения и т.д.) для анализа ассортимента и цен конкурентов.
Для выполнения задачи понадобилось:
1. Сбор технических требований (мы получили список категорий, которые необходимо мониторить, уточнили, какие именно данные нужно собирать: название, цена, бренд, ссылка, фото, наличие, рейтинг, артикул и др, Определили формат выгрузки (Excel ))
2.Изучение структуры Ozon
3. Разработка логики парсера (реализовали скрипт, который проходит по заданному списку категорий, собирает нужные поля с карточки товара, сохраняет данные в таблицу Excel)
4. Добавление фильтров (ввели возможность ограничения по количеству товаров или цене)
5. Формирование результата (после тестового прогона проверили корректность данных, провели фильтрацию и очистку результатов, сформировали итоговый файл с удобной структурой)
Как работает программа:
Пользователю предоставляется возможность выбора наиболее подходящего для него способа сбора данных: в данном случае по ссылке на категорию.
Также есть возможность выбрать колонки отображаемые в выходном файле.
Поле выполнения получается xlsx файл, содержащий в себе информацию по артикулам и названиям, которая может быть использована для актуализации информации по продуктам.
Результаты:
- Произвели сбор товаров по заданным ссылкам на категории
- Каждая карточка содержит такие данные, как: название, цена, цена со скидкой, цена по карте, бренд, характеристики, описание, рейтинг и др.
- Формат выгрузки — Excel с фильтрами
Более подробную информацию по работе программы Вы можете найти по ссылке:
https://parsingsite.ru/product/parser-ozon-ru
Часов понадобилось:
8 часов