Парсер предназначен для автоматического сбора данных с сайта Emk24.ru — специализированной площадки по продаже трубной продукции и комплектующих. Решение позволяет получать полный каталог товаров по категориям, структурировать данные и сохранять их в базу данных для последующей обработки и интеграции с другими системами.
📥 Что делает парсер:
-
Переходит по всем разделам каталога, включая вложенные категории.
-
Для каждой карточки товара извлекает всю доступную информацию:
-
Название и артикул
-
Характеристики (размеры, материал, тип соединения и пр.)
-
Описание и технические параметры
-
Цена (если отображается)
-
Изображения
-
-
Сохраняет данные в базу данных (например, PostgreSQL или MySQL), откуда их можно экспортировать в разные форматы (Excel, CSV, XML, 1C и др.) для импорта на сайты или в ERP-системы.
🛡 Особенности реализации:
-
Сайт Emk24.ru защищён Cloudflare, что блокирует обычные автоматические запросы.
-
Для корректной работы парсер использует DrissionPage — решение, имитирующее поведение браузера и способное автоматически проходить капчу, даже без использования прокси.
-
Прокси не применяются, так как Cloudflare блокирует доступ именно при использовании сторонних IP.
⚙️ Статус проекта:
-
Парсер работает в стабильном режиме и может быть запущен как вручную, так и по расписанию (например, через cron).
-
Возможна доработка под структуру клиентской базы данных и конкретные задачи выгрузки (интеграция с CMS, загрузка в маркетплейсы и др.).