Пред нами стояла цель:
Разработать программу для автоматического сбора данных с сайта immobiliare.it
Извлечь информацию о недвижимости, такую как цены, характеристики, расположение, изображения и другие параметры, сохранить в нормализованном виде в базе данных.
Для этого понадобилось:
Провести анализ структуры сайта для уточнения собираемых данных, методов сбора, технологий и проектирование структуры БД.
Разработать скрипт (или программу) для парсинга страниц сайта и извлечения нужной информации.
Обеспечить обработку возможных ошибок и исключений в процессе парсинга.
Провести тестирование парсера на различных страницах сайта, для проверки корректности извлечения данных.
Исправить ошибки и улучшить производительность на основе результатов тестирования.
Предоставить описание работы парсера, включая инструкции по установке и использованию.
Предоставить документацию по структуре собираемых данных.
Результат:
Мы разработали программу, которая собирает информацию, по указанным критериям заказчика.
Города, провинции, на всех языках и со всеми характеристиками, описание, расположение, состояние здания с хранением в Базе Данных.
Часов понадобилось:
72 часа
Технологии:
С# - Язык программирования
ASP.NET Core - Фреймворк для разработки веб-приложений
EF Core - ORM предназначенная для работы с базой данных
Принимали участие:
Максим Римкус - разработчик C#
Пётр Секриеру – руководитель группы Parsigsite