cianparser
cianparser copied to clipboard
Сбор данных с сайта объявлений Циан / The parser of general information from the site cian.ru
Загружал данные о 'land-plot' и практически во всех случаях стоит '-1', хотя на сайте информация есть )
Здравствуйте. Парсер ложится на 3-4 - ой странице с ошибкой Exception: 429 Client Error: Too Many Requests for url: https://www.cian.ru/cat.php?engine_version=2&p=4&with_neighbors=0®ion=4959&deal_type=sale&offer_type=flat&room1=1 The collection of information from the pages with ending parse...
Здравствуйте! Планируется ли добавление в парсер сбора координат объекта в объявлении (latitude, longitude)?
Proxy
Здравствуйте! Как добавить прокси? Я взял открытые, но не знаю куда их нужно написать) proxies = [ '185.174.138.19', '185.221.160.123', '176.192.65.34', '37.18.73.60', '185.221.160.0', '185.221.160.176', '45.8.211.90', '185.221.160.60', '31.12.75.183', '85.26.146.169', '31.12.75.145', '45.8.211.64', '45.8.211.110',...
Предполагается ли передача прокси разных типов?
Здравствуйте! Спасибо за классный инструмент! На циан есть поиск по Московской области, а также по районам (не округам) Москвы (Лефортово, например). Можно ли сделать так, чтобы location можно было присвоить...
Это если просто вставить список прокси ``` 9 | proxy 50.171.32.224:80: unavailable.. trying another.. Error: ``` Но если добавить в файл parser.py следующее ``` import ssl ssl._create_default_https_context = ssl._create_unverified_context ```...
Добрый день. Планируется ли добавить хэндлер капчи? В какой-то момент в ответ приходит капча (где нужно выбрать картинки со светофором, например), и пока ее не пройдешь, объявлений в ответ не...
Привет! Спасибо за парсер, работает отлично. Хотелось бы в будущем иметь возможность получать ссылки на фотографии из объявлений. Во многих ML проектах было бы полезно)
Возникла проблема с кодировкой во время парсинга: > data = cianparser.parse( > deal_type="sale", > accommodation_type="flat", > location="Москва", > rooms=3, > start_page=1, > end_page=2, > is_saving_csv=True, > is_latin=False, > is_express_mode=False) Output:...