Карел (karmike) wrote,
Карел
karmike

Category:

Portia visual web scraper

Portia - это надстройка для Scrapy, которая позволяет вместо ручного написания достаточно хитроумных спайдеров просто открыть нужный сайт и показывать, что из него следует извлекать.

Сейчас к ней появилась добавка в виде portia2code, которая позволяет плоды трудов по анализу сайтов выгрузить в виде текстов спайдеров, которые потом можно править вручную.

Ставил на Linux mint 18 по инструкции отсюда: http://portia.readthedocs.io/en/latest/installation.html

Только Vagrant и VirtualBox ставил Синаптиком, чтобы не возиться. Они в Синаптике чуть старее, чем на своих сайтах.

Короче, Portia стартует и работает, в отличие от тех версий, с которыми я возися в прошлом году.

Буду опробовать в деле.
Tags: софт
Subscribe
  • Post a new comment

    Error

    default userpic
    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 0 comments