Продам библиотеку для безшаблонного парсинга

12.12.2009

Я уже писал про свой безшаблонный граббер. Многим показалась интересным эта библиотека поэтому теперь её может приобрести любой желающий. Кстати продаю я полностью переработанную версию которая даже из блога тормоза может вытащить кусочек текста. В комплекте набор php библиотек и пример использования. Код полностью открыт и снабжен комментариями, так что очень легко встраивается в любой проект.
Пример кода:

  1. <?php
  2.  
  3. require './libs/http.php';
  4. require './libs/domhtml.php';
  5. require './libs/contentparser.php';
  6.  
  7.  
  8. if (isset($_GET['url'])) {
  9.     $parser = new ContentParser;
  10.     echo $parser->getArticle($_GET['url']);
  11.     echo '<br/>';
  12.     echo 'Page load time: '.$parser->pageLoadTime.' s.<br/>';
  13.     echo 'Parsing time: '.$parser->parsingTime.' s.<br/>';
  14. }
  15.  
  16. ?>

Сейчас библиотека умеет выделять статью или значимый текст из практически любой страницы. Корректно работает с кодировками (всегда возвращает результат в utf-8 независимо от кодировки страницы). Работает даже с невалидными HTML страницами. Очищает текст от ненужных тегов, преобразует адреса ссылок и картинок из относительных в абсолютные. Имеет достаточно гибкие настройки которые позволяют настроить парсер под себя.
Демо можно посмотреть здесь.
Библиотека расcчитана на опытных пользователей которые знают что им нужно поэтому цена будет достаточно высокой — 100$. Обновления бесплатны.
Купить сейчас

  1. # Тормоз:

    Джек, спасибо за подарок!
    Скорей всего пригодится.

  2. # Dark:

    Даешь пару строчек из contentparser.php )

  3. # †ALEX†:

    Dark, парой не обойтись. :(
    Эта пара может быть вида

  4. # †ALEX†:

    Сорри…
    <?php
    echo "<?php";
    echo "”;
    echo “?>”;
    ?>

  5. # †ALEX†:

    PS: Jeck, можно убрать вывод HTML в комментах?
    Посмотри коммент №3 в этой новости.
    Кажишь лишнее можно впихнуть…

  6. # Guanako:

    я прочитала “Продам библиотеку для безбашенного пирсинга…”. Думаю, на фига библиотека?

  7. # richkeeper:

    Дороговато конечно, стоит задуматься над применением. А этот парсер просто грабит или перемешивает тоже?

  8. # Elvis:

    Guanako, -)))

  9. # Ida:

    Guanako, я так же прочитала, начала читать статью и потом решила перечитать заголовок, подумав что-то тут не то ))))

  10. # SEO blog:

    их больше было О_о

  11. # Andipas:

    Этот класс случайно не тот что в webgraber-e используется, либо измененный?

  12. # Andipas: