Показать сообщение отдельно
Старый 03.10.2009, 16:45
#1
Интересующийся
 
Пол: Мужской
Регистрация: 02.10.2009
Сообщений: 21
Благодарностей: 0
Альтернативный граббер контента

Предлагаю Вашему вниманию DLE Grabber написанный на PHP.
DLE порталы очень популярны в рунете, отсюда и актуальность данной темы.
-------------------------------------------------------------------------


Особенности скрипта:
  • Скрипт полностью автономен и самодостаточен.
    Он легко устанавливается, имеет простой интуитивный интерфейс.

  • Универсальность.
    Граббер позволяет получать контент с большинства DLE-сайтов (не используя RSS), а полученный контент
    можно использовать на любом сайте, независимо от того, базируется он на популярной CMS или на самописном скрипте.

  • Гибкость - два режима работы.
    >>Классический режим:
    В этом режиме дистрибутив граббера копируется в директорию Вашего сайта.
    Все что нужно - указать его драйвер.
    Полученные новости, после их подтверждения, автоматически размещаются у Вас на сайте.

    >>Пакетный режим:
    Суть режима заключается в разделении процесса получения новостей от их добавления.
    Грабить новости вы можете на своем локальном сервере (для пользователей Windows отлично подойдет набор denwer),
    скрипт в этом режиме будет формировать специальные пакеты (.php файлы), которые, впоследствии, копируются на Ваш сайт, где другая копия граббера их обрабатывает.
    Преимущества данного режима:
    • Возможность грабить большое количество статей одновременно, если этого не позволяет делать Ваш хостинг;
    • Если вы грабите долгое время с одного сайта, рано или поздно, Ваш IP на этом сайте может быть просто забанен,
      а если грабить с локального сервера - тут Вам на помощь прокси и/или динамический IP.

  • Функциональность.
    • Поддержка авторизаций на сайте-источнике для получения элементов, недоступных гостям;
    • Возможнсоть получения новостей определенной категории или всех новостей, публекуемых на главной странице;
    • Возможность ограничения количества одновременных запросов с указанием интервала для паузы;*
    • Возможность добавления "случайных" дат при размещении новостей на Вашем сайте;
    • Возможность проверки новости на уникальность перед добавлением;
    • Возможность поэтапного добавления новостей на Ваш сайт;
    • Возможность автоматического определения категории новости по её содержимому (с помощью шаблонов);
    • Возможность автоматического добавления "подписей" в новости, где можно указать сайт, например, сайт-источник или ключевые слова;
    • Возможность цензурирования новостей;
    • Возможность "чистки" HTML-кода новости;
    • Возможность синонимизации текста (в дистрибутив входят две открытые базы синонимов);

    * - На некоторых DLE (да и не только) сайтах стоит анти-спам защита (ограничение количества обращений с одного IP в период времени). Данный скрипт имеет опцию ограничения количества одновременных запросов с указанием интервала для паузы. Что, конечно, увеличивает время граббинга, но все же оставляет его автоматизированным даже на сайтах с анти-спам защитой.
    Данная опция также может быть полезна, если на Вашем хостинге отключена стандартная функция снятия ограничения времени выполнения скрипта.
    (на большинстве серверов она по понятным причинам как раз отключена). В этом случае, обычно, вылетает ошибка 403 (Forbidden).



  • Оптимизация.
    Работа с граббером максимально нацелена на оптимизацию. Все конфиги расположены в отдельной директории и максимально документированы. По желанию, мы также можем оптимизировать скрипт персонально для Вас.

  • Надеждый механизм работы.
    Весь полученный контент хранится в директориях скрипта и может быть использован при повторном запросе на получение тех же статей.
    Это очень полезно, если объем получаемого контента большой, - ведь в этом случае возобновление работы
    после любого сбоя не представляет проблем
    , достаточно заного указать начальную и конечную страницы,
    а скрипт сам определит какие из статей уже получены, а какие предстоит сграбить.

  • Расширяемость.
    С граббером поставляется и документация к нему с описанием функций и структуры. Ключевые его элементы подробно закомментированы и
    расположены в отдельных библиотеках, что позволит оптимизировать или расширить
    функционал скрипта даже начинающему программисту
    . В граббер, также, встроен простой, но удобный механизм подключения
    собственных модулей по обработке контента.

  • Безопасность.
    Граббер имеет встроенный механизм авторизации для ограничения доступа к скрипту.
    Данную функцию можно включить и выключить в любой момент.

  • Выгодные условия.
    Стоимость данного скрипта - 25 WMZ. Форма оплаты - WebMoney.
    При покупке вы получаете:
    • Полный дистрибутив скрипта с открытым исходным кодом и документацией;
    • Драйвера для следующих движков: DLE, IPB, SMF, WordPress, phpBB 3.0.x;
    • Несколько модулей, включая модуль загрузки новостных картинок на Ваш сайт;
    • Отсутствие ограничений по времени использования;
    • Отсутствие привязок (к домену/IP/....);
    • Бесплатную техническую поддержку по электронной почте и ICQ в течении месяца;
    • Бесплатную услугу по написанию драйвера под Вашу CMS (сайт) в течении двух суток с момента покупки;


  • Итого
    По любым вопросам вы можете обращаться по ICQ: 494-897-304.
    Если Вас заинтересовал граббер, я могу предоставить ссылку на демонстрационную онлайн версию,
    где вы можете протестировать его на сайтах, которые Вам интересны. Пишите!



-------------------------------------------------------------------------
Sergey Gr вне форума
Перейти в тему этого сообщения: Альтернативный граббер контента