Seo и бульба - Seo в Беларуси, рунете и мире. Блог о тяжёлой жизни в интернете и победах на личном фронте. Манимейкерство и seo.

Blog Harvester - удобный парсер блогов

Blog Harvester

С каждым апом тиц всё меньше и старые темы умирают, а новые не палят. И остаются среди прочего блоги. Кто-то скажет, что это «спам», кто-то – «умный спам», а другой заявит – «размещение ссылок». Так или иначе, осмелюсь предположить, что каждый второй прибегает к спаму по блогам или же имел к этому отношение. Но сейчас не время для разжевывания обстоятельств. Итак, теперь по делу.

Данный пост посвящён эффективному инструменту для парсинга блогов на 11 движках (Wordpress, Wordpress.com, Typepad, TextPattern, Nucleus, b2evolution, Blogdrive, Drupal, Livejournal, ExpressionEngine и Blogger) имя которому Blog Harvester.

Blog Harvester – скрипт-парсер блогов из выдачи google и blogsearch.google. Как уже ранее отмечалось, скрипт умеет распознавать 11 популярных движков среди блоггеров.

парсить движки блогов

Изо дня в день появляется, чуть ли новый прототип Хумера с набором различных функций и украшений. Цена, конечно же, у такого «детища» отталкивается от 100 и более американских. Определимся с тем, что нам необходимо. Знаем тему с тицем на блогах, а значит, нужен перечень желательно follow-блогов. Заметьте, для этого не требуется покупать супер-мега программное обеспечение. Либо ты программист и пишешь под себя, чем фантазия не ограничивается, либо заказываешь у ребят спарсенные блоги, либо сам вручную втыкаешь в выдачу и ctrl+c & ctrl+v.

Но можно и сэкономить своё время. Blog Harvester буквально сэкономит ваше время и создаст все условия для наращивания тиц. Тема ещё жива, а значит, выжимаем все соки из неё. Кстати, если не хватает фантазии составить интересный комментарий, то лучше попросить товарища или заказать на специализирующися сервисах.

Функционал:

Скрипт можно заточить и под себя, указав помимо 11 типов движков свои признаки парсинга. Таким образом, можно сформировать множество запросов, а при реализации proxy инструмент будет на вес золота.

Имеется возможность парсинга по определённому ключевому слову, как показано на рисунке ниже.


скрипт-парсер

Собранную информацию можно фильтровать по следующим признакам: CY, PR, Domen PR, Follow\Nofollow, Outbound links, что удобно для оформления пакетов блогов по разным критериям:

Blog Harvester

Реализована, помимо парсинга, возможность комментирования блогов. Так, вы можете, «не отходя от кассы», публиковать комментарии в блоги, а если блог нерусский – не проблема, так как для таких случаев имеется встроенный переводчик:

http://yuzver.name/img/translate_comment.PNG

Для удобства пользователя имеется возможность пакетной загрузки ссылок с указанием конкретного их количества для того или иного блога. Наугад будут выбираться загруженные пакетом ссылки, и выводиться в верхний фрейм.

скрипт-парсер

Оперативность:

На момент написания обзора в скрипте не было поддержки proxy. Разработчиками было заявлено, что в новой версии, обновления, между прочим, бесплатны, будет реализована поддержка.

Скорость оставляет желать лучшего, однако куда спешить. Загрузили список ключевых слов (запрос на строку), выбрали объект парсинга, типы блогов, язык русский или английский, фильтр сортировки парсинга: CY, PR, Follow\Nofollow, Outbound links и запускаем процесс. Можно свернуть и дальше заниматься своими делами – особо не напрягает

.

Можно запускать параллельно несколько процессов парсинга по тому или иному запросу, однако время затянется при этом.

Суппорт отзывчивый. Адекватный. Приятно сотрудничать с ребятами.

Цена: 69$

Системные требования:
Apache2.0 + PHP5 + curl
Denwer

Установка:

Особых проблем при установке скрипта возникнуть не должно. Кстати, пароль по умолчанию: 123. Содержимое архива извлекается в корневую папку сервера, выставляются права на директории:

  • /tmp/ - 0777
  • /bases/ - 0777

и файлы:

  • conf.txt – 0777
  • priznaks.txt – 0777
  • cookie.txt – 0777

Сайт разработчика: blogharvester
ICQ: 177316914
Отзывы: SE и GoFuck

Комментарии

Осталось только добавить, что от такого друпал защищается достаточно просто.
1. Изменяем форму каментов на уровне модуля .
2. В форматах вода в фильтеред хтмл убираем тег а.

Спамеры, даже если пробьются - ссылку оставить не смогут.

Слышал о этой проге где-то. Есть ещё Fast Blog Finder - там полубесплатная и работает по тому же принципу. За 69$ можно хорошую базу для хрума купить и не парсить выдачу, из которой большая половина активно модерируется и защищается. А спам в блогах всегда есть и будет. Яндекс эти ссылки и дальше учитывать будет, т.к. блоги - будущее рунета и "хоронить" их - значит хоронить себя.

Аватар пользователя Stimerex-es
Stimerex-es

Зачем покупать базы за деньги, если их можно собрать самому.....надо только поискать и/или самому крякнуть. Будем пробовать, надеюсь время даст эффект. Благодарствуйте.

Аватар пользователя dietguy
dietguy

Fast Blog Finder неплохой софт

Аватар пользователя Serhiy Zamriy
Serhiy Zamriy

Хз пока не увижу не поверю одно кидалово сейчас в сети

Аватар пользователя Алекс
Алекс

какие есть аналоги более свежие?

Добавить комментарий