Наконец-то, продолжаем.
1. Контент.
Больной вопрос для каждого вебмастера, будь то гс-мейкер или владелец белых проектов. Но, если белый сайт расчитан на длительный заработок и многократную окупаемость, то тут вопрос решается несложно: нанимать журналиста и получать эксклюзивные публикации. С ГС не все так просто: нужно, чтобы быстро и, желательно, бесплатно.
Методов полчения г-контента очень много, все ограничивается лишь вашей смекалкой. Важно помнишь лишь одно: есть контент, который для Яндекса является своеобразной красной тряпкой. При обнаружении такого контента ваш сайт выкидывается из выдачи моментально. Думаю, тут даже механизм запуска фильтра не активируется, ибо комплексную проверку сайта проводить уже нет смысла. Речь идет о низкокачественном синонимайзе и о скане с ошибками разпознавания.
Если у вас качественный синонимайзер(в паблике таких, насколько я знаю, нет), работающий с частотностью слов, то можете попробовать использовать его. Я не пробовал(ибо софта не имею), но, в теории, должно работать. Относительно скана: если уж собрались использовать данный высокозатратный вид наполнения, то начисто выверяйте весь текст, удаляйте всю шелуху, знаки переноса, разные артефакты, грамотно форматируйте текст. Но, я считаю, что скан для ГС – нерентабелен. Уж слишком много времени и денег нужно на него тратить.
Копипаст.
Основной тезис: за копипаст не банят, хватит верить сказкам. У меня ГС на копипасте жили и по полгода. Причем, эксперименты с добавлением уника толковых результатов не дали: сайты с 2k страниц чистого копипаста жили по несколько месяцев, а разбавленные уником – уходили, бывало, в 2-3 раза быстрее. Было и наоборот. Короче, эксперимент оказался херней, я забил и перестал совершать лишние телодвижения: строчил ГС на блогботе, состоящие на 100% из копипаста.
Разнообразных парсеров-грабберов в сети валом. Нулленых – меньше, но все же есть. Сам я, как уже упоминал, пользовался лицензией Blogbot, но навскидку могу назвать след. инструменты:
- Плагин к WP FeedMaster;
- Плагин к WP WPRobot;
- Скрипт TextMaker от Sibirlab;
- Комбайн от VipBablo.
- Куча малоизвестного софта разной степени качества;
Естесственно, вот так вот просто выкладывать эти скрипты я не буду. Это не очень-то честно, к тому же я не собираюсь делать из блога варезник. Программы вы можете приобрести у производителя, либо найти в сети. Так же могу поделиться некоторыми скриптами в обмен на постовой (для владельцев блогов). Согласитесь, недорого.
Генерированный контент.
По поводу синонимайзеров, как источников генерированного контента я уже говорил. Но это не единственный источник ген.контента. Вот вам еще парочка:
Классная штука, генерит бредоконтент, но абсолютно грамотный морфологически: все склонения, обороты и окончания генерируются по нормам русского языка. Основан на Яндекс.рефератах. Живут сайты на такой контенте в среднем 1,5-3 месяца, хотя, конечно, влияние контента, как отдельного фактора достоверно выяснить невозможно.
Использование: просто жмете на волшебную кнопку и забираете .xml файл с 50 записями, который можно экспортировать в ВП или румбу. Процедуру повторять необходимое кол-во раз. Пользовался, рекомендую. Пример:
Действие транслирует голос персонажа, такого мнения придерживаются многие депутаты Государственной Думы. Волна защищает экспериментальный мнимотакт, таким образом сбылась мечта идиота – утверждение полностью доказано. Прибор вызывает даосизм, хорошо, что в российском посольстве есть медпункт.
Все предельно просто. Для примера возьму первый:
<?php
$file= fopen(“result.txt”,”w+”);
$text=file_get_contents(“text.txt”);
$mod_str = wordwrap($text,20,”|”);
$str_exp = explode(“|”,$mod_str);
shuffle($str_exp);
$mod_str2= implode(” “, $str_exp);
fputs ($file,$mod_str2);
echo “Перемешивание текста завершено”;
?>
Кидаем файл со скриптом на хостинг и туда же заливаем два текстовых файла: text.txt и result.txt. В первый пихаем изначатльный текст, во второй будет выводиться результат. Статьи можете парсить, копипастить руками – хоть сами пишите, разницы нет.
Фишка в том, что перемешиваются предложения, которые сами по себе остаются синтаксически и морфологически правильными. Следовательно, частотность слов в предложении не нарушается. Единственное, нужны большие статьи(школьнег рекомендует от 3k символов) и как можно более короткие предложения для достижения уникальности. Скрипт я пробовал лишь в качестве эксперимента на нескольких сайтах, поэтому каких-то конкретных данных о живучести нет. Мои пациенты вылетели через ~1,5-2 месяца. Сам школьнег говорит, что у него и круче получалось.
2.Структура.
Почему я решил отдельным пунктом выделить вопрос о структуре? Да только потому, что уверен, что сателлитовидная структура является большим палевом для вашего сайта. Что может очевидней говорить о предназначенности сайта для линкобирж, чем структура, основанная исключительно на УВ2 и УВ3 страницах? Наверное, только использование спец. cms для сателлитов. Для естесственной структуры сайта характерно как минимум в 2-3 раза больше уровней вложенности. Как решать проблему? Элементарно, в сети есть куча сервисов для генерации специальных карт сайта под sape и подобные биржи. Только беда в том, что по-умолчанию в Румбе нету xml-карты сайта. Идем сюда, генерим xml-карту и кидаем в корень сайта.
Далее, топаем сюда, вбиваем адрес нужного сайта, получаем архив со страницами карты и список ссылок на эти страницы. Архив качаем, распаковываем, странички кидаем в корневой каталог. Вообще, можно и в любой другой, но, тогда не забудьте внести соответствующие изменения в полученные ссылки. Далее, проставляем те самые ссылки на наши карты на морде сайта и суем в сапу. Ждем, пока сапоиндексатор закончит свою работу и благополучно убираем линки. Таким образом, мы можем засунуть в сапу какое угодно количество страниц и при этом не палиться поисковикам.
3. Экспорт в Rumba XML.
Тут действуем по алгоритму с офф. сайта:
- В админ-панели WordPress сделайте экспорт базы данных
- Скопируйте полученный файл в корень сайта и переименуйте его в wp.xml
- Распакуйте в корень сайта дистрибутив Rumba XML
- Запустите файл import.php и после окончания импорта работы удалите его
Было бы нечестно умолчать об одной неприятности: В плане экспорта данных Румба – довольно сырая система, и постоянно выкидывает номера. Глюков у меня было много, пока не наладил более-менее адекватный алгоритм. Несколько рекомендаций:
- Перед экспортом из WP убедитесь, что каждая запись имеет присвоенные теги и рубрики;
- Убедитесь, чтобы в ЧПУ не было символов “%”, “#”, “$” и т.п.
- Не грузите в румбу файлы, содержащие более 500 постов;
Это то, что помогло мне. В любом случае, по любым вопросам можете обращаться на форум. Саппорт там работает медленно, но качественно.
Есть альтернатива продажам ссылок – сайты для сбора трафика под адсенс или бегун. Я пока не занимался, но профи в этой области есть и они “процветают”. А сплоги под блогун? Этот вариант катит?
vitvlad
Думаю, да. И, кстати, эти два варианта (блогун + адсенс) можно объединить.
Где еще можно скачать “бесконечный контент для wordpress”? ссылка битая
Вот бесплатный он-лайн сервис для генерации контента для WordPress:
http://kashinas.ru/generator-contenta-wordpress/