Функции для автоматизации, ч.2
Буду потихоньку выкладывать функции для автоматизации
Кстати, сразу говорю – многие функции писал не я, часть я лишь нахожу и переделываю под себя. Хотя некоторые, конечно, делаю сам с нуля… Сам я их применяю в доргене, и пишу/ищу по мере надобности, часть буду выкладывать здесь.
Парсинг текста
Что обычно нужно для генерации дорвея? Кейворды и текст для генерации. Если с кейвордами более-менее разобрались, то с текстом пришлось повозиться…
Во первых, откуда парсить? Так я сам обычно искал контент в Яндексе, для него я и написал парсер. Работает он достаточно просто – составляет поисковый запрос ($key.” обзор”), отправляет в яндекс, парсит адреса первых 10 результатов выдачи, парсит контент с этих сайтов и объединяет его:
И если парсинг выдачи оказался достаточно простым (готовая функция), то для очистки контента от мусора с сайтов оказалось гораздо сложнее (( Стандартный strip_tags() не справлялся, пришлось нарыть аналогичную функцию на каком то форуме и использовать её… На выходе получается достаточно грязный, но объемный текст, из которого уже можно генерировать текст цепями маркова.
Для буржунета достаточно парсить выдачу гугла и все. Вообще, можно использовать другой источник чистого контента – RSS, но я пока оставил это на потом (для цепей маркова вполне хватает текста, напарсенного с выдачи).
Генерация имени домена
Как истинный баблокнопкостроитель, я стремлюсь автоматизировать всё. Работа с доменами – не исключение. Авторегистрацию ru-доменов я для себя сделал (может как ни будь сделаю сервис “для всех”) – через API. Нужно только найти свободный домен по тематике.
Функция работает достаточно просто – к ключевому слову (однословному желательно) попеременно добавляет до и после некоторые слова. К примеру, “2″ или “all”. Если свободных среди них нет – добавляет через тире. Актуальна данная функция для ру-доменов (хотя можно под любую зону, только whois настроить) – в gTld доменах придется использовать гораздо более расширенную генерацию (масштабы побольше рунета), и, возможно, оценочную систему (к примеру, что лучше – nissan.ws или all-nissan-dream.com? Гугле ведь все равно на зону, а первый выглядит гораздо лучше второго), но это я буду делать, когда разберусь с рунетом
Лично меня качество генерирования вполне устраивает
Тем более вручную я делаю практически тоже самое, только гораздо дольше… Хотя и очищаю контент лучше.
Выделение поискового запроса
Когда то для себя я уже писал такой скрипт, но лишь при наличии трафика понял, что процентов 30 (если не больше) запросов он попросту нерасшифровывает.. Пришлось в срочном порядке искать новый, и я его нашел. Им оказался модуль , который даже не пришлось переделывать (только добавить поисковые системы рунета):
Данная функция гораздо более универсально, чем мое нагромождения, и этот код можно использовать одинаково эффективно и в рунете, и в буржунете.
PS. Кстати, если вам нужен какой либо скрипт/функция, пишите в комментариях – может чем помогу. Скоро уже буду делать отдельную страничку скриптов, их уже 9 штук набралось.
————————-
Сам я усиленно пишу дорген ) По автоматизации довожу его до кондиции “тематика”->”получить бабло”, чтобы ничего не нужно было проверять, добавлять и т.д. Дорген сам генерирует домен, регистрирует его, прописывает на сервере, парсит кейворды, тексты, генерирует дор, заливает его, следит за статистикой, раскручивает и спамит… Сейчас я гораздо ближе к концу работы, чем к началу, на стадии генерации поддоменов (а конкретно – распределение кейвордов между поддоменами в соответствии с тематикой). По плану я должен его закончить 20-25 мая, и начать массовую генерацию доров (штук 20 доменов -> 600-1000 поддоменов), чтобы к концу июня выйти на план (10$, около 5к трафика ежедневно, сейчас в 20 раз меньше). Но это только планы, на практике еще предстоит разобраться с раскруткой (создал и забил – не катит) и другими вопросами.
Прогресс по дорам можно увидеть справа, в сайдбаре (мелкий спад). По индексации – в гугле если были ссылки – теперь в индексе (трафика минимум), яндекс все кроме двух доров побанил, в раме только один дор полноценно в индексе, остальные 10-15 страниц (жду полной индексации). Буду ждать, авось некоторые вылезут (особенно надеюсь на рамблер).
————————
постовой
————————
написал про полезность . Полностью с ним согласен, на одних готовых скриптах далеко не уедешь
Если правда денег много, можно и на готовых, но мы ж бедные студенты, к тому же делаем все под себя..
рассказал о том, как он . Неплохой способ, хотя и несколько туманно…