Статика vs. Динамика
Доргены можно условно разделить на статические и динамические. Условно – потому что для поисковиков все равно, каким способом сделан дорвей, это лишь удобство для дорвейщиков
Статичные
Это – самый простой способ. Дорген сразу создает страницы дорвея, которые остается просто залить по фтп. Ну или дорген сам заливает. В чем плюсы? Во первых, работает на фрихостах (типа народа), да и вообще, не требует каких то настроек хостинга/сервера, не загружает память, процессор и т.д. Во вторых – это не вызывает сложностей, то есть все просто – только html страницы, не надо заботиться о мускуле, установке и т.д. Но, есть и минусы. Во первых, отсутствие динамического изменения (поставить редирект к примеру) – но это легко решается яваскриптом, подключаемым с основного сайта. Или, к примеру, подробную статистику собирать сложнее, но это опять решается яваскриптом, или же создание .php страниц с инклудом (как сделал я, мне проще это сделать, чем изучать яваскрипт). Во вторых, статичные дорвеи имеют простую структуру, которая не меняется со временем (к примеру, там не сделать постепенный постинг). Гугл, к примеру, обожает проверять сайт на обновление, а тут – никакого движения… Не то, чтобы он сильно обижается, но наверняка немного расстраивается) И в третьих, хоть он и не грузит сервер, но занимает много места, это иногда сильно затрудняет работу.
Динамичные
Собственно, динамичные доры почти всегда делают серверными. Фактически, все плюсы вытекают из минусов статичных, и наоборот
На совсем фрихостах обычно не работает. Если дорген более-менее сложный, то нужно отдельно настраивать и подключать модули на хостинге. Так же много доров могут вызвать существенную нагрузку на сервер (как и прочие часто посещаемые сайты) – что вынуждает использовать VDS и собственные серверы (хотя, для начала они не нужны). Можно широко управлять дорвеем – менять шаблон, коды рекламы/редиректа, добавлять новые страницы и т.д. (все зависит от доргена и собственно системы управления дором, CMD блин
).
Динамичные доры – более гибкие, их можно сделать действительно похожими на сайты для людей, и они даже могут там найти что-то полезное (если будет такая цель стоять при создании дорвея). Статичные же – простые, как черенок от лопаты, но это отнють не мешает генерировать их сотнями и тысячами, и получить лавину трафика
Я, к примеру, делаю дорвеи модифицированным доргеном от (полгода назад где то купил), он генерирует странички на лету, причем текст на страницах каждый раз разный
Гугля это палит и не индексирует, Яндекс после проспамки просто фильтр накладывает, а Рамблеру, видимо, как то пофиг, трафик он дает)) Плюсы – занимает очень мало места, не надо ничего особо настраивать.. Минусы – загружает сервер, гугля не любит, поэтому сейчас думаю, как сохранять тексты… Но это в принципе не так сложно, поэтому, гугля, держись))))
Вообще, без разницы, каким молотком пользоваться – главное уметь гвозди забивать, чем то лучше, чем то хуже, но молоток – не главное. Образно конечно, но думаю, вы поняли мысль.
——————-
Решил собрать базу кейвордов для себя, парсить постоянно директ как то надоедает ( А на пастухова денег пока нет, хотя сейчас это был бы идеальный вариант, пока вручную делаю доры. Поэтому я запасся бесплатными мусорными базами ( и , а так же свои наработки). В итоге получилось ~7 миллионов нефильтрованных кеев, сейчас их импортирую в mysql базу, что занимает дикое количество времени ((( выборки то быстро получается сделать, а вот проверять на дубли (а потом еще и по всей базе проходить и высчитывать количество упоминаний…) – нагружают комп по самое не хочу. 100к кеев несколько часов добавляется, я наверно всю неделю буду импортировать(( Придется включать ноутбук в режим “Йа маленький сервер!” – оставлять сутками включенным, на ночь убирать подальше (чтобы не шумел), отрубать режим сна и импортировать, импортировать, импортировать….ЫЫыы, как Пастухов орудует 60-миллионными базами?)
——————-
Anatol22 написал пост . Неплохая идея насчет Short Url – дополнительное шифрование, но это работает только при передаче постеителя без кейворда и реферер инфо (к примеру, адалт смс-партнерки).
Toxic_Cat сделал виджет для показа . Классно, надо бы тоже распарсивать ричклик, да и вообще расширять информация в сайдбаре по своим дорам
28 Июнь 2008 at 13:13
Я на ShortUrl’aх в свое время не плохо заработал. Но тема умерла уже пол года как, странно что Anatol22 о ней написал…
Динамика vs Статика = пофиг. Последние доры были статические, до сих пор страницы из индекса выгнать не могу (хотя сами доры давно стер).
Яндекс жрет на ура, это точно, и висела ссылка на ошибку в ТОПе очень долго…
P.S. сайд бар делай обязательно, у тебя он будет смотреться гораздо красивее, так как трафик есть и обновление будет частое
03 Июль 2008 at 19:34
> поэтому сейчас думаю, как сохранять тексты…
Самый простой способ – srand();
по-сложнее – банальный кеш. if (file_exists()) {} else {}
> 100к кеев несколько часов добавляется, я наверно всю неделю буду импортировать
А ты уникальное поле-то сними. Профильтровать и файлом можно, без базы. Тем более что быстрее порядка на 4. (7 лямов минут за 20 должен успеть).
Mysql вообще нагрузки держит замечательно, если его готовить правильно. А 60 лямов пастуховских строк в базу добавляются несколько часов.
03 Июль 2008 at 22:45
Секрет, я думаю закешировать сам текст.. Только без кучи файлов, все в один, может даже в php формате (массивом). Шаб и ссылки не обязательно кешировать, они во первых не нагружают, а во вторых – статичны.
Ага, снял уже, задолбался ждать
Все просто импортировал, а при выборке беру DISTINCT. Проблема в том, что какие то тематики в базе есть, каких то нет, но все равно приходится постоянно парсить…. Наверно, поставлю парсер прямого эфира на автомат, авось наберет постепенно базу…
04 Июль 2008 at 2:00
А юзать-то ты как будешь? Грузить весь файл в память и брать элемент массива? Доры маленькие или полгига памяти – не проблема?
В один файл – это нужно будет индекс делать. Где записано положение текста под номером n. Потом в основном файле делаешь
seek($pos[$n]);
fread($fp,$pos[$n+1]-$pos[$n]);
Однако куча файлов – это не плохо. Совсем не плохо. Не стоит видеть проблему там, где её нет. Место на винте нынче дешёвое.
04 Июль 2008 at 3:07
Хм.. а ты ведь прав, получится файл размером 5-10 метров, и при каждом посещении его загружать в память… явно не самый лучший способ.
Надо либо в БД все загонять (что пока что рано), либо, как наиболее оптимально, сразу генерировать и сохранять страницы дора. И память не нагружается, и сложностей в исполнении нет. Правда, занимает место на винте, но места гораздо больше, чем оперативки…
07 Июль 2008 at 1:00
>>100к кеев несколько часов добавляется….
а ты случайно каждый кей не отдельным INSERT вставляешь? Пробуй одним INSERT вставлять по 250 кеев, быстродействие вырастет в 200 раз.
07 Июль 2008 at 9:54
Ваш любимый Платон Щукин, точно! Что-то мне явно не хватает знаний по оптимизации программирования… Операциям с большим количеством данных…
09 Июль 2008 at 17:07
насчет необновляемости статики очень сильно ошибаешься. ну, не то чтобы ошибаешься, просто типовой расклад описываешь. у меня вот все в статике, а обновляется новыми постами еженедельно (можно и чаще, был бы контент). вообще, контент – единственная действительно острая проблема всех сеошников. Остальное – достаточно легко решаемая фигня (написать отличное двигло для постинга, которому нет аналогов в паблике – это три месяца работы, если есть опыт).
11 Июль 2008 at 17:41
Если есть хороший контент, двигло для него вообще писать смысла нет, уже можно бабки делать сразу
> Надо либо в БД все загонять (что пока что рано),
Пороть надо. Реально надо всех, кто за программирование берётся, сначала хорошо выпороть. Что рано-то? Рано учиться загонять в базу? Да загнать\взять из базы проще, чем хуй вовремя вытащить, когда кончаешь. Причём намного проще, хотя и не скажу, что последнее так уж сложно.
Так что потрать два дня на обучение работе с mysql (или с любой другой базой на выбор). Будешь юзать или нет – сам решишь, не всегда mysql нужен, но уметь там особо нечего, про сложность см. выше.
11 Июль 2008 at 22:55
Секрет, проблема не в этом)) У меня уже давно вся статистика по дорам (200к пока что), прокси, кейворды лежат в БД. Баго с мускулем я разобрался давно. Просто у меня очень кривые руки, и я до сих пор не могу вкурить, как захреначить нормальную кодировку для базы, постоянно кракозябры выходят. На обычном хостинге все ок, на VDS (first) – лажа. Нашел один очень умный вариант – урлкодирование-декодирование, но это херня а не вариант при работе с кучей текста.
14 Июль 2008 at 17:29
>>Если есть хороший контент, двигло для него вообще писать смысла нет, уже можно бабки делать сразу
угу. проблема один: реюзабельность. т.е. как долго контент будет оставаться хорошим. без нормального двигла показатель стремится к нулю.
проблема два: вопрос оприходования (которая при топорном подходе рождает проблему один). представь что сейчас дам пятьдесят гигов уникального текста про машинки. как скоро и насколько эффективно можно будет оприходовать этот контент, юзая обычные постеры/доргены/ручки? я уверен, кпд будет запорото.