SEO
В дорвеестроительстве, в отличие от создания СДЛ, важно изначально понимать, через какие фильтры придется пройти сайту. Как ни как лицензия на поиск нарушается (пункт 3.5, «Поисковый спам»), да и на лицо полная зависимость от индексации и позиций. Если при создании белого проекта цели вебмастера (создать хороший сайт) и ПС (отранжировать хорошие сайты выше) так или иначе в большинстве случаев совпадают, то при создании дорвеев начинается явное противостояние. Цель дорвейщика — создать механизм, позволяющий максимально автоматизировано получать поисковый трафик, цель поисковой системы — не допустить этого.
Сразу хочу отметить, что «окологуманитарный» подход, частенько принятый в «белом» SEO, здесь не совсем подходит. Почему «окологуманитарный»? Да по другому и не может быть. Белые проекты — долгоживущие. Развивать и раскручивать их надо на перспективу, а не подстраиваясь под текущие алгоритмы. Отсюда и «надо повышать траст», «обмениваться ссылками», «покупать статьи на тематичных ресурсах» и т.д. Плюс большая растянутость во времени, не позволяющая точно оценить влияние того или иного фактора. К примеру, есть у меня сайт, который я двигаю в топ по запросу миллионнику (по вордстату). Бюджет не изменялся уже несколько месяцев, однако позиции подросли с 100+ до первой тридцатки, скоро и в топ выбьюсь. С чем это связано? Статьи стали действовать, ссылки отстоялись, какие-то из доноров стали более трастовыми, естественные ссылки сказались, просто сайт стал более «выдержанным»? Точно не ответить, скорее всего все вместе. И далее я буду развивать сайт не делая упор на что-то одно, а именно «гуманитарным» комплексным методом — ссылок прикупить, статей разместить, контента добавить, внутреннею перелинковку улучшить и т.д. Т.е. упор идет не на воздействие на какой-то конкретный алгоритм, а на развитие сайта неким эталонным образом. Хотя, конечно, и технических моментов хватает, от составления анкоров до подбора доноров. К слову о донорах, зачем искать хорошие площадки в сапе, когда их можно найти в Яндексе, а потом уже проверить, какие из них продают ссылки и сформировать свой white list.
С дорвеями все немного по другому. Надо обойти фильтры, которые существуют здесь и сейчас. Надо постараться создать такую технологию, разработка противодействия которой либо теоретически трудно реализуема, либо повлечет большие накладные расходы, существенно превышающие потенциальные убытки, либо если практическая реализация будет иметь слишком большую погрешность. За примерами далеко ходить не надо — фильтр АГС17. Ну были ГС, ну продавали с них ссылки и что с того? Но когда это стало настолько массовым, что новые индексируемые сайты были на 99% ГС для влияния на ранжирование, когда выбор доноров для покупки ссылок был просто заоблачным практически по любым тематикам, когда стали появляться даже специальные CMS для ГС — надо было что-то делать. И сделали. Причем, на мой взгляд, весьма успешно. Да, была погрешность и улетали многие белые сайты. Да, было потрачено время на разработку этого фильтра. Да, пришлось выделить мощности, чтобы проверить этим фильтром все или большинство имеющихся сайтов в индексе. Но однозначно игра стоила свеч — массовая индустрия создания ГС под сапу фактически умерла.
Именно поэтому стоит пользоваться своими приватными наработками. Предположим, есть какая-то технология, например хитрый клоакинг по ip-шникам или рефереру. Этой технологией пользуется один-два-три человека. Сколько они создадут дорвеев? Сто, тысячу, вряд ли больше. Стоит ли этому искать противодействие? Может быть и да, но всегда есть другие, более насущные проблемы. А теперь представим, что эта технология выходит в паблик, становится опцией по умолчанию в доргенах и т.д. Что получим в итоге? Ежедневное создание 100500 доров и захламление выдачи. Как результат — разработка фильтра и его внедрение. А это со стороны ПС лишние траты, как денег так и мощностей, но в данном случае оправданные.
В общем и целом надо изначально осознавать, что работать придется с алгоритмами, т.е. программами. Дорвеи (да и все сайты) проверяет не человек, а именно программа, с четкой логикой и прочими атрибутами. Это, думаю, понятно всем, но почему-то все об этом забывают. Добавить «рюшечек», чтобы дор смотрелся чуток СДЛ-нее — пожалуйста, а ответить для чего это делается и в обходе какого фильтра поможет, затрудняемся.
Лирическое отступление, получившееся немного больше запланированного, закончилось. Дальше будет собственно про фильтры Яндекса.
Как уже выше говорилось, для успешного дорвеестроительства необходимо представлять себе те фильтры, через которые придется пройти. Документации на них, естественно, нет. Поэтому приходится заниматься так называемой «обратной разработкой», когда по внешним проявлением строится модель, приближенная к оригиналу.
На основании своего небольшого опыта, ряда проведенных экспериментов, анализа выдачи, прочтения большого количества блогов и форумов я построил для себя некую теорию фильтров Яндекса. Скорее всего она где-то не совсем верна, где-то есть упущения, но с чего-то начинать надо. Как минимум эта самая теория дает мне две вещи — дальнейший вектор развития, не хаотичный, а четко структурированный, где я знаю что, зачем и для чего, а также ответы если не на все вопросы, так на большинство.
Сразу оговорюсь, что все ниже приведенные рассуждения касаются новозареганных рушек, наверняка на фри хосты существуют дополнительные фильтры, как и на «неблагонадежные зоны», например .info, не говоря уже о .cn и прочих.
Далее отталкиваться буду от следующих концепций:
- Апдейты в Яндексе происходят ежедневно, если не чаще. Раз в несколько дней результаты последнего (?) апдейта выкладывают в паблик. Это и называется в понимании большинства «апом Яндекса». Придумал это не я (хотя догадаться было бы не сложно), это где-то говорили/писали представители Яндекса, точную ссылку на источник, к сожалению, привести не могу, не помню.
-
Фильтров несколько. Структура прохождения сайтов через фильтр — очередь (FIFO, First Input — First Output). Каждый сайт проходит через все фильтры последовательно. Прямой взаимосвязи между индексом, алгоритмами ранжирования и фильтрами нет. Т.е. апдейты это один процесс, прохождение сайтов через фильтры совершенно другой.
С первым утверждением все понятно, поэтому перейдем к более подробному рассмотрению второго.
Структура прохождения всех сайтов через конкретный фильтр — очередь. Попробую пояснить наиболее понятно. Есть сто новых еще непроиндексированных сайтов. Утверждение о том, что робот просканировал страницы сайта, сразу пробил каким-то фильтром, принял решение исключать из индекса или продолжать сканировать, считаю в корне неверным. Скорее всего при обращении к новому сайту происходит его сканирование в штатном режиме, одновременно этот сайт отсылается на проверку фильтрами, где он встает в конец очереди из уже ранее отправленных. Таким образом, пока проверку не пройдут предыдущие сайты, вновь отправленный будет ожидать своей очереди. Естественно, все это происходит многопоточно на столько, на сколько это позволяют ресурсы (в распределительных вычислениях, к сожалению, не силен, поэтому продолжить мысль дальше не смогу).
Фильтров несколько. Ну это и так понятно, что существует не один «мегафильтр», а много разных, на контент, на трафик, на ссылки входящие/исходящие и т.д. Смысл в том, что каждый сайт проходит через все фильтры не «разом», а в строгой последовательности. Связано это, в первую очередь, с экономией мощностей. Для наглядности приведу упрощенный пример. Есть 100 сайтов. Есть два фильтра, один проверяет наличие простеньких JS редиректов/скрытого текста, второй — морфологическую целостность текста. Сайт проходит через эти два фильтра последовательно, результат прохождения, условно, либо 0 (фильтр не пройден, сайт забанен, второй фильтр не проходится), либо 1 (фильтр пройден, постановка в очередь на проверку через второй фильтр). Предположим, что экспериментально доказано, что 50% сайтов не соответствуют как первому, так и второму фильтру. С какого фильтра надо начать? Естественно, с первого. По той причине, что на прохождение ста сайтов через первый фильтр и 50 через второй потребуется затратить меньше мощностей, чем сначала у всех сайтов проверить морфологию (достаточно затратный процесс) и у оставшихся тупо проанализировать исходный код и файлы стилей. Таким образом, фильтры располагаются в следующем порядке — первыми идут те, которые требуют меньше всего мощностей и которые в идеале отсеивают больше всего сайтов, последними идут те, которые соответственно потребляют больше всего мощностей, т.к. чисто экономически выгодно, чтобы до этого фильтра добралось как можно меньше сайтов. Также повторюсь, что все фильтры проходятся последовательно, т.е. пока сайт стоит в очереди на проверку, скажем, вторым фильтром, третьим-четвертым-пятым он не проверится.
Теперь немного о самих фильтрах и вообще об отношении Яндекса к сайту прошедшему/непрошедшему фильтр. Изначально сайт считается «белым». Такая вот презумпция невиновности. Даже если сайт полностью состоит из генерированного контента, спам ссылок и т.д., он все равно будет считаться «белым» и будет находится в индексе до тех пор, пока не пройдет хотя бы первый фильтр.
Результатом работы фильтра является не «Да/Нет», а скорее какое-то переменное значение, характеризующее степень соответствия фильтру, пускай будет от 0 до 10. Если 0 — сайт полностью соответствует фильтру и банится, если 10, то никаких признаков соответствия не обнаружено, сайт все также считается «белым» (возможно даже что-то типа +1 к трасту) и встает в очередь на проверку следующим фильтром. Соответственно есть и пограничные варианты, например степень соответствия 3-5, тогда сайт не банится, а выкидывается часть страниц, 7-8 — опускается в результатах поиска и т.д. Из этого следует, что если вы сделали дорвей, и он сразу забанился, значит был не пройдет один из первых фильтров, если полностью влез в индекс и забанился спустя несколько дней, значит первые фильтры пройдены успешно, но не удалось пройти другие, если не забанился, а влез только 5-10-30 страницами, значит какому-то фильтру дорвей соответствует только частично и вы двигаетесь в правильном направлении, немного доработок — и очередной фильтр будет пройден.
На данный момент я выделяю для себя четыре основных фильтра. Как уже говорил выше, каждый сайт проходит через них последовательно, каждый последующий фильтр требует от ПС все больше и больше мощностей.
-
Фильтр #1
Простейший морфологический анализ текстовой составляющей.На этом фильтре отсеивается грубо генерированный контент, транслит, плохой синонимайзинг. Чаще всего результатом работы этого фильтра являются пограничные значения, 0 или 10, т.е. либо бан/урезание количества страниц в индексе до не более 10, либо переход к следующему фильтру. Время, необходимое для прохождения сайтов через этот фильтр, минимально. От постановки сайта в очередь до прохождения через фильтр проходит редко больше нескольких дней.
-
Фильтр #2
«Полезность» контента.Весьма абстрактный фильтр. Под него попадает «плохой» копипаст (заюзанные адалт рассказы, например), неформатированный контент, в том числе и уник (напарсенный с закрытых от индексации источников или скан). Результат работы фильтра очень зависит от типа контента. Если «плохой» копипаст — бан, если копипаст из многих источников (парсинг Яндекс Новостей), то скорее всего урежет страницы, «хороший» копипаст или уник — ну и нормально, может быть 10-ку не получит, но на 7-8 можно рассчитывать смело. С медиа контентом так вообще прекрасно, Яндекс не может определить полезность, скажем, подборки картинок, подкастов или ютуб-роликов, поэтому такой сайт получает твердую 9-10, если явных нарушений нет.
-
Фильтр #3
Теория вероятностей и мат.статистика.Вот тут начинается самое интересное. Наиболее простой пример применения данного фильтра — 100% тайтлов это ключи из вордстата. Дальше — больше. Основательный анализ контента на предмет морфологии и статистического распределения слов и словосочетаний (наилучшая реализация цепей Маркова, прошедшая через первый фильтр, скорее всего запорится на этом). Или еще пример — на сайте 1000 статей, каждая статья содержит 10-15 предложений, по 30-70 знаков в каждом, причем все распределено крайне равномерно без явных отклонений. Что это означает? Да только то, что сайт — генерированный.
Пройти этот фильтр, если используется генерированный контент, очень трудно. Если копипаст или уник, то вполне реально, главное чуток подучить теорвер.
Время, необходимое для того, чтобы новый сайт добрался до этого фильтра, примерно неделя-две, иногда больше.
Для большинства вроде как хорошо сделанных дорвеев прохождение этого фильтра оканчивается баном.
-
Фильтр #4
Анализ трафика, хитроботы.До этого фильтра у меня пока не добрался ни один дорвей. На вскидку здесь проверяется разные способы клоакинга, мониторится входящий/исходящий трафик, пути юзеров по сайту, хитробот выполняет скрипты и т.д.
Небольшая вставка, на каком этапе сейчас нахожусь я. Первый фильтр преодолевать научился, генерированный текст паблик средствами, синонимайзинг и транслит себя не оправдали. Хороший копипаст, уник, медиа-контент чаще всего проходят этот фильтр без проблем.
О четвертом фильтре пока и не задумываюсь, так как умение обходить первые три уже даст хороший профит, обход четвертого нужен для создания так называемых «вечных» доров, которые живут месяцами и банятся в основном только по стуку.
По поводу третьего мыслей очень много, но отложил пока на потом. Сейчас делаю упор на обход второго, т.е. создание доров из контента, который Яндексу будет казаться полезным. Просто забивать дор роликами с ютуба или картинками не вариант, нужны способы изощреннее, вот когда начну на 100% пробивать второй фильтр, тогда перейду к третьему.
Теперь вернемся к взаимосвязи апдейтов и фильтров. Апдейты идут ежедневно, как только какой-то сайт индексируется, он сразу попадает в выдачу. Одновременно сайты проходят через ряд фильтров, в зависимости от результатов прохождения меняется положение сайта в выдаче и количество страниц в индексе. Причем меняется не сразу после того, как сайт прошел фильтр, а только во время очередного апдейта. Т.е. к примеру сайт попал в индекс и уже висит в выдаче, до наступления следующего апдейта он успел пройти какой-то фильтр, где набрал 3-4 балла из 10, что соответствует урезанию страниц в индексе, до следующего апдейта он будет висеть со всеми страницами, которыми был при предыдущем, а как новый апдейт наступит — тогда уже страницы и вылетят. То же касается и банов. Т.е. по факту прохождения фильтра сайт банится, но до наступления следующего апдейта будет висеть в выдаче. Что касается синхронизации ежедневных апдейтов и тех, при которых индекс выкладывают в паблик, у меня видение такое. Скорее всего тот индекс, который выложили сегодня, принадлежит апдейту некоторой давности, что наиболее целесообразно с той точки зрения, чтобы побольше сайтов успело зафильтроваться и в выдаче было меньше спама. Более того, иногда происходит синхронизация ежедневных апдейтов с выложенным в паблик индексом. Это всем известные выпадения сайтов или баны в «междуапье». Т.е. если сайт попал под какой-нибудь АГС17, то вы об этом узнаете только через несколько дней, когда в паблик выложат тот индекс, в котором уже у сайта урезанное количество страниц. А если сайт попал в бан, то происходит синхронизация текущего индекса с тем, что выложен в паблик именно для этого сайта. Это, в принципе, правильно. Если сайт попал в бан, то это явный спам, а зачем спам держать в индексе еще несколько дней?
Вот вроде бы все. Конечно, многие моменты спорны, многие описаны лишь поверхностно, но для начала, думаю, сойдет. В заключении хотелось бы привести некий Q&A, т.к. я в самом начале сказал, что моя теория отвечает на многие вопросы.
Q: Почему доры на ломе нормально индексируются даже на генерированном контенте?
A: Т.к. сайт уже давным давно прошел через все фильтры, вновь добавленные страницы повторно не проверяются (ну или не так быстро). Еще траст, конечно, но это уже касательно высоких позиций, нежели индексации как таковой.
Q: Почему в выдаче можно найти дорвеи, сделанные паблик доргенами с плохой текстовкой?
A: Как я уже говорил, сайты строятся перед фильтром в очередь и пока фильтр не пройден, сайт считается хорошим. А т.к. дорвеи на паблик решениях генерируются в промышленных масштабах, то пройти через фильтры до наступления того времени, когда индекс выкладывают в паблик, успевают не все доры. Отсюда и их присутствие в выдаче.
Q: Почему раньше, если сгенерировать дор и повесить на главную страницу уник, то он лучше индексировался?
A: Видимо для ускорения прохождения сайтов через фильтр анализировалась только главная страница. Соответственно если на ней был уник, то фильтр проходился.
Q: Что лучше, отстаивать домен с заглушкой или с мини сайтом?
A: Склоняюсь к тому, что с мини сайтом. Скорее всего Яндекс не считает заглушку «Сайт в разработке» или приветственные страницы установленных CMS полноценными сайтами, поэтому прохождение через фильтры начинается только тогда, когда на сайте начинает что-то появляться. Отсюда, кстати, и тот факт, что полностью идентичные сайты (с только что установленным вордпрессом с тестовой записью, например) не склеиваются.
Q: Почему среднее время жизни хорошего дора порядка двух недель?
A: Проходят два первых фильтра, но не проходят третий. А это как раз неделя-две.
Q: Почему иногда доры банятся в междуапье?
A: Дор забанился во время очередного ежедневного апа. Раз забанился, значит спам и держать такой сайт в выдаче еще несколько дней не представляется разумным. Поэтому происходит синхронизация индекса, выложенного в паблик, с индексом, полученным в результате последнего апдейта.
Q: Почему иногда все доры у всех начинают очень быстро банится?
A: Обычно когда на всех форумах начинают писать, что доры стали резко банится, можно заметить либо тормозящие другие сервисы Яндеса, либо радостные сообщения в официальном блоге/блоге на Хабре о приобретении нового оборудования. Т.е. либо выделили новые мощности в ущерб чему-то, либо просто расширили техническую базу. В итоге сайты стали проходить через фильтры быстрее.
- 8 комментариев
Ранее, когда я раскручивал в основном сателлиты, анкоры я составлял автоматически, т.е. генерировал (более подробно об этом уже писал). К составлению самих шаблонов для генерации подходил достаточно основательно, на выходе получалось несколько тысяч читаемых предложений, из который уже отбирал нужное количество наиболее «уникальных» (в оллсабмиттере есть встроенный функционал для этого).
Но несмотря на такой казалось бы умный подход, все равно было видно, что анкоры – генерированные. Да, если взять отдельно взятый анкор, то вроде нормальный, читаемый, но если смотреть по всей массе, то зависимости между ними прослеживались четко. Можно ли было всякими ухищрениями добиться генерирования нормальных анкоров? Может быть и да, но смотря на то, какой бред выдает тот же сеопульт, писать «анкорогенератор» только для себя представлялось слишком трудоемким и нецелесообразным, составлять тексты ссылок ведь не каждый день приходится.
Теперь же, когда ссылки я закупаю в основном на СДЛ, анкоры составляю только и только вручную. Стоит признать, времени на это уходит масса, на составление текстов ссылок только для одного проекта можно убить сутки. Для примера, в среднем для каждого сайта составляю от 500 анкоров, средняя длина каждого 60-70 символов, а это в итоге от 30к текста. Но если подумать, что по этому проекту я буду закупаться ссылками ни один месяц, а скорее всего и ни один год, то временные затраты более чем оправданы. В итоге на выходе получаются сотни уникальных и осмысленных анкоров с околоссылочным текстом, такие ссылки пропустит даже самый придирчивый вебмастер, не желающий портить свой СДЛ размещением нечитаемого бреда.
При создании анкоров для сателлитов и прочих гс такой подход естественно не целесообразен, слишком долго и трудно. Намного проще или сгенерировать самому или с помощью сеопульта.
Соответственно, если анкоры создаются для раскрутки гс, то только автоматика (плюс сеопульт и статистика поисковых запросов яндекса и рамблера), если для продвижения СДЛ – то вручную. Согласитесь, глупо пытаться сэкономить на составлении анкоров, когда на создание самого сайта убита куча времени и на его продвижение выделяются далеко не лишние деньги.
С точки зрения оптимизаторов, наиболее целесообразно покупать ссылки, размещенные в одном блоке с контентом, до или после текста (если не брать в расчет контекстные ссылки).
Вебмастера же чаще выносят сапоссылки в отдельный блок, не желая портить внешний вид своего сайта, помещая нетематические линки (часто с бредовыми анкорами) в поле зрения посетителей.
Так или иначе, но к консенсусу интересов вебмастеров и оптимизаторов надо прийти. Я последнее время руководствуюсь следующими правилами размещения сапоссылок на своих сайтах.
Во-первых, никакого разбиения ссылок на несколько блоков, хотя ранее я был другого мнения (пост «Разносим ссылки в сапе»), но с тех пор многое изменилось. Яндекс стал умнее, обмануть его не получится, поэтому любые попытки замаскировать продажные ссылки бессмысленны. Плюс ко всему, последнее время продавать более чем по 3-4 ссылки со страницы стало неликвидно, в идеале, конечно, размещать максимум по 1-2 ссылки и не со всех страниц, доступных по уровню вложенности для продажи. Слишком велика вероятность того, что даже СДЛ вылетит из индекса с очередным АГС-ом. Да и если «прогнозируемое число внешних ссылок» на сайте слишком большое, то попасть под фильтры оптимизаторов и сеопульта будет трудно, придется демпинговать. Ну а если мы размещаем мало ссылок, то и разносить получается нечего.
Абстрагируемся от того факта, что сапоссылки – это по сути спам. Будем считать их «рекламными материалами». А реклама всяко не может размещаться в футере и сливаться с фоном. Следовательно, размещение ссылок в подвале – зло.
Где же тогда размещать сапоссылки? Обратимся к нормальным СДЛ, которые размещают текстовые ссылки не через биржи, а вручную, правда, чаще для обмена трафиком, чем для сео. А ссылки они размещают в сайдбарах, где и меню, причем по оформлению эта реклама мало чем отличается от блоков навигации (пример для блогов – блогролл).
Так и мы будем размещать наши сапоссылки. Это красиво (не выбивается из дизайна, как блок неформатированного текста с линками), практически не раздражает пользователей (особенно если блок назвать «реклама» или «наши партнеры», кликать по ссылкам, спутав с меню, точно не будут), вызывает меньше подозрений у поисковиков (еще бы, мы же постыдно не прячем ссылки в подвале, а демонстративно размещаем их в области видимости, вписывая в дизайн, ну да, продаем рекламу, и что из этого?), больше шансов на то, что оптимизатор, перейдя на сайт, не откажется от размещения ссылки (а я практически всегда перед покупкой каждой ссылки смотрю на сайт).
К чему это я. Ссылки-то многие размещают в блоках в сайдбарах, но выводят их одним сплошным текстовым месивом, руша основную затею – преподнести сапоссылки не как спам, а как рекламу. В лучшем случае разделяют ссылки знаком «|» и другими, но от этого не легче.
Как выводится меню в блоках? Последние комментарии? Популярные материалы? Блогролл? Списком! Поэтому и сапоссылки надо выводить только и только списком. А об этом забывают если не все, то почти все.
Небольшая инструкция, как реализовать вывод ссылок sape списком. Идем в настройку нашей площадки в сапе и указываем в качестве разделителя </li><li>. Теперь вроде бы осталось только обрамить предлагаемый сапой код тегами <ul><li>код сапы</li></ul>. Но это решение «в лоб» имеет один недостаток. Если на странице, на которой установлен код сапы, еще не купили ни одной ссылки, то код <ul><li></li></ul> все равно будет выводиться. Например, если в Drupal создать блок с php кодом, то он будет отображаться только если есть хоть какая-то информация для вывода. При таком решении этой информацией будут теги открытия и закрытия списка, поэтому на всех страницах будет красоваться пустой блок «реклама» или «партнеры сайта», что, естественно, нежелательно. То же касается и WP, если мы не пользуемся плагином для сапы, а создаем блок вручную. Да и вообще, не зависимо от движка, выводить что-либо имеет смысл только тогда, когда есть что выводить, автоматической вставки в код страницы ненужного мусора, в независимости есть ли ссылки для вывода или нет, лучше избежать.
Модифицируем немного код sape:
- <?php
- if (!defined('_SAPE_USER')){
- define('_SAPE_USER', 'ваш код');
- }
- require_once($_SERVER['DOCUMENT_ROOT'].'/'._SAPE_USER.'/sape.php');
- $sape = new SAPE_client();
- $var = $sape->return_links(); /*помещаем в переменную $var ссылки*/
- if(!empty($var)) /*проверяем, есть ли ссылки для вывода*/
- {
- /*если есть, выводим ссылки, обрамленные тегами списка*/
- echo '<ul><li>'.$var.'</li></ul>';
- }
- ?>
На этом блоге у меня стоит такой код, чуток изменил, чтобы нормально работал в Drupal:
- <?php
- if (!defined('_SAPE_USER')){
- define('_SAPE_USER', 'ваш код');
- }
- require_once($_SERVER['DOCUMENT_ROOT'].'/'._SAPE_USER.'/sape.php');
- $o['charset'] = 'UTF-8';
- $sape = new SAPE_client($o);
- unset($o);
- $var = $sape->return_links();
- if(!empty($var)){
- echo '<div class="item-list"><ul><li>'.$var.'</li></ul></div>';
- }
- ?>
Теперь все отображается идеально, и сапоссылки более не выглядят как поисковый спам. А если еще и одобрять только тематические ссылки – то и придраться будет не к чему. Конечно, когда сайт только добавлен в сапу, то цель стоит распродать все места, но когда все места заняты, то почему бы изредка и не проводить чистку на явный мусор и нетематику, а на освободившиеся места одобрять только уже подходящие ссылки.
Только ленивый еще не писал про фильтр АГС-17.
«Робот анализирует содержание всех страниц сайта и принимает решение о включении их в индекс. Если сайт большой, а в поиске участвует лишь несколько его страниц, это означает, что остальные были классифицированы как не имеющие дополнительной ценности для пользователей.
Какое количество страниц будет проиндексировано - зависит от многих факторов, в том числе от качества контента, интереса пользователей к ресурсу и соответствия сайта поисковой лицензии, особенно это касается пункта 3.5. В некоторых случаях число страниц может быть и меньше 10, и больше 10. В любом случае проиндексированных страниц должно быть достаточно для того, чтобы сайт находился по основным запросам, на которые он может дать хороший и релевантный ответ», - прокомментировал для Searchengines.ru менеджер проектов по борьбе с поисковым спамом компании «Яндекс».
Сайты выпадают у многих. У кого пачками, у кого выборочно. Почитать обсуждение можно на серче, там уже в теме больше пятисот постов. Мнения, естественно, расходятся, каждый настаивает на своем и т.д. Ясно только одно – никакой конкретики нет, надо ждать. Вылетают сайты как с уником, так и с копипастом, как на популярных движках, так и на самописных, как с сапой, так и без.
Меня же этот фильтр затронул достаточно сильно. Всего у меня 30 сайтов, восемь из них в сапе, наиболее доходных за счет продажи ссылок – четыре. Так вот, все эти четыре сайта вылетели из индекса, осталось только по 5-8 страниц у каждого. ГС-ами их назвать трудно. Один из вылетевших – этот блог. Еще один сайт – в ЯК-е и Директе. И два относительно старых сайта, часть контента уник, часть копипаст. Ссылки продавались без фанатизма – завышенные раза в два цены, в среднем по одной ссылке на страницу, даже меньше.
В первый ап вылетел только один мой сайт. Ну, думаю, вылетел почти СДЛ, пусть и ссылки продающий, напишу Платону, должны вернуть. Вчерашний ап скосил еще три сайта, плюс пришло письмо из суппорта яндекса. Если опустить всю лирику, ака «развивайте сайт», «читайте советы Яндекса вебмастеру» и т.д., внимание заслуживает следующее:
Не все страницы сайта, известные поиску Яндекса, включены в индекс и ранжируются высоко. Их включение и позиция зависят от качества сайта и его контента с точки зрения пользователей, и многих других факторов. В множество критериев, отражающих качество сайта, входит и размещение на его страницах SEO-cсылок, что мы считаем плохой практикой, вредящей пользователям поиска. Подобные факторы вредят ранжированию сайта по всем запросам, не направленным на поиск самого сайта.
Как бы недвусмысленно намекнули, что размещение продажных ссылок рано или поздно приведет к вылету из индекса. Ну а вернуть сайт обратно можно только эти самые ссылки сняв.
Почувствовал я действие фильтра не только как вебмастер, но и как оптимизатор – доноры вылетают пачками. Сейчас у меня на 1,5к купленных в сапе ссылок 3к сайтов в ГБЛ. И это с учетом того, что еще пару недель назад было куплено 2к ссылок – т.е. последнее время закупка происходит на порядок медленнее, чем вылет уже купленных сайтов. Как дела обстоят в сеопульте - не смотрел. Но вряд ли намного лучше.
В общем, как-то так. Трудно сказать, хорошо это все или плохо. С одной стороны у меня доход устремился к нулю, плюс мои потуги последних месяцев по созданию сетки и наращиванию тиц даже если и дадут выхлоп – то засовывать сайты в сапу уже как-то боязно. Но зато я теперь смотрю в сторону СДЛ. Все-таки пытаться строить свой основной доход на продаже ссылок с сателлитов крайне недальновидно.
Решил объединить в одном посте все то, что на данный момент мне известно о тиц.
Из официального:
- ТИЦ сайта зависит от внешних ссылок, каждая из которых передает некий «вес», являющийся качественной характеристикой ссылающегося ресурса и рассчитывающийся по специальному алгоритму.
- Большую роль играет тематическая близость ресурса и ссылающихся на него сайтов.
- Само по себе количество ссылок на ресурс также влияет на значение его тИЦ, но тИЦ определяется не количеством ссылок, а суммой их весов.
- ТИЦ рассчитывается для всего сайта полностью, а не для конкретных страниц или разделов /если какой-либо раздел сайта описан в Яндекс Каталоге, то он считается самостоятельным ресурсом и для него тоже будет рассчитываться ТИЦ/.
- Внутренняя структура сайта, перелинковка страниц и т.д. никак не влияет на тиц.
- ТИЦ не может быть увеличен за счет расположения нескольких ссылок на одной или нескольких страницах одного и того же внешнего ресурса. Т.е. ссылка с «морды» и с внутренней страницы в плане передачи ТИЦ одинаковы.
- При расчете ТИЦ не учитываются ссылки, распложенные на бесплатных хостингах, если они не описаны в Яндекс Каталоге. Также не учитываются и ссылки с немодерируемых ресурсов/доски, каталоги, форумы и прочее/.
Из неофициального:
- Отсутствует прямая зависимость между ТИЦ-ем донора и весом, который передает внешняя ссылка с него.
- Внешние ссылки начинают передавать ТИЦ не сразу, а по истечению определенного времени/~1-2 апа ТИЦ/.
- Среднерыночная стоимость ТИЦ составляет 0.6$ за единицу/кто-то считал, большинство согласилось/.
- Критичный параметр в плане передачи веса – количество внешних ссылок с донора. Не совсем понятно, что конкретно учитывается – соотношение внешних ссылок с ресурса /ссылок на ресурс/количество страниц в индексе или же количество внешних ссылок с конкретной страницы. Скорее всего и то и другое, плюс еще что-то. Но так или иначе – чем внешних ссылок на сайте меньше, тем больше веса он передает.
- Точной формулы подсчета ТИЦ не существует, она меняется от апа к апу, поэтому предсказать рост или падение ТИЦ достаточно проблематично.
Из теорий:
Вес, который передает ссылка, зависит не только от самого ресурса, но и от параметров самой страницы, на которой эта ссылка расположена. На вскидку – наличие большого околоссылочного текста /ну или другими словами размещение ссылки в тексте, т.е. продвижение статьями/, тематичность страницы /звучит бредово, но можно предположить, что определяется сугубо по наличию тематичных ключей в тексте страницы, в анкоре и на самом акцепторе, т.е. еще один плюс в сторону наращивания тиц статьями, т.к. сама статья обычно изобилует ключами/.
Как-то мало вышло, может чего и упустил. Но все остальное сводится уже чисто к догадкам, часто основанных на случайностях и совпадениях.
Аптиц 31.08.09 ничем не порадовал, везде по нулям, но привести мысли в порядок не мешало бы. Итак, что имеем.
Блогун
Использую для трех сайтов. Один имеет старые каталожные и естественные ссылки, тиц держался в районе десятки около года, потом обнулился, докупкой постовых хочу восстановить. Второй сайт нулевой, покупка ссылок в блогуне идет в качестве дополнения к скупке ссылок в сеопульте. И последний сайт крутится исключительно блогуном. Ссылки покупаю дешевые – до 20 центов за штуку. Естественно, процентов 90 площадок при таком раскладе это ГС, сделанные специально для продажи постовых. Скупаю все, что в индексе. Точнее не только в индексе, а имеющие кол-во страниц в индексе, сопоставимое с количеством проданных ссылок. Раньше было тяжело – чтобы выбрать с десяток-другой блогов для размещения постового приходилось просматривать сотни сайтов. Но по мере роста блек-листа/сейчас в нем около 1к блогов/ черновой работы по отбору площадок хоть немного, но поубавилось. Лезут бэки хорошо. Сейчас посмотрел – на 150 купленных ссылок в вебмастер яндексе вылезло 127, весьма и весьма неплохо. На данный момент суммарный бюджет/включая и покупку постовых на этот блог – да, на этот блог я тоже немного затарился постовыми и тоже с него барыжу ссылками в сапе=)/ где-то около 85$, планирую увеличивать.
SeoPult
3 сайта по ~300р./месяц на каждый. Фильтры – цена меньше 1р, не больше 2-х внешних, домены второго уровня, без English&Adult. Автоматом закуплено по 350-400 ссылок на сайт, в вебмастер яндексе вылезло по 220 обраток, т.е. где-то 60%. Учитывая то, что никаких действий по ускорению индексации ссылок не предпринималось и что настроен автосъем ссылок, непроиндексированных более чем за 30 дней, то все вроде как неплохо. Максимальная автоматизация – создал проект, закинул денег на счет и можно забыть. На халяву смахивает, посмотрим как выхлоп будет.
Sape
6 сайтов. Бюджет на данный момент от 160р./мес. до 290р./мес. на каждый, в среднем по 250р., в течение двух-трех недель планирую довести бюджет каждого сайта до 300р./месяц. Фильтры все те же – цена до рубля, не больше двух внешних, плюс пытался попадать в тематику. Изначально ставил полный автомат, однако впоследствии обнаружилось, что из скупленных ссылок 50% сайтов не в индексе, 25% в индексе, но переиндексацию страниц с уже моими ссылками можно ждать вечность и только 25% купленных ссылок отображались в бэках в вебмастер яндексе. Пришлось разгребать. Вместо автомата поставил полуавтомат/все заявки подтверждаю вручную/, непроиндексированные страницы поубивал используя плагин SAPE для Firefox /спасибо Сергею Жилину за наводку в комментарии к одному из постов/, ускоряю индексацию ссылок сервисом Алексея Барыкина. Теперь все вроде пошло более-менее размеренно и подконтрольно. В среднем уже вылезло по 160 беков на сайт, с каждым апом прибавляются. При работе же на полном автомате при аналогичных расходах обраток было около 70.
Вот как-то так пока и живем. Еще бы Лиекс потестить, но на данный момент не потяну финансово.
Большинство моих планов по достижению стабильного дохода связано с продажей ссылок на сапе. Соответственно, проблема наращивания ТИЦ для меня достаточна актуальна. Ниже приведу список того, что было сделано. Если выгорит – отпишусь о результатах.
1. Социальные закладки
Прогнал все сайты по соц. закладкам. Скорее для «галочки», нежели в надежде на какой-либо выхлоп с них. Гонял через бпостер, купил вип аккаунт.
Бюджет: ~650 р. за акк
2. Каталоги сайтов и каталоги статей
Есть софт, есть базы. Составлять проекты и прогонять по ним сайты – очень времязатратное дело, особенно если учесть околонулевой выхлоп со всего этого. Но прогонять буду, пока «окучил» только один сайт, все сайты прогнать не получится, времени на это нет, но еще пару-тройку, думаю, успею.
Бюджет: ~1050 р. за базы, allsubmitter покупал давно.
3. Блогун
Закупил на три сайта двадцатицентовых постовых примерно на 15 долларов на каждый. Это где-то по 75-100 ссылок на сайт получается. Плюс на этот блог покупал постовые на 30 баксов, покупал как двадцатицентовики, так и постовые за 1$.
Бюджет: ~3 000 р. /у них комиссия 20%/
4. seopult
Три сайта с бюджетом по 300 рублей на каждый. Ручной режим. Фильтры – домены второго уровня, прогноз внешних не более двух, цена не более 1 р. за ссылку.
Бюджет: ~1 000 р./месяц
5. sape.ru
Шесть сайтов с бюджетом в 300 рублей на каждый. Автоматический режим, скупка ссылок по составленным вручную фильтрам – не более рубля за ссылку, не более 2-х внешних, домены второго уровня. Плюс хоть как-то, но старался попадать в тематику. Установил дневную квоту покупки ссылок в 5 шт/сутки, скорее всего повышу до 15.
Бюджет: ~1800 р./месяц
Вот, в принципе, и все, что я на данный момент использую. Также где-то методы могут пересекаться, т.е. есть сайт, на который закупаются постовые в блогуне и одновременно ссылки в сеопульте. Все сайты гонялись по закладкам, некоторые будут гоняться по каталогам сайтов и статей.
Что я не использовал и использовать не буду: уязвимости сайтов, любые разновидности спама, в том числе и ручной спам по комментам.
Что я не использовал, но использовать планирую: размещение статей на сайтах с посуточной оплатой/через лиекс, например/, ручное размещение статей на качественных площадках/миралинкс/.
При запуске рекламных кампаний в сапе пришлось посоставлять анкоры, дело для меня непривычное, но нужное. Плюс ко всему я разделяю точку зрения, что количество уникальных анкоров должно соответствовать количеству покупаемых ссылок. Вручную несколько тысяч анкоров, конечно, не составить, поэтому необходимо прибегать к разного рода автоматизации. Ниже по пунктам распишу, как я составлял анкоры. Схема, вроде, оптимальная. Сразу замечу – никаких мозговых штурмов представлено не будет, ссылки закупались в первую очередь для тиц, ну и как бонус продвижение по СЧ и НЧ, т.е. упор был не на позиции.
2. Покурили? Открываем ворд, исходя из прочитанного составляем вручную анкоры. Так, с десяток хороших анкоров уже есть, но уже вымотались. Переходим к пункту три.
3. Идем в вордстат яндекса и статистику поисковых запросов рамблера. Вбиваем наш ключевик и копипастим в эксель все запросы. Если ключ не слишком НЧ, то запросов удастся получить больше 1к. Дальше идем в эксель и бегло все просматриваем, удаляя явно ненужное. Итого после этого у меня остается 100-200 анкоров. Можно, в принципе, оставить и больше.
4. Так, есть десяток самописных анкоров, больше сотни взятых из статистики запросов. Теперь начнем генерить анкоры с околоссылочным текстом. Я использую для этих целей генератор allsubmitter-а, а вообще аналогичных программ море, в том числе и онлайн сервисов.
Для ключа «работа в интернете» пишем что-то вроде: #a#[Работа в интернете|Работа в интернете на дому|Безрисковая работа в интернете] #/a# [- все рекомендации на нашем сайте|только тут|- научись зарабатывать в интернете]
И еще с дцать вариантов, составленных на основе знаний, полученных в пункте один. Нагенерить таким образом можно просто тысячи анкоров. Но нам ведь столько не нужно? Эта задача хорошо решается в allsubmitter-е – имея несколько тысяч вариантов, полученных чисто перебором, можно играясь с процентом схожести текстов и шинглами довести количество выдаваемых вариантов до нужного нам, причем чем этих вариантов будет меньше, тем они будут уникальнее.
Две недели назад прогнал несколько десятков сайтов по соц. закладкам. Всего сервисов соц. закладок, по которым гонял, штук тридцать-сорок. В каждом где-то по десять акков. Каждый сайт гонял по одному разу, т.е. каждый сайт добавлял в каждый сервис соц. закладок только один раз, хотел еще нарегать акков и прогон повторить два-три раза, но руки что-то не доходят.
Касательно выхлопа со всего этого.
- Трафик околонулевой. Раньше добавленные сайты часто транслировались на главной, теперь же из-за спама это прикрыли. Только если по тегам люди находят сайты и переходят на них, но это скорее исключение, чем правило, особенно для сателлитов.
- Бэков повылезало всего 3-5 на каждый сайт.
- Особого сео-эффекта не заметил. Тайтлы писал не сам, а брал неизмененные тайтлы с прогоняемых сайтов, благо они заточены под СЧ/НЧ.
В общем, эффекта крайне мало, может если бы прогнал все сайты не по одному разу, а больше, чего и выгорело бы. На многих сервисах соц. закладок для каждого сайта учитывается у скольких пользователей он в закладках и ранжируется выше, отображается в популярном и т.д. Но как-то не охота этим пока заниматься, пока сойдет и так, в принципе за несколько часов работы по четыре бека на несколько десятков сайтов не так уж и плохо.
И не стоит пытаться вгонять прогоном по закладкам сайты в индекс, особенно если контент рерайт или копирайт. Могут спереть. И не просто спереть – а продолжать воровать и в будущем каждую добавленную статью. Намного безопасней новый сайт просто добавить в Яндекс.Вебмастер, у меня так все сайты влетели в индекс через один-два апа. Ну или, если же сайт не хочет индексироваться, купить несколько морд с часто обновляемых сайтов или постовых с СДЛ блогов.
Естественные ссылки, естественные ссылки… Делайте интересные сайты для посетителей – и не надо будет думать о бэках и пузомерках, все будет расти и увеличиваться само, еще бы, ведь сайт СДЛ, а не сгенерированный ГС. Ага.
Сайт на комп. тематику. Контент уник, более чем полезный. Посещалка ~100. На народе правда, но не суть. За несколько лет его существования – ни одной обратки.
Сайта три с трафиком 70-150, если обобщить тематики, то пусть будет просто хобби. Люди находят то, что ищут. Контент самописный, скан, хорошая систематизированная подборка копипаста. За пару лет – максимум несколько естественных ссылок на каждый с блогов на бесплатных блогплатформах и с форумов, которые, как ни странно, через некоторое время имеют свойство отваливаться.
Собственно, каким бы хорошим сайт не был, на естественные ссылки надеться не надо. Исключение – когда потенциальная аудитория вашего сайта имеет свои сайты, блоги, общается на форумах.
Естественные ссылки, конечно, пойдут, но только тогда, когда сайт уже станет популярным в своей тематике и будет иметь хороший трафик. Но это уже как бонус, толку от него никакого, ресурс уже раскручен. А вот тогда, когда сайтик молодой и очень нуждается в ссылочной подпитке, на него не ссылаются, некому. Замкнутый круг. Хотя это может только мне так не везет.
