SЕalytics (Сергей Людкевич)
2.5K subscribers
790 photos
9 videos
2 files
3.54K links
Мысли по аналитике поисковых машин и сложным вопросам SEO от Сергея Людкевича

SEO-консалтинг, аудиты, onsite и onpage оптимизация.
Связь:
email: ludkiewicz@ya.ru
telegram: @ludkiewicz
skype: ludkiewicz_serge
сайт: https://www.ludkiewicz.ru/
Download Telegram
Пятничное. В одной из сеошных групп зашёл разговор о текстовых анализаторах. Которые считают что-то там среднее по текстам документов из топов и дают советы, как к этому среднему приблизиться. И мало кто задумывается, что главное - не как сравнить, а с кем сравнить. Как сравнить - решения предлагают куча сервисов. Но никто не предлагает - с кем сравнивать будет правильно. Помню, лет сколько-то назад то ли на Ашмановке, то ли на Кибермаркетинге представляли один из первых текстовых анализаторов. А тогда ещё в Яндексе работал оператор intext:, который ранжировал чисто по текстовой релевантности. И на мой вопрос разработчикам, а используют ли они его, я видел в их глазах полнейшее непонимание - а зачем? Ведь массам лучше продается сравнение с обычным топом. Вот и считают за эталон тексты у документов из топа, которые там оказались вполне возможно не благодаря этим текстам, а может даже вопреки.
👍15
Рекомендую подписчикам канала вступить в привязанную к нему группу @sealytics_seo_chat
Так интересные обсуждения постов не пройдут мимо вас. Ну и можно будет позадавать различные интересующие вас вопросы.
👍6
Сейчас на фоне новостей о нейросети ChatGPT стала активно обсуждаться тема генерации SEO-текстов с помощью искусственного интеллекта. Подозреваю, что не за горами появление в антиспаме поисковиков факторов, пессимизирующих сгенерированный таким образом контент.
👍3🔥3
В сети потихоньку начинают появляться разные анализы факторов из последней утечки исходников Яндекса. Помню лет десять (а то и побольше) назад, когда утекла первая пачка факторов в несколько сотен штук, у увидевших ее была эйфория. Ой, вот это - фактор, и вот это - фактор, мы теперь знаем всё, что учитывается. А потом утекли развесовки по некоторым запросам. И там было видно, что очень многие факторы имеют нулевой вес. И более того, некоторые из тех, которые по логике должны быть положительными, на деле были отрицательными. В общем, понятно стало, что список факторов без развесовок - просто информация для общего развития )
👍10❤‍🔥3🥰2
Наткнулся тут на официальное подтверждение того, что тег <noindex> в Яндексе хоть и запрещает индексацию контента, но при этом неиндексируемый контент учитывается в антиспаме. Так что применение тега <noindex> в качестве защиты от переспама абсолютно бесполезно.
Цитата из ответа службы поддержки Яндекса:
"Материалы, запрещенные к индексированию, не используются при формировании поискового индекса, но могут использоваться другими способами, например, для обнаружения нарушений на сайте".
Еще один пример абсурдной логики. Наказание в индексе за то, что не в индексе.
👍4
Чем больше сеошная публика вчитывается в утекший из Яндекса список факторов, тем большее разочарование ее постигает. Всем хочется заиметь маленькую аккуратную дырочку в алгоритме, а не несколько тысяч непонятно как взвешенных факторов. Даже если и знать, что есть, к примеру, фактор, учитывающий наличие цифр в урле, то практической пользы от этого знания с гулькин нос. Ну, разве что статейку запилить где-нибудь на виси - я умею читать список факторов. )
👍13
А вот это уже любопытнее. Во вчерашней буржуйской статейке https://searchengineland.com/yandex-leak-learnings-392393 чувак по имени Michael King утверждает, что нашел в коде развесовку 257 из аж 17,000+ факторов. Действительно какие-то коэффициенты, привязанные к факторам на скриншоте https://searchengineland.com/wp-content/seloads/2023/01/yandex-relevance-scoring-554x600.png.webp присутствуют, однако очень сомнительно, что вот так вот прямо в коде забиты веса. Опять же - по какой именно формуле/запросу? Да и сами веса довольно странные, например, фактор FI_TEXT_RELEV_PHRASE (есть все слова запроса подряд в документе) имеет отрицательный коэффициент на скриншоте.
👍4
А ведь мутный список с непонятной развесовкой факторов из предыдущего поста канала начинает завладевать умами сеошников. Уже на полном серьезе от разных лиц звучат призывы отказываться от доменов в зоне .ru, так как в списке это отрицательный фактор. Правда совсем уж неудобные нестыковки комментаторы стараются обходить стороной, и пока еще никто не призывает отказаться от использования в тексте всех слов запроса подряд, хотя в списке этот фактор тоже обозначен отрицательным.
😁8
А вот нашелся и комментарий Дэна Расковалова (бывший сотрудник отдела качества поиска Яндекса) к тому самому мутному списку факторов с развесовками, выложенному на https://gist.github.com/lord-alfred/97400a79f10f3bb13bb4bcd42268b1f8

"nav_linear.h has nothing to do with ranking web search results in Yandex search."

Хозяйке на заметку, как говорится.
Ну что, паззл потихонечку сложился. Поступила информация, что в файлике nav_linear.h находится вычисление значения фактора 682 FI_NAV_LINEAR - что-то там про "полунавигационные" запросы. Вот так вот. Один фактор. Про классификацию запросов. Вскрытие Матрикснета отменяется. Можете менять домены com обратно на ru )
😁12
Пока все ищут священный грааль в утечке из Яндекса, в Гугле тоже немножко рассказали за факторы. Джон Мюллер заявил, что у них нет понятия оптимальной плотности ключевых слов: https://www.youtube.com/watch?v=TMLE-Hrcgvw&t=359s
В общем-то, ничего нового, но многие сеошники до сих пор отказываются верить в это. Кстати, если отмотаете в самое начало, то услышите подтверждение еще одной прописной истины - метатег keywords не помогает в ранжировании.
Итак, продолжаем копаться в файле factors_gen.txt. Мысли по поводу факторов с пометкой TG_UNUSED.
Многие комментаторы априори записали такие факторы в разряд неиспользуемых. Но я думаю, что не все так просто.
В описании фактора FI_MATRIXNET читаем: "Ко всем факторам применяется MatrixNet - формула (TG_UNUSED - чтобы предотвратить вхождние в какие-либо формулы)", в описании фактора FI_URL_SHOWS_WITH_NEXT_PAGE_CLICKS_P10 еще интереснее: "Фактор используется в SelectionRank. TG_UNUSED: не должен входить в формулы во избежание обратной связи".
Итак, получается, факторы с такой пометкой не используются в Матрикснете из-за опасности положительной обратной связи. Но вполне себе могут использоваться в других частях модели ранжирования. В том же SelectionRank - осталось только понять, что это такое ). Или, например, в антиспаме. Или в добавке из полиномов, которая точно была раньше, и, возможно, есть и сейчас - предлагаю присмотреться к описанию факторов FI_FULL_POLYNOM, FI_FAST_POLYNOM, FI_FILTER_POLYNOM, FI_META_POLYNOM.
Так что я бы не сбрасывал такие факторы со счетов. Кстати, интересно, что такую пометку имеет фактор FI_PAGE_RANK.
👍2
Продолжаю тему факторов из файла factors_gen.txt. Любопытным показался фактор 1085 FI_AVG_TITLE_CAPITAL_LETTERS_RATIO с описанием "Доля заглавных букв в Title". Судя по прикрепленной ссылке на внутреннюю Вики (https://wiki.yandex-team.ru/JandeksPoisk/Antispam/Tech/Mascot), этот фактор имеет отношение к Антиспаму.
Сразу вспомнилась практика, несколько лет назад активно использовавшаяся сеошниками для формирования более заметного сниппета - писать тег title заглавными буквами. Видимо, эта практика и стала причиной появления этого фактора. Странно, что в списке не нашлось фактора, который учитывает наличие спецсимволов Юникода в тегах title и description, которые сеошники используют с той же целью. Хотя, судя по тому, что такие спецсимволы в сниппетах топа Яндекса встречаются гораздо реже, чем у Гугла, в файлик могли попасть не все факторы Антиспама.
👍6
Увидел тут в одном чате дискуссию про то, какими следует считать запросы, содержащие в себе топоним - геозависимыми или геонезависимыми.
Здесь все зависит от того, что считать геонезависимостью. Независимость выдачи по запросу от региона пользователя или вообще от какого-либо региона.
На мой взгляд, второе определение будет более корректным. Запросы с топонимами зависят от региона, который в них указан, и поэтому их следует считать геозависимыми.
Да и сам Яндекс в своей статье https://yandex.ru/company/technologies/regions особо оговаривает случай, когда город указан в запросе, в подразделе о результатах регионального поиска, т.е. геозависимых.
👍1
Прочтя свежеопубликованную позицию Гугла по поводу сгенерированого с помощью искусственного интеллекта контента (https://developers.google.com/search/blog/2023/02/google-search-and-ai-content), подумалось, что не за горами появление для него маркера по типу nofollow для неестественных ссылок.
Несмотря на то, что позиция Гугла по этому поводу на данный момент, ну, очень обтекаема.
👍5
Оказывается, в своем посте https://t.me/sealytics/13 я немножко предвосхитил события. Яндекс только сегодня объявил о прекращении поддержки директивы canonical при смене протокола: https://webmaster.yandex.ru/blog/otklyuchenie-podderzhki-rel-canonical-pri-pereezde-s-https-na-http
Получается таки, это был единственный известный мне случай поддержки Яндексом кросс-доменной директивы canonical.
Любопытна оговорка в названии новости: "при переезде с https на http". Обычно переезжают в другом направлении )
👍4
Поступила информация о том, что слова о переезде именно с https на http в заголовке новости https://webmaster.yandex.ru/blog/otklyuchenie-podderzhki-rel-canonical-pri-pereezde-s-https-na-http - не опечатка.
Насколько я понимаю, проблема с директивой canonical возникает именно при необходимости переезда с https на http в случае неработающего сертфиката ssl - робот не имеет доступа к https и не видит canonical.
В случае же "классического" переезда с http на https проблем с директивой canonical быть не должно.
👍8🔥1
Удивительно, но до сих пор немало сеошников верят в то, что статический вес страницы рассчитывается по классической формуле PageRank образца 1997 года, и что он может куда-то там утечь по ссылкам со страницы.
Меж тем давным-давно уже ходит байка про бывшего сотрудника Гугла, заявившего, что аж с 2006-го года классический алгоритм PageRank заменен на некий более экономный в расчетах. Что в общем-то вполне логично. Но так как новой формулы никто не знает, то многие предпочитают верить в старую )
В общем, рекомендую в работе сосредоточиться на том, кто и как ссылается на вас, а не на том, сколько ссылаетесь вы.

P.S. Ну, конечно, при условии, что ссылаться надо все-таки на хороших ребят )
👍8
Немножко о том, чем я могу быть полезен.
Вы занимаетесь поисковым продвижением сайта, но понимаете, что уперлись в потолок или близки к нему. Вы прогнали свой сайт по всевозможным сеошным сервисам и программам, но в голове каша из их отчетов. Нужен свежий незамыленный взгляд со стороны. Тогда это ко мне. Проведу глубокий авторский SEO-аудит сайта, внимательно посмотрю его глазами, пощупаю руками, и обязательно найду препятствующие хорошему ранжированию ошибки, дам рекомендации по их исправлению.
Не нужен полноценный аудит, а есть только отдельные вопросы? На этот случай есть разные варианты, начиная от часовой беседы без предварительной подготовки. Всегда рад помочь: @ludkiewicz
👍8❤‍🔥3🤣1
Да, важный момент по аудитам. Я работаю по следующей схеме - нет никаких толстых отчетов с разнообразной водой в виде результата прогона сайта по стандартному чек-листу или по автоматическим сервисам или программам. Клиент обозначает проблемы, я анализирую сайт и даю рекомендации по их решению, параллельно выдавая общие рекомендации. Либо у клиента нет конкретных проблем, и он хочет получить критическую оценку текущего состояния сайта (так сказать, незамыленный взгляд) и рекомендации по его развитию. Наиболее эффективным способом взаимодействия с клиентом по итогам аудита считаю двусторонний диалог по любому мессенджеру, но возможен и формат письменных рекомендаций.
👍4❤‍🔥1🙏1
На днях Google обновил контент на англоязычной версии страницы документации по ссылкам.
Интересно изменение заголовка страницы с "Make your links crawlable" на "SEO Link Best Practices for Google".
Среди прочего показался любопытным следующий момент:

As a fallback, Google can use the title attribute as anchor text if the <a> element is for some reason empty.
<a href="
https://example.com/ghost-pepper-recipe" title="how to pickle ghost peppers"></a>

Честно говоря, не совсем понимаю, по каким таким причинам содержимое тега <a> можно оставлять пустым. Ведь в этом случае ссылка будет не видна пользователю. И еще более странным видится то, что в этом случае вполне легально содержимое атрибута title будет считаться анкором такой невидимой ссылки.