SЕalytics (SEO-аналитика от Сергея Людкевича)

Меж тем Яндекс заменяет асессоров на искусственный интеллект. Делаем ставки – насколько повысится качество поиска? 😉

678 viewsСергей Людкевич, 19:11

Как в Яндексе заменили сложную разметку на LLM

В конце прошлой осени Команда качества поиска одной из первых в Яндексе смогла существенно удешевить сложную асессорскую разметку за счёт генеративной модели. Татьяна Климук, руководитель Службы исследований и качества ранжирования, рассказала, как работали над технологией.

Яндекс использует услуги тысяч асессоров, которые каждый день выполняют десятки тысяч заданий по оценке выдачи с точки зрения качества и релевантности. Это дорогой, долгий и сложный процесс.

Идея проекта в том, чтобы отдать рутинную работу по разметке сильной нейронке. При этом мы не отказываемся от асессоров, а переключаем их на разметку более важных и сложных кейсов, а также поручаем контролировать корректность работы модели.

Архитектура

Мы начали с экспериментов с базовым претрейном от YandexGPT. На вход подавали сжатую инструкцию, запрос и контент документа, на выходе получали решение о принадлежности к одной из категорий релевантности.

Однако промптинг даже SoTA-моделей пока не даёт нужного качества на нестандартных кейсах. Инструкция оказывается для них настолько сложной, что без дообучения ни одна модель не справляется с ней. Поэтому на старте получилось выжать только 55% качества асессоров.

Тогда мы сделали ряд улучшений:

— Взяли претрейн от Нейро, который лучше понимает поисковый домен и легче обучается решать поисковые задачи.
— Обучались не просто на метку класса, но и на подготовленные Chain-of-Thoughts, чтобы научить модель больше думать перед тем, как она даёт ответ.
— Добавили внешние данные — знания, необходимые для понимания контекста, которые нельзя извлечь из текста. Пример таких знаний — то, какие страницы в сети официальные, а какие — нет.
— Подавали данные для обучения в нужном порядке — от более мусорных к более качественным.

Так мы добились качества 102% относительно разметки асессоров, что уже было неплохо. Но оставался риск «сломать» Поиск — поэтому нужно было проверить модель на разных классах запросов, исключить риск деградации со временем и учесть другие нюансы.

Решение

В итоге мы придумали решение, которое использует оценку как от людей, так и от нейросети. Мы стали извлекать из неё не только ответ по инструкции, но ещё и уверенность в этом предсказании. В зависимости от степени уверенности мы принимали решение, использовать ли в задаче человеческий ресурс.

— Если модель уверена в ответе, скорее всего, задача простая и не требует помощи асессоров. С этими кейсами она нередко справляется даже лучше людей. Таких задач оказалось около половины от общей массы.
— Если модель не до конца уверена в ответе, привлекаем её вместо одного из трёх асессоров. Размер этой зоны — около 30%.
— Когда модель говорит, что совсем не уверена в решении, отдаём задачу трём сильным асессорам — как это происходит в стандартном процессе. Таких задач порядка 20%.

Результаты и планы

С помощью этого решения мы получили 105% качества и 60% экономии денег.

Мы уже используем его экспериментально в разметке обучающих и валидационных пулов для моделей ранжирования, но конечный мониторинг интегрального качества поиска пока остаётся на людях.

Планируем продолжать наращивать качество и запускаться на новых разметках. Также в долгосрочных планах — свести процесс к промптингу, когда ты не обучаешь модель, а описываешь задачу текстом. Так мы сможем более гибко менять инструкции разметок без переобучения модели.

Мы рассчитываем, что решение поможет нам перекинуть рутину на нейронки, а людям давать более интересные и сложные задачи.

ML Underhood

👍5❤2🔥1

596 viewsСергей Людкевич, 19:11

SЕalytics (SEO-аналитика от Сергея Людкевича)

Любопытный факт:

"Юрист Google утверждает, что менее 1% просмотров на YouTube поступает со ссылок поиска."

Android Authority

Search plays almost no role in YouTube's massive viewership, Google claims

A lawyer representing Google in federal court claims that Search links are responsible for roughly less than 1% of YouTube's viewership.

708 viewsСергей Людкевич, 06:05

SЕalytics (SEO-аналитика от Сергея Людкевича)

Начинают поступать сигналы от буржуйских сеошников, что Google стал ограничивать поисковый трафик с изображений, сгенерированных ИИ.

SEO Tip - If you're getting traffic from AI generated images, you might get hammered soon (if you didn't already)

The chart below…

SEO Tip - If you're getting traffic from AI generated images, you might get hammered soon (if you didn't already)

The chart below shows Web vs Image for our video game Animal Matchup, and the image traffic (which comes from our AI images) just took a big…

👍4

917 viewsСергей Людкевич, 12:24

SЕalytics (SEO-аналитика от Сергея Людкевича)

Руководство по генерации разметки JSON-LD в больших масштабах с помощью фрагментов JavaScript от Screaming Frog.

Screaming Frog

Generate JSON-LD Schema at Scale With JavaScript Snippets - Screaming Frog

This tutorial shows how to leverage the Screaming Frog SEO Spider’s recently released custom JavaScript functionality to create JSON-LD schema markup at scale. With a small amount of code, I will demonstrate how to extract elements from a webpage and integrate…

👎2🔥2

782 viewsСергей Людкевич, 16:55

SЕalytics (SEO-аналитика от Сергея Людкевича)

Оказывается, Google вставляет палки в колеса гениальным руководителям Reddit'а, и те из-за него не получили ожидаемую прибыль за четвертый квартал. Как тяжело жить... 😀

CNBC

Reddit shares plunge after Google algorithm change contributes to miss in user numbers

Reddit reported better-than-expected results, but the company issued disappointing user numbers.

😁5

732 viewsСергей Людкевич, 18:35

SЕalytics (SEO-аналитика от Сергея Людкевича)

"Programmatic SEO" сайт HubPages, пылесосящий запросы на все случаи жизни, демонстрирует резкую положительную динамику в Google. Интересно, надолго?

746 viewsСергей Людкевич, 21:28

SЕalytics (SEO-аналитика от Сергея Людкевича)

Список поисковых краулеров и пользовательских агентов на базе ИИ.
Если кому надо.

Momentic

List of Top AI Search Crawlers & User Agents (April 2025) | Momentic

A list of AI search crawlers and how to verify they can access your website. Includes a validation tool and example robots.txt configurations.

793 viewsСергей Людкевич, edited 05:48

SЕalytics (SEO-аналитика от Сергея Людкевича)

SEOMigrator — автоматизированный инструмент сопоставления URL-адресов для миграции сайта.

SEOMigrator

Automated URL Mapping Tool For SEO Migrations | SEOMigrator

A powerful tool that helps you map and match URLs during website migrations, making the process faster and more efficient with intelligent URL matching algorithms.

👍7

829 viewsСергей Людкевич, edited 11:39

SЕalytics (SEO-аналитика от Сергея Людкевича)

Интересный подход к оценке рентабельности SEO поддержки от буржуйского сеошника Люка Карти – использование метрики ROAS, которой оперируют рекламщики

Ecommerce Consultant

How to get ROAS for Ecommerce SEO using Google Analytics - Ecommerce Consultant

The way that most SEOs report on performance is outdated. Using GA4 audiences we're able to report on SEO performance in the same way as PPC

👍1

711 viewsСергей Людкевич, 13:22

SЕalytics (SEO-аналитика от Сергея Людкевича)

Гуглоиды добавили примеры и инструкции по использованию свойства priceType и нового бета-свойства validForMemberTier для кодирования активных цен, цен распродажи, зачеркнутых цен и цен участников в формате JSON-LD в документацию по структурированным данным листинга продавцов.

Google for Developers

How To Add Merchant Listing Structured Data | Google Search Central | Documentation | Google for Developers

Discover how you can add merchant listing structured data to attract potential buyers while they are searching for items to purchase on Google.

2.76K viewsСергей Людкевич, edited 15:01

SЕalytics (SEO-аналитика от Сергея Людкевича)

Хинт от гуглоида Джона Мюллера: если вы получили сообщение о проблеме в Google Search Console, но при этом не приводится ни одного примера URL-адресов, затронутых ею, смело

"можете отправить запрос на проверку, и обычно это приводит к получению большего количества/некоторых образцов URL, если проблема не была временной."

Конечно же, опытные сеошники в случае проблемы жмут на все кнопки, которые доступны, но неопытных такое может поставить в тупик 😊

Bluesky Social

John Mueller (@johnmu.com)

Depending on the type of issue, that can happen. You can always submit a review request, and usually that results in getting more/some sample URLs, if the issue was not temporary.

😁5

783 viewsСергей Людкевич, edited 21:36

SЕalytics (SEO-аналитика от Сергея Людкевича)

Сеошники из Forbes, получившие пенальти от Google за злоупотребление репутацией, начали топить за Generative Engine Optimization (GEO) – оптимизацию под системы генеративного ИИ, называя это будущим поиска.
P.S. Теперь они, походу, – геошники. 😄

😁15👎2

795 viewsСергей Людкевич, edited 12:01

SЕalytics (SEO-аналитика от Сергея Людкевича)

P.P.S. Тимлид наставляет сеошника-джуниора: "Будешь плохо сеошить – станешь геошником" 😄

🤔7😁6👎2

759 viewsСергей Людкевич, edited 12:14

SЕalytics (SEO-аналитика от Сергея Людкевича)

Google собирается воткнуть переключатель между режимами традиционного поиска и поиска с помощью генеративного ИИ в Pixel Launcher. Вот и везде бы так, да еще и убрать AI Overviews из Google Search – кто хочет, пусть ищет у ИИ, а остальных избавить от этого счастья. 😀

Android Authority

Google will soon let you access its new AI search mode right from your Pixel’s home screen

The Pixel Launcher will soon get a shortcut to the new AI Mode feature in Google Search. Here's what it'll look like.

👍4

730 viewsСергей Людкевич, edited 18:25

SЕalytics (SEO-аналитика от Сергея Людкевича)

Разборки в песочнице 😄

699 viewsСергей Людкевич, 21:10

SЕalytics (SEO-аналитика от Сергея Людкевича)

Интересное исследование степени предвзятости Google по запросам политического толка.
Как бы уши торчат.

Search Engine Land

Is Google biased? An SEO veteran's perspective

This deep dive uses SEO tools and data analysis to explore the claims, controversies, and facts behind political search results.

681 viewsСергей Людкевич, edited 10:18

SЕalytics (SEO-аналитика от Сергея Людкевича)

Обновлен отчёт Google CrUX. Добавлена более детальная информация об LCP и RTT, что может помочь оптимизировать скорость загрузки страниц.

Chrome for Developers

LCP image subparts and RTT now available in CrUX | Blog | Chrome for Developers

Learn about the change to the Chrome User Experience Report (CrUX changes) in the February 2025 release including LCP image subparts, LCP resource types, and RTT.

721 viewsСергей Людкевич, edited 14:32

SЕalytics (SEO-аналитика от Сергея Людкевича)

Буржуйский сеошник Гарри Кларксон-Беннет дотошно и довольно иронично разбирает патент Google "Системы и методы повышения рейтинга новостных статей".
Желаю приятного чтения на сон грядущий, но не следует забывать, что

«То, что Google что-то запатентовал, не означает, что это использовалось или используется в его алгоритме».

Substack

How Google REALLY ranks news sites

This breakdown of key Google news patents can help clarify why Google's news ecosystem can feel like the wild west

👍2

728 viewsСергей Людкевич, edited 21:49

SЕalytics (SEO-аналитика от Сергея Людкевича)

Число ссылок на YouTube в Google AI Overviews выросло на 25% с начала года.
Гуглоиды определено не хотят выпускать юзеров за пределы своей экосистемы.

Search Engine Land

YouTube citations in Google AI Overviews surge 25%

Google AI Overviews more often cite YouTube for Instructional content, visual demonstrations, verification/examples, and current events.

673 viewsСергей Людкевич, edited 06:22

About

Blog

Apps

Platform