Как работает SGE (Search Generative Experience) и почему поисково-дополненная генерация (RAG, retrieval-augmented generation) - это наше будущее
Основательное исследование Майкла Кинга (агентство iPullRank) вышло на Search Engine Land.
Некоторые тезисы:
- Google SGE меняет подход к поиску информации: поиск, каким мы его знаем, был безвозвратно изменен генеративными нейросетями
- в долгосрочной перспективе, возможно, мы будем вспоминать 10 синих ссылок также, как мы вспоминаем мини-диски и пейджеры
- очевидно, что трафик 10 синих ссылок для подавляющего большинства запросов будет находиться под угрозой, CTR первой позиции выдачи, скорее всего, резко упадет
- стремительные улучшения продукта и недавние заявления Сундара Пичаи о его будущем позволяют предположить, что SGE никуда не денется
- достижения в области обработки естественного языка (NLP, natural language processing), начавшиеся с улучшения поиска, дали нам большие языковые модели на основе трансформеров (transformer-based large language models)
- по сути, поиск становится многомерным, и задача создателей контента в том, чтобы их контент прошел несколько этапов, чтобы оставаться в наборе для рассмотрения
- принято считать, что Google создал SGE как ответ Bing'у в начале 2023 года. Однако исследовательская группа Google представила реализацию RAG в своей статье, опубликованной в августе 2020 года
- SGE использует комбинацию языковых моделей PaLM 2 и MuM с элементами поиска Google (это известно из открытых источников)
- скорость генерации ИИ-ответа с момента запуска SGE существенно увеличилась
- интерфейс SGE все еще находится в процессе развития (недавно полный ответ скрыли под кнопкой «Показать еще»)
- SGE чаще всего использует первые 6 результатов из топ-10 для построения своего ответа, но в 9,5% случаев он не использует ни один из топ-10 результатов.
Основательное исследование Майкла Кинга (агентство iPullRank) вышло на Search Engine Land.
Некоторые тезисы:
- Google SGE меняет подход к поиску информации: поиск, каким мы его знаем, был безвозвратно изменен генеративными нейросетями
- в долгосрочной перспективе, возможно, мы будем вспоминать 10 синих ссылок также, как мы вспоминаем мини-диски и пейджеры
- очевидно, что трафик 10 синих ссылок для подавляющего большинства запросов будет находиться под угрозой, CTR первой позиции выдачи, скорее всего, резко упадет
- стремительные улучшения продукта и недавние заявления Сундара Пичаи о его будущем позволяют предположить, что SGE никуда не денется
- достижения в области обработки естественного языка (NLP, natural language processing), начавшиеся с улучшения поиска, дали нам большие языковые модели на основе трансформеров (transformer-based large language models)
- по сути, поиск становится многомерным, и задача создателей контента в том, чтобы их контент прошел несколько этапов, чтобы оставаться в наборе для рассмотрения
- принято считать, что Google создал SGE как ответ Bing'у в начале 2023 года. Однако исследовательская группа Google представила реализацию RAG в своей статье, опубликованной в августе 2020 года
- SGE использует комбинацию языковых моделей PaLM 2 и MuM с элементами поиска Google (это известно из открытых источников)
- скорость генерации ИИ-ответа с момента запуска SGE существенно увеличилась
- интерфейс SGE все еще находится в процессе развития (недавно полный ответ скрыли под кнопкой «Показать еще»)
- SGE чаще всего использует первые 6 результатов из топ-10 для построения своего ответа, но в 9,5% случаев он не использует ни один из топ-10 результатов.
Search Engine Land
How Search Generative Experience works and why retrieval-augmented generation is our future
Gauge the potential threat level of SGE on your site traffic. Get insights into the likely changes to the search demand curve and CTR model.
Failed: Hostload exceeded
Некоторые вебмастера в последние 3-4 дня сталкиваются с ошибкой "Failed: Hostload exceeded" при сканировании гуглоботом, вот, к примеру, тред на Reddite или на форуме хостинга Infinityfree или на форуме сообщества Центра Google Поиска или на Google Cloud Community.
Я тоже на одном хосте вижу подобное (скрин из GSC).
Джон Мюллер пока конкретного ответа не дал: "Мы более подробно рассмотрели это и другие подобные сообщения на форуме, и у меня нет окончательного ответа. Это не так однозначно, как обычно бывает с этой ошибкой, извините... Я сообщу здесь, как только мы узнаем больше".
Некоторые вебмастера в последние 3-4 дня сталкиваются с ошибкой "Failed: Hostload exceeded" при сканировании гуглоботом, вот, к примеру, тред на Reddite или на форуме хостинга Infinityfree или на форуме сообщества Центра Google Поиска или на Google Cloud Community.
Я тоже на одном хосте вижу подобное (скрин из GSC).
Джон Мюллер пока конкретного ответа не дал: "Мы более подробно рассмотрели это и другие подобные сообщения на форуме, и у меня нет окончательного ответа. Это не так однозначно, как обычно бывает с этой ошибкой, извините... Я сообщу здесь, как только мы узнаем больше".
Google Bard: некоторые факты
- Языковая модель: LaMDA (Language Models for Dialog Applications, языковые модели для диалоговых приложений)
- Количество параметров: 137 млрд
- Архитектура нейронной сети: трансформеры
- Размер набора обучающих данных: 750 ГБ (1,56 трлн слов и кода)
- Поддерживаемые языки и страны: 40 языков в 230 странах
- Название происходит от бардов кельтских культур, которые были профессиональными рассказчиками, поэтами, композиторами, историками и специалистами по генеалогии
- Google работает над LaMDA с 2017 года вместе с командой Google AI, таким образом на самом деле проекту более 6 лет
via Meetanshi Blog
- Языковая модель: LaMDA (Language Models for Dialog Applications, языковые модели для диалоговых приложений)
- Количество параметров: 137 млрд
- Архитектура нейронной сети: трансформеры
- Размер набора обучающих данных: 750 ГБ (1,56 трлн слов и кода)
- Поддерживаемые языки и страны: 40 языков в 230 странах
- Название происходит от бардов кельтских культур, которые были профессиональными рассказчиками, поэтами, композиторами, историками и специалистами по генеалогии
- Google работает над LaMDA с 2017 года вместе с командой Google AI, таким образом на самом деле проекту более 6 лет
via Meetanshi Blog
Джон Мюллер пока не признает наличие проблемы на стороне Гугла, утверждая, что эта проблема возникает при проверке/отправке на на индексацию большого кол-ва урлов в GSC и касается только консоли, но не сканирования.
(речь про Failed: Hostload exceeded / Превышена нагрузка на хост).
Однако, это не так - сканирование у ряда сайтов при этом также остановилось.
В Google Search Status Dashboard информации об инциденте нет.
(речь про Failed: Hostload exceeded / Превышена нагрузка на хост).
Однако, это не так - сканирование у ряда сайтов при этом также остановилось.
В Google Search Status Dashboard информации об инциденте нет.
noindex, nofollow
Джон Мюллер пока не признает наличие проблемы на стороне Гугла, утверждая, что эта проблема возникает при проверке/отправке на на индексацию большого кол-ва урлов в GSC и касается только консоли, но не сканирования. (речь про Failed: Hostload exceeded / Превышена…
Свежие посты в Google Search Central Community смотрятся показательно.
noindex, nofollow
Джон Мюллер пока не признает наличие проблемы на стороне Гугла, утверждая, что эта проблема возникает при проверке/отправке на на индексацию большого кол-ва урлов в GSC и касается только консоли, но не сканирования. (речь про Failed: Hostload exceeded / Превышена…
(из комментов)
тоже вижу, что на 2 сайтах проблема исчезла.
тоже вижу, что на 2 сайтах проблема исчезла.
Обзор Sistrix по следам прошедших Core и (anti) Spam апдейтов в октябре 2023
Разделить их невозможно, т.к. проходили в одно и то же время.
Приведенные данные относятся к региону UK (Великобритания).
Приводятся домены, увеличившие и потерявшие видимость.
Разделить их невозможно, т.к. проходили в одно и то же время.
Приведенные данные относятся к региону UK (Великобритания).
Приводятся домены, увеличившие и потерявшие видимость.
noindex, nofollow
Вслед за отключением сниппетов на основе разметки How-To и почти полным отказом от FAQPage (остались только для авторитетных, государственных и др. сайтов) Гугл прекратил показывать сниппеты на основе разметки Event. Официального подтверждения этому пока нет…
Представитель Гугла Райан Леверинг подтвердил отключение сниппетов на основе разметки Event в ходе мероприятия Search Central в Цюрихе во время сессии вопросов-ответов.
Search Engine Land
Google rich results for events removed from search snippets
You may have noticed a reduction in clicks from Google Search related to this change.
На том же мероприятии в Цюрихе анонсировали будущие расширенные сниппеты:
- для форумов на основе https://schema.org/DiscussionForumPosting
- для персон на основе https://schema.org/ProfilePage с mainEntity https://schema.org/Person
via Hristo Ganchev @ X
- для форумов на основе https://schema.org/DiscussionForumPosting
- для персон на основе https://schema.org/ProfilePage с mainEntity https://schema.org/Person
via Hristo Ganchev @ X
noindex, nofollow
Представитель Гугла Райан Леверинг подтвердил отключение сниппетов на основе разметки Event в ходе мероприятия Search Central в Цюрихе во время сессии вопросов-ответов.
Про причины отключения FAQ rich snippets: "Google отключил расширенные результаты FAQ из-за чрезмерно агрессивного использования этой функции. Исправления были внесены, но появились слишком поздно."
Объединение синтаксисов разметки Schema.org
Еще один анонс из Цюриха: появилась возможность объектам, описанным в разных синтаксисах разметки структурированных данных (JSON-LD, Microdata и RDFa), совмещаться или объединяться в цепочки.
via Aleyda Solis @ X
Оба валидатора -
https://validator.schema.org/
https://search.google.com/test/rich-results
уже поддерживают нововведение.
Еще один анонс из Цюриха: появилась возможность объектам, описанным в разных синтаксисах разметки структурированных данных (JSON-LD, Microdata и RDFa), совмещаться или объединяться в цепочки.
via Aleyda Solis @ X
Оба валидатора -
https://validator.schema.org/
https://search.google.com/test/rich-results
уже поддерживают нововведение.
Гугл запустил функцию "Об этом изображении" в выдаче. Полезно на фоне расцвета сгенерированных картинок.
Пока она доступна только на английском.
Пока она доступна только на английском.
Ethan Lazuk заметил новый фильтр "Perspectives" (перспективы) в десктопной версии результатов поиска для всех запросов.
Он оставляет в выдаче длинные и короткие видео, картинки и посты, которыми люди поделились на форумах, сайтах вопросов-ответов и соцсетях.
В июне 2023 он был запущен на мобильных, а под блоком "Top stories" может показываться одноименная, но другая функция.
Он оставляет в выдаче длинные и короткие видео, картинки и посты, которыми люди поделились на форумах, сайтах вопросов-ответов и соцсетях.
В июне 2023 он был запущен на мобильных, а под блоком "Top stories" может показываться одноименная, но другая функция.
Граф знаний (Knowledge Graph) в Гугле серьезно обновился
Джейсон Барнард отслеживает кол-во сущностей в Графе знаний Гугла c 2015 года.
Он утверждает, что его расширение повлияло на августовский core update и возможно на октябрьский.
Это выглядит логично в контексте развития и роста важности EEAT-парадигмы.
Кол-во сущностей в Графе увеличивается каждое лето.
Кол-во персон этим летом утроилось за 4 дня с 14 по 28 июля.
К сентябрю 2023 года количество персон увеличилось почти в 20 раз по сравнению с маем 2020 года.
Большая часть Графа знаний была создана на основе данных из тщательно отобранных и структурированных сторонних источников, таких как IMDB (киноиндустрия), MusicBrainz (музыкальная индустрия), правительственные сайты и различные спортивные сайты, Википедия.
С течением времени Гугл снижает зависимость от внешних источников, строя собственную базу.
via Search Engine Land
Джейсон Барнард отслеживает кол-во сущностей в Графе знаний Гугла c 2015 года.
Он утверждает, что его расширение повлияло на августовский core update и возможно на октябрьский.
Это выглядит логично в контексте развития и роста важности EEAT-парадигмы.
Кол-во сущностей в Графе увеличивается каждое лето.
Кол-во персон этим летом утроилось за 4 дня с 14 по 28 июля.
К сентябрю 2023 года количество персон увеличилось почти в 20 раз по сравнению с маем 2020 года.
Большая часть Графа знаний была создана на основе данных из тщательно отобранных и структурированных сторонних источников, таких как IMDB (киноиндустрия), MusicBrainz (музыкальная индустрия), правительственные сайты и различные спортивные сайты, Википедия.
С течением времени Гугл снижает зависимость от внешних источников, строя собственную базу.
via Search Engine Land
Пробовали ли вы внедрять Web Stories (ex-AMP stories) на сайте?
Anonymous Poll
3%
Да, и получили значимый трафик из поиска Гугла и/или Discover
5%
Да, но не получили значимого трафика
19%
Нет и не собираюсь
7%
Нет, но планирую
67%
Хочу посмотреть ответы