Яндекс улучшил поиск по it-запросам (усовершенствована нейросеть YATI, в основном, по программированию) и обогащенные ответы по StackOverflow, GitHub.
Источники:
1 — https://www.cnews.ru/news/line/2022-09-20_yandeks_obnovil_poisk_na
2 — https://yandex.ru/promo/unisearch/cs_search
Источники:
1 — https://www.cnews.ru/news/line/2022-09-20_yandeks_obnovil_poisk_na
2 — https://yandex.ru/promo/unisearch/cs_search
CNews.ru
«Яндекс» обновил поиск на базе модели CS YATI - CNews
«Яндекс» усовершенствовал поиск с помощью нейросети CS YATI — это новая модель, обученная на документах для...
👍3
Forwarded from Mike Blazer (Mike Blazer)
Джеки Чоу пробует тактику, которая кажется для него вполне разумной:
— Массовый запуск 10-20 сайтов на ИИ контенте
— Примерно 5 из них начнут получать траф
— Возьмём посты, которые ранжируются на этих сайтах, и напишем их вручную.
— Удалим те, которые не ранжируются в топ-100.
Повторяем несколько раз.
Это снижает риск вложения значительных средств в контент для получения шанса на попадание в топ, а как только ИИ контент начнёт продвигаться, мы просто доработаем его.
Найдите дыры в этой логике.
@MikeBlazerX
— Массовый запуск 10-20 сайтов на ИИ контенте
— Примерно 5 из них начнут получать траф
— Возьмём посты, которые ранжируются на этих сайтах, и напишем их вручную.
— Удалим те, которые не ранжируются в топ-100.
Повторяем несколько раз.
Это снижает риск вложения значительных средств в контент для получения шанса на попадание в топ, а как только ИИ контент начнёт продвигаться, мы просто доработаем его.
Найдите дыры в этой логике.
@MikeBlazerX
Сергей Людкевич пишет о пользе региональных доменов под Яндекс. К плюсам можно добавить и появление региональной морды
Forwarded from SЕalytics (SEO-аналитика от Сергея Людкевича)
Итак, начнем. Первая мысль, которой хотелось бы поделиться, навеяна дискуссией в одно закрытой SEO-группе. Хотя, впрочем дискуссии на эту тему идут давно и в разных местах. Речь идет о целесообразности использования региональных поддоменов. Оговорюсь сразу, для Google региональные поддомены слабо эффективны. А вот в Яндексе есть как минимум две причины, по которым их использование целесообразно в ряде случаев:
1) Поддомену легко присвоить нужный регион через сервис Яндекс.Вебмастер безо всяких верификаций геоинформации (чего требует Яндекс.Справочник). Правда, всего один, но этого вполне достаточно, т.к. для каждого региона будет свой поддомен.
2) Страницы с одинаковым контентом (например, листинги товаров в категориях) на разных поддоменах не будут считаться Яндексом дублями, в отличии от страниц на одном поддомене (например, с случае организации региональных папок). И поэтому не нужны танцы с бубнами в виде рандомизации порядка вывода товаров в региональных категориях, чтоб минимизировать вероятность склейки.
1) Поддомену легко присвоить нужный регион через сервис Яндекс.Вебмастер безо всяких верификаций геоинформации (чего требует Яндекс.Справочник). Правда, всего один, но этого вполне достаточно, т.к. для каждого региона будет свой поддомен.
2) Страницы с одинаковым контентом (например, листинги товаров в категориях) на разных поддоменах не будут считаться Яндексом дублями, в отличии от страниц на одном поддомене (например, с случае организации региональных папок). И поэтому не нужны танцы с бубнами в виде рандомизации порядка вывода товаров в региональных категориях, чтоб минимизировать вероятность склейки.
Forwarded from SEO без воды
Google запустил September 2022 product reviews update
— Сайтам с обзорами товаров на английском снова достанется. Другим языкам позже.
— Раскатку планируют завершить в течение 2 недель.
— О завершении сообщат здесь.
— Рекомендации по оптимизации обзоров под этот алгоритм пока те же.
— Напоминаю, что параллельно всё ещё идет раскатка September 2022 core update. В течение недели должна завершиться.
Источник: Twitter.
— Сайтам с обзорами товаров на английском снова достанется. Другим языкам позже.
— Раскатку планируют завершить в течение 2 недель.
— О завершении сообщат здесь.
— Рекомендации по оптимизации обзоров под этот алгоритм пока те же.
— Напоминаю, что параллельно всё ещё идет раскатка September 2022 core update. В течение недели должна завершиться.
Источник: Twitter.
Автоматизация посткластеризации
Под посткластеризацией подразумеваются действия, в основном последующие после кластеризации, в результате которой создаются группы ключевых слов. Суть идеи в раздельном тегировании запросов и страниц, связывании их между собой (программируемый коннектор) и использовании в автоматизации, например, в следующих операциях:
— Генерация и обновление шаблонных текстов для Title, H1, Description и других блоков;
— Обновление семантики, в частности, разнесение появившихся новых ключевых слов по существующим кластерам;
— Связывание семантики из разных источников, например, кластеров, извлеченных из Вордстата с семантикой, генеренной под фильтры (и их сочетания) в и-магазинах.
Для небольших сайтов пока это мало интересно, т.к. быстрее сделать в Excel. Для крупных сайтов с большим количеством шаблонных текстов (например, и-магазины) позволит автоматизировать множество рутинных операций. Пока этого нет в сервисах, можно брать из них ID групп ключевых слов и самостоятельно обрабатывать в Python и внешней базе данных (например, в SQLite).
Тегирование описано по ссылке - https://traffi.ru/seo/url-tagging
Под посткластеризацией подразумеваются действия, в основном последующие после кластеризации, в результате которой создаются группы ключевых слов. Суть идеи в раздельном тегировании запросов и страниц, связывании их между собой (программируемый коннектор) и использовании в автоматизации, например, в следующих операциях:
— Генерация и обновление шаблонных текстов для Title, H1, Description и других блоков;
— Обновление семантики, в частности, разнесение появившихся новых ключевых слов по существующим кластерам;
— Связывание семантики из разных источников, например, кластеров, извлеченных из Вордстата с семантикой, генеренной под фильтры (и их сочетания) в и-магазинах.
Для небольших сайтов пока это мало интересно, т.к. быстрее сделать в Excel. Для крупных сайтов с большим количеством шаблонных текстов (например, и-магазины) позволит автоматизировать множество рутинных операций. Пока этого нет в сервисах, можно брать из них ID групп ключевых слов и самостоятельно обрабатывать в Python и внешней базе данных (например, в SQLite).
Тегирование описано по ссылке - https://traffi.ru/seo/url-tagging
👍1
Forwarded from 42 секунды
РБК: Яндекс начал строительство своего самого мощного дата-центра в России
– Он нужен, чтобы покрыть растущий спрос на облачные услуги
– В дата-центре расположится более 3,8 тыс. серверных стоек
– Общая проектная мощность новой площадки составит 63 МВт
– Это в 1,5 раза больше, чем в наиболее мощном из текущих ДЦ
– Открытие первой зоны планируется на первое полугодие 2023
– Дата-центр в Калуге станет четвертым ДЦ компании в России
– Для его строительства используют собственное оборудование
– ДЦ будут использовать для размещения оборудования клиентов
– Также для некоторых клиентов будет снижение цен на 20-30%
@ftsec
– Он нужен, чтобы покрыть растущий спрос на облачные услуги
– В дата-центре расположится более 3,8 тыс. серверных стоек
– Общая проектная мощность новой площадки составит 63 МВт
– Это в 1,5 раза больше, чем в наиболее мощном из текущих ДЦ
– Открытие первой зоны планируется на первое полугодие 2023
– Дата-центр в Калуге станет четвертым ДЦ компании в России
– Для его строительства используют собственное оборудование
– ДЦ будут использовать для размещения оборудования клиентов
– Также для некоторых клиентов будет снижение цен на 20-30%
@ftsec
> Стратегический шаг для компаний заключается не в том, чтобы использовать ИИ-контент целиком, а в том, чтобы использовать такие инструменты в своих процессах создания контента, и снижать предсказуемость текста...
В переводе на сеошный - длинные последовательности слов в gpt-моделях слишком предсказуемы и хорошо детектируются алгоритмами Гугла
В переводе на сеошный - длинные последовательности слов в gpt-моделях слишком предсказуемы и хорошо детектируются алгоритмами Гугла
👍1
Forwarded from noindex, nofollow
Кейс: как ИИ-контент был пессимизирован августовским HCU апдейтом (Helpful Content Update)
Оригинал: пост Кевина Индига (https://www.kevin-indig.com/case-study-ai-content-punished-by-the-hcu-update/).
Ярким примером сгенерированного машинным интеллектом контента является https://www.throughtheclutter.com/ - он содержит профили знаменитостей и истории про фильмы. Это тот уровень качества контента, который бы понижен HCU апдейтом.
На пике они получали 1 млн переходов из Гугла. 30 августа трафик начал падать. Через неделю он упал почти до нуля.
Даже просто глядя на структуру страницы, вы можете сказать, что с ней что-то не так.
Видимость домена показывает типичное развитие трафика для сайтов, которые агрессивно масштабируются с помощью ИИ-контента: резкий рост, плато и резкое снижение.
Чтобы доказать, что текст был создан ИИ, автор проанализировал образец с помощью двух разных инструментов обнаружения ИИ-контента: GLTR (инструмент от IBM Watson и Harvard NLP, основанный на GPT-2 и Huggingface's GPT-2 Output Detector.
Они измеряют визуальный след текста, чтобы оценить вероятность его автоматической генерации.
Google может обнаруживать ИИ-контент просто на основании того, насколько «предсказуемым» является текст, особенно по сравнению со всем остальным контентом на ту же тему в его корпусе.
Стратегический шаг для компаний заключается не в том, чтобы использовать ИИ-контент целиком, а в том, чтобы использовать такие инструменты в своих процессах создания контента, и снижать предсказуемость текста, чтобы повысить вероятность привлечения органического трафика.
Оригинал: пост Кевина Индига (https://www.kevin-indig.com/case-study-ai-content-punished-by-the-hcu-update/).
Ярким примером сгенерированного машинным интеллектом контента является https://www.throughtheclutter.com/ - он содержит профили знаменитостей и истории про фильмы. Это тот уровень качества контента, который бы понижен HCU апдейтом.
На пике они получали 1 млн переходов из Гугла. 30 августа трафик начал падать. Через неделю он упал почти до нуля.
Даже просто глядя на структуру страницы, вы можете сказать, что с ней что-то не так.
Видимость домена показывает типичное развитие трафика для сайтов, которые агрессивно масштабируются с помощью ИИ-контента: резкий рост, плато и резкое снижение.
Чтобы доказать, что текст был создан ИИ, автор проанализировал образец с помощью двух разных инструментов обнаружения ИИ-контента: GLTR (инструмент от IBM Watson и Harvard NLP, основанный на GPT-2 и Huggingface's GPT-2 Output Detector.
Они измеряют визуальный след текста, чтобы оценить вероятность его автоматической генерации.
Google может обнаруживать ИИ-контент просто на основании того, насколько «предсказуемым» является текст, особенно по сравнению со всем остальным контентом на ту же тему в его корпусе.
Стратегический шаг для компаний заключается не в том, чтобы использовать ИИ-контент целиком, а в том, чтобы использовать такие инструменты в своих процессах создания контента, и снижать предсказуемость текста, чтобы повысить вероятность привлечения органического трафика.
Growth-Memo
AI content punished by the HCU update
Google's HCU update punished low-quality AI content after all. In this case study, I show why and how to detect it.
Forwarded from 42 секунды
РБК: Microsoft и Netflix убрали ускоряющие загрузку контента серверы из России
– Их CDN-серверы были на московской точке обмена трафиком
– Речь про крупнейшую в стране точку обмена трафиком MSK-IX
– К точке MSK-IX подключены 346 различных операторов связи
– Пользователям стоит ожидать замедления работы сервисов
– Однако доступность сервисов для пользователей сохранится
– Ранее часть собственных серверов в России отключила Google
– Они использовались для ускорения загрузки YouTube и др.
@ftsec
– Их CDN-серверы были на московской точке обмена трафиком
– Речь про крупнейшую в стране точку обмена трафиком MSK-IX
– К точке MSK-IX подключены 346 различных операторов связи
– Пользователям стоит ожидать замедления работы сервисов
– Однако доступность сервисов для пользователей сохранится
– Ранее часть собственных серверов в России отключила Google
– Они использовались для ускорения загрузки YouTube и др.
@ftsec
Forwarded from noindex, nofollow
Dan Petrovic из агентства Dejan провел эксперимент: взял текст со страницы сайта Белого дома США из блока, который раскрывается только по клику, скопировал на главную собственного сайта (перед этим убедившись, что этот контент не защищен авторским правом) и через час по точной цитате был в Гугле выше первоисточника.
После того, как текст на его сайте также стал доступен только по клику, позиции страницы по точной цитате снизились.
Вывод, в общем-то, неудивительный: изначально видимый на странице контент имеет бОльшую ценность для Гугла, чем скрытый.
После того, как текст на его сайте также стал доступен только по клику, позиции страницы по точной цитате снизились.
Вывод, в общем-то, неудивительный: изначально видимый на странице контент имеет бОльшую ценность для Гугла, чем скрытый.
👍3
Forwarded from noindex, nofollow
Гугл перезапустил раздел с рекомендациями для веб-мастеров
Теперь он называется "Основы поиска" (Google Search Essentials)
и доступен по адресу https://developers.google.com/search/docs/essentials
Он содержит 3 раздела:
- Технические требования
- Политика в отношении спама
- Ключевые рекомендации (лучшие практики)
«Мы отказались от использования термина "веб-мастер" и оставалось только "Руководство для веб-мастеров". Как мы упоминали ранее, термин "веб-мастер" устарел, и очень немногие люди отождествляют себя с ним» - сообщается в блоге Центра Google поиска.
Теперь он называется "Основы поиска" (Google Search Essentials)
и доступен по адресу https://developers.google.com/search/docs/essentials
Он содержит 3 раздела:
- Технические требования
- Политика в отношении спама
- Ключевые рекомендации (лучшие практики)
«Мы отказались от использования термина "веб-мастер" и оставалось только "Руководство для веб-мастеров". Как мы упоминали ранее, термин "веб-мастер" устарел, и очень немногие люди отождествляют себя с ним» - сообщается в блоге Центра Google поиска.
#Закладки
Виды пенальти в Google → https://searchengineland.com/google-penalties-manual-actions-notifications-guide-388509
Виды пенальти в Google → https://searchengineland.com/google-penalties-manual-actions-notifications-guide-388509
Search Engine Land
Google penalties, manual actions and notifications: A complete guide
Learn all about on-page and off-page guideline violations, what Google's messaging means, and how to get a Google manual action removed.
#Закладки
"Использование ML в противодействии парсингу" в Яндексе ("Антиробот") → https://www.youtube.com/watch?v=jfQySJ9POPM
"Использование ML в противодействии парсингу" в Яндексе ("Антиробот") → https://www.youtube.com/watch?v=jfQySJ9POPM
🔥2👍1