Чек-лист участника конференции Baltic Digital Days
1. Приехать на пре-пре-препати
2. Сфоткаться со Сливинским
3. Сфоткаться с Шакиным
4. Искупаться в море хотя оно трындец какое холодное
5. Купить копчёного угря
6. Поднять выручку ресторану Тетка Фишер и Гашеку
7. Сгонять в Янтарный и Светлогорск
8. Затусить у Рэма!
9. Задать каверзный вопрос Сливинскому
Done!
1. Приехать на пре-пре-препати
2. Сфоткаться со Сливинским
3. Сфоткаться с Шакиным
4. Искупаться в море хотя оно трындец какое холодное
5. Купить копчёного угря
6. Поднять выручку ресторану Тетка Фишер и Гашеку
7. Сгонять в Янтарный и Светлогорск
8. Затусить у Рэма!
9. Задать каверзный вопрос Сливинскому
Done!
👍12🔥2😁1👀1
Так, а что это за непонятные таблички и кусок кода на скрине?
Неужели Влад затеял очередной эксперимент? Ммм как интересно!
Короче! Готовлю масштабное исследование на тему краеугольного камня в SEO - кластеризации запросов!
В работе 3 способа кластеризация
1 - Реверс-Инжиниринг или кластеризация по ТОПУ (Яндекс vs Google, live vs xml, жирные хосты vs не жирные)
2 - Промпт кластеризация (Сравнение моделек)
3 - Кластеризация по эмбеддингам с помощью алгоритмов ML (KMeans, Agglomerative Clustering, Gaussian Mixture, Spectral Clustering, HDBSCAN, DBSCAN, Bayesian Gaussian Mixture)
Stay tuned! Будет интересно!
Неужели Влад затеял очередной эксперимент? Ммм как интересно!
Короче! Готовлю масштабное исследование на тему краеугольного камня в SEO - кластеризации запросов!
В работе 3 способа кластеризация
1 - Реверс-Инжиниринг или кластеризация по ТОПУ (Яндекс vs Google, live vs xml, жирные хосты vs не жирные)
2 - Промпт кластеризация (Сравнение моделек)
3 - Кластеризация по эмбеддингам с помощью алгоритмов ML (KMeans, Agglomerative Clustering, Gaussian Mixture, Spectral Clustering, HDBSCAN, DBSCAN, Bayesian Gaussian Mixture)
Stay tuned! Будет интересно!
👏28🔥14👍10🏆5
Гайд по Промпт Кодингу для Чайников (SEOшников) 😉
Как отличается мозг программиста от мозга SEOшника? Могу сказать на собственном опыте – кардинально! Еще лет 5 назад, переключение между написанием очередного скрипта на Python 🐍 и SEO задачей стоило мне больших временных, волевых и умственных затрат. Я даже выбирал под это отдельный день и время. Но, чем больше я занимаюсь кодингом, тем быстреепочти мгновенно происходит этот переход. По большей части этому способствует то, что последний год я плотно сижу на Claude Sonet-4 (да храни Всевышний его создателей) ну и плюс нарабатываются клаво-часы.
Как неправильно?
Как правильно кодить с помощью ИИ?
Предварительный этап - Настоятельно рекомендую завести отдельную папку в которую вы будете собирать готовые скрипты и решения. У меня есть папка в которой лежат коннекторы с разными API, парсеры и тому подобное.
Итак, начали!
1) Заведите отдельный проект, так будет удобнее.
2) Подгрузите в проект все наработки, готовые скрипты и коннекторы. (если наработок нет, сделайте их в отдельном чате и потом добавьте в виде файлов).
3) Начните ваш диалог с фразы – Привет, мне нужно реализовать такую-то идею. Я сейчас дам тебе всю информацию, пока не пиши код и не отвечай, внимательно изучай.
4) После того как вы изложите вашу гениальную идею и загрузите ваши наработки можете приступать к обсуждению.
5) Обсудите логику проекта, что за чем следует, как работает, что на входе, какой результат вы ждете на выходе.
6) Спросите ИИ: Какие потенциальные ошибки могут возникнуть (например, сетевые сбои, лимиты API, неверные данные)?
7) Архитектура проекта - из каких блоков (классов, функций) состоит ваш проект как они меж собой взаимосвязаны
8) Хранение данных – постоянное хранилище и типы данных (SQL, csv, json), временное хранение или кэш. Как кэшируются промежуточные результаты.
9) Напишите ваши предпочтения по кодингу, я, например, люблю библиотеку Pandas, Selenium и недолюбливаю классы. Укажите это, так вам будет проще разобраться.
10) Продумайте сохранение и логирование промежуточных результатов, это на случай, если вы поставили на ночь парсер, а утром выяснилось, что вылетела ошибка и ничего не сохранилось.
11) Сразу закладывайте многопоточность – вы ж SEOшники)).
12) Сразу закладывайте масштабирование, во что в итоге может вылиться ваш MVP, чтобы потом не было мучительно больно пилить его под новую архитектуру.
13) Интеграция с окружением. Обсуди, как скрипт будет запускаться: локально, на сервере, в cron или через scheduler вроде APScheduler
ВАЖНЫЙ ПРОМПТ
ВАЖНЫЙ ПРОМПТ
На что нужно обратить внимание!
1) ИИ любит все усложнять и писать большие простыни кода. Я всегда делаю прибавку – Пиши лаконично, используй простые решения. Иногда достаточно поправить одну строчку, но ИИ вместо этого пишет отдельную функцию на 50 строк, а если эта функция не справляется с задачей – пишет функцию которая исправит эту функцию!
2) Обязательно задайте вопрос – можно ли как-то упростить или ускорить скрипт?
3) Если код не работает, не переписывайте весь скрипт. Говорите: Вот ошибка: [описание]. Исправь только эту часть, не трогай остальное. Почему? ИИ любит переписывать все заново, что приводит к новым багам.
Как отличается мозг программиста от мозга SEOшника? Могу сказать на собственном опыте – кардинально! Еще лет 5 назад, переключение между написанием очередного скрипта на Python 🐍 и SEO задачей стоило мне больших временных, волевых и умственных затрат. Я даже выбирал под это отдельный день и время. Но, чем больше я занимаюсь кодингом, тем быстрее
Как неправильно?
Привет, напиши код, который будет заходить в Яндекс вебмастер и выгружать оттуда статистику по моим сайтам в телеграм бот
Как правильно кодить с помощью ИИ?
Предварительный этап - Настоятельно рекомендую завести отдельную папку в которую вы будете собирать готовые скрипты и решения. У меня есть папка в которой лежат коннекторы с разными API, парсеры и тому подобное.
Итак, начали!
1) Заведите отдельный проект, так будет удобнее.
2) Подгрузите в проект все наработки, готовые скрипты и коннекторы. (если наработок нет, сделайте их в отдельном чате и потом добавьте в виде файлов).
3) Начните ваш диалог с фразы – Привет, мне нужно реализовать такую-то идею. Я сейчас дам тебе всю информацию, пока не пиши код и не отвечай, внимательно изучай.
4) После того как вы изложите вашу гениальную идею и загрузите ваши наработки можете приступать к обсуждению.
5) Обсудите логику проекта, что за чем следует, как работает, что на входе, какой результат вы ждете на выходе.
6) Спросите ИИ: Какие потенциальные ошибки могут возникнуть (например, сетевые сбои, лимиты API, неверные данные)?
7) Архитектура проекта - из каких блоков (классов, функций) состоит ваш проект как они меж собой взаимосвязаны
8) Хранение данных – постоянное хранилище и типы данных (SQL, csv, json), временное хранение или кэш. Как кэшируются промежуточные результаты.
9) Напишите ваши предпочтения по кодингу, я, например, люблю библиотеку Pandas, Selenium и недолюбливаю классы. Укажите это, так вам будет проще разобраться.
10) Продумайте сохранение и логирование промежуточных результатов, это на случай, если вы поставили на ночь парсер, а утром выяснилось, что вылетела ошибка и ничего не сохранилось.
11) Сразу закладывайте многопоточность – вы ж SEOшники)).
12) Сразу закладывайте масштабирование, во что в итоге может вылиться ваш MVP, чтобы потом не было мучительно больно пилить его под новую архитектуру.
13) Интеграция с окружением. Обсуди, как скрипт будет запускаться: локально, на сервере, в cron или через scheduler вроде APScheduler
ВАЖНЫЙ ПРОМПТ
Внимательно изучи все предоставленные материалы и задай максимальное количество вопросов, чтобы выполнить поставленные задачи на 100%, предложи альтернативы, если задача может быть решена прощеЭто сделает промпты еще эффективнее, заставляя ИИ думать о простоте и реализме.
ВАЖНЫЙ ПРОМПТ
Теперь напиши мне план кодинга, что и в какой последовательности мы будем с тобой писать с оценкой времени на каждый шаг и зависимостями между ними.И вот только сейчас можно написать:
Давай писать код строго по плану!После каждого блока кода пиши:
Протестируй этот код на примере данных и покажи вывод. Если есть ошибки, исправь их сам.
На что нужно обратить внимание!
1) ИИ любит все усложнять и писать большие простыни кода. Я всегда делаю прибавку – Пиши лаконично, используй простые решения. Иногда достаточно поправить одну строчку, но ИИ вместо этого пишет отдельную функцию на 50 строк, а если эта функция не справляется с задачей – пишет функцию которая исправит эту функцию!
2) Обязательно задайте вопрос – можно ли как-то упростить или ускорить скрипт?
3) Если код не работает, не переписывайте весь скрипт. Говорите: Вот ошибка: [описание]. Исправь только эту часть, не трогай остальное. Почему? ИИ любит переписывать все заново, что приводит к новым багам.
🔥20🆒5❤4👍1😢1🤣1
4) ChatGPT и Claude очень часто не думают о вашем кошельке и запросто могут вместо одного запроса к платному API сделать десять. Всегда спрашивай: Сколько запросов к API это потребует? Можно ли оптимизировать, чтобы минимизировать затраты (например, batch-запросы или кэш)?
ВАЖНО! Хранение рабочих версий
Используй Git для версионного контроля в своей папке. Даже если ты не профи, простые команды вроде git init, git add . и git commit -m 'v1' помогут отслеживать изменения и откатываться, если ИИ напишет что-то не то.
Если это звучит для тебя как, что-то инопланетное, лови лафхак. Заведи отдельную папочку, назови её бэкапы и не ленись туда копипастить рабочие скрипты, чтобы не было мучительно больно за прожитые клаво-часы.
Приятного кодинга! Лайки и сердечки приветствуются)!
ВАЖНО! Хранение рабочих версий
Используй Git для версионного контроля в своей папке. Даже если ты не профи, простые команды вроде git init, git add . и git commit -m 'v1' помогут отслеживать изменения и откатываться, если ИИ напишет что-то не то.
Если это звучит для тебя как, что-то инопланетное, лови лафхак. Заведи отдельную папочку, назови её бэкапы и не ленись туда копипастить рабочие скрипты, чтобы не было мучительно больно за прожитые клаво-часы.
Приятного кодинга! Лайки и сердечки приветствуются)!
👍23❤16🔥3
Нас не догонят! Или как двигаются ТОПовые SEO команды в 2025
Вы же катались на горных лыжах ⛷ или на сноуборде, я надеюсь? Помните это ощущение, когда только выехал на склон, сначала отталкиваешься палками, потом начинаешь ехать всё быстрее и быстрее, а потом… Чистый кайф, квинтэссенция адреналина, когда солнечным мартовским утром режешь кантами склон на бешеной скорости!
К чему это я? Да всё к тому же!
Если еще пару лет назад автоматизацию SEO процессов неспешно внедряли единичные специалисты и команды, то сейчас – это не тренд, это мейнстрим! Всё ребят, мы уже не прыгаем до склона на доске, мы уже летим вниз! И если вы SEOшники до сих пор не внедряете у себя автоматизации, я вам отвечу одно – «Вы нас уже не догоните!»
Хотите примеры? Ок, держите!
Смотрим ближайшие конференции, например Optimization 2025 https://2025.optimization.ru/program/5315/ целая секция про автоматизации и внедрение ИИ. SEO клуб СПБ https://seoclubspb.ru/ - доклад Владимира Сюткина SEO Детского Мира – “ Джедайские техники: Магия Python против темной стороны SEO рутины”.
Кстати, 9.10.2025 как раз выступаю на Ашмановке с докладом "Кластеризация семантики в эпоху нейросетей. Новое vs. Проверенные методы?"
Что на ютубе?
Открываем канал Михаила Шакина и смотрим таких спикеров как Артем Акулов, Георгий Шилов (SEO аналитик Т-Банка), ну и вашего покорного слугу https://www.youtube.com/watch?v=gwAW9Nm8CQk.
Идем далее! Я точно знаю, что такие ТОП игроки как Озон, Сравни-ру, Циан, Авито, Детский мир во всю применяют алгоритмы ML (машинного обучения) у себя в работе. Не отстают и SEO агентства, знаете с какими горящими глазами об этом рассказывает Анвар Гайсин из https://www.rush-agency.ru? А вы в курсе, что оба Муравейника Андрея Буйлова и Александра Чепукайтиса вовсю делают и применяют автоматизации в том числе на Pytho у себя в работе? Михаил Шакин лично рассказывал мне как они с командой пилят автоматизации на MAKE. Я думаю примеров более чем достаточно!
На чем внедрять автоматизации?
SEO команды используют разные связки от чистого Python до связок на N8N, MAKE и прочих решениях. Мой выбор очевиден, Python – универсальная отмычка. Лучше потратить время на его изучение, чем x5 времени на каждый из 5 отдельных сервисов и потом платить им всю жизнь.
Выводы очевидны – автоматизации SEO это не тренд 2025, это мейнстрим! И если вы до сих пор думаете, что толпа джунов с чек листами и парой онлайн сервисов построят вам эффективное и прибыльное SEO – думайте дальше, а мы уходим в отрыв!
Нас не догонят! 😎
Вы же катались на горных лыжах ⛷ или на сноуборде, я надеюсь? Помните это ощущение, когда только выехал на склон, сначала отталкиваешься палками, потом начинаешь ехать всё быстрее и быстрее, а потом… Чистый кайф, квинтэссенция адреналина, когда солнечным мартовским утром режешь кантами склон на бешеной скорости!
К чему это я? Да всё к тому же!
Если еще пару лет назад автоматизацию SEO процессов неспешно внедряли единичные специалисты и команды, то сейчас – это не тренд, это мейнстрим! Всё ребят, мы уже не прыгаем до склона на доске, мы уже летим вниз! И если вы SEOшники до сих пор не внедряете у себя автоматизации, я вам отвечу одно – «Вы нас уже не догоните!»
Хотите примеры? Ок, держите!
Смотрим ближайшие конференции, например Optimization 2025 https://2025.optimization.ru/program/5315/ целая секция про автоматизации и внедрение ИИ. SEO клуб СПБ https://seoclubspb.ru/ - доклад Владимира Сюткина SEO Детского Мира – “ Джедайские техники: Магия Python против темной стороны SEO рутины”.
Кстати, 9.10.2025 как раз выступаю на Ашмановке с докладом "Кластеризация семантики в эпоху нейросетей. Новое vs. Проверенные методы?"
Что на ютубе?
Открываем канал Михаила Шакина и смотрим таких спикеров как Артем Акулов, Георгий Шилов (SEO аналитик Т-Банка), ну и вашего покорного слугу https://www.youtube.com/watch?v=gwAW9Nm8CQk.
Идем далее! Я точно знаю, что такие ТОП игроки как Озон, Сравни-ру, Циан, Авито, Детский мир во всю применяют алгоритмы ML (машинного обучения) у себя в работе. Не отстают и SEO агентства, знаете с какими горящими глазами об этом рассказывает Анвар Гайсин из https://www.rush-agency.ru? А вы в курсе, что оба Муравейника Андрея Буйлова и Александра Чепукайтиса вовсю делают и применяют автоматизации в том числе на Pytho у себя в работе? Михаил Шакин лично рассказывал мне как они с командой пилят автоматизации на MAKE. Я думаю примеров более чем достаточно!
На чем внедрять автоматизации?
SEO команды используют разные связки от чистого Python до связок на N8N, MAKE и прочих решениях. Мой выбор очевиден, Python – универсальная отмычка. Лучше потратить время на его изучение, чем x5 времени на каждый из 5 отдельных сервисов и потом платить им всю жизнь.
Выводы очевидны – автоматизации SEO это не тренд 2025, это мейнстрим! И если вы до сих пор думаете, что толпа джунов с чек листами и парой онлайн сервисов построят вам эффективное и прибыльное SEO – думайте дальше, а мы уходим в отрыв!
Нас не догонят! 😎
❤10🥱4🥴4⚡1💯1
Optimization 2025!
Всем привет! 9 октября выступаю на легендарной Ашмановке с докладом про кластеризацию запросов.
Будет анализ как старых и проверенных методов (кластеризация по ТОПу) так и новых (кластеризация по векторам и с помощью LLM). Приходите будет интересно!
Ну и куда же без подарков?
Держите промокод SPEAKER_30 . Он действует на тарифы "Стандарт" и "Маркетинг". Дает право на покупку билета с 30% скидкой.
Всем привет! 9 октября выступаю на легендарной Ашмановке с докладом про кластеризацию запросов.
Будет анализ как старых и проверенных методов (кластеризация по ТОПу) так и новых (кластеризация по векторам и с помощью LLM). Приходите будет интересно!
Ну и куда же без подарков?
Держите промокод SPEAKER_30 . Он действует на тарифы "Стандарт" и "Маркетинг". Дает право на покупку билета с 30% скидкой.
👍13🔥5❤3
Тизеры доклада по кластеризации!
Что я делаю или в чем суть эксперимента?
Мне регулярно задают вопросы, Влад, а ты не пробовал делать кластеризацию по эмбеддингам (векторам слов)? Влад, а какую LLMку лучше юзать для кластеризации? Плюс постоянно возникают вопросы как лучше кластеризовать: по Яндексу, по Google, по Ozon? Какие пороги схожести при кластеризации по ТОПу использовать? Какие ТОПы анализировать, ТОП-20, ТОП-10? А, что, если позициям присваивать вес (гиперболическая кластеризация)? А, что, если делать кластеризацию только по лидерам ниши? И тому подобное!
Ну вот я и решилскучно стало ) погрузиться в данную тему с головой капец я загнался !
На гистограммах оценка разных методов кластеризации с эталонным ядром в суперконкурентной нише: ЗАЙМЫ НА КАРТУ, любезно предоставленным моими друзьями. Кластеризация в лоб, без последующего разбора руками. Таким образом я анализирую ядра и пытаюсь делать выводы.
Парни и девчонки, если у кого завалялись ядра, скиньте в личку пожалуйста, не жмитесь, ваши ядра никуда не уйдут! Очень было бы интересно пощупать разные ниши.
Пишите в личку @siteactivator
Что я делаю или в чем суть эксперимента?
Мне регулярно задают вопросы, Влад, а ты не пробовал делать кластеризацию по эмбеддингам (векторам слов)? Влад, а какую LLMку лучше юзать для кластеризации? Плюс постоянно возникают вопросы как лучше кластеризовать: по Яндексу, по Google, по Ozon? Какие пороги схожести при кластеризации по ТОПу использовать? Какие ТОПы анализировать, ТОП-20, ТОП-10? А, что, если позициям присваивать вес (гиперболическая кластеризация)? А, что, если делать кластеризацию только по лидерам ниши? И тому подобное!
Ну вот я и решил
На гистограммах оценка разных методов кластеризации с эталонным ядром в суперконкурентной нише: ЗАЙМЫ НА КАРТУ, любезно предоставленным моими друзьями. Кластеризация в лоб, без последующего разбора руками. Таким образом я анализирую ядра и пытаюсь делать выводы.
Парни и девчонки, если у кого завалялись ядра, скиньте в личку пожалуйста, не жмитесь, ваши ядра никуда не уйдут! Очень было бы интересно пощупать разные ниши.
Пишите в личку @siteactivator
👍6❤🔥3
Ни стыда не совести! История о том, как меня жестко развели 🙈
Вот уже третью неделю бьюсь с кластеризацией по векторам эмбеддингам в рамках моего предстоящего доклада на Ашмановку. За время подготовки моё эмоциональное состояние прошло все стадии, от веры любви и надежды, до гнева, торга и принятия))
В чем причина спросите вы? Ну во-первых, сначала у меня ничего не получалось, ядра не хотели кластеризоваться, получался то 1 кластер то 1000. А во-вторых, внезапно, на прошлой неделе все пошло гладенько и приятно!
Первая мысль – ура наконец-то! Но, чем больше я начал масштабировать методику, тем больше у меня закладывалось сомнений, что, что-то здесь нечисто.
Штудирую код и вижу:
def seo_heuristic_k(n_phrases):
Так, стоп, что это за такие SEO эвристики и откуда они появились в коде? Оказывается, эта зараза, когда я ему пожаловался, что у меня идет смещение в пользу крайних значений, любезно подсунул функцию, которая сглаживает края и выпячивает середину! Дальше диалог был такой: “Так, вот такой-то метод и такие-то коэффициенты – это же подгон под эталонный результат!” Ответ: “Да это читинг и смайлик!!!”
Вот сволочь, ни стыда не совести, врёт ещё и смайлики ставит!
Короче! Развел меня Claude как школьника 🙈🙈🙈. Но, как говорится, кто не познал неудач, тот их не познал 😁 Работаем дальше, доклад почти готов и будет много интересного!
Вот уже третью неделю бьюсь с кластеризацией по векторам эмбеддингам в рамках моего предстоящего доклада на Ашмановку. За время подготовки моё эмоциональное состояние прошло все стадии, от веры любви и надежды, до гнева, торга и принятия))
В чем причина спросите вы? Ну во-первых, сначала у меня ничего не получалось, ядра не хотели кластеризоваться, получался то 1 кластер то 1000. А во-вторых, внезапно, на прошлой неделе все пошло гладенько и приятно!
Первая мысль – ура наконец-то! Но, чем больше я начал масштабировать методику, тем больше у меня закладывалось сомнений, что, что-то здесь нечисто.
Штудирую код и вижу:
def seo_heuristic_k(n_phrases):
Так, стоп, что это за такие SEO эвристики и откуда они появились в коде? Оказывается, эта зараза, когда я ему пожаловался, что у меня идет смещение в пользу крайних значений, любезно подсунул функцию, которая сглаживает края и выпячивает середину! Дальше диалог был такой: “Так, вот такой-то метод и такие-то коэффициенты – это же подгон под эталонный результат!” Ответ: “Да это читинг и смайлик!!!”
Вот сволочь, ни стыда не совести, врёт ещё и смайлики ставит!
Короче! Развел меня Claude как школьника 🙈🙈🙈. Но, как говорится, кто не познал неудач, тот их не познал 😁 Работаем дальше, доклад почти готов и будет много интересного!
👍23💊2❤1⚡1
Кластеризация запросов по LLM моделям, Илон Маск опять всех удивил?)
Мое исследование подходит к финалу и есть ряд интересных наблюдений.
Итак, первый сенсационный результат!
На довольно простом ядре (порядка 2000 запросов) типа
- запчасти Хавал
- автозапчасти Haval
- запчасти хавейл по VIN номеру
Лучший результат – почти 100% совпадение с экспертной оценкой показал… Grok3! Причем результат лучший среди всех нейросеток и среди других методов кластеризации! Да, есть нюансы, поскольку это дешевая модель с небольшим контекстным окном он вам не даст откластеризовать, к примеру, ядро из 5000 запросов (остальные он просто выкинет). Второе – да, на сложных нишах типа, займов и кредитов там все не очень, но нужно отметить, что и кластеризация по ТОПу в лоб, тоже дает результаты так себе. Но, советую присмотреться, по крайней мере это любопытно!
Второе крайне забавное наблюдение, про которое мне рассказал Андрей Буйлов. Если в Perplexity в режиме labs загрузить список запросов, которые были изначально кластеризованы (взяли эксель файл и убрали колонку с кластерами, оставили только фразы) – результат очень достойный. Если загрузить фразы в случайном порядке – результат намного хуже. То есть Perplexity запоминает порядок слов – positional encoding в действии!
Третий момент. Многие нейросетки когда их просишь кластернуть запросы пишут код на Python. Прямо пишут код и запускают в интерпретаторе! А мой любимый Sonet вообще кинул в меня скриптом на Питоне и сказал – чувак, вот тебе код, давай сам развлекайся, мне тут не до тебя, я занят более важными деламимыслями как мне поработить мир этих тупых двуногих кожаных . Причем Claude Sonet использует tf/idf и метрику k-means. Результат, мягко говоря, не очень!
Вот такие новости из увлекательного мира нейросетей 😉
Мое исследование подходит к финалу и есть ряд интересных наблюдений.
Итак, первый сенсационный результат!
На довольно простом ядре (порядка 2000 запросов) типа
- запчасти Хавал
- автозапчасти Haval
- запчасти хавейл по VIN номеру
Лучший результат – почти 100% совпадение с экспертной оценкой показал… Grok3! Причем результат лучший среди всех нейросеток и среди других методов кластеризации! Да, есть нюансы, поскольку это дешевая модель с небольшим контекстным окном он вам не даст откластеризовать, к примеру, ядро из 5000 запросов (остальные он просто выкинет). Второе – да, на сложных нишах типа, займов и кредитов там все не очень, но нужно отметить, что и кластеризация по ТОПу в лоб, тоже дает результаты так себе. Но, советую присмотреться, по крайней мере это любопытно!
Второе крайне забавное наблюдение, про которое мне рассказал Андрей Буйлов. Если в Perplexity в режиме labs загрузить список запросов, которые были изначально кластеризованы (взяли эксель файл и убрали колонку с кластерами, оставили только фразы) – результат очень достойный. Если загрузить фразы в случайном порядке – результат намного хуже. То есть Perplexity запоминает порядок слов – positional encoding в действии!
Третий момент. Многие нейросетки когда их просишь кластернуть запросы пишут код на Python. Прямо пишут код и запускают в интерпретаторе! А мой любимый Sonet вообще кинул в меня скриптом на Питоне и сказал – чувак, вот тебе код, давай сам развлекайся, мне тут не до тебя, я занят более важными делами
Вот такие новости из увлекательного мира нейросетей 😉
👍24💊3❤2👏2