Якщо робити якісний промпт, то можна значно підвищити вирогідність успішного результату та точність відповіді від LLM, скоротити час роботи та кількість використаних токенів. Основні паттерни гарного промпта, які були відтестовані:
https://www.reddit.com/r/PromptEngineering/comments/1nt7x7v/after_1000_hours_of_prompt_engineering_i_found/
Тримай це простим
- Неправильно: 500 слів контексту
- Правильно: Одне чітке завдання
- Приклад: Замість «Мені потрібна допомога з написанням матеріалу про Redis» використайте «Напишіть технічний посібник з кешування Redis для SEO»
- Результат: використання токенів зменшується на 70%, відповіді в 3 рази швидші
Легко перевірити
- Ваш запит повинен містити чіткі критерії успіху
- Замість «зроби це цікавішим» використайте «включи 3 конкретні SEO-тактики»
- Якщо немає можливості перевірити успіх, ШІ не зможе його виконати
- За тестами: 85% успіху з чіткими критеріями проти 41% без них
Відтворювані результати
- Уникайте часових посилань («поточні тенденції», «останні найкращі практики»)
- Використовуйте конкретні версії та точні вимоги
- Один і той же запит повинен працювати наступного тижня, наступного місяця
Вузький діапазон завдань
- Один промпт = одна мета
- Не поєднуйте контент + метаопис + внутрішні посилання в одному запиті
- Розділяйте складні завдання
- Запити з одною метою: 89% задоволеності проти 41% для багатозадачних
Явні обмеження
- Радійте ШІ, що НЕ потрібно робити
- «SEO контент» → «SEO контент. Ніяких зайвих слів. Не більше 1200 слів.»
- Обмеження зменшують небажані виходи на 91%
Логічна структура
- Форматуйте кожен запит так:
1. Контекст (вхід)
2. Завдання (функція)
3. Обмеження (параметри)
4. Формат (вихід)
Більше опису за посиланням.
https://www.reddit.com/r/PromptEngineering/comments/1nt7x7v/after_1000_hours_of_prompt_engineering_i_found/
Тримай це простим
- Неправильно: 500 слів контексту
- Правильно: Одне чітке завдання
- Приклад: Замість «Мені потрібна допомога з написанням матеріалу про Redis» використайте «Напишіть технічний посібник з кешування Redis для SEO»
- Результат: використання токенів зменшується на 70%, відповіді в 3 рази швидші
Легко перевірити
- Ваш запит повинен містити чіткі критерії успіху
- Замість «зроби це цікавішим» використайте «включи 3 конкретні SEO-тактики»
- Якщо немає можливості перевірити успіх, ШІ не зможе його виконати
- За тестами: 85% успіху з чіткими критеріями проти 41% без них
Відтворювані результати
- Уникайте часових посилань («поточні тенденції», «останні найкращі практики»)
- Використовуйте конкретні версії та точні вимоги
- Один і той же запит повинен працювати наступного тижня, наступного місяця
Вузький діапазон завдань
- Один промпт = одна мета
- Не поєднуйте контент + метаопис + внутрішні посилання в одному запиті
- Розділяйте складні завдання
- Запити з одною метою: 89% задоволеності проти 41% для багатозадачних
Явні обмеження
- Радійте ШІ, що НЕ потрібно робити
- «SEO контент» → «SEO контент. Ніяких зайвих слів. Не більше 1200 слів.»
- Обмеження зменшують небажані виходи на 91%
Логічна структура
- Форматуйте кожен запит так:
1. Контекст (вхід)
2. Завдання (функція)
3. Обмеження (параметри)
4. Формат (вихід)
Більше опису за посиланням.
Reddit
From the PromptEngineering community on Reddit
Explore this post and more from the PromptEngineering community
👍20❤2👌1
Вже зараз разом з Ігорем Рудником підбиваємо підсумки 2025
Поговоримо про зміни в галузі та тренди наступного року. Пишіть питання у чат трансляції на сесію запитань-відповідей
Долучайтеся прямо зараз 🎄 Це фінальний вебінар Collaborator сезону
👉 https://collaborator.pro/ua/events/webinar/seo_and_ai_trends_for_2026
Поговоримо про зміни в галузі та тренди наступного року. Пишіть питання у чат трансляції на сесію запитань-відповідей
Долучайтеся прямо зараз 🎄 Це фінальний вебінар Collaborator сезону
👉 https://collaborator.pro/ua/events/webinar/seo_and_ai_trends_for_2026
🔥12
Forwarded from by @shmeo
Сьогодні розберемо останні новини по SEO за цей тиждень
Відбулося багато прикольного, тож будемо розбирати найважливе
Ми трохи посунули час на 19-30. Це буде наш основний час.
Готуйте чай, каву — чи що вам до смаку. Буде цікаво!
До зустрічі в ефірі!
https://www.youtube.com/watch?v=Yu41-e42w74
Відбулося багато прикольного, тож будемо розбирати найважливе
Ми трохи посунули час на 19-30. Це буде наш основний час.
Готуйте чай, каву — чи що вам до смаку. Буде цікаво!
До зустрічі в ефірі!
https://www.youtube.com/watch?v=Yu41-e42w74
👍7
Reddit подав в суд на Perplexity, а Google судиться з SerpAPI. Все через парсінг контенту.
SerpAPI парсить Google у великих масштабах, обходить систему безпеки та captcha. Google називає їх бізнес-модель паразітарною, використовуя сотні мільонів фальшивих запитів щодня. Все це зараз дуже активно обговорюється в соцмережах.
Збільшення показів у вас в консолі при відсутності змін середньої позиції це також результати роботи автоматичних парсерів. Технічно Google вже не може з ними боротись, тому переходе в правове поле.
Анонс на SE RoundTable:
https://www.seroundtable.com/google-sues-serpapi-40631.html
Пост від гугла:
https://blog.google/technology/safety-security/serpapi-lawsuit/
SerpAPI парсить Google у великих масштабах, обходить систему безпеки та captcha. Google називає їх бізнес-модель паразітарною, використовуя сотні мільонів фальшивих запитів щодня. Все це зараз дуже активно обговорюється в соцмережах.
Збільшення показів у вас в консолі при відсутності змін середньої позиції це також результати роботи автоматичних парсерів. Технічно Google вже не може з ними боротись, тому переходе в правове поле.
Анонс на SE RoundTable:
https://www.seroundtable.com/google-sues-serpapi-40631.html
Пост від гугла:
https://blog.google/technology/safety-security/serpapi-lawsuit/
Search Engine Roundtable
Google Sues SerpApi Over Scraping Search Results
On Friday, Google announced it had filed a lawsuit against SerpApi for scraping the Google search results. Google alleges that SerpApi is running an "unlawful" operation that bypasses Google’s security measures to scrape search results at an astonishing scale.
😁21
Інші цікаві події. Понад 8 мільйонів користувачів Chrome та Edge мають розширення браузера, які збирають повні та розширені AI-розмови користувачів і передають їх для маркетингових цілей.
https://arstechnica.com/security/2025/12/browser-extensions-with-8-million-users-collect-extended-ai-conversations/
Виявлено вісім таких розширень; вони перехоплюють обміни даними з чат‑платформами (ChatGPT, Claude, Gemini, Copilot, Perplexity, DeepSeek, Grok, Meta AI) за допомогою виконавчих скриптів і надсилають дані на сервери розробників. Розробники пов'язані з Urban Cyber Security та BiScience.
Серед розширень, які мають таку бізнес-модель, в основному VPN Proxy та блокувачі реклами.
Збираються кожен запит користувача до AI, відповідь, ідентифікатори сеансів, часові мітки, метадані сеансу, використана платформа та модель.
У повідомленнях під час установки розширення може з'являтися повідомлення про обробку "ChatAI communication" та інші сигнали безпеки, але деталі збору AI‑розмов зазвичай приховані в юридичних документах; персональні дані можуть передаватися третім сторонам через "marketing analytics".
P.S. До речі, в цьому перевага DevakaTools над розширеннями )) інструмент не збирає ваші персональні дані.
https://arstechnica.com/security/2025/12/browser-extensions-with-8-million-users-collect-extended-ai-conversations/
Виявлено вісім таких розширень; вони перехоплюють обміни даними з чат‑платформами (ChatGPT, Claude, Gemini, Copilot, Perplexity, DeepSeek, Grok, Meta AI) за допомогою виконавчих скриптів і надсилають дані на сервери розробників. Розробники пов'язані з Urban Cyber Security та BiScience.
Серед розширень, які мають таку бізнес-модель, в основному VPN Proxy та блокувачі реклами.
Збираються кожен запит користувача до AI, відповідь, ідентифікатори сеансів, часові мітки, метадані сеансу, використана платформа та модель.
У повідомленнях під час установки розширення може з'являтися повідомлення про обробку "ChatAI communication" та інші сигнали безпеки, але деталі збору AI‑розмов зазвичай приховані в юридичних документах; персональні дані можуть передаватися третім сторонам через "marketing analytics".
P.S. До речі, в цьому перевага DevakaTools над розширеннями )) інструмент не збирає ваші персональні дані.
Ars Technica
Browser extensions with 8 million users collect extended AI conversations
The extensions, available for Chromium browsers, harvest full AI conversations over months.
👍8✍6😱4😁2
Screaming Frog - $270 на рік
Ahrefs Standard - $270 на місяць
Чув, багато хто каже що Frog дорогий. Тут дивлячись з чим порівнювати.
Ahrefs Standard - $270 на місяць
Чув, багато хто каже що Frog дорогий. Тут дивлячись з чим порівнювати.
💯39❤3
Forwarded from by @shmeo
AI rank tracking — це дно.
Surfer SEO порівняли два способи вимірювання AI-видимості:
• API-відповіді (те, що бачать більшість AI-tracking інструментів)
• UI-відповіді (те, що реально бачать користувачі в ChatGPT)
Один і той самий промпт. Чисте дослідження.
Результат?
- Лише 24% брендів збігаються між API та UI
- За джерелами й цитуваннями — 4% збігу
Тобто можна «ранжуватися» в AI-звітах…
і взагалі не існувати для реальних клієнтів.
https://surferseo.com/blog/llm-scraped-ai-answers-vs-api-results/
Surfer SEO порівняли два способи вимірювання AI-видимості:
• API-відповіді (те, що бачать більшість AI-tracking інструментів)
• UI-відповіді (те, що реально бачать користувачі в ChatGPT)
Один і той самий промпт. Чисте дослідження.
Результат?
- Лише 24% брендів збігаються між API та UI
- За джерелами й цитуваннями — 4% збігу
Тобто можна «ранжуватися» в AI-звітах…
і взагалі не існувати для реальних клієнтів.
https://surferseo.com/blog/llm-scraped-ai-answers-vs-api-results/
Surfer
Scraped AI Answers vs. API Results from LLMs. Is There a Difference? [AI Search Study]
There's a significant difference between actual AI answers and what their APIs show. We analyzed 1000 prompts to find these differences.
👍9🤔4😱2
Як реклама на сторінках впливає на ранжування Google (з підтвержденням DOJ-позову та витоку Content Warehouse API).
https://www.hobo-web.co.uk/how-ads-on-your-site-kill-your-google-rankings-evidence-from-google-leak/
Є тиск від гугла на зростання реклами. І є певні технічні сигнали, які це вимірюють.
clutterScore: хостовий сигнал, який виявляє та штрафує за надмірну рекламу та відволікаючі ресурси на сайті. Він може впливати на загальний рейтинг усього домену, а не лише окремих URL.
violatesMobileInterstitialPolicy та adsDensityInterstitialViolationStrength: щільність реклами на мобілках.
Page Layout Algorithm розглядається як частина більшої системи управління якістю та UX.
https://www.hobo-web.co.uk/how-ads-on-your-site-kill-your-google-rankings-evidence-from-google-leak/
Є тиск від гугла на зростання реклами. І є певні технічні сигнали, які це вимірюють.
clutterScore: хостовий сигнал, який виявляє та штрафує за надмірну рекламу та відволікаючі ресурси на сайті. Він може впливати на загальний рейтинг усього домену, а не лише окремих URL.
violatesMobileInterstitialPolicy та adsDensityInterstitialViolationStrength: щільність реклами на мобілках.
Page Layout Algorithm розглядається як частина більшої системи управління якістю та UX.
Hobo
How Ads On Your Site Kill Your Google Rankings - Evidence From Leak
Find out why Google says, "Don't let ads harm your mobile page ranking".
❤4👍3
Валенсія!
Поки не у всіх голова забита салатами, саме час для нового анонсу
☕️ WhiteHatTea за підтримки Redhead Agency повертається на сонячний південь Іспанії
🗣 Хто спікер?
Ілля Сидорчук
Head of SEO at Develux
— 7 років досвіду в SEO для конкурентних ніш та міжнародних проєктів;
— Очолює департамент із п’яти команд загальною чисельністю понад 40 спеціалістів;
📜 Тема
Як підготувати SEO-команду до нового кварталу: від хаосу до системи
📅 Коли
23 січня о 19:00
📍 Де
UAESPACE Calle Salamanca, 54, Valencia 46005
💶 Вартість участі: €50
💻 Тут найкращі люди (с)
📍Для бронювання писати організатору івенту - WELLDANOV
P.S. кількість місць обмежена і розбирають їх швидко. тому не гальмуй, снікерсуй)
Поки не у всіх голова забита салатами, саме час для нового анонсу
🗣 Хто спікер?
Ілля Сидорчук
Head of SEO at Develux
— 7 років досвіду в SEO для конкурентних ніш та міжнародних проєктів;
— Очолює департамент із п’яти команд загальною чисельністю понад 40 спеціалістів;
📜 Тема
Як підготувати SEO-команду до нового кварталу: від хаосу до системи
23 січня о 19:00
UAESPACE Calle Salamanca, 54, Valencia 46005
💶 Вартість участі: €50
💻 Тут найкращі люди (с)
📍Для бронювання писати організатору івенту - WELLDANOV
P.S. кількість місць обмежена і розбирають їх швидко. тому не гальмуй, снікерсуй)
Please open Telegram to view this post
VIEW IN TELEGRAM
😁7👍5❤1
Forwarded from Anton 🇺🇦 Krokhmal
Зробив інструмент для себе, а тепер віддаю його вам безкоштовно 🔥
Мене звати Антон https://www.linkedin.com/in/anton-krokhmal/
Я SEO-спеціаліст і трохи гік по автоматизації. Мене завжди дратувала рутина: скопіювати текст зі сторінки → відкрити вкладку з ChatGPT → вставити → отримати відповідь → повернутися назад. Це вбиває продуктивність.
Тому я й написав Bundle Chat AI.
Це Chrome-розширення, яке дозволяє спілкуватися з будь-яким сайтом, не покидаючи вкладку.
Що він вміє:
✅ Аналізувати виділений текст, картинки або весь HTML сторінки.
✅ Працювати з будь-якою моделлю (GPT, Claude, Llama, Gemini, etc) через ваш API ключ OpenRouter.
✅ Працювати приватно: історія та ключі зберігаються лише у вас локально.
✅ Зберігати вашу бібліотек промтів.
Я вирішив зробити його повністю безкоштовним. Жодних підписок.
Буду дуже вдячний, якщо встановите, потестите і напишете в коментарях, чого не вистачає. Ваша думка для мене зараз найважливіша валюта. 👇
https://bundlechat.ai/
Мене звати Антон https://www.linkedin.com/in/anton-krokhmal/
Я SEO-спеціаліст і трохи гік по автоматизації. Мене завжди дратувала рутина: скопіювати текст зі сторінки → відкрити вкладку з ChatGPT → вставити → отримати відповідь → повернутися назад. Це вбиває продуктивність.
Тому я й написав Bundle Chat AI.
Це Chrome-розширення, яке дозволяє спілкуватися з будь-яким сайтом, не покидаючи вкладку.
Що він вміє:
✅ Аналізувати виділений текст, картинки або весь HTML сторінки.
✅ Працювати з будь-якою моделлю (GPT, Claude, Llama, Gemini, etc) через ваш API ключ OpenRouter.
✅ Працювати приватно: історія та ключі зберігаються лише у вас локально.
✅ Зберігати вашу бібліотек промтів.
Я вирішив зробити його повністю безкоштовним. Жодних підписок.
Буду дуже вдячний, якщо встановите, потестите і напишете в коментарях, чого не вистачає. Ваша думка для мене зараз найважливіша валюта. 👇
https://bundlechat.ai/
bundlechat.ai
Bundle Chat AI | One Chat. All Models. Just a Click Away.
Bundle Chat AI Chrome Extension allows you to chat with any website content using your OpenRouter API key, supporting text, HTML, and images.
❤15👍10😁1🤔1😢1
Команда Phoenix Project пропонує:
Якісні багаторівневі посилання (TIER 1-6) для потужного бусту вашого старого чи нового сайту, для білої чи gambling ніші.
Що ви отримаєте
— Реальні результати за 5-30 днів, а не за півроку
— Економія до 40% при ефекті в 400-500% порівняно зі звичайним лінкбілдингом
Зібрали 600+ позитивних відгуків та 1000+ кейсів:
• Кейс 1
• Кейс 2
• Кейс 3
Кому підійде?
— iGaming-проектам будь-якого типу: монобренди, ревью-сайти, портали
— Власникам PBN: підтримати масу посилань і посилити вже отримані посилання
— Якщо ви купили PBN-сітку 10+ сайтів: піднімемо траст та вагу
— Якщо є 100+ зовнішніх посилань: прискоримо індексацію і доштовхнемо посилання, що "висять" в індекс
Скільки коштує? Ціни починаються від 10 $
Зв'язок @PPSaIesManager
***
Підписуйтесь на наш канал по лінкбілдингу, там вже 5000 сеошників, чекаємо на тебе!
#реклама #текстнадісланий
Якісні багаторівневі посилання (TIER 1-6) для потужного бусту вашого старого чи нового сайту, для білої чи gambling ніші.
Що ви отримаєте
— Реальні результати за 5-30 днів, а не за півроку
— Економія до 40% при ефекті в 400-500% порівняно зі звичайним лінкбілдингом
Зібрали 600+ позитивних відгуків та 1000+ кейсів:
• Кейс 1
• Кейс 2
• Кейс 3
Кому підійде?
— iGaming-проектам будь-якого типу: монобренди, ревью-сайти, портали
— Власникам PBN: підтримати масу посилань і посилити вже отримані посилання
— Якщо ви купили PBN-сітку 10+ сайтів: піднімемо траст та вагу
— Якщо є 100+ зовнішніх посилань: прискоримо індексацію і доштовхнемо посилання, що "висять" в індекс
Способів застосування багаторівневих посилань більше сотні (для PBN, дропів, у гемблінгу, money та white сайти).
Пишіть нам, розповімо подробиці.
Скільки коштує? Ціни починаються від 10 $
Зв'язок @PPSaIesManager
***
Підписуйтесь на наш канал по лінкбілдингу, там вже 5000 сеошників, чекаємо на тебе!
#реклама #текстнадісланий
😁11👍5❤2🌭2🔥1👌1
Різдвяна казочка.
Всі пишуть про ітоги, а я розкажу, що зі мною сталося в цьому році, що залишило незабутний слід та змінило мене.
Минулого Різдва я був на скелелазінні та щось собі пошкодив. Десь 2 місяці в мене боліла спина, а в березні я вже не зміг встати. Боліла спина, нога та все тіло. Дмитро Бондар казав, що покоління сеошників старіє, так воно і є ))
В березні я не міг ходити, не міг сидіти, не міг лежати. Кожні 2 години приймав знеболювальне. По квартирі совався якось, літерою Г, бо не міг розігнутись. Коли потрібно було проводити стріми, я вимикав камеру, бо не міг сидіти прямо. Думав, через пару днів пройде і піду в лікарню. Але хрін там. Працювати також особо не міг, реклама допомогала. Дякую, що терпіли всі ці рекламні пости і не відписувались ))
Десь за місяць до цього мене запросили на конференцію, вже купували всі квитки та забронювали гостиницю. Я такий думаю, ну за 2 тижні я маю поправитись, все буде норм. Але хрін там. Я не ходив десь 2 місяці. На скріні моя статистика по крокам щомісяця. В березені я ходив в середньому ~200 кроків на добу. Раз мене забирала швидка, бо я втратив свідомість.
Перерив весь ютуб, щоб зрозуміти, що зі мною не так. Плакав, коли дивився відео людей, які розповідали про себе. Ти їх розумієш тільки коли сам зіштовхуєся з подібною ситуацією.
Зрозумів, що проблема в мене в м'язах. Сидяча робота сеошника роками, додаткове перенапруження в спорті і капець. Не буду вдаватись в деталі, скажу тільки, що почав робити різні вправи. Перепробував багато чого з вправ. По ітогу дуже допомогли прокатування на тенісному м'ячику, прогрівання та розтяжки. В мене дома з'явився спортивний куточок, де я періодично роблю різні вправи.
За декілька місяців майже повністю відновився. Аж не віриться. Так приємно ходити прямо, та і взагалі ходити, нагинатися без болю, підніматися сходами... За цей період було над чим поміркувати та переосмислити.
Наразі зі мною все добре. Чого і вам бажаю!
Хай у вас все буде добре. Гарного Різдва!
Всі пишуть про ітоги, а я розкажу, що зі мною сталося в цьому році, що залишило незабутний слід та змінило мене.
Минулого Різдва я був на скелелазінні та щось собі пошкодив. Десь 2 місяці в мене боліла спина, а в березні я вже не зміг встати. Боліла спина, нога та все тіло. Дмитро Бондар казав, що покоління сеошників старіє, так воно і є ))
В березні я не міг ходити, не міг сидіти, не міг лежати. Кожні 2 години приймав знеболювальне. По квартирі совався якось, літерою Г, бо не міг розігнутись. Коли потрібно було проводити стріми, я вимикав камеру, бо не міг сидіти прямо. Думав, через пару днів пройде і піду в лікарню. Але хрін там. Працювати також особо не міг, реклама допомогала. Дякую, що терпіли всі ці рекламні пости і не відписувались ))
Десь за місяць до цього мене запросили на конференцію, вже купували всі квитки та забронювали гостиницю. Я такий думаю, ну за 2 тижні я маю поправитись, все буде норм. Але хрін там. Я не ходив десь 2 місяці. На скріні моя статистика по крокам щомісяця. В березені я ходив в середньому ~200 кроків на добу. Раз мене забирала швидка, бо я втратив свідомість.
Перерив весь ютуб, щоб зрозуміти, що зі мною не так. Плакав, коли дивився відео людей, які розповідали про себе. Ти їх розумієш тільки коли сам зіштовхуєся з подібною ситуацією.
Зрозумів, що проблема в мене в м'язах. Сидяча робота сеошника роками, додаткове перенапруження в спорті і капець. Не буду вдаватись в деталі, скажу тільки, що почав робити різні вправи. Перепробував багато чого з вправ. По ітогу дуже допомогли прокатування на тенісному м'ячику, прогрівання та розтяжки. В мене дома з'явився спортивний куточок, де я періодично роблю різні вправи.
За декілька місяців майже повністю відновився. Аж не віриться. Так приємно ходити прямо, та і взагалі ходити, нагинатися без болю, підніматися сходами... За цей період було над чим поміркувати та переосмислити.
Наразі зі мною все добре. Чого і вам бажаю!
Хай у вас все буде добре. Гарного Різдва!
1❤159👍16😢1
Зараз працюю з ембеддінгами, використовуючі API OpenAI та Gemini. Розкажу про деякі нюанси, про які вам варто знати.
У Gemini класний API, але судячи по вихідному коду, це обкладенка для їх Vertext AI, а не окремий API.
Плюси в тому, що можна задати тип задачі для ембеддінгу, під яку він буде оптимізований (класифікація, пошук, семантична близькість, факт-чекінг тощо). Текст можна розбивати на чанки та надсилати одразу чанками. Все обробляється доволі швидко.
Google мені всім подобається, але є нюанс по цінам та токенам.
Gemini Embeddings — 15 центів за 1 млн. токенів
Ліміт документу — 2048 токенів
При batch запитах не більше 100 одночасних
OpenAI Embeddings — 13 центів за 1млн. токенів
Ліміт документу — 8192 токенів
Може містити 50 000 реквестів при батч запитах
Тобто, у ChatGPT робота з ембеддінгами виходе дешевше, плюс кращі ліміти. Єдине що підкупає в Gemini, то що ми оптимізуємо тексти під Google, а не під ChatGPT )) все таки в них різні вектори на виході.
Моделі по-різному сприймають синоніми, довгі фрази, контекстуальні залежності. Можуть відкидати стоп-слова по-різному. Все це буде впливати на косинусну близькість. "SEO optimization" та "search engine ranking" будуть мати різні відстані в embedding space у GPT та Gemini. Чисто під SEO задачи обирав би гугл. Плюс гугл розуміє/обробляє набагато більше мов ніж ChatGPT.
Ще одна думка. Так як у Google меньше ліміти на вході (в 4 рази), можливо він (коли працює сам з векторами) при аналізі сторінок разбиває їх на невелику кількість чанків. Сторінка може містити 10-15 тис. токенів (без HTML коду), буває і більше. А на вхід оцінки (створення вектору) йде тільки 2000. То ж, робити велику кількість контенту для SEO немає сенсу. Треба знайти якийсь патент, як саме гугл розбиває контент на чанки, думаю це буде корисно.
Ось такі думки. Хто працює з ембеддінгами, розкажіть, який API використовуєте?
У Gemini класний API, але судячи по вихідному коду, це обкладенка для їх Vertext AI, а не окремий API.
Плюси в тому, що можна задати тип задачі для ембеддінгу, під яку він буде оптимізований (класифікація, пошук, семантична близькість, факт-чекінг тощо). Текст можна розбивати на чанки та надсилати одразу чанками. Все обробляється доволі швидко.
Google мені всім подобається, але є нюанс по цінам та токенам.
Gemini Embeddings — 15 центів за 1 млн. токенів
Ліміт документу — 2048 токенів
При batch запитах не більше 100 одночасних
OpenAI Embeddings — 13 центів за 1млн. токенів
Ліміт документу — 8192 токенів
Може містити 50 000 реквестів при батч запитах
Тобто, у ChatGPT робота з ембеддінгами виходе дешевше, плюс кращі ліміти. Єдине що підкупає в Gemini, то що ми оптимізуємо тексти під Google, а не під ChatGPT )) все таки в них різні вектори на виході.
Моделі по-різному сприймають синоніми, довгі фрази, контекстуальні залежності. Можуть відкидати стоп-слова по-різному. Все це буде впливати на косинусну близькість. "SEO optimization" та "search engine ranking" будуть мати різні відстані в embedding space у GPT та Gemini. Чисто під SEO задачи обирав би гугл. Плюс гугл розуміє/обробляє набагато більше мов ніж ChatGPT.
Ще одна думка. Так як у Google меньше ліміти на вході (в 4 рази), можливо він (коли працює сам з векторами) при аналізі сторінок разбиває їх на невелику кількість чанків. Сторінка може містити 10-15 тис. токенів (без HTML коду), буває і більше. А на вхід оцінки (створення вектору) йде тільки 2000. То ж, робити велику кількість контенту для SEO немає сенсу. Треба знайти якийсь патент, як саме гугл розбиває контент на чанки, думаю це буде корисно.
Ось такі думки. Хто працює з ембеддінгами, розкажіть, який API використовуєте?
👍9❤3