Metric Sense
119 subscribers
10 photos
7 links
Download Telegram
Большинство смотрит на GPU как на покупку “побольше и подороже”. Но в таких задачах, как локальный инференс, главный узкий участок — не бренд и не класс железа, а объём VRAM на фунт затрат.

Человек уже имел RTX 4080 с 16 ГБ: для игр — достаточно, для LLM — потолок. Вместо того чтобы переплачивать за топовую карту, он добрал ещё 16 ГБ серверной видеопамяти через датацентровый GPU и собрал 32 ГБ суммарно за £200. Итог: модель на 27B параметров работает локально и выдаёт ~32 токена/с.

Здесь важен не сам «дешёвый хак», а экономика решения:
— если задача упирается в память, а не в FPS, покупка consumer-GPU может быть неэффективной;
— лишняя производительность без VRAM не конвертируется в полезный результат;
— иногда оптимальный путь — не апгрейд в лоб, а пересборка архитектуры под метрику ограничения.

Хороший контрпример мейнстриму: считать не «какая карта мощнее», а «какая конфигурация даёт нужный результат за минимальную стоимость». 💾
Forwarded from Потрачено! Клуб спящих бизнесменов!
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 aff.top — вся индустрия арбитража в одном месте
🧠 Блог про арбитраж и ИИ — как нейросети меняют залив и антифрод
🚨 База спамеров — ежедневно собираем спамеров и ведём рейтинг
🛠 70+ инструментов — от клоаки до антифрод-чека
🎬 1000+ видео — весь YouTube про трафик в одной ленте
👤 2400+ персон — байеры и фаундеры с контактами напрямую
Без регистрации, без платных «премиумов».
👇 Подписывайся на канал
Сайты больше не читают только поисковые роботы. Их уже обходят LLM-агенты — и делают это не по правилам SEO, а по правилам доступа к данным.

Мейнстрим-ошибка: считать, что robots.txt всё ещё главный документ контроля. Он был про индексацию. Но индексация и использование контента для ответа пользователю — это разные вещи. Если вы не разделяете эти сценарии, то фактически отдаёте данные «на доверии», не понимая, кто и зачем их забирает.

Что меняется на практике:
— robots.txt отвечает на вопрос «можно ли сканировать»;
— LLMs.txt пытается объяснить, что именно лучше читать и как интерпретировать сайт;
— контроль агентов должен задавать не только запреты, но и допустимые сценарии использования.

Для growth-команд это не теория, а вопрос потерь. Если агент забирает контент, но не приводит трафик — классическая метрика CTR перестаёт быть релевантной. Если ответ формируется без перехода на сайт, вы теряете сессию, атрибуцию и часть воронки.

Новая точка контроля — не «попадём ли мы в индекс», а «в каком виде нас прочитают и кто получит value из нашего контента» 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
Алиса AI будет конкурировать с Google AI Studio

Яндекс разворачивает экосистему AI-агентов на базе Алисы с доступом сначала для компаний, затем для всех. Агенты уже работают в Яндекс Такси и Лавке, скоро появятся в браузере и студии разработки. Платформа интегрирует стандартные функции — заказ такси, покупки, анализ данных. Алиса AI показывает неплохие результаты: менее известна, чем конкуренты, поэтому предлагает щедрые лимиты на видеогенерацию и работу с контентом. Яндекс планирует внедрить…

➡️ Читайте на сайте: https://aff.top/blog/alisa-ai-budet-konkurirovat-s-google-ai-studio

🧠 Ещё больше инсайтов → в канале AFF.top
This media is not supported in your browser
VIEW IN TELEGRAM
В Zennoposter добавили ИИ-помощник

Zennolab добавил в Zennoposter встроенный ИИ-кубик с доступом к четырём моделям (Gemini, DeepSeek, Claude, ChatGPT) — 50 бесплатных запросов в сутки. Есть режимы Assistant (чтение) и Agent (автоматическое создание скриптов), плюс новый GET-запрос по API. Нейросети хорошо справляются с регистрацией, постингом, фармингом аккаунтов и простым кодированием, но требуют проверки при парсинге динамических сайтов и диагностике ошибок. В связке с Zennoobr…

➡️ Читайте на сайте: https://aff.top/blog/v-zennoposter-dobavili-ii-pomoschnik

🧠 Ещё больше инсайтов → в канале AFF.top
This media is not supported in your browser
VIEW IN TELEGRAM
Новую Google reCapcha прошли статичной картинкой

Google выпустил обновленную reCAPTCHA, требующую движений рук для прохождения, но система оказалась уязвима к обходу. Достаточно транслировать статичное изображение с нужным жестом через виртуальную камеру с помощью простого Python-скрипта, чтобы нейросеть пропустила пользователя. Это создает серьёзный риск для сайтов: защита от ботов, позиционировавшаяся как прорыв, на деле не работает. Баг остается актуальным и позволяет спамерам легко автомат…

➡️ Читайте на сайте: https://aff.top/blog/novuiu-google-recapcha-proshli-statichnoi-kartinkoi

🧠 Ещё больше инсайтов → в канале AFF.top
Самый «надёжный» бот часто ломается не из-за сложной атаки, а из-за банальной слепоты к рискам.

История с эксплойтом в боте для MAX — это не про хакеров-кинжалов. Это про продуктовую ошибку: безопасность встроили как декорацию, а не как часть архитектуры. В итоге один баг в логике доступа превращается в дыру в доверии, поддержке и репутации.

Для growth-продуктов это особенно болезненно:
— один инцидент убивает конверсию в активацию;
— повторные касания пользователей падают;
— CAC растёт, потому что бренд перестаёт «дожимать» органику;
— payback удлиняется, хотя в таблицах всё ещё красиво.

📉 Типичная ошибка: мерить только количество пользователей и игнорировать “security retention” — сколько людей возвращаются после инцидента.

Контринтуитивно, самый опасный риск не там, где шумно. А там, где команда уверена, что «у нас всё под контролем». Именно такая уверенность и ломает рост быстрее всего.
Forwarded from AFF.TOP
This media is not supported in your browser
VIEW IN TELEGRAM
DeepSeek представит последнюю версию v4

DeepSeek выпустит v4 в середине июля с новой моделью ценообразования API: токены подорожают в 2 раза в часы пиковой нагрузки (09:00–12:00 и 14:00–18:00 по пекинскому времени). Компания планирует уведомлять пользователей по почте за 24 часа до изменения тарифов. Проблема с ошибками «server busy» останется, но обойдётся дороже — это может существенно повлиять на экономику проектов, которые активно используют API DeepSeek для автоматизации и масшта…

➡️ Читайте на сайте: https://aff.top/blog/deepseek-predstavit-posledniuiu-versiiu-v4

🧠 Ещё больше инсайтов → в канале AFF.top
Forwarded from AFF.TOP
This media is not supported in your browser
VIEW IN TELEGRAM
Anthropic выпустили Sonnet 5

30 июня вышла Claude Sonnet 5 — новая версия позиционируется как самая агентная в линейке и приближается к флагманской Opus 4.8. Модель лучше справляется со сложными многоуровневыми задачами, устойчива к вредоносным запросам и не генерирует эксплойты. Sonnet 5 доступна на Free-тарифе, но тестирование показало скромные улучшения: хотя работает лучше Sonnet 4.6, её обгоняют конкуренты, включая китайские модели, которые дешевле через API при лучшей…

➡️ Читайте на сайте: https://aff.top/blog/anthropic-vypustili-sonnet-5

🧠 Ещё больше инсайтов → в канале AFF.top
Forwarded from AFF.TOP
This media is not supported in your browser
VIEW IN TELEGRAM
Clickstar прекращает работу

Clickstar закрывается. Легендарная пуш-сеть прекращает закуп трафика с 1 августа, полная остановка — 20 августа.

Сетка работала почти 8 лет и была одним из лучших источников качественного трафика на Россию и СНГ. Сейчас пуш-трафик стал слишком ботовым из-за гугловских банов на скрипты сбора.

Что это означает для арбитражников — разбираемся в ста…

➡️ Читайте на сайте: https://aff.top/blog/clickstar-prekraschaet-rabotu

🧠 Ещё больше инсайтов → в канале AFF.top
Kafka любят подавать как “надёжную трубу”: сообщение ушло — значит, всё обработается. На практике у consumer’а есть неприятная особенность: одно и то же событие может быть обработано повторно. И это не баг, а нормальный сценарий при сбоях, ребалансах, таймаутах и падениях после commit’а.

Контринтуитивный вывод: проблема не в том, что Kafka “плохо доставляет”, а в том, что люди путают доставку с выполнением бизнес-операции. Kafka гарантирует порядок и сохранность в рамках своей модели, но не превращает ваш код в exactly-once без дополнительных ограничений.

Что это значит для продукта и денег? Один дубль в логике “списать бонусы”, “создать заказ”, “начислить cashback” — и метрика уже искажена. Воронка выглядит лучше или хуже реальности, retention шумит, а финансы получают лишние операции 💥

Правильный вопрос не “как убрать retry”, а “как сделать обработку идемпотентной”. Потому что в distributed-системах повтор — не исключение, а базовый риск. И если это не заложено в дизайн, рано или поздно оно вылезет в проде.