This media is not supported in your browser
VIEW IN TELEGRAM
Привет, друзья! ИИ-инженер построил небольшую систему на базе ИИ, которая считает картофель, движущийся по конвейерной ленте
Никаких массивных наборов данных и тяжелых моделей - просто четкая задача и настройка, которая подходит для этой работы.
Он использовал Ultralytics ObjectCounter с крошечной нано-моделью YOLO11 и обучил ее на одном аннотированном кадре с помощью SAM 2 от Meta* (система, которая быстро сегментирует и маркирует объекты на изображениях и видео), поскольку никакого набора данных по картофелю не существовало.
Этого единственного изображения оказалось достаточно, чтобы система могла работать с полным видео в режиме реального времени.
*Деятельность Meta запрещена на территории РФ
Автор видео: IlirAliu_ в X
#интересное
Нейросети: Волшебство ИИ
Никаких массивных наборов данных и тяжелых моделей - просто четкая задача и настройка, которая подходит для этой работы.
Он использовал Ultralytics ObjectCounter с крошечной нано-моделью YOLO11 и обучил ее на одном аннотированном кадре с помощью SAM 2 от Meta* (система, которая быстро сегментирует и маркирует объекты на изображениях и видео), поскольку никакого набора данных по картофелю не существовало.
Этого единственного изображения оказалось достаточно, чтобы система могла работать с полным видео в режиме реального времени.
*Деятельность Meta запрещена на территории РФ
Автор видео: IlirAliu_ в X
#интересное
Нейросети: Волшебство ИИ
👍2
Forwarded from NN
ИИ победил писателей: рассказы от нейронок начали нравиться людям в разы чаще, чем публикации живых авторов.
Для эксперимента в MIT дообучили GPT-4o на работах 50 известных писателей. Читатели оценили нейротексты выше по качеству и стилю. В 97% случаев их даже не смогли отличить от написанных человеком.
При этом обучение модели оказалось в 300 раз дешевле, чем работа писателя.
Для эксперимента в MIT дообучили GPT-4o на работах 50 известных писателей. Читатели оценили нейротексты выше по качеству и стилю. В 97% случаев их даже не смогли отличить от написанных человеком.
При этом обучение модели оказалось в 300 раз дешевле, чем работа писателя.
Сегодня ChatGPT исполнилось три года. Уже три года. Всего три года.
👍1😱1
Разработчики открыли «суперсилы» ИИ-агентов: на GitHub вышла библиотека готовых воркфлоу для продвинутого вайбкодинга.
Одной короткой командой бота можно попросить построить сложный план проекта, структурировать разработку, написать тесты для каждой фичи и провести код-ревью. Работает с Claude Code, Codex и OpenCode.
Превращаем агентов в суперпрограммистов здесь.
Одной короткой командой бота можно попросить построить сложный план проекта, структурировать разработку, написать тесты для каждой фичи и провести код-ревью. Работает с Claude Code, Codex и OpenCode.
Превращаем агентов в суперпрограммистов здесь.
👍2
ИНТЕРНЕТ_РЕКЛАМА_2025_КОНЕЦ_ИГРЫ 2.pdf
15.7 MB
Немного циничный взгляд на Интернет-рекламу 2025-26. Без "соплей умиления" и ожидания ИИ-благоденствия.
🔥2
ЛАЙФХАК — ДВОЙНОЙ УДАР: короткие ролики ловят внимание, а одна хорошо сделанная длинная VSL‑видео уже дожимает до денег.
Как устроена воронка
- Сверху — короткие ролики до 60 секунд в TikTok, Shorts и Reels. Они нужны только для одного: зацепить взгляд, вызвать интерес и отправить человека «ниже» по воронке, а не сразу что‑то продать.
- Дальше человек попадает на VSL (я чуть выше давал полную расскладку как такие видео создавать) — продающее видео от 2 до 10+ минут, где спокойно, по шагам, объясняется проблема, показывается решение, выгоды и призыв купить/оставить заявку.
Получается «двухскоростной двигатель»: быстрые ролики крутят охват и трафик, VSL делает основную работу по продаже.
Почему это так хорошо работает
- Короткие видео платформы сами разгоняют алгоритмами: охват большой, делать их быстро и дешево, но продавать прямо из них сложно — внимания мало, доверия нет, чек часто высокий.
- VSL, наоборот, смотрят уже более мотивированные люди: у них выше доверие и готовность слушать, поэтому конверсия в заявку/оплату и итоговый ROI заметно выше, особенно для SaaS и дорогих продуктов.
Проще говоря: короткие видео — это «дешёвый вход», VSL — «дорогой выход». В сумме эта микро‑воронка выжимает максимум из трафика и даёт сильно больше прибыли, чем попытка «убедить и продать» в одном 30‑секундном ролике.
Как устроена воронка
- Сверху — короткие ролики до 60 секунд в TikTok, Shorts и Reels. Они нужны только для одного: зацепить взгляд, вызвать интерес и отправить человека «ниже» по воронке, а не сразу что‑то продать.
- Дальше человек попадает на VSL (я чуть выше давал полную расскладку как такие видео создавать) — продающее видео от 2 до 10+ минут, где спокойно, по шагам, объясняется проблема, показывается решение, выгоды и призыв купить/оставить заявку.
Получается «двухскоростной двигатель»: быстрые ролики крутят охват и трафик, VSL делает основную работу по продаже.
Почему это так хорошо работает
- Короткие видео платформы сами разгоняют алгоритмами: охват большой, делать их быстро и дешево, но продавать прямо из них сложно — внимания мало, доверия нет, чек часто высокий.
- VSL, наоборот, смотрят уже более мотивированные люди: у них выше доверие и готовность слушать, поэтому конверсия в заявку/оплату и итоговый ROI заметно выше, особенно для SaaS и дорогих продуктов.
Проще говоря: короткие видео — это «дешёвый вход», VSL — «дорогой выход». В сумме эта микро‑воронка выжимает максимум из трафика и даёт сильно больше прибыли, чем попытка «убедить и продать» в одном 30‑секундном ролике.
❤1
SEO мертв. AI убил его.
Я вам скажу то, что гугл-специалисты не хотят вам рассказывать: их профессия исчезает.
2025 год. Органический трафик падает на -25%, потому что люди уже не ломают голову над поиском — они просто пишут вопрос в AI-ассистент и получают готовый ответ. Зачем лезть в Google?
Но есть лазейка.
- Те, кто правильно разметил свой контент через Schema.org, получают +40% видимости в AI-ответах. Их данные берут из первых источников. Их показывают первыми.
Примеры:
- Ищешь врача → AI показывает его профиль, рейтинг, часы работы (если он разметил через Schema.org)
- Ищешь товар → выводит описание, цену, доступность (если у магазина правильная разметка)
- Ищешь сервис → показывает контакты и FAQ (если заполнено через Schema.org)
Вывод: SEO как было — мертв. Встречаем AEO — оптимизацию для AI-движков.
Если ты ещё оптимизируешь сайт под Google и ключевые слова, то опаздываешь на 3 года.
Разметь свой бизнес правильно — и будешь везде. Не разметишь — станешь невидимкой, пока конкуренты крадут твоих клиентов.
Я вам скажу то, что гугл-специалисты не хотят вам рассказывать: их профессия исчезает.
2025 год. Органический трафик падает на -25%, потому что люди уже не ломают голову над поиском — они просто пишут вопрос в AI-ассистент и получают готовый ответ. Зачем лезть в Google?
Но есть лазейка.
- Те, кто правильно разметил свой контент через Schema.org, получают +40% видимости в AI-ответах. Их данные берут из первых источников. Их показывают первыми.
Примеры:
- Ищешь врача → AI показывает его профиль, рейтинг, часы работы (если он разметил через Schema.org)
- Ищешь товар → выводит описание, цену, доступность (если у магазина правильная разметка)
- Ищешь сервис → показывает контакты и FAQ (если заполнено через Schema.org)
Вывод: SEO как было — мертв. Встречаем AEO — оптимизацию для AI-движков.
Если ты ещё оптимизируешь сайт под Google и ключевые слова, то опаздываешь на 3 года.
Разметь свой бизнес правильно — и будешь везде. Не разметишь — станешь невидимкой, пока конкуренты крадут твоих клиентов.
Ozon? Забудьте. Telegram — новая экосистема продаж.
"Пользователь больше не покидает своих экосистем - в РФ это 61% — Telegram, но где то и WB | Ozon". Изучайте где ваша аудитория.
Почему это рушит рынок — работайте внутри экосистем (например):
Telegram Ads → Push (61% открытий!) → Mini App → Telegram Payments = замкнутый круг. (а вчера Павел Дуров объявил о своей платформе нейро-серверов - это замыкает экосистему на 1 млрд подписчиков - это входящая в топ - 7-10 экосистем мира).
Нет перехода в броузер, нет оттока, нет потерь 70% трафика на переходах.
Факты без воды:
- ROI 3-4x (кейсы показывают до 12x конверсий)
- LTV +15% в Mini Apps (подписки, IAP)
- Клиент платит в один клик, вы — богатеете.
SEO-шники, e-com'щики — проснитесь. Постройте в TG, или конкуренты съедят ваш трафик. (справедливо для мамочек в WB - там меняем TG на WB
"Пользователь больше не покидает своих экосистем - в РФ это 61% — Telegram, но где то и WB | Ozon". Изучайте где ваша аудитория.
Почему это рушит рынок — работайте внутри экосистем (например):
Telegram Ads → Push (61% открытий!) → Mini App → Telegram Payments = замкнутый круг. (а вчера Павел Дуров объявил о своей платформе нейро-серверов - это замыкает экосистему на 1 млрд подписчиков - это входящая в топ - 7-10 экосистем мира).
Нет перехода в броузер, нет оттока, нет потерь 70% трафика на переходах.
Факты без воды:
- ROI 3-4x (кейсы показывают до 12x конверсий)
- LTV +15% в Mini Apps (подписки, IAP)
- Клиент платит в один клик, вы — богатеете.
SEO-шники, e-com'щики — проснитесь. Постройте в TG, или конкуренты съедят ваш трафик. (справедливо для мамочек в WB - там меняем TG на WB
Вышли DeepSeek-V3.2 и DeepSeek-V3.2-Speciale — новые флагманские модели от китайских разработчиков.
Обе модели по бенчмаркам не уступают GPT-5 и Gemini 3 Pro, а в контестах по математике и информатике оказались даже лучше.
Базовую DeepSeek-V3.2 уже можно бесплатно опробовать здесь. Более «умную» пока отдают только через API.
Обе модели по бенчмаркам не уступают GPT-5 и Gemini 3 Pro, а в контестах по математике и информатике оказались даже лучше.
Базовую DeepSeek-V3.2 уже можно бесплатно опробовать здесь. Более «умную» пока отдают только через API.
GPU на вес золота, но последнее всё ещё стоит дороже
Встречаем понедельник с забавной аналитикой. The Register решили проверить, что было ценнее в последние годы — передовые GPU от Nvidia или старые добрые драгметаллы. И сравнили честно, по-рыночному: в пересчёте на массу в унциях (1 унция = 28,3 г).
Результат порадует консервативных инвесторов. Золото всё ещё держится выше и его стоимость растёт быстрее рынка GPU.
Платина и палладий при таких расчётах тоже остаются дороже GPU. Германий — примерно вдвое дешевле. А серебро, галлий и особенно медь на фоне всей этой роскоши выглядят почти бесплатными.
@anti_agi
Встречаем понедельник с забавной аналитикой. The Register решили проверить, что было ценнее в последние годы — передовые GPU от Nvidia или старые добрые драгметаллы. И сравнили честно, по-рыночному: в пересчёте на массу в унциях (1 унция = 28,3 г).
Результат порадует консервативных инвесторов. Золото всё ещё держится выше и его стоимость растёт быстрее рынка GPU.
В 2024 году цена на графические ускорители достигла пика — чуть менее $650 за унцию — на модели Hopper H200. Но золото к концу года стоило в 4 раза дороже — $2624. В этом году разрыв составил уже 12,4 раза: Blackwell B200 SXM6 торгуется по цене около $330 за унцию, в то время как цена на золото взлетела до более чем $4 тысяч.
Платина и палладий при таких расчётах тоже остаются дороже GPU. Германий — примерно вдвое дешевле. А серебро, галлий и особенно медь на фоне всей этой роскоши выглядят почти бесплатными.
@anti_agi
Почти как в кино: вышел генератор видео Runway Gen 4.5 — по качеству модель обогнала Veo 3, Klink и Sora 2 Pro.
Gen 4.5 хорошо понимает законы физики и справляется с динамичными кадрами. Можно настраивать движения камеры, композицию, звук и другие детали сцены.
Протестировать можно тут. Доступ будут открывать поэтапно.
Gen 4.5 хорошо понимает законы физики и справляется с динамичными кадрами. Можно настраивать движения камеры, композицию, звук и другие детали сцены.
Протестировать можно тут. Доступ будут открывать поэтапно.
Media is too big
VIEW IN TELEGRAM
Kling выпустил видеоредактор O1
Работает как Nano Banana, но с видео. Генерирует по референсам, меняет стиль, угол съемки, объекты и всё остальное по текстовым промптам.
Можно попробовать бесплатно тут: https://app.klingai.com/global/omni/new
Работает как Nano Banana, но с видео. Генерирует по референсам, меняет стиль, угол съемки, объекты и всё остальное по текстовым промптам.
Можно попробовать бесплатно тут: https://app.klingai.com/global/omni/new
Топ фондов по числу ранних инвестиций в будущих единорогов
Учитывались только Series A и более ранние стадии.
https://www.linkedin.com/posts/ilyavcandpe_top-early-stage-unicorn-vcs-sequoia-capital-share-7391864243748352001-lBpj
Учитывались только Series A и более ранние стадии.
https://www.linkedin.com/posts/ilyavcandpe_top-early-stage-unicorn-vcs-sequoia-capital-share-7391864243748352001-lBpj
Вышедший из тени стартап со скромным названием OpenAGI заявил, что его собственная модель по имени Lux на тесте Online-Mind2Web для автономных агентов легко бьет всех именитых конкурентов (картинка выше).
Достигнуто это за счет того, что Lux -- не дообученная LLM, а модель, которую изначально учили на выходе совершать действия, а не тексты генерить: "By contrast, our model learns to produce actions. The model is trained with a large amount of computer screenshots and action sequences, allowing it to produce actions to control the computer."
Она работает не только в браузере, как многие другие агенты, а может и управлять другими приложениями, хоть Slack, хоть Excel. Модель может работать в трех режимах с говорящими названиями Tasker, Actor и Thinker. На страничке проекта немало громких слов про парадигмальные сдвиги и пр., но тут лучше подождать результатов массового независимого тестирования. Стартап как раз и призывает начать пробовать: Try our developer-friendly SDKs, frameworks, and UX template - all wired into Lux, the world’s most advanced computer use model.
https://venturebeat.com/ai/openagi-emerges-from-stealth-with-an-ai-agent-that-it-claims-crushes-openai
Страница собственно проекта — https://www.agiopen.org
Достигнуто это за счет того, что Lux -- не дообученная LLM, а модель, которую изначально учили на выходе совершать действия, а не тексты генерить: "By contrast, our model learns to produce actions. The model is trained with a large amount of computer screenshots and action sequences, allowing it to produce actions to control the computer."
Она работает не только в браузере, как многие другие агенты, а может и управлять другими приложениями, хоть Slack, хоть Excel. Модель может работать в трех режимах с говорящими названиями Tasker, Actor и Thinker. На страничке проекта немало громких слов про парадигмальные сдвиги и пр., но тут лучше подождать результатов массового независимого тестирования. Стартап как раз и призывает начать пробовать: Try our developer-friendly SDKs, frameworks, and UX template - all wired into Lux, the world’s most advanced computer use model.
https://venturebeat.com/ai/openagi-emerges-from-stealth-with-an-ai-agent-that-it-claims-crushes-openai
Страница собственно проекта — https://www.agiopen.org
❤1👍1
AI_Landscape_December_2025.pdf
13 MB
На лекциях - главный вопрос - какая модель сейчас самая-самая. Обычно отвечаю - что как у хорошего шеф-повара есть целый набор ножей - так и с ИИ-шками. Но все равно разбираться стало уже сложновато, поэтому собрал отчет в презентацию - читать стало проще.
Зарядил задачи по разным направлениям собираются отчеты в perplexity (медиа, LLM, код...). И чтобы эти отчеты проще было читать - превратил в презентацию-отчет в google notebookLM.
Зарядил задачи по разным направлениям собираются отчеты в perplexity (медиа, LLM, код...). И чтобы эти отчеты проще было читать - превратил в презентацию-отчет в google notebookLM.
🔥4
Обновился бесплатный генератор сайтов DeepSite от Hugging Face
DeepSite v3 умеет генерировать лендинги и многостраничные сайты. Под капотом DeepSeek, Qwen и Kimi.
https://huggingface.co/deepsite
DeepSite v3 умеет генерировать лендинги и многостраничные сайты. Под капотом DeepSeek, Qwen и Kimi.
https://huggingface.co/deepsite
ByteDance сделали 300-страничный гайд по современным ИИ-агентам. Это целая энциклопедия для разработки софта с помощью нейронок.
Внутри — обзор лучших практик вайбкодинга, подключения сторонних инструментов, автоматизации тестов и кодревью, а также исправления багов. Поможет прокачать работу с агентами.
Изучаем здесь.
Внутри — обзор лучших практик вайбкодинга, подключения сторонних инструментов, автоматизации тестов и кодревью, а также исправления багов. Поможет прокачать работу с агентами.
Изучаем здесь.
✍1
Mistral выпустил 10 открытых моделей
Флагманская модель — Mistral Large 3. 675 миллиардов параметров и MoE-архитектура. По бенчмаркам конкурирует с DeepSeek-V3.1 и Kimi-K2.
Остальные модели меньше и могут работать почти где угодно — от смартфонов и дронов до корпоративных систем.
Лицензия Apache 2.0.
Веса: https://huggingface.co/mistralai
Флагманская модель — Mistral Large 3. 675 миллиардов параметров и MoE-архитектура. По бенчмаркам конкурирует с DeepSeek-V3.1 и Kimi-K2.
Остальные модели меньше и могут работать почти где угодно — от смартфонов и дронов до корпоративных систем.
Лицензия Apache 2.0.
Веса: https://huggingface.co/mistralai