AI Роман | Про нейросети
7.32K subscribers
419 photos
312 videos
3 files
429 links
Полезные инструкции к нейросетям, которые упростят вам жизнь и работу.

Канал Романа Куцева @roman_kucev – Founder LLM Arena & VseLLM. Выпускник ВМК МГУ, 10 лет в сборе и разметке данных.

👉🏼 Для сотрудничества: @grigoryev_ni
Download Telegram
Кто справился лучше?

❤️ – 1 (GPT Image)
🔥 – 2 (Grok Imagine)
👍 – 3 (Nano Banana)

Промпт в комментариях ⤵️
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
41🔥9👍5👾1
🐡 Новость дня: Sakana AI дропнула Fugu

Японская Sakana AI выпустила модель, которая сама почти ничего не считает. Она раздаёт задачи другим нейронкам, проверяет их и собирает финальный ответ. Снаружи один API, внутри толпа моделей-исполнителей.

По бенчам в сумме держится на уровне с Fable 5 и Mythos Preview, а Gemini 3.1 Pro, Opus 4.8 и GPT 5.5 на прикладных задачах оставляет позади.

Есть две версии:
🐟 Fugu - для повседневки, быстрая;
🐟 Fugu Ultra - для сложных многошаговых задач.
Обе через один OpenAI-совместимый API. В Европе пока не работает.

Помните, как Fable 5 прикрыли из-за экспортных ограничений? Fugu не завязана на одного поставщика: закрыли доступ к одной модели - работа уходит на другие из пула.

Забавно, что сама Fable в этот пул даже не входит. Sakana догоняет её, но не пользуется ей.

И так скоро будут строить все. Meta, Apple и Microsoft уже собирают системы поверх чужих моделей, на очереди Google, Anthropic и OpenAI.

Своей топовой модели у Sakana нет, вся сила в дирижировании. Но цифры говорят сами за себя.
👍1163
This media is not supported in your browser
VIEW IN TELEGRAM
☝️ Новый тренд в инсте

AI-блогеры сейчас поголовно отклеивают себя от экрана. Пока выглядит свежо и трендово, забираем для своего блога.

Рассказываю, как повторить ⤵️
1⃣ Берём любое своё фото
2⃣ Копируем промпт:
Cinematic hybrid fashion editorial combining studio and abstract street aesthetic in a 1:1 composition. Same female stylish model with sleek bun and black mesh outfit. Multi-angle storytelling: one panel with a studio circular cutout portrait, one panel with outdoor blurred neon city vibe, one panel with an extreme close-up beauty shot with dramatic lighting. Color palette shifting between teal shadows and warm orange highlights. Vogue-inspired cinematic depth, high-fashion storytelling, ultra-realistic photography, no text, no typography, no captions, clean visual composition only.

3⃣ Идём со своей фотографией и этим промптом в SeeDance 2.0

Когда всё получится – не забудьте поблагодарить реакцией, комментом или бустом

Если что-то не работает – идём в чат и пытаемся разобраться вместе

Сохраните, чтобы не потерять 📌

❤️ – нужно больше инструкций
Please open Telegram to view this post
VIEW IN TELEGRAM
18🔥3😁2❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🥺 ByteDance анонсировали Seedance 2.5

Всё, что вам нужно знать об этом:
➡️ Модель сможет генерировать 30-секундные видео за один раз
➡️ Дроп планируется в июле
➡️ Появится платформа для коммерциализации авторских прав на ИИ-контент
➡️ Для Seedance 2.0 уже включили вывод в 4K-формате

Сколько это полуминутное добро в 4K будет стоить – другой вопрос. Возможно, будет дешевле сшить несколько коротких видео от Veo, чем делать одно длинное в SeeDance. Такие новости.

В чате спрашивали про бесплатный доступ к SeeDance – такого, насколько я знаю, нет. Изучу актуальные платформы дам повестку на днях, где лучше брать.

Ставьте ❤️, если надо
Please open Telegram to view this post
VIEW IN TELEGRAM
220🔥2👍1
❗️ Пост-предупреждение

Если читали канал Метаверсище и ИИще – знайте, что акк его владельца взломали, угнали паблик и поэтому там сейчас крипто-шлак. Не ведитесь, а лучше просто отпишитесь – восстановить доступ к каналу сложно и почти невозможно.

И главное – если вам пишут об оставшихся в каком-то боте ваших персональных данных или с другими подобными заявлениями – блокируйте сразу. Чтобы и свой аккаунт оставить в безопасности.

Я тоже не напишу вам первым, никаких продуктов у меня на данный момент нет – а если бы был, сообщил здесь, на канале.

Берегите себя и свои кровные.
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍42💔1🤝1
This media is not supported in your browser
VIEW IN TELEGRAM
💜 Добавил VFX-эффекты в генерацию

Тестил в SeeDance танцы с неоновыми линиями, получилось красиво и свежо.

P.S. Качество подъела телега, на выходе картинка лучше и плавнее.

Как вам?

Промпт в комментариях ⤵️
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥163😍2❤‍🔥1
📌 Что нового в мире ИИ

🤪 ByteDance обновила Seedance 2.0 и показала 2.5
Во вторую версию завезли вывод в 4K, картинка стала заметно чётче.
В 2.5 обещают добавить ролики до 30 секунд без склейки.

🐡 Sakana AI выпустила Fugu
Модель сама собирает команду из других нейронок под задачу.
Версии две: обычная Fugu для повседневки и Fugu Ultra для сложных многошаговых сценариев. Это дирижёр, который сам ничего не считает, но заставляет играть весь оркестр.

🔊 ElevenLabs запустила Ads Engine
Сервис адаптирует рекламу под 50+ языков. Берёт готовый ролик, делает дубляж, меняет текст, картинки и видео под конкретный рынок и собирает локальные версии одной кампании.

🙀 Mistral выпустила OCR 4 для распознавания документов
Она не просто вытаскивает текст из сканов, а понимает структуру страницы: заголовки, таблицы, формулы, подписи и места, где распознавание вышло неуверенным.
Поддерживает 170 языков, ставится на свои серверы. Цена – $4 за 1000 страниц или $2 через batch API.

Genspark выпустила дизайн-инструмент на Claude Opus 4.7
Внутри можно собирать UI-прототипы, постеры, HTML-анимации и видео.
Главная фишка: макет потом превращается в рабочий код через Genspark Code. От картинки до готового интерфейса, без передачи разработчику.

💻 DeepReinforce выпустила Ornith-1.0
Семейство открытых моделей для агентного кодинга. Четыре версии: 9B, 31B, 35B MoE и 397B MoE.
Флагман набрал 77.5 на Terminal-Bench 2.1 и 82.4 на SWE-Bench Verified. Веса уже на Hugging Face.

🤖 OpenAI показала GPT-5.6, но пока только проверенным партнёрам
В семействе три модели: Sol самая мощная, Terra дешевле и сбалансированнее, Luna самая быстрая.
Sol поставила новый рекорд OpenAI на Terminal-Bench 2.1, а в кибербезе вышла на уровень Mythos Preview, потратив при этом меньше токенов.

🫷 Perplexity запустила продукт для юристов
Ищет по судебным решениям, нормативке, публичным документам и файлам клиента, к каждому ответу прикладывает источники.
Ещё собирает досье перед встречей, следит за изменениями в законах, вытаскивает пункты из договоров в таблицу и ищет патентные аналоги.

🫢 Google добавил в Gemini раздел Study Notebooks
Пространство для учёбы и подготовки к экзаменам. Загружаешь конспекты или программу, Gemini прогоняет короткий тест и понимает, что ты уже знаешь, что нужно докрутить.

Сохраните, чтобы не потерять ⭐️
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍3🔥1
🤖 Затестил новый Grok Imagine Video 1.5

Модель стала заметно лучше: физика движений выглядит более естественно и плавнее, картинка чище, генерация быстрее. В качестве и стабильности модель прокачали.

Из минусов – лимиты стали жёстче. Если генерите часто и в больших количествах – почувствуете ограничения.

Вам как?
🔥 – первое видео лучше (Grok Imagine)
❤️ – второе лучше (Grok Imagine 1.5)
👍 – не вижу разницы вообще

Подписаться на канал AI Роман
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
15👍4🔥3
Слышали о челлендже BitGN E-commerce AI Agent Challenge?

Он прошёл в мае — проект серьёзный. Я бы даже сказал, ECOM1 — бенчмарк агентной коммерции от BitGN. Там AI-агенты работают в симулированной операционной системе интернет-магазина. Отвечают за всё: корзины, товары, заказы, чекаут, фрод, возвраты, сбои оплат.

Так вот, моё внимание зацепил один конкретный AI-агент. Exoskeleton — самый умный из быстрых агентов в ECOM1.

Создал его Ильяс Салихов, CTO RetailCRM. Агент взял 1 место в Speed и вышел на 1 место в Live PROD лидербордах. На gpt-5.4-mini — модели в 6 раз дешевле gpt-5.5, на которых строили агентов конкуренты.

«Как?» спросите вы. Я задался тем же вопросом и пошёл разбираться))

Главное — архитектура. Ильяс назвал её «Экзоскелет», и это прямо отражает суть.

— Mini — слабое тело, а вокруг каркас из кода и nano-моделей. Ещё до старта агенту принудительно грузят все данные. Nano-классификатор разбирает намерения — фрод, манипуляция, подмена личности.

— Безопасность зашита в код, решения принимает логика. По ходу работы автоматом собираются ссылки на регламенты — модели не нужно их помнить. В конце ещё одна nano причёсывает ответ.

— Вся тяжёлая логика — в коде. Модель делает только то, в чём сильна.

Результат — обошла агентов на старших моделях и по очкам, и по скорости 💪

Если вам интересно почитать подробности так же сильно, как и мне — Ильяс опубликовал полную статью со схемами:

🇷🇺 Русская версия
🇬🇧 English

И да, у него свой канал про инженерию и AI. От души рекомендую → подписаться 🔗
👍5👌53
🥸 Anthropic ворвались с кучей новостей

➡️ Вышел Sonnet 5. По параметрам почти дотягивает до Opus 4.8. Уже затестил в приложении – пока особо разницы не увидел.

➡️ Запустили Claude Science. Этот рабочий стол с агентами помогает гонять анализы, ходить в научные базы, собирать графики, таблицы и сразу собирать из этого черновик статьи.

➡️ Сегодня Fable 5 обещают вернуть в общий доступ. Экспортные ограничения сняты. Пока не ясно, восстановят ли неделю доступа по подписке или сразу начнут брать оплату по API-ценам, но новость топ.

Как скачать Claude и другие заблокированные в РФ приложения себе на iPhone – рассказал в этом посте.

В веб-версии включаем прокси, на Android ставим USA-почту в Play Market.

Приятных генераций 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥53👍1