STARTOBUS
2.72K subscribers
2.53K photos
763 videos
209 files
3.32K links
@startobus: AI — гайды, инструменты, кейсы для креатива, маркетинга и бизнеса
👋 @dchannov, Денис Чаннов, 35 лет опыта 🚀 2500+ проектов в 30+ странах.
Download Telegram
Вышедший из тени стартап со скромным названием OpenAGI заявил, что его собственная модель по имени Lux на тесте Online-Mind2Web для автономных агентов легко бьет всех именитых конкурентов (картинка выше).
Достигнуто это за счет того, что Lux -- не дообученная LLM, а модель, которую изначально учили на выходе совершать действия, а не тексты генерить: "By contrast, our model learns to produce actions. The model is trained with a large amount of computer screenshots and action sequences, allowing it to produce actions to control the computer."
Она работает не только в браузере, как многие другие агенты, а может и управлять другими приложениями, хоть Slack, хоть Excel. Модель может работать в трех режимах с говорящими названиями Tasker, Actor и Thinker. На страничке проекта немало громких слов про парадигмальные сдвиги и пр., но тут лучше подождать результатов массового независимого тестирования. Стартап как раз и призывает начать пробовать: Try our developer-friendly SDKs, frameworks, and UX template - all wired into Lux, the world’s most advanced computer use model.
https://venturebeat.com/ai/openagi-emerges-from-stealth-with-an-ai-agent-that-it-claims-crushes-openai
Страница собственно проекта — https://www.agiopen.org
1👍1
AI_Landscape_December_2025.pdf
13 MB
На лекциях - главный вопрос - какая модель сейчас самая-самая. Обычно отвечаю - что как у хорошего шеф-повара есть целый набор ножей - так и с ИИ-шками. Но все равно разбираться стало уже сложновато, поэтому собрал отчет в презентацию - читать стало проще.

Зарядил задачи по разным направлениям собираются отчеты в perplexity (медиа, LLM, код...). И чтобы эти отчеты проще было читать - превратил в презентацию-отчет в google notebookLM.
🔥4
Обновился бесплатный генератор сайтов DeepSite от Hugging Face

DeepSite v3 умеет генерировать лендинги и многостраничные сайты. Под капотом DeepSeek, Qwen и Kimi.

https://huggingface.co/deepsite
ByteDance сделали 300-страничный гайд по современным ИИ-агентам. Это целая энциклопедия для разработки софта с помощью нейронок.

Внутри — обзор лучших практик вайбкодинга, подключения сторонних инструментов, автоматизации тестов и кодревью, а также исправления багов. Поможет прокачать работу с агентами.

Изучаем здесь.
1
Mistral выпустил 10 открытых моделей

Флагманская модель — Mistral Large 3. 675 миллиардов параметров и MoE-архитектура. По бенчмаркам конкурирует с DeepSeek-V3.1 и Kimi-K2.

Остальные модели меньше и могут работать почти где угодно — от смартфонов и дронов до корпоративных систем.

Лицензия Apache 2.0.

Веса: https://huggingface.co/mistralai
Меньше месяца до Нового года, и многие ИИ-компании начинают радовать нас подарками.

Например, Google запустила свой адвент-календарь по ИИ-агентам: теперь каждый день с 1 по 25 декабря будет выходить один урок о том, как создать и где применить своего агента.

Два урока уже доступны: https://adventofagents.com/
1
Ты, наверное, сейчас гуглишь «как увеличить продажи»

А твои конкуренты уже зашли в наш канал 🤫
59.000₽ 👉 0₽

Внутри — то, за что обычно платят на закрытых консультациях:
- 50 фраз, после которых клиент говорит: «Да, я беру!»
- база из 200 проверенных блогеров бесплатно
- первая помощь при старте ТГ

Это не теория из курсов
Это рабочие схемы людей, которые делают от 5 до 50 миллионов в год

Как забрать?

1. Добавляй нашу папку (если не получается, удаликакую-то из старых папок)
2. Переходи в канал "польза"
3. Изучай материалы
4. Применяй в работе


Жёсткая правда:
Пока ты читаешь этот текст, кто-то уже взял оффер из канала, адаптировал под себя и сегодня уже сделал продажу

Твой выбор: взять работающее прямо сейчас или через месяц спрашивать у этих же людей «а как ты так сделал?»

Забирай материал 👇
https://t.me/addlist/W3YpYnUU-78zMzI6
Bloomberg: Продажи Baidu упали до рекордно низкого уровня, несмотря на инвестиции в ИИ

– Baidu сообщила про рекордное падение квартальной выручки
– Эффективность рекламного бизнеса оказалась под сомнением
– Выручка Baidu за квартал упала на 7%, примерно до $4,4 млрд
– Чистый убыток из-за списания активов был почти $1,6 млрд
– Лидер интернет-поиска Китая стал испытывать трудности
– Поисковая реклама теряет аудиторию из-за конкурентов и др.
– Рекламные бюджеты переманивают ByteDance, Xiaohongshu и др.
– В сфере ИИ компания активно конкурирует с Alibaba и др.
– Недавно Baidu представил новую версию свой модели Ernie 5.0
– Baidu получила преимущество на старте китайской ИИ-гонки
– Позднее компания уступила лидерство ByteDance и Alibaba
– Обновленная Ernie вряд ли повлияет на перспективы компании

@ftsec

ПОЧЕМУ ЭТО ВАЖНО: рекламная модель интернет через поиск - начинает проигрывать инструментам: (1) вовлечения от вертикальных видео (тик ток, риалс, шортс), (2) поиску через ИИ - мы перестаем (уже 57% в Американских исследованиях) изучать ссылки в поиске, а сразу ищем в ИИ, сравнивая характеристики.
Кто выигрывает - кроме указанных выше (те кто делает вертикальное видео и продает на впечатлениях), и делает AEO (SEO для AI). Вероятно еще выиграют те кто будет вкладываться в бренды (легче вспомнить что искать и сравнивать).

И как обычно - именно Китай сейчас задает тренды для старых экономик.
Вышла бесплатная модель — Seedream 4.5 от ByteDance, которая эффективно справляется с большинством задач, не уступая Nano Banana Pro.

Модель прекрасно генерирует текст, создает инфографику и даже может составлять небольшие книги. Например, можно создать мини-сборник рецептов или самоучитель по иностранному языку.

#сервис #изображения

Нейросети: Волшебство ИИ
Media is too big
VIEW IN TELEGRAM
Милейшая реклама IKEA.
Старая, но по-прежнему прекрасная!
#новыйгодзауглом
4
Решил возобновить подписку на ChatGPT после нескольких месяцев перерыва. Повод — нужно было сгенерировать обложку для нового проекта. Полгода назад там же делал отличный набор карточек, всё получилось с первого-второго захода.

Сейчас у меня активны подписки на Perplexity и Gemini Ultra и несколько других платформ — постоянно тестирую инструменты для своих проектов и курсов. Думал, GPT-5 по картинкам за это время только улучшился.

Реальность оказалась противоположной. Десятки итераций, модель не понимает контекст, игнорирует конкретные указания, выдаёт результаты, которые противоречат предыдущим инструкциям. Галлюцинации, бестолковые уточняющие вопросы вместо выполнения задачи. Даже советы по улучшению промптов работали в обратную сторону.

Полная деградация относительно Claude, Gemini или даже бесплатных моделей через OpenRouter. Теперь понятна та нервозность Альтмана в последних интервью — продукт реально откатился назад.

Итог: для визуального контента сразу иду в Nano Banana. ChatGPT сейчас годится разве что для базовой текстовой работы, да и то с оговорками.
👍31
10 каналов для погружения в AI и машинное обучение

Прикольный списочек
На половину уже был подписан. Вторую половину еще покопаю.
Возможно, и вам будет полезно.

1. Andrej Karpathy

2. sentdex

3. Sebastian Raschka

4. Jeremy Howard

5. MIT OpenCourseWare

6. Stanford Online

7. StatQuest with Josh Starmer

8. 3Blue1Brown

9. Krish Naik

10. CampusX

#полезное
​​🙇 Архетипы фаундеров из YC и шансы на успех – анализ 500+ инвестиций Rebel Fund.

Какие сочные и необычные данные, прямо интересно почитать! Rebel Fund очень известен в узких кругах – инвестирует на ранних стадиях и почти всегда делает это в фаундеров из Y Combinator. Партнеры фонда сами как фаундеры проходили YC.

И вот, они набрали 500+ инвестиций и разложили фаундеров на 5 групп по некоторым “архетипам”, оценив вероятность их успеха, провала, вероятность застрять в статусе “зомби” (когда жив, но уже успех маловероятен). Если вдуматься, подобные архетипы должны работать и для остальных фаундеров, не из YC. Да?

1/ Что же это за 5 архетипов.
Харизматичный хастлер ( “Charismatic Hustlers”). Не очень понятно, почему с этого типа начинают, возможно, потому что таких больше всего. Это те, у кого опыта не так много относительно других (в среднем ~6 лет), но зато горящие глаза, быстрый ум, харизма. Они сильны в аналитике, а также энергией. Берут напором.
Предприниматели из Долины (“Bay-Area Value Builders”). Это опытные операторы, экс-фаундеры, у них большой нетворк и хорошая репутация. Важно, что они серийные фаундеры – большинство имеют 5+ лет опыта уже как фаундеры, а вообще их опыт ~10 лет. У них и ролей до этого было больше, чем в среднем. Они находятся в самом сердце Долины и являются своими.
Образованные эксперты из операционки в B2B (“Pedigreed B2B Operators”). Это если называть словами автора, но вообще очень похоже на экс-топов и сениоров из Google, Amazon и подобных компаний. У них хорошее топовое образование, опыт работы в больших компаниях, которые сформировали у них хорошую базу. У них ~9 лет опыта работы и больше разных ролей в резюме.
Ветераны дженералисты (“Veteran Generalists”). У них наибольший опыт (~12 лет) до фаундерства и опыт фаундерства (~6 лет). Огромный опыт просто потому, что они его пережили.
Прагматичные инженеры (“Pragmatic Engineers”). Это уже на 100% технари. Они знают продукт и предпочитают фокусироваться на нем. У них тоже ~6 лет опыта, как и у первой группы, но меньше всего ко-фаундерского опыта. Часто это профиль фаундера стартапа из университета (со своими сокурсниками).

2/ Какие у них у всех шансы на успех?
🔹Давайте будем откровенными – Rebel Fund, походу, ставит в основном на группу 2 – билдеры из сердца Долины. Они выделены красным на приложенной картинке.
🔹У них наибольшая вероятность успеха (меньше всего у 5-й группы прагматичных инженеров).
🔹У них также ниже всего вероятность стать зомби-компанией (выше всего вероятность зомби у группы 4 ветеранов дженералистов).
🔹У них также невысокая вероятность неудачи, но ниже всех также группа 4 – ветераны дженералисты. Получается, что 4-я группа реже проваливается, но часто не может сделать прорывной успех. Вероятность неудачи, к слову, выше всего у группы 5 (прагматичные инженеры).

3/ Однако Rebel Fund отмечает, что делить на белое и черное нельзя, и среди разных типов фаундеров есть успешные. Среди типа 5, например, к таким можно отнести основателя Doordash Энди Фанга.

👉 Читайте подробнее тут: https://jaredheyman.medium.com/on-the-5-archetypes-of-top-yc-founders-b0a81e8e09fc

@proVenture

#research #howtovc #полезное
1👍1
Мне нравится подход Google к корпоративным задачам: они стараются адаптировать старые, давно зарекомендовавшие себя инструменты под новые решения.

Например, сегодня они добавили в Workspace возможность создавать ИИ-агентов. Самое интересное, что в презентации основной упор сделан именно на то, что не нужны никакие технические навыки или знания кода. Главное - это понимание процессов и того, что вы хотите получить в результате.

В общем, благодаря тому, что агенты глубоко интегрированы с приложениями Workspace, такими как Gmail, Диск и Чат, они понимают полный контекст вашей работы. Вы можете просто создать шаблон задачи или написать промпт в формате: «Если письмо содержит вопрос ко мне, пометь его тегом "Ответить" и пингани меня в чате».

И Gemini автоматически создаст Gem-агента под эту задачу.
Ещё мне понравился кейс компании Kärcher, которая развернула виртуальную команду агентов, созданных в Studio. Теперь, когда в чате предлагается идея новой функции:
1. Gem для мозгового штурма оценивает ее достоинства.
2. Технический Gem проверяет ее на реализуемость.
3. UX Gem описывает возможный пользовательский путь (user flow).
4. Финальный Gem составляет полноценную пользовательскую историю (user story) для рассмотрения командой, основываясь на результатах предыдущих шагов.

Пишут, что это сократило время на составление документации на 90%, превратив часы ручного сведения данных в готовый к проверке план всего за две минуты.

Так что, если вы используете Gmail на своем домене и оплачиваете подписку на Workspace — можно уже пользоваться.
У Хиггсфилд, оказывается, есть генератор вертикальных видео на базе Sora 2

То есть там есть редактор с пресетами под тренды ТикТока, Ютуба и Инсты.

В принципе, и в самой Sora тоже, листая ленту, можно провалиться в понравившееся видео и ремейкнуть его, но все равно – до какого абсурда доходит уже генеративный ИИ, когда развлекательный контент шаблонизируется, и все что нужно сделать автору – нажать 2 кнопки. Раньше хотя бы нужно было поработать, чтобы повторить)
🌭1
This media is not supported in your browser
VIEW IN TELEGRAM
Hedra добавила Image-режим: рисуешь на фото стрелки или правки — ИИ сразу превращает в видео с говорящим аватаром.

Держит мимику, стиль и движения без артефактов — идеально для роликов в соцсети или презентаций.

Поиграться бесплатно можно по ссылке.

#Service | Подписаться
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Хватит тащить всё в одиночку. Пора узнать, как работают те, кто не просто выживает, а зарабатывает.

Кредиты под бешеные проценты, сокращения, неуверенность в завтрашнем дне... Знакомо? Кажется, что выбора нет, а он есть!

Представляем эксклюзивный проект от «Нескучных финансов»: откровенные интервью с топами российского рынка, где срывают все покровы.

Никакого глянца. Никаких заученных фраз. Только реальные кейсы, жёсткая аналитика и рабочие схемы, которые прямо сейчас приносят миллионы.

А в подарок 🎁 - получите чек-листы от «Нескучных финансов», которые дадут четкий ответ на главный вопрос: что ждет ваш бизнес в 2026 году?

Смотрите. Берите. Внедряйте. Ваш бизнес больше никогда не будет прежним.
This media is not supported in your browser
VIEW IN TELEGRAM
Новый Kling 2.6 против Veo-3 📹

Под конец года будто посрывало клапаны с релизами, и вот у нас сразу два больших обновления на поляне видеомоделей: Runway Gen и Kling (сразу в двух опциях).

Сегодня про новый Kling 2.6. Соль — прыжок в сторону Veo-3: модель теперь в видео может генерировать озвучку, музыку, пение и SFX по промптам.

Для нас, к сожалению, пока не особо интересно в плане озвучки, так как понимает (пока) только английский и китайский. Но если вдруг очень надо, придумал кустарный лайфхак: можно написать что-то вроде says: "Plohoo chto Kling ne mozhet generirovat na russkom", чтобы попасть в липсинк, а затем переозвучить в ElevenLabs.

Также подросло понимание промпта и всякое по мелочи. Хотя версия 2.5 и так была универсальным бойцом.

Бьёт Veo 3.1? В целом, по качеству липсинка — пока нет (у вео весь ютуб в датасете). Но есть одна важная особенность: Veo генерит в 720p и довольно сильно «жмякает» исходные кадры, что иногда критично, например когда нужно сохранить текстуру кожи. Kling же традиционно делает 1080p — с этим проблем нет. Другая особенность: Veo не очень любит сложные и динамичные сцены — получается мееееедлееееныыымиии. В Kling с динамикой и экшеном всё хорошо.

Короче: если вам в кадре нужен экшен, персонаж должен говорить и важно не пожмакать исходный кадр — Kling хорошая альтернатива. Но думаю, скоро будет Veo 3.5/4 уже на другом уровне, так что ждём.

А вот контестный Kling O1 уже интереснее — об этом в следующем посте.

P.S: сделал саммари гайда по промптингу для 2.6 — может быть полезно.

Самое главное: модель понимает сценарный формат. Вам нужно не просто описать картинку, а прописать «роли» и «реплики».

1. Формула идеального промпта
Структура должна быть такой: [Описание визуальной сцены] + [Кто говорит, описание голоса] says: "Текст речи" + [Фоновые звуки]

2. Как прописывать Диалоги и Речь (Синтаксис)
Чтобы персонаж заговорил, используйте конструкцию с квадратными скобками и словом says:

Базовый формат:

[A man] says: "Hello, world!"

С описанием голоса (важно для эмоций):

[A young woman, happy and excited voice] says: "I can't believe I won!"

Диалог двух людей: Нужно четко разделять действия и слова.

A man and a woman differ in a cafe. [The man, angry voice] says: "This is not what I ordered." Then [The woman, calm voice] says: "Let me check that for you."

Важные нюансы:

Текст, который нужно произнести, обязательно пишите в кавычках "...".

Используйте слово says (говорит) — это главный триггер для генерации липсинка (движения губ).

3. Ключевые слова-триггеры (Trigger Words)
Добавляйте эти слова в описание, чтобы задать стиль аудио:

Для голоса (Voice):

Narration / Voiceover — закадровый голос (губы не шевелятся).

Monologue — монолог (персонаж говорит в камеру).

Whispering — шепот.

Shouting / Yelling — крик.

Laughing — смех.

Singing — пение (можно добавить текст песни).

Rapping — рэп.

Характеристики голоса (Tone/Style):

Deep voice (низкий голос), Hoarse voice (хриплый), High-pitched (высокий).

Sad, Happy, Angry, Professional, Robotic (эмоциональный окрас).

Fast talking (быстрая речь) или Slow talking (медленная речь).

Для звуков окружения (SFX/Ambience): Описывайте их в конце промпта или в контексте сцены.

Background sound: city noise (шум города).

Sound of rain (звук дождя).

Footsteps (шаги), Explosion (взрыв), Glass breaking (битое стекло).

BGM (Background Music) — фоновая музыка (например, Sad piano BGM).

4. Пример готового промпта
Сцена: Девушка-блогер на пляже.

Промпт: Cinematic shot of a girl on a sunny beach holding a camera. [A cute girl, energetic and cheerful voice] says: "Hey guys! Look at this amazing view, the ocean is beautiful today!" Background: Sound of waves crashing, seagulls calling, relaxing acoustic guitar music.
Please open Telegram to view this post
VIEW IN TELEGRAM
Pantone назвал цвет 2026 года — белый оттенок Cloud Dancer

Воздушный, мягкий, «как чистый холст» — он символизирует стремление к новому началу и ощущение спокойствия в перегруженном мире.


С точки зрения брендинга Cloud Dancer про:
⬜️очистку от визуального шума
⬜️честность и минимализм
⬜️доверие через простоту
⬜️возвращение к форме и смыслу
⬜️айдентику, которая «держится» без лишнего

А, чтобы лучше запомнить тренд, предлагаем сделать это с помощью юмора! 🤣

#пятничный_мем
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3