STARTOBUS
2.77K subscribers
2.55K photos
772 videos
212 files
3.35K links
@startobus: AI — гайды, инструменты, кейсы для креатива, маркетинга и бизнеса
👋 @dchannov, Денис Чаннов, 35 лет опыта 🚀 2500+ проектов в 30+ странах.
Download Telegram
А вам какой цвет 2025 года больше нравится?
1.
Pantone всех удивил и предложил цвет «московской зимней грязи».
2. Нашел другой - JAFCA - японская ассоциация цветов, ежегодно публикует прогноз цвета на следующий год, который обсуждается и выбирается Комитетом по отбору цвета на следующий год (JAFCA + Михоко Комори (Специальный комитет JAFCA). ​​​​​​В этом году JAFCA выбрала зеленый цвет Horizon Green с синим цветом в качестве цвета 2025 года. Этот цвет олицетворяет, по мнению ассоциации спокойную силу и твердую надежду.

https://mp.weixin.qq.com/s/U6acESIgo_mbOEF0dg3NFA

А вам что ближе:
💩- цвет от Pantone
❤️ - Horizon Green от JAFCA
1😁1
This media is not supported in your browser
VIEW IN TELEGRAM
ИИ-редактор фото Krea обновился и теперь умеет менять любые объекты на картинках.

Нейронка сама распознает границы объектов, редактирует их или меняет на новые по промту. Появилась кисть Magic Brush, чтобы выделять конкретные места для исправления.

Модель бесплатная для всех, проверяем тут.
1
Grok сгенерировал Пушкина и Толстого

Качество изображения реально впечатляет, по сравнению с другими ИИ.

Пользуюсь через твиттер - бесплатно (только впн нужен). Задумался купить подписку Твиттер - но не смог оплатить со счета мобильного телефона(.
👍1😍1
This media is not supported in the widget
VIEW IN TELEGRAM
👍2👏21
This media is not supported in your browser
VIEW IN TELEGRAM
Компания Kling AI представила обновленную версию своей нейросети.

Новая модель получила значительные улучшения в обработке промптов, визуальной эстетике и физических действиях, что позволяет достигать более последовательных и выразительных результатов.

Ключевые особенности KLING 1.6:
⭐️ Существенно улучшена точность следования промптам
⭐️ Поддержка двух режимов работы: Стандартного и Профессионального
⭐️Общая производительность выросла на 195% по сравнению с предыдущей версией

#kling #видео
Please open Telegram to view this post
VIEW IN TELEGRAM
1
STARTOBUS pinned Deleted message
Google выпустил конкурента ChatGPT o1

Gemini 2.0 Flash Thinking — первая модель рассуждений от Google. В компании утверждают, что новинка обучена «думать вслух». Благодаря этому, можно узнать, как модель пришла к тому или иному ответу.

Пробная бесплатная версия Gemini 2.0 Flash Thinking уже появилась в Google AI Studio https://aistudio.google.com/prompts/new_chat (с российских IP-адресов недоступна).

https://9to5google.com/2024/12/19/gemini-2-0-flash-thinking/
Suno v4 и Pika 2.0 можно попробовать бесплатно

Suno дает сгенерировать 10 бесплатных песен в своей самой передовой нейросети. https://suno.com/

Pika 2.0 доступна бесплатно до 22 декабря. Число сгенерированных видео неограничено, но сервера сильно загружены, так что ждать приходится долго. https://pika.art/
This media is not supported in your browser
VIEW IN TELEGRAM
Возможности нейросети Movie Gen от Instagram*

Глава соцсети рассказал что выход Movie Gen ожидается в следующем году.

На полустатическом видео говорящей головы — верю, что в жизни будет так же красиво как на демо. Демо классное, да.

*принадлежит Meta, признанной экстремистской и запрещенной в РФ
STARTOBUS pinned «ДАША - Снегурочка / а ну-ка, давай-ка https://youtube.com/shorts/UOCd3K0ALKs?si=FwUA2M2qVkBxjAyF Ошибочная ссылка - вот правильная)»
This media is not supported in your browser
VIEW IN TELEGRAM
LTX Video 0.9.1: плавность, скорость, красота

LTX Studio выкатила обновление 0.9.1 для своего редактора, и оно реально.

Что нового?
1️⃣ Плавная анимация и улучшенная физика.
2️⃣ Чистая визуализация без потери скорости.
3️⃣ Устранение мерцания и дрожания.

Для чего подходит?
1️⃣ Крутой текст-в-видео.
2️⃣ Преобразование изображений в видео с улучшенным качеством.
Please open Telegram to view this post
VIEW IN TELEGRAM
Genesis: опенсорсная платформа + модель, которая может симулировать физику реального мира в 3d.

Умеет делать:
- Физически точные и пространственно согласованные видео
- Движения камеры и её параметры
- Движения человеческих и животных персонажей
- Локомоция роботов, применимая в реальном мире
- Полностью интерактивные 3D-сцены
- Генерация открытого мира с артикулированными объектами
- Речь, анимация лица и эмоции
Да, о3-о4-о5 по большей части автоматизируют разработку и любую работу, которая не требует физического присутствия, типа продаж, инфлюенсеров, маркетинга, финансов и чего угодно другого, что можно решить генерируя неотличимый от человека аватар в зуме и симулируя нажатия на кнопки клавиатуры.

С этим мы за последние 2 года как-то смирились (хотя и не все готовы 😆), НО для меня самым впечатляющим результатом о3 остается Frontier Math. Чтобы понять почему можно посмотреть бумагу самого бенчмарка.

Общее распределение задач примерно такое:
25% - задачи уровня международных олимпиад
50% - задачи экспертного университетского уровня
25% - исследовательские задачи уровня кандидаткой или докторской работы.

Пока что о3 решает только 25.5% (каких - не ясно), но прогресс случился в разы быстрее, чем предполагали многие.

А важно это потому что такого рода задачи, в отличии от написания кода, это про новую науку и новые открытия, что приведет не просто к автоматизации и удешевлению, а к качественному переизобретению многих вещей. В том числе, пусть и не сразу, но и систем координации.

Эффективная акселерация (e/acc) происходит прямо на наших глазах и первая производная растёт.
Please open Telegram to view this post
VIEW IN TELEGRAM
OpenAI объявила модель o3, которая очень круто решает задачки из ARC-AGI.

ARC-AGI - это набор задачек, которые должны сравнивать человеческий интеллект с машинным. На их сайте написано, что решение ARC-AGI - это даже круче, чем изобретение трансформера.

o3 смогла решить 91% задачек из этого бенчмарка.

Да, теоретически o3 очень крутая модель, но она в ближайшее время не окажет большого влияния на мир (я смотрю с точки применения в автоматизации бизнес-процессов в компаниях). Почему? Да дело хотя бы в unit economics.

Если o1 pro - это золотой стандарт по цене и качеству, то o3 - это прямо заоблачная модель и по качеству и по цене.

o3 более заоблачно дорогая, нежели качественная (см картинку). Люди пока дешевле и эффективнее на задачах c тем уровнем сложности, который представлен в ARC-AGI.

Чтобы LLM практически использовалась в бизнесе, у нас должна быть измеримая выгода от внедрения. И пока она лучше всего достигается на задачах, где LLM справляется с задачами дешевле, терпеливее и качественнее человека. Это достаточно простые и легко верифицируемые задачи - извлечение данных, сканирование документации, классификация запросов, написание не очень сложного кода итп.

В общем, именно o3 вряд ли как-то заметно повлияет на автоматизацию бизнес-процессов. Но, возможно, она проложит путь к повышению качества моделей с более доступными ценами. И вот тогда начнется самое интересное.

Ваш, @llm_under_hood 🤗
Spotify использует вымышленных исполнителей, чтобы не платить роялти настоящим музыкантам. Об этом заявляет Harpers.

Вкратце, компания Perfect Fit Content находит ноу-нейм музыкантов, покупает права на их музыку и выкладывает её под другими псевдонимами. Иногда на Spotify дело доходит до абсурда: они придумывают целые вымышленные легенды для несуществующих людей.

Для чего это делается? Spotify это очень выгодно, так как многие включают фоновую музыку, обычно — сгенерированные алгоритмами плейлисты, куда легко подмешать «призрачные» треки. Для реальных исполнителей это означает потерю слушателей, ведь их можно заменить на более дешёвых и вымышленных артистов.

@lobushkin
Вместо десятка слайдов

— Как за минуту заинтересовать инвестора? — спросил стартапер
— Шестью ответами

Шведский предприниматель основал в 2006 году сервис потоковой музыки Spotify. Он обошел десятки венчурных фондов в поисках финансирования и ответил там на сотни вопросов. Сейчас сам стал инвестором и ему нужно всего шесть ответов:

1. Какую долгосрочную, большую возможность видите? Например, рост спроса на цифровую музыку.

2. Как приблизить ее в краткосрочной перспективе?
Убрать необходимость приобретать отдельные альбомы и треки

3. Кому в первую очередь даете результат и каким способом? Миллионы песен без рекламы для молодых пользователей.

4. Чем поддерживаете рост и как взламываете его? Например, персонализированные плейлисты и ежегодные обзоры песен, которые слушал каждый пользователь.

5. Как привлекаете пользователей? С кем партнеритесь? Даем слушать бесплатно с рекламой или платно без нее; продвигаемся через поставщиков телекоммуникационных услуг.

6. За что берете деньги и на что тратите? Получаем доход от подписки и рекламы; отдаем за лицензирование и поддержание инфраструктуры.

Так можно понять видение, миссию, ценностное предложение, технологию, дистрибуцию и финмодель.

Вывод прост: хотите донести ценность за минуту — уложите ответы в шесть предложений.
👍1