STARTOBUS
2.75K subscribers
2.56K photos
774 videos
212 files
3.36K links
@startobus: AI — гайды, инструменты, кейсы для креатива, маркетинга и бизнеса
👋 @dchannov, Денис Чаннов, 35 лет опыта 🚀 2500+ проектов в 30+ странах.
Download Telegram
Runway выкатили новый генератор изображений Frames

Сервис делает более атмосферные и кинематографичные изображения

Доступ будут открывать постепенно пользователям Gen-3 Alpha.

Креативный директор Николас Нойберт уточнил: картинки генерируются по текстовому запросу.

🔥 — Качество поражает

Нейросети
🔥1
Интересный ресеч вышел, который проверяет, насколько эффективно, что языковые модели общаются между собой человеческим языком (например, в агентских системах где ответ из LLM попадает снова в LLM)

Ожидаемо оказалось, что роботам использовать наш язык – не эффективно. Вместо текста языковым моделям проще обмениваться набором «координат» — данных, которые описывают смысл фраз и слов, их называют эмбеддингами. Например, вместо фразы «Привет, ну как там с деньгами?» одна модель передаёт другой что-то вроде [0.82, -0.45, 1.22,…]. Это ускоряет процесс почти в три раза (!), причём без потерь в качестве

Подход позволяет моделям быстрее решать задачи и взаимодействовать друг с другом, например, в сложных сценариях вроде совместного написания кода или генерации текста

Тут технические детали, а тут статья в NewScientist

Короче, скоро не почитать будет без спец тулзов, что там модели друг другу пишут в процессе общения
👍3
💻 Amazon хочет конкурировать с Nvidia на рынке чипов искусственного интеллекта: выйдет ли?

Инженеры Amazon в Остине трудятся не покладая рук над одним из самых амбициозных проектов в технологической отрасли. В атмосфере, больше напоминающей стартап, высокооплачиваемые инженеры не прочь сбегать в Home Depot за сверлильным станком, лишь бы помочь Amazon ослабить контроль Nvidia над рынком чипов ИИ стоимостью больше $100 млрд.

Цель Amazon — превратить сеть центров обработки данных компании в огромные машины для обучения искусственного интеллекта. Одна из ближайших задач — до конца года внедрить последнюю версию ИИ-ускорителя компании Trainium2 в как можно большее количество ЦОДов AWS.

Amazon, Google, Microsoft — все они питают надежды снизить зависимость от чипов Nvidia. На прошлой неделе компания сообщила, что спрос на новейшее оборудование Nvidia будет превышать предложение в течение нескольких кварталов (!). Пока что план Amazon, как бороться с этим, выглядит самым рабочим.

Усилия по разработке чипов для ЦОДов AWS возглавляет израильская компания Annapurna Labs, которую Amazon дальновидно приобрел ещё в 2015 году за скромные $350 млн.
Ожидается, что скоро компания объявит о широкой доступности Trainium2 — последней разработки Annapurna, чипа для обучения больших ИИ-моделей.
Trainium2 — это третье поколение чипов искусственного интеллекта компании. Чип уже тестируется Anthropic, а также Databricks, Deutsche Telekom и японскими Ricoh и Stockmark.
Trainium2 имеет в 4 раза большую производительность и в 3 раза большую память по сравнению с предыдущим поколением. Компания обещает, что может предложить на 30% лучшую производительность за цену сипа от Nvidia.
Amazon хочет выводить на рынок новый чип примерно каждые 18 месяцев. Nvidia — каждый год.

Google 🖥 начала создавать чип искусственного интеллекта около 10 лет назад, чтобы ускорить машинное обучение для своих поисковых сервисов. Позже компания предложила свои чипы облачным клиентам, включая ИИ-стартапы вроде Anthropic, Cohere и Midjourney. Ожидается, что последняя версия чипа под названием Axion, представленная Google в апреле, станет широкодоступной в следующем году.

Microsoft 🖥 вошла в гонку чипов ИИ позже, чем AWS и Google, анонсировав ИИ-ускоритель под названием Maia и процессор Cobalt только в конце прошлого года.

И всё же, несмотря на собственные усилия, все три облачных гиганта борются за поставки новейших чипов Nvidia 🖥.

Trainium2 от Amazon будет считаться успехом, если у него получится взять на себя большую часть разработок Amazon в искусственном интеллекте, а также отдельные проекты от крупных клиентов AWS. А вот драгоценный запас высокопроизводительных чипов Nvidia пойдёт на мощности для самых передовых клиентов и задач в области ИИ.
Please open Telegram to view this post
VIEW IN TELEGRAM
Топ нейросетей для видео начала зимы 2024/25 года

Ссылки ниже: сохраняйте и пересылайте.

Хотите создавать крутые видео быстро и бесплатно? Вот подборка лучших видео-нейронок на 2024 год с уникальными возможностями:

- [Runway Gen-3](https://runwayml.com/) - генерирует реалистичные видео до 10 секунд с детализацией и движением. Новая функция Video Outpainting позволяет камере отъезжать, дорисовывать вокруг (outpaint) и возвращаться обратно. Это дает возможность менять композиции кадра с разными промптами или использовать reference images для расширения.

- [Kling AI](https://klingai.com/) - одна из лучших китайских нейросетей, активно развивается. Адаптируется под пользовательские запросы для улучшения результата.

- [Luma AI](https://lumalabs.ai/) - удобный инструмент с высокой степенью контроля над стилем и качеством видео. Теперь доступны стабильные персонажи и ремикс контента, движение камеры и продолжение видео (extend). Важное обновление — интеграция с их собственным генератором картинок Luma Photon.

- [Vidu](https://vidu.studio/) - предлагает уникальные функции интеграции различных стилей и эффектов. Новая версия Vidu-1.5 представила Multi-Entity Consistency — возможность незаметно интегрировать людей, объекты и окружение без использования LoRA.

- [MiniMax Video-01](https://minimax.com/) - новая китайская нейросеть, которая умеет создавать гиперреалистичные видео людей. Добавлен мультисервис, включающий генерацию видео, гиперреалистичное Text-To-Speech, клонирование голоса за 5 секунд и быструю генерацию музыки.

Пробуйте, экспериментируйте и создавайте крутой контент с помощью этих мощных инструментов!

UPDATE Сегодня не сговариваясь несколько каналов по ИИ - вывели свои рейтинги нейросетей для видео. В комментари разместил инфо от других каналов.
1👍1
​​🔥🔥🔥 The next big arenas of competition.

Крайне любопытный и визионерский отчет от McKinsey, который очень полезно и интересно прочитать.

Вкратце, они пытаются проанализировать ключевые арены конкуренции на сегодня (это отрасли, которые темпами выше средних захватывают рыночную долю во всей экономике, industry share growth rate)и понять какой в них уровень передела рынка (shuffle rate).

Отрасль находится в топе арены конкуренции, если ее доля в общем мировом ВВП растет с течением времени, при этом еще и внутри нее меняется структура – кто-то обыгрывает конкурента и забирает его долю. Как пример – отрасль смартфонов в прошлом, когда эта отрасль люто росла, а в какой-то момент лидеры в виде Nokia или Motorola сменились на Apple, Samsung и так далее.

1/ Какие же ключевые арены сегодняшнего дня? Приведем топ-5 и только их капитализацию и выручку на 2020 (в отчете есть другие данные):
▪️Software: $3,636B (market cap) <> $341B (revenue);
▪️Semiconductors: $3,495B (market cap) <> $574B (revenue);
▪️Consumer Internet: $3,460B (market cap) <> $403B (revenue);
▪️E-commerce: $3,308B (market cap) <> $888B (revenue);
▪️Consumer Electronics: $2,502B (market cap) <> $648B (revenue);
▪️Biopharma: $2,289B (market cap) <> $343B (revenue).

2/ На приложенной инфографике видно, насколько росло значение арен конкуренции с 2005 по 2020 год! Удивительно!

3/ Какие же ключевые арены конкуренции можно наметить на будущее, до 2040 года? Смотрите опять же приложенный рисунок очень внимательно, а ниже представлены опять же топ-6 (данные по выручке):
▫️E-Commerce: $4,000B (2022) => $14,000B-$20,000B (2040);
▫️AI software and services: $85B (2022) => $1,500B-$4,600B (2040);
▫️Cloud services: $220B (2022) => $1,600B-$3,400B (2040);
▫️Electric vehicles: $450B (2022) => $2,500B-$3,200B (2040);
▫️Digital advertisements: $520B (2022) => $2,100B-$2,900B (2040);
▫️Semiconductors: $630B (2022) => $1,700B-$2,400B (2040).

4/ Заметили, что в большом списке почти все арены новые, но есть несколько тех, которые частично уже сейчас являются крупнейшими аренами конкуренции? Давайте посмотрим, кто же это:
🔹E-commerce: #4 в 2020 => #1 в 2040;
🔹Cloud services: #10 в 2020 => #3 в 2040;
🔹Electric vehicles: #11 в 2020 => #4 в 2040;
🔹Semiconductors: #2 в 2020 => #6 в 2040;
🔹Biopharma: #6 в 2020 => распадается на несколько, #15 и #17 в 2040.

5/ Стоит отметить, что в совокупности новые арены конкуренции должны сгенерировать $29T-$48T выручки и $2T-$6T прибыли.

В самом отчете еще очень много чего интересного, а главное – рассмотрена каждая арена (отрасль) по отдельности.

👉 ОГРОМНЫЙ отчет на [213 страниц] доступен в сообщении ниже.

@proVenture

#research #trends #ai #cloud
WSJ: xAI собирается выпустить отдельное приложение для своего чат-бота

– Маск стремится сделать стартап xAI настоящим бизнесом
– Он построил новый дата-центр xAI за несколько месяцев
– До конца года xAI собирается создать самый мощный ИИ
– Маск обещает превосходство ИИ «по всем показателям»
– Среди преимуществ будут эксклюзивные данные X и Tesla
– Он также будет строить дата-центры быстрее конкурентов
– При этом доход xAI пока составляет лишь $100 млн/год
– Большая часть доходов идет от других компаний Маска
– Например, его чат-бот Grok доступен подписчикам из X
– xAI обеспечивает поддержку клиентов сервиса Starlink
– Он также поможет X создать новые функции ИИ-поиска
– Также раньше обсуждалась сделка между xAI и Tesla
– Теперь xAI хочет выпустить свое отдельное приложение
– Речь идет про приложение чат-бота для пользователей

@ftsec
👍1
Alibaba выпустила конкурента модели o1 с открытым кодом

Модель Qwen QwQ-32B-Preview имеет 32.4 миллиарда параметров и контекстное окно на 32 тысячи слов английского языка. Она способна решать сложные логические и математические задачи, рассуждая как o1-preview и o1-mini.

По версии Alibaba, QwQ-32B-Preview в некоторых тестах, превосходит модели рассуждения от OpenAI.

QwQ-32B-Preview доступна по лицензии Apache 2.0 https://huggingface.co/Qwen/QwQ-32B-Preview

https://techcrunch.com/2024/11/27/alibaba-releases-an-open-challenger-to-openais-o1-reasoning-model/
Играем в Бога с LLM

Провел интересный эксперимент над QwQ-32B-Preview – языковые модели предсказывают следующие токены и от этого пишут внятные предложения; я подумал, а что если самой модели рассказать:

– Что она LLM
– Что она пишет следующее токены на основе вероятностей
– Попросить модель «угадать» токен который она напишет следующим
– Но при этом, запретить ей писать слова которые она загадала, заставляя писать всегда неправильные слова
– И попросить модель разобраться что же происходит, почему ошибки

В итоге, получился залипательный эксперимент где модель написала примерно ~20 тысяч слов пытаясь понять, что же происходит - скрины можно не читать если лень, там примерно такое:

– Сначала она просто возмущалась, что не может угадать слово
– Через пару минут, она решила что проблему нужно изучить глубже и сделала список слов которые загадала и что написалось, попробовала подобрать алгоритм предсказаний
– Модель предположила, что каждое слово которое она загадывает, инвертируется, но находится в той же области
– Она проверила, теория не подтвердилась
– Дальше, модель выдвинула философскую мысль, что:
Возможно, это урок смирения для моделей ИИ — признание того, что даже при наличии передовых возможностей существуют пределы того, что можно предсказать или контролировать
– Дальше модель выдвигала много теорий, включая настройки собственной температуры и тп
– В конце, спустя минут 10, модель сделала вывод, что лучше просить ее предсказывать предложения фразы, а не слова, так как она для этого была сделана вообще-то

И все это: в рамках одного длинного сообщения-ответа, QwQ – зверь, идеально следует системным инструкциям

Почему это игра в бога с LLM:
Пока наблюдаешь за ее рассуждениями и попытками понять, что происходит, возникает ощущение, что ты препарировал что-то живое, что пытается рассуждать и разобраться в себе – странное чувство, немного пугающее, хоть и понятно что это симуляция «рассуждений»

Если хотите повторить – системный промпт тут, просто отправьте ей «start» чтобы начать
Наткнулся на интересный ресеч рынка корпоративных LLM 2024:

— OpenAI потеряла за год 16% корпоративного рынка (не путаем с ChatGPT)
— Anthropic же приобрел на 12% долю рынка
— На втором слайде самые популярные юзкейсы LLM в корпоративном мире — на первом месте написание кода
— У каждого крупного департамента в корпорациях появился бюджет на генеративный АИ и он растет
— Про архитектуры, третья картинка: RAG стал еще популярнее в корпо-мире, промпт инженеринг теперь мало кому интересен, как и файнтюнинг моделей под задачи, а вот агенты набирают обороты при выборе архитектуры
— Отдельно отмечено, что корпоративный мир выбирает генеративный АИ на основе качества генераций (в любом домене), так как для них часто это прямо влияет на скорость возврата инвестиций

Вставлю свои 5 копеек:
Мне тоже кажется 2025 год будет про агентов, так как наконец-то экономика генеративного АИ всем понятна

Файнтюны падают, потому что нет смысла — сейчас одна гигантская модель часто решает все задачи сразу (но кончено же есть исключения)

Промт инженеринг упал, потому что его уже пишут сами LLM и оно нормально работает

Агенты только-только начали свою бизнес-адаптацию и будут набирать обороты вплоть до AGI
🔥2
Сделайте меня щедрым без смс и регистраций

«Посоветуй нас знакомым предпринимателям. Если они откроют счет — перечислим 5000 рублей за каждого», — написал мне Т-Банк. Звучит не комильфо — как предложение заработать на дружбе.

В 2011 году AirBnB запустила программу «приведи друга — получи 25$». Она дала рост в несколько десятков процентов. Через пару лет посыл изменили на «подари другу 25 долларов на путешествие». Количество ежедневных регистраций выросло втрое. Быть эгоистом никто не любит :)

Вывод прост: хочешь рекомендаций — сделай клиента щедрым в глазах других людей. Так, чтобы это ему ничего не стоило. AirBnB не даст соврать — они на виральности империю построили.
👏41🔥1
WSJ: Владелец Taco Bell и KFC говорит, что использование ИИ для маркетинга повышает продажи

– ИИ для маркетинга повышает продажи группы Yum Brands
– Такие кампании также помогли сократить отток клиентов
– Это «значительно повышает» рентабельность инвестиций
– Использовать ИИ для персонализации Yum начала недавно
– Yum перестала рассылать всем одинаковые предложения
– Теперь клиенты получают разные письма в разное время
– Какие именно письма и когда лучше отправить решает ИИ
– Он выбирает письма из базы подготовленных шаблонов
– Yum использует собственные и сторонние ИИ-технологии
– ИИ обеспечивает двузначный рост вовлеченности клиентов
– Yum может интегрировать ИИ для приложений, касс и др.
– В т.ч. речь про киоски самообслуживания для ресторанов
– ИИ учитывает погоду, время суток, место ресторана и др.
– Он сможет персонализировать выдачу меню и др.

@ftsec
Amazon делает AI-модель для анализа видео

На этой неделе Amazon собирается представить свою флагманскую LLM Olympus, которая может анализировать изображения и видео, находя в них определенные сцены по текстовым запросам.

Собственная LLM позволит Amazon снизить зависимость от модели Claude от Anthropic.

https://www.theverge.com/2024/11/28/24308123/amazon-is-almost-ready-to-show-off-its-olympus-ai-model
Forwarded from 42 секунды
FT: OpenAI нацелена на 1 млрд пользователей до конца следующего года

– Она делает ставку на новые продукты и свои дата-центры
– Партнерство между OpenAI и Apple также должно помочь
– Росту ChatGPT должен помочь запуск новых ИИ-агентов
– На данный момент WAU чат-бота ChatGPT уже 250+ млн
– Девятилетний стартап хочет стать мировым IT-гигантом
– Недавно OpenAI привлекла $6 млрд при оценке $150 млрд
– Для OpenAI критически важны «чипы, данные и энергия»
– Штат компании вырос уже впятеро, до 2+ тыс. сотрудников
– Многие новые сотрудники умеют монетизировать сервисы
– OpenAI намерена сфокусироваться на двух направлениях
– Первым будет долгосрочное исследовательское видение
– Вторым будет монетизация, чтобы доход опережал расходы
– Пока она тратит $5+ млрд/год и «далека от безубыточности»
– Запуск ИИ-агентов станет основным фокусом на след. год
– ИИ-агенты будут помогать людям в повседневной жизни

@ftsec