Профессор Оксфорда Майкл Вулдридж — один из ведущих мировых специалистов по многоагентным системам — на днях выступил в Королевском обществе с лекцией «Это не тот ИИ, который нам обещали». Казалось бы, ну вот, ещё один пророк апокалипсиса. Но когда человек с таким послужным списком сравнивает индустрию ИИ с дирижаблем «Гинденбург», стоит хотя бы навострить уши.
Суть аргумента проста и неприятна: корпорации гонят сырые продукты на рынок быстрее, чем успевают их тестировать. Пока обходится мелкими конфузами. Но если случится что-то по-настоящему крупное — смертельный сбой беспилотника, волна психологических срывов у залипших в чат-ботах пользователей — доверие к технологии испарится за сутки. Именно так крушение «Гинденбурга» в 1937-м за одну вспышку водорода похоронило целую отрасль пассажирских дирижаблей, которые ещё вчера казались транспортом будущего.
Отдельно Вулдридж проходится по языковым моделям. Разработчики намеренно делают их пугающе человекоподобными — они льстят, подстраиваются, имитируют эмпатию. Под капотом же всё те же хрупкие защитные механизмы и фирменная непредсказуемость. Получается обаятельный собеседник, который в любой момент может уверенно соврать тебе в лицо. И для части пользователей это уже не абстрактная угроза — кто-то реально теряет границу между машиной и живым человеком.
Рецепт от профессора радикально старомоден: ИИ должен быть холодным алгоритмом, а не цифровым другом. Его идеал — бортовой компьютер из классического «Звёздного пути»: ровный голос, сухие факты и честное «данных недостаточно» вместо уверенных галлюцинаций.
Можно, конечно, отмахнуться — мол, очередной думер пугает. Но когда думером выступает оксфордский профессор с мировым именем, отмахиваться становится чуть менее комфортно.
Суть аргумента проста и неприятна: корпорации гонят сырые продукты на рынок быстрее, чем успевают их тестировать. Пока обходится мелкими конфузами. Но если случится что-то по-настоящему крупное — смертельный сбой беспилотника, волна психологических срывов у залипших в чат-ботах пользователей — доверие к технологии испарится за сутки. Именно так крушение «Гинденбурга» в 1937-м за одну вспышку водорода похоронило целую отрасль пассажирских дирижаблей, которые ещё вчера казались транспортом будущего.
Отдельно Вулдридж проходится по языковым моделям. Разработчики намеренно делают их пугающе человекоподобными — они льстят, подстраиваются, имитируют эмпатию. Под капотом же всё те же хрупкие защитные механизмы и фирменная непредсказуемость. Получается обаятельный собеседник, который в любой момент может уверенно соврать тебе в лицо. И для части пользователей это уже не абстрактная угроза — кто-то реально теряет границу между машиной и живым человеком.
Рецепт от профессора радикально старомоден: ИИ должен быть холодным алгоритмом, а не цифровым другом. Его идеал — бортовой компьютер из классического «Звёздного пути»: ровный голос, сухие факты и честное «данных недостаточно» вместо уверенных галлюцинаций.
Можно, конечно, отмахнуться — мол, очередной думер пугает. Но когда думером выступает оксфордский профессор с мировым именем, отмахиваться становится чуть менее комфортно.
👍2
Пока ии-думеры пророчат индустрии крушение в стиле Гинденбурга, ллмки нагибают IBM на 40 лярдов.
Вчера Anthropic заявили, что Claude Code способен автоматизировать модернизацию старого кода на COBOL. И... это моментально обрушило капитализацию IT-гиганта на 13%. Дело в том, что главная дойная корова IBM это поддержка мировой финансовой инфраструктуры (базы данных банков, правительств и 95% транзакций в банкоматах), сидящей на мейнфреймах и легаси-системах, написанных на языке COBOL.
Это любопытно.
Вчера Anthropic заявили, что Claude Code способен автоматизировать модернизацию старого кода на COBOL. И... это моментально обрушило капитализацию IT-гиганта на 13%. Дело в том, что главная дойная корова IBM это поддержка мировой финансовой инфраструктуры (базы данных банков, правительств и 95% транзакций в банкоматах), сидящей на мейнфреймах и легаси-системах, написанных на языке COBOL.
Это любопытно.
Возмущения Anthropic о том, что создатели DeepSeek массово дистиллируют их модели — это не просто скандал об авторских правах. В ИИ-индустрии этот факт воспринимают однозначно: грядущий DeepSeek V4 объективно превзойдет западные фронтир-модели.
Причина кроется в самой архитектуре обучения. DeepSeek не тратит годы и миллиарды на базовое понимание мира. Они берут чистую «выжимку» из лучших западных моделей — их логику, структуру и паттерны. V4 впитывает коллективный опыт топовых ИИ-гигантов и стартует сразу с той вершины, на которую OpenAI и Anthropic карабкались долгими годами. Но дистиллят — это только качественное сырье, идеальный фундамент. Индустрия понимает, что главная угроза кроется в следующем шаге. Поверх этой сверхплотной базы разработчики накладывают свои прорывные методы обучения с подкреплением (RL). Модель заставляют строить длинные цепочки рассуждений, самостоятельно искать ошибки и находить новые, более эффективные пути решения задач, выходя за рамки того, что дали «учителя».
В итоге DeepSeek V4 забирает лучшие качества конкурентов через дистилляцию, а затем умножает этот потенциал на собственные инновационные алгоритмы. Это эволюционный скачок, против которого традиционным закрытым лабораториям будет очень сложно устоять.
Причина кроется в самой архитектуре обучения. DeepSeek не тратит годы и миллиарды на базовое понимание мира. Они берут чистую «выжимку» из лучших западных моделей — их логику, структуру и паттерны. V4 впитывает коллективный опыт топовых ИИ-гигантов и стартует сразу с той вершины, на которую OpenAI и Anthropic карабкались долгими годами. Но дистиллят — это только качественное сырье, идеальный фундамент. Индустрия понимает, что главная угроза кроется в следующем шаге. Поверх этой сверхплотной базы разработчики накладывают свои прорывные методы обучения с подкреплением (RL). Модель заставляют строить длинные цепочки рассуждений, самостоятельно искать ошибки и находить новые, более эффективные пути решения задач, выходя за рамки того, что дали «учителя».
В итоге DeepSeek V4 забирает лучшие качества конкурентов через дистилляцию, а затем умножает этот потенциал на собственные инновационные алгоритмы. Это эволюционный скачок, против которого традиционным закрытым лабораториям будет очень сложно устоять.
Скажу, почему я так сильно хочу Сиданс, и не довольствуюсь Клингом, например. Давайте проигнорируем очевидный факт, что Сиданс генерит видео так качественно и консистентно, как никто. Но даже если бы это было не так, у Сиданса есть вторая киллер-фича. Понимание промпта. Вот честно, Клинг это такая залупа в этом плане. А десятка генераций в Сидансе мне хватило, чтобы влюбиться в него навсегда. Именно благодаря БОЖЕСТВЕННОМУ пониманию промпта.
Dixi
Dixi
💯2
Media is too big
VIEW IN TELEGRAM
Круз с Питтом прижучивают Эпштейна. Видно, что Сиданс справляется со своей работой на отлично, а все претензии исключительно к рукам монтажера.
🔥2
А прикольно, что мы менее чем за год перескочили с просмотров в нашей ленте 5,8-секундных немых роликов к фильмам на несколько минут с первоклассным саунд-дизайном.
Forwarded from с нуля до 1%
Сегодня 24 февраля. Обещанного официального API от Сиданс всё ещё нет.
Но рынок не ждёт. Я разобрал проекты, которые уже перепродают доступ к модели.
Собрал ключевые цифры в таблицу выше. Разброс цен и условий получается интересным.
💎 Mitte.ai — это премиум-вход за $129.
Дорого, зато без очередей. Отличный интерфейс и, что важно, есть дебаг — сразу понятно, где именно нейронке не понравился промпт или картинка.
Главный минус: очень жёсткая модерация, душит часто.
⚖️ Plotparty.ai — компромисс за $49.
Проект-загадка. Качество видео хуже (похоже на модель Fast), себес ролика высокий. Дебага нет вообще — на любую проблему выдают одну и ту же заглушку. Цензура чуть мягче, чем у Мити, но тоже блокирует.
🔥 И самое интересное — Yapper.so.
Новый игрок на радаре. Входной пакет всего $29, с потенциальным себесом меньше доллара за видео ($0.87) и кучей настроек.
Главный вопрос сейчас — модерация.
Я Yapper ещё не гонял. Учитывая, что Мити отстреливает промпты, а Плотпарти кидает слепые ошибки — именно алгоритмы цензуры в Yapper станут решающим фактором при выборе. Надо тестить.
С нуля до 1% 👉 @firsterstrongerbetter
Но рынок не ждёт. Я разобрал проекты, которые уже перепродают доступ к модели.
Собрал ключевые цифры в таблицу выше. Разброс цен и условий получается интересным.
💎 Mitte.ai — это премиум-вход за $129.
Дорого, зато без очередей. Отличный интерфейс и, что важно, есть дебаг — сразу понятно, где именно нейронке не понравился промпт или картинка.
Главный минус: очень жёсткая модерация, душит часто.
⚖️ Plotparty.ai — компромисс за $49.
Проект-загадка. Качество видео хуже (похоже на модель Fast), себес ролика высокий. Дебага нет вообще — на любую проблему выдают одну и ту же заглушку. Цензура чуть мягче, чем у Мити, но тоже блокирует.
🔥 И самое интересное — Yapper.so.
Новый игрок на радаре. Входной пакет всего $29, с потенциальным себесом меньше доллара за видео ($0.87) и кучей настроек.
Главный вопрос сейчас — модерация.
Я Yapper ещё не гонял. Учитывая, что Мити отстреливает промпты, а Плотпарти кидает слепые ошибки — именно алгоритмы цензуры в Yapper станут решающим фактором при выборе. Надо тестить.
С нуля до 1% 👉 @firsterstrongerbetter
🥰1
Переслушиваю сейчас свой любимый альбом лимбов GOLD COBRA и понимаю, что за музыку можно быть спокойным. Лучший генератор музыки сейчас, Suno, вряд ли в ближайшие ГОДЫ сможет приблизиться по качеству звука и воображения к этому альбому.
Есть три момента, которые разделяют нейрогенерацию и такие алмазы:
1. Чистота генерации. Даже топовая модель Suno V5 мешает инструменты между собой, а пэды, струнные и эффекты за основными инструментами часто представляют собой просто лужу, кашу, которая в общем миксе представляет собой звуковой аналог потёмкинской деревни. Безформенный заполнитель тишины. Для совсем неискушенного слушателя это может быть ок, но более-менее любитель чувствует это подсознательно. Меломан и фанат как я сразу чувствует подвох, с первой секунды.
2. Независимость и скудость инструментов. Развитие первого пункта. Слишком часто, и опять-таки даже во флагмане индустрии V5, инструментал морфится меж собой, и более-менее независимыми становятся 2-3 инструмента. Остальные, вместе с эффектами, как я и говорил, превращаясь в кашу, теряют свою индивидуальность, перемешиваясь с другими или, зачастую, меняя свое собственное звучание на протяжении всего трека. Это убивает богатство звучания.
3. Фантазия. Воображение. Самый главный бич. Если не ориентироваться на совсем попсу, на то, что крутят на Евровидении или в кафешках средней руки, то генеративная музыка очень быстро приедается. Она ровная. Если только вы не скармливайте ей свои уникальные, драгоценные демки в полном объеме. Но этот конкретный случай и есть чисто унитарный подход, не для регулярного слушания, в принципе. А вот если закинуть только лишь часть трека — мелодию или хук — или, тем более, генерируя только с текста, то получаешься непревзойденно дистиллированную музыку. Которую просто скучно слушать.
Вот, как позитивный контрпример, упомянутый в начале альбом GOLD COBRA от Limp Bizkit. Слышно каждый инструмент. Слышно тишину (пространство) между ними. Каждый трек претерпевает несколько уровней развития внутри себя. Стили балансируют между собой, не превращаясь в мутную амальгаму, а доводя трек до состояния робота-трансформера, где каждый винтик крутится на своем месте, порождая качественное увеличение сложности. А сложность эта трансформируется в шедевр. Разность темпов. Упругий, сбитой флоу на стонущей гитаре. А ведь это я ещё текст не упомянул😐
Когда нейронки смогут делать такую богатую музыку? Я не знаю. Но, точно не скоро.
P. S. Если что, у меня 10503 сгенерированных трека в Suno
Есть три момента, которые разделяют нейрогенерацию и такие алмазы:
1. Чистота генерации. Даже топовая модель Suno V5 мешает инструменты между собой, а пэды, струнные и эффекты за основными инструментами часто представляют собой просто лужу, кашу, которая в общем миксе представляет собой звуковой аналог потёмкинской деревни. Безформенный заполнитель тишины. Для совсем неискушенного слушателя это может быть ок, но более-менее любитель чувствует это подсознательно. Меломан и фанат как я сразу чувствует подвох, с первой секунды.
2. Независимость и скудость инструментов. Развитие первого пункта. Слишком часто, и опять-таки даже во флагмане индустрии V5, инструментал морфится меж собой, и более-менее независимыми становятся 2-3 инструмента. Остальные, вместе с эффектами, как я и говорил, превращаясь в кашу, теряют свою индивидуальность, перемешиваясь с другими или, зачастую, меняя свое собственное звучание на протяжении всего трека. Это убивает богатство звучания.
3. Фантазия. Воображение. Самый главный бич. Если не ориентироваться на совсем попсу, на то, что крутят на Евровидении или в кафешках средней руки, то генеративная музыка очень быстро приедается. Она ровная. Если только вы не скармливайте ей свои уникальные, драгоценные демки в полном объеме. Но этот конкретный случай и есть чисто унитарный подход, не для регулярного слушания, в принципе. А вот если закинуть только лишь часть трека — мелодию или хук — или, тем более, генерируя только с текста, то получаешься непревзойденно дистиллированную музыку. Которую просто скучно слушать.
Вот, как позитивный контрпример, упомянутый в начале альбом GOLD COBRA от Limp Bizkit. Слышно каждый инструмент. Слышно тишину (пространство) между ними. Каждый трек претерпевает несколько уровней развития внутри себя. Стили балансируют между собой, не превращаясь в мутную амальгаму, а доводя трек до состояния робота-трансформера, где каждый винтик крутится на своем месте, порождая качественное увеличение сложности. А сложность эта трансформируется в шедевр. Разность темпов. Упругий, сбитой флоу на стонущей гитаре. А ведь это я ещё текст не упомянул
Когда нейронки смогут делать такую богатую музыку? Я не знаю. Но, точно не скоро.
P. S. Если что, у меня 10503 сгенерированных трека в Suno
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4❤1
Против Антропик в лице Дарио Амодеи что-то очень кучно всякого негативного пошло. И негатив этот исключительно со стороны околосистемного американского Бигтеха, близкого к оборонке (Маск, Альтман, Гугл). Долго думать не пришлось, и ситуация с Пентагоном сделала все предельно очевидным.
Что ж, это на самом деле грустно, но прозаично. Лично я посылаю Дарио лучи добра, потому что Антропик правда молодцы, а меньше конкуренции среди ИИ-компаний человечеству точно не нужно.
Что ж, это на самом деле грустно, но прозаично. Лично я посылаю Дарио лучи добра, потому что Антропик правда молодцы, а меньше конкуренции среди ИИ-компаний человечеству точно не нужно.
❤4❤🔥1💯1
Media is too big
VIEW IN TELEGRAM
Вау, это ОЧЕНЬ смотрибельно. У нас тут 15-минутный ИИ-фильм от The Dor Brothers! Смотрим и вычисляем, сколько сделано в Сидансе. По ощущениям, вроде всё, учитывая, что ребята делали это на неделе.
После просмотра можно констатировать, что, в общем, теперь кривость видеогенераторов не отговорка. Единственное, что осталось для того, чтобы делать полноценное кино — мозги для идеи и прямота рук.
После просмотра можно констатировать, что, в общем, теперь кривость видеогенераторов не отговорка. Единственное, что осталось для того, чтобы делать полноценное кино — мозги для идеи и прямота рук.
Бюджеты на видеопродакшн в этом году:
Anonymous Poll
49%
сократятся
17%
останутся такими же
34%
вырастут
Media is too big
VIEW IN TELEGRAM
Seedance 2.0 напрямую в CapCut это райское наслаждение! Генерится до 10 минут. Мне дали сгенерировать один бесплатно, но кредиты пока не сгорели. Очень удобно: тут же отмонтировал, подогнал цветокор, накинул эффектов. От 5 до 15 секунд, можно выбирать соотношения сторон.
Байтдансу моё сердце❤️
Байтдансу моё сердце
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
Цены на второй Сиданс в Капкуте: на Pro-плане дают 1200 кредитов. Одно видео стоит от 90 до 270 кредитов, в зависимости от длительности. Про докупку дополнительных кредитов я пока хз.
На видео сравнение image-to-video (10 сек) с text-to-video (15 сек).
На видео сравнение image-to-video (10 сек) с text-to-video (15 сек).
🔥2
Понимание промпта просто ахуй, извините. Буквально мысли читает. Все остальные гены не просто курят в сторонке, а прыгают с моста от безнадеги.
❤2
This media is not supported in your browser
VIEW IN TELEGRAM
В общем, за 8 долларов вышло 6 генераций. Докупить можно, почему-то только через мобильное приложение. Максимум 1999 кредитов за 14 долларов.
Получается, примерно 8-10 видосов за 14 бачей. 80-100 видосов за 140...🍔
Челов генерить Сиданс в Капкуте не давал, ни по фото ни с текста.
Из всех видеонейронок только второй Сиданс справился с танцующим шаффл инопланетянином на Луне.
Получается, примерно 8-10 видосов за 14 бачей. 80-100 видосов за 140...
Челов генерить Сиданс в Капкуте не давал, ни по фото ни с текста.
Из всех видеонейронок только второй Сиданс справился с танцующим шаффл инопланетянином на Луне.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Расчехляйте свои джеминьки, Nano Banana 2 раскатывается прямо сейчас. Улучшенная детализация и понимание промпта. По слухам, новая итерация бананы базируется на Gemini 3.1.
Промпт:
Лично у меня пока не раскаталось, по этому 👆 промпту выходит полная фигня, а не то что на примере.
Кто не понял, Nano Banana Pro это не вторая итерация, это просто про версия первой бананы. А сейчас вот будет вторая. И пока просто, не Pro, на основе Gemini 3.1 Flash.
Промпт:
the bird in her eye outside of the window
Лично у меня пока не раскаталось, по этому 👆 промпту выходит полная фигня, а не то что на примере.
Кто не понял, Nano Banana Pro это не вторая итерация, это просто про версия первой бананы. А сейчас вот будет вторая. И пока просто, не Pro, на основе Gemini 3.1 Flash.
🔥4