🕹️ Mirage 2: создай свой мир в генеративном движке
Представлен новый генератор миров Mirage 2. Первая версия появилась месяц назад, а вторая уже доступна для игры прямо на сайте.
Пользователи могут загружать изображения в стиле киберпанк, детские рисунки или любые другие концепты и сразу же начинать игру.
В отличие от Genie 3, Mirage 2 предлагает не только ходилки, но и стрелялки среди управляющих элементов. Разработчики утверждают: "Mirage 2 делает гигантский шаг вперед, создавая модель мира общего домена, которая позволяет мгновенно создавать, играть и преобразовывать любой игровой мир."
С Mirage 2 игра становится генеративной: пользователи создают свои собственные миры, делятся ими с друзьями и формируют их в реальном времени, исследуя их вместе с понимающим ИИ.
Представлен новый генератор миров Mirage 2. Первая версия появилась месяц назад, а вторая уже доступна для игры прямо на сайте.
Пользователи могут загружать изображения в стиле киберпанк, детские рисунки или любые другие концепты и сразу же начинать игру.
В отличие от Genie 3, Mirage 2 предлагает не только ходилки, но и стрелялки среди управляющих элементов. Разработчики утверждают: "Mirage 2 делает гигантский шаг вперед, создавая модель мира общего домена, которая позволяет мгновенно создавать, играть и преобразовывать любой игровой мир."
С Mirage 2 игра становится генеративной: пользователи создают свои собственные миры, делятся ими с друзьями и формируют их в реальном времени, исследуя их вместе с понимающим ИИ.
This media is not supported in your browser
VIEW IN TELEGRAM
🕹️ Runway Game Worlds: ИИ превращает текст в приключения
Runway представила Game Worlds, текстовую игру, оживленную искусственным интеллектом. Это своего рода возвращение к истокам жанра, где пользователь управляет сюжетом текстовыми командами.
Игрок пишет промпт, а игра визуализирует происходящее, создавая уникальные образы с помощью ИИ. Таким образом, текстовое приключение получает визуальное дополнение.
"Game Worlds" использует передовые AI-технологии для создания нелинейных повествований. Каждая игровая сессия уникальна благодаря персонализированным историям, персонажам и мультимедийному контенту, генерируемым в реальном времени.
В бета-версии пользователям доступны:
⚪️ Готовые текстовые игры.
⚪️ Возможность создавать собственные сценарии.
Runway представила Game Worlds, текстовую игру, оживленную искусственным интеллектом. Это своего рода возвращение к истокам жанра, где пользователь управляет сюжетом текстовыми командами.
Игрок пишет промпт, а игра визуализирует происходящее, создавая уникальные образы с помощью ИИ. Таким образом, текстовое приключение получает визуальное дополнение.
"Game Worlds" использует передовые AI-технологии для создания нелинейных повествований. Каждая игровая сессия уникальна благодаря персонализированным историям, персонажам и мультимедийному контенту, генерируемым в реальном времени.
В бета-версии пользователям доступны:
⚪️ Готовые текстовые игры.
⚪️ Возможность создавать собственные сценарии.
⚙️ ChatGPT: секрет экономии времени с помощью инструкций
Многие пользователи ChatGPT тратят время на повторный ввод промптов. Существует решение – пользовательские инструкции, функция, позволяющая задавать системный промпт, учитываемый ChatGPT перед началом каждого диалога.
Пользовательские инструкции позволяют задать стиль общения, цели, роли и готовые схемы работы.
Чтобы активировать функцию, необходимо:
⚪️ Кликнуть на имя пользователя в левом меню и выбрать «Настройки»;
⚪️ Выбрать «Персонализация» → «Пользовательские инструкции»;
⚪️ Включить ползунок «Включить для новых чатов»;
⚪️ В нижнее поле «Какими характеристиками должен обладать ChatGPT?» вставить подходящий промпт, например, на эмпатию или роль эксперта-ассистента;
⚪️ Нажать «Сохранить».
После активации каждый новый чат будет начинаться с заданными инструкциями.
Например, SMM-щик может использовать следующий промпт: "Ты – копирайтер для соцсетей. Всегда предлагай 3 варианта заголовка, используй эмодзи и разбивай текст на абзацы с подзаголовками. Избегай воды". После этого достаточно попросить: "Напиши пост о новом турнике в парке".
Рекомендуется заранее подготовить необходимые промпты и сохранять их в отдельном файле. Для возврата к настройкам по умолчанию достаточно отключить ползунок.
Многие пользователи ChatGPT тратят время на повторный ввод промптов. Существует решение – пользовательские инструкции, функция, позволяющая задавать системный промпт, учитываемый ChatGPT перед началом каждого диалога.
Пользовательские инструкции позволяют задать стиль общения, цели, роли и готовые схемы работы.
Чтобы активировать функцию, необходимо:
⚪️ Кликнуть на имя пользователя в левом меню и выбрать «Настройки»;
⚪️ Выбрать «Персонализация» → «Пользовательские инструкции»;
⚪️ Включить ползунок «Включить для новых чатов»;
⚪️ В нижнее поле «Какими характеристиками должен обладать ChatGPT?» вставить подходящий промпт, например, на эмпатию или роль эксперта-ассистента;
⚪️ Нажать «Сохранить».
После активации каждый новый чат будет начинаться с заданными инструкциями.
Например, SMM-щик может использовать следующий промпт: "Ты – копирайтер для соцсетей. Всегда предлагай 3 варианта заголовка, используй эмодзи и разбивай текст на абзацы с подзаголовками. Избегай воды". После этого достаточно попросить: "Напиши пост о новом турнике в парке".
Рекомендуется заранее подготовить необходимые промпты и сохранять их в отдельном файле. Для возврата к настройкам по умолчанию достаточно отключить ползунок.
▶️ PewDiePie и его безумный сервер для ИИ
Известный блогер PewDiePie удивил публику, собрав собственный сервер для локального инференса LLM.
В его арсенале:
8 видеокарт.
Процессор Threadripper.
160 гигабайт видеопамяти.
Кажется, что возможно увидеть все, но подобное зрелище действительно поражает воображение.
Известный блогер PewDiePie удивил публику, собрав собственный сервер для локального инференса LLM.
В его арсенале:
8 видеокарт.
Процессор Threadripper.
160 гигабайт видеопамяти.
Кажется, что возможно увидеть все, но подобное зрелище действительно поражает воображение.
💡 Теневой ИИ: сотрудники используют личные инструменты в обход компаний
Отчет MIT вызвал дискуссии об использовании ИИ в бизнесе. Заголовки о "провале" ИИ и 5% успешных инициатив не отражают всей картины.
Анализ показывает, что сотрудники активно используют общедоступные ИИ-инструменты, предпочитая их корпоративным из-за качества.
Исследование выявило, что 90% работников применяют личные ИИ-инструменты, формируя "теневую экономику ИИ". Эта скрытая деятельность повышает продуктивность, ускользая от корпоративного контроля. Это говорит о проблемах управления, позволяющего сотрудникам самостоятельно находить эффективные решения.
Отчет MIT вызвал дискуссии об использовании ИИ в бизнесе. Заголовки о "провале" ИИ и 5% успешных инициатив не отражают всей картины.
Анализ показывает, что сотрудники активно используют общедоступные ИИ-инструменты, предпочитая их корпоративным из-за качества.
Исследование выявило, что 90% работников применяют личные ИИ-инструменты, формируя "теневую экономику ИИ". Эта скрытая деятельность повышает продуктивность, ускользая от корпоративного контроля. Это говорит о проблемах управления, позволяющего сотрудникам самостоятельно находить эффективные решения.
⚡️ В школах России грядут перемены в изучении языков
В российских школах планируется сокращение уроков английского языка. В 5-7 классах количество занятий в неделю уменьшится до двух.
Сокращение коснется не только английского, но и других иностранных языков, таких как испанский, китайский и французский. С 2026 года планируется сокращение уроков немецкого языка. Возможно, настало время учить Инглиш через ChatGPT.
В российских школах планируется сокращение уроков английского языка. В 5-7 классах количество занятий в неделю уменьшится до двух.
Сокращение коснется не только английского, но и других иностранных языков, таких как испанский, китайский и французский. С 2026 года планируется сокращение уроков немецкого языка. Возможно, настало время учить Инглиш через ChatGPT.
🔈 GigaAM: Сбер совершил революцию в распознавании русской речи
Сбер представил GigaAM, новый метод предобучения для распознавания русской речи. Он показывает отличные результаты даже при малом количестве размеченных данных. Разработка была отмечена на Interspeech 2025.
GigaAM использует сигналы из CTC-модели (Connectionist Temporal Classification), а не акустические переменные. Это позволяет получать текст прямо из аудио, не прибегая к сложной разметке.
Self-supervised подход реализуется в два этапа:
⚪️ обучение CTC-модели на основе Conformer на 50 000 часов русской речи;
⚪️ K-means кластеризация для создания меток и обучение новой модели предсказывать эти метки на замаскированных участках аудио.
Финальное обучение проходит на 50 000 часах русской речи. Во время обучения случайно меняется размер чанков (от 200 мс до 8 секунд). Это нужно для адаптации модели к работе в онлайн-режиме и с учетом полного контекста.
Результаты впечатляют:
⏺️ снижение WER на 50% по сравнению с Whisper-large-v3;
⏺️ лидирующая точность среди open-source решений для русского языка;
⏺️ единая модель для онлайн- и оффлайн-режимов;
⏺️ масштабируемость по данным и параметрам;
⏺️ эффективная работа даже на 0.1% размеченных данных.
Новый подход значительно уменьшает зависимость от больших размеченных датасетов и упрощает разработку голосовых интерфейсов. Модель и код доступны в открытом доступе.
Сбер представил GigaAM, новый метод предобучения для распознавания русской речи. Он показывает отличные результаты даже при малом количестве размеченных данных. Разработка была отмечена на Interspeech 2025.
GigaAM использует сигналы из CTC-модели (Connectionist Temporal Classification), а не акустические переменные. Это позволяет получать текст прямо из аудио, не прибегая к сложной разметке.
Self-supervised подход реализуется в два этапа:
⚪️ обучение CTC-модели на основе Conformer на 50 000 часов русской речи;
⚪️ K-means кластеризация для создания меток и обучение новой модели предсказывать эти метки на замаскированных участках аудио.
Финальное обучение проходит на 50 000 часах русской речи. Во время обучения случайно меняется размер чанков (от 200 мс до 8 секунд). Это нужно для адаптации модели к работе в онлайн-режиме и с учетом полного контекста.
Результаты впечатляют:
⏺️ снижение WER на 50% по сравнению с Whisper-large-v3;
⏺️ лидирующая точность среди open-source решений для русского языка;
⏺️ единая модель для онлайн- и оффлайн-режимов;
⏺️ масштабируемость по данным и параметрам;
⏺️ эффективная работа даже на 0.1% размеченных данных.
Новый подход значительно уменьшает зависимость от больших размеченных датасетов и упрощает разработку голосовых интерфейсов. Модель и код доступны в открытом доступе.
🖼️ World Labs: ИИ создает мир из одной картинки
Фей-Фей Ли представила world model своего нового стартапа – World Labs.
Утверждается, что для генерации целого мира ИИ требуется всего одна картинка. Судя по видео, консистентность модели на высоком уровне.
ИИ не забывает детали локации, даже если пользователь отворачивается, и длина генерации не ограничена.
Фей-Фей Ли представила world model своего нового стартапа – World Labs.
Утверждается, что для генерации целого мира ИИ требуется всего одна картинка. Судя по видео, консистентность модели на высоком уровне.
ИИ не забывает детали локации, даже если пользователь отворачивается, и длина генерации не ограничена.
🌃 DeepSeek, Huawei и API: свежие вести из мира ИИ
DeepSeek представила модель V3.1, сочетающую стандартные функции и возможности рассуждений. Отмечается, что в длине цепочек рассуждений она несколько уступает модели R1.
По слухам, DeepSeek могла воздержаться от выпуска более мощной модели из-за требований КПК использовать чипы Huawei для обучения. Несмотря на поддержку Huawei, возникли сложности, и обучение планируется на картах Nvidia, оставив Ascend для развертывания. Ранее появлялась информация об изъятии загранпаспортов у ведущих исследователей DeepSeek.
OpenAI запустила приоритетный уровень в API вместе с релизом GPT-5. За двойную цену запросы будут обрабатываться быстрее, что может быть полезно в пользовательских приложениях для VIP-клиентов. Приоритетный уровень функционирует не только для моделей пятого поколения.
DeepSeek представила модель V3.1, сочетающую стандартные функции и возможности рассуждений. Отмечается, что в длине цепочек рассуждений она несколько уступает модели R1.
По слухам, DeepSeek могла воздержаться от выпуска более мощной модели из-за требований КПК использовать чипы Huawei для обучения. Несмотря на поддержку Huawei, возникли сложности, и обучение планируется на картах Nvidia, оставив Ascend для развертывания. Ранее появлялась информация об изъятии загранпаспортов у ведущих исследователей DeepSeek.
OpenAI запустила приоритетный уровень в API вместе с релизом GPT-5. За двойную цену запросы будут обрабатываться быстрее, что может быть полезно в пользовательских приложениях для VIP-клиентов. Приоритетный уровень функционирует не только для моделей пятого поколения.
🤖 Apple Intelligence может получить Google Gemini
Глава Google, Сундар Пичай, намекнул на переговоры между двумя гигантами несколько месяцев назад.
Стало известно, что Apple не просто хочет использовать Gemini, а запросила у Google специальную версию модели для Siri.
Марк Гурман из Bloomberg сообщает, что Google уже приступила к обучению модели по запросу Apple.
Обучение еще не гарантирует партнерства: Apple может отказаться, если не устроит производительность, приватность или цена.
🍏 Apple также ведет переговоры с OpenAI, Perplexity и Anthropic. Пока неизвестно, кто станет партнером, но компания планирует совершить рывок в ИИ и выпустить умную Siri весной.
Глава Google, Сундар Пичай, намекнул на переговоры между двумя гигантами несколько месяцев назад.
Стало известно, что Apple не просто хочет использовать Gemini, а запросила у Google специальную версию модели для Siri.
Марк Гурман из Bloomberg сообщает, что Google уже приступила к обучению модели по запросу Apple.
Обучение еще не гарантирует партнерства: Apple может отказаться, если не устроит производительность, приватность или цена.
🍏 Apple также ведет переговоры с OpenAI, Perplexity и Anthropic. Пока неизвестно, кто станет партнером, но компания планирует совершить рывок в ИИ и выпустить умную Siri весной.
✨ Tripo: новый уровень реализма в 3D-моделях
В сфере 3D-графики наблюдается значительный прогресс: детализация моделей достигла уровня, сравнимого с фотографиями. Это важный шаг для специалистов по визуализации и энтузиастов 3D.
🆕 В Tripo появились Flux и GPT-4o, упрощающие подбор референсов. Пользователь описывает идею, а система создает основу для работы, экономя время и упрощая процесс для новичков.
💵 Доступ к Tripo остается бесплатным, с щедрой системой кредитов. Это позволяет экспериментировать и развиваться без ограничений.
Возможно, скоро 3D-принтер станет таким же обыденным приобретением, как смартфон.
В сфере 3D-графики наблюдается значительный прогресс: детализация моделей достигла уровня, сравнимого с фотографиями. Это важный шаг для специалистов по визуализации и энтузиастов 3D.
🆕 В Tripo появились Flux и GPT-4o, упрощающие подбор референсов. Пользователь описывает идею, а система создает основу для работы, экономя время и упрощая процесс для новичков.
💵 Доступ к Tripo остается бесплатным, с щедрой системой кредитов. Это позволяет экспериментировать и развиваться без ограничений.
Возможно, скоро 3D-принтер станет таким же обыденным приобретением, как смартфон.
🖼️ Meta* и Midjourney: новая глава в мире ИИ
Появилась информация о том, что Meta, возможно, лицензирует технологии Midjourney. Судя по всему, компания активно ищет новые решения на рынке ИИ.
В первую очередь, Meta заинтересована в генеративном контенте для ленты, аватаров и цифровых инфлюенсеров.
Несмотря на то, что собственные генераторы изображений и видео Meta демонстрировали неплохие результаты, сделка с Midjourney говорит о стремлении к большему.
Пока Midjourney заявляет о своей независимости, эксперты полагают, что в скором времени появятся новые подробности сотрудничества. Одно можно сказать наверняка: у Midjourney появится больше ресурсов, например, для разработки инструментов редактирования изображений.
* – Meta – экстремистская организация, деятельность которой запрещена в РФ
Появилась информация о том, что Meta, возможно, лицензирует технологии Midjourney. Судя по всему, компания активно ищет новые решения на рынке ИИ.
В первую очередь, Meta заинтересована в генеративном контенте для ленты, аватаров и цифровых инфлюенсеров.
Несмотря на то, что собственные генераторы изображений и видео Meta демонстрировали неплохие результаты, сделка с Midjourney говорит о стремлении к большему.
Пока Midjourney заявляет о своей независимости, эксперты полагают, что в скором времени появятся новые подробности сотрудничества. Одно можно сказать наверняка: у Midjourney появится больше ресурсов, например, для разработки инструментов редактирования изображений.
* – Meta – экстремистская организация, деятельность которой запрещена в РФ
This media is not supported in your browser
VIEW IN TELEGRAM
🧬 GPT-4b micro: новый шаг к бессмертию
ChatGPT теперь помогает бороться со старением. Модель GPT-4b micro научили создавать белки, способствующие регенерации тела.
Нейронная сеть умеет просчитывать и предлагать новые варианты белков Яманаки. Именно эти белки запускают процесс регенерации клеток.
Ученые в восторге: новая модель может открыть новые пути к замедлению старения и лечению тяжелых болезней.
ChatGPT теперь помогает бороться со старением. Модель GPT-4b micro научили создавать белки, способствующие регенерации тела.
Нейронная сеть умеет просчитывать и предлагать новые варианты белков Яманаки. Именно эти белки запускают процесс регенерации клеток.
Ученые в восторге: новая модель может открыть новые пути к замедлению старения и лечению тяжелых болезней.
🤖 xAI открыла веса Grok-2: шаг к открытому ИИ
Компания xAI представила веса модели Grok-2. Несмотря на то, что она уже не является передовой, этот шаг важен.
Публикация весов демонстрирует приверженность компании принципам открытого исходного кода.
Это хороший пример для других компаний, которым стоит задуматься о публикации устаревших моделей, таких как GPT 4.5 или Claude 3 Opus.
Веса модели доступны по ссылке: https://huggingface.co/xai-org/grok-2.
Компания xAI представила веса модели Grok-2. Несмотря на то, что она уже не является передовой, этот шаг важен.
Публикация весов демонстрирует приверженность компании принципам открытого исходного кода.
Это хороший пример для других компаний, которым стоит задуматься о публикации устаревших моделей, таких как GPT 4.5 или Claude 3 Opus.
Веса модели доступны по ссылке: https://huggingface.co/xai-org/grok-2.