Forwarded from эйай ньюз
OpenAI выпустили o3-mini - бесплатно
Лимиты бесплатным пользователям пока непонятные, Pro подписчикам дают безлимит, Team и Plus - 150 сообщений в день. Также к o3-mini, в качестве эксперимента, прикрутили поиск.
Модель доступна одновременно как и в чате так и в API, куда добавили поддержку function calling и structured output для этой модели. Цену скинули в три раза - стоит новая модель $1.10/$4.40 за миллион токенов, что лишь немногим дороже R1 с официального API (и дешевле многих неофициальных).
У новой модели есть три режима работы:
(1) быстрый режим low compute,
(2) обходящий o1-mini режим medium (всё равно на 24% быстрее),
(3) и опережающий o1 на большинстве бенчей, более медленный режим high compute.
Есть и нюансы - как и оригинальная o1-mini, o3-mini не поддерживает мультимодальный ввод, а одну из требующих агентности задач модель полностью провалила - использовала bash вместо питона не смотря на все попытки уговорить её это не делать.
Модель очень интересная, классно что бесплатным пользователям наконец-то дали reasoning модель. Ощущается как OpenAI задвигались, когда появилась конкуренция - и цены сбрасывают, и доступ бесплатным юзерам дают, и поиск прикручивают.
@ai_newz
Лимиты бесплатным пользователям пока непонятные, Pro подписчикам дают безлимит, Team и Plus - 150 сообщений в день. Также к o3-mini, в качестве эксперимента, прикрутили поиск.
Модель доступна одновременно как и в чате так и в API, куда добавили поддержку function calling и structured output для этой модели. Цену скинули в три раза - стоит новая модель $1.10/$4.40 за миллион токенов, что лишь немногим дороже R1 с официального API (и дешевле многих неофициальных).
У новой модели есть три режима работы:
(1) быстрый режим low compute,
(2) обходящий o1-mini режим medium (всё равно на 24% быстрее),
(3) и опережающий o1 на большинстве бенчей, более медленный режим high compute.
Есть и нюансы - как и оригинальная o1-mini, o3-mini не поддерживает мультимодальный ввод, а одну из требующих агентности задач модель полностью провалила - использовала bash вместо питона не смотря на все попытки уговорить её это не делать.
Модель очень интересная, классно что бесплатным пользователям наконец-то дали reasoning модель. Ощущается как OpenAI задвигались, когда появилась конкуренция - и цены сбрасывают, и доступ бесплатным юзерам дают, и поиск прикручивают.
@ai_newz
VisoMaster Portable by Neurogen | Бывший Rope | DeepFake
VisoMaster - профессиональный DeepFake видеоредактор от разработчиков Rope и RopeMod. Так как оригинальный разработчик Rope уже около полугода не выпускал обновлений, комьюнити решило отделиться и сделать свой "ремастер" для Rope.
Программа практически полностью повторяет функционал RopeMod, такие как тонкая настройка маски и замена видео с вебкамеры, но возможно некоторые функции буду добавлены позже.
Самое главное в программе - что графический интерфейс для пользователя стал еще более удобным и быстрым - теперь все быстро отзывается, вы можете работать не только папками но и единичными файлами, а также подросла скорость работы отдельных элементов.
От себя, я пересобрал сборку на основе Cuda 12.6 и библиотек, а также добавил все необходимые модели.
Сборка доступна для загрузки для поддержавших канал финансово на:
Boosty | Приватный ТГ канал со сборками
#portable #rope #deepfake
VisoMaster - профессиональный DeepFake видеоредактор от разработчиков Rope и RopeMod. Так как оригинальный разработчик Rope уже около полугода не выпускал обновлений, комьюнити решило отделиться и сделать свой "ремастер" для Rope.
Программа практически полностью повторяет функционал RopeMod, такие как тонкая настройка маски и замена видео с вебкамеры, но возможно некоторые функции буду добавлены позже.
Самое главное в программе - что графический интерфейс для пользователя стал еще более удобным и быстрым - теперь все быстро отзывается, вы можете работать не только папками но и единичными файлами, а также подросла скорость работы отдельных элементов.
От себя, я пересобрал сборку на основе Cuda 12.6 и библиотек, а также добавил все необходимые модели.
Сборка доступна для загрузки для поддержавших канал финансово на:
Boosty | Приватный ТГ канал со сборками
#portable #rope #deepfake
🔥 OpenAI объединяет все технологии в GPT‑5: что нас ждёт?
💡 OpenAI меняет стратегию — вместо множества специализированных моделей создаётся единая система GPT‑5, чтобы избавиться от запутанного выбора для пользователей. Сэм Альтман объяснил, что цель – «единственный интеллект, который просто работает».
📌 Новая линейка моделей:
• GPT‑4.5 ("Orion")
Это промежуточная версия без технологии «цепочки мыслей». Запуск GPT‑4.5 ожидается уже в ближайшие недели и станет тестом для новых наработок.
• GPT‑5
Унифицированная модель, включающая голосовое управление, обработку изображений, улучшенный поиск и алгоритмы рассуждения. Базовая версия будет бесплатной для всех пользователей, а подписчики Plus и Pro получат расширенные возможности. По большинству источников (Reuters, Business Insider, WSJ и др.) GPT‑5 может появиться в ближайшие месяцы, хотя точные даты пока не объявлены. Некоторые публикации отмечают, что проект уже столкнулся с задержками и высокими затратами.
📌 Как будет организован доступ и монетизация?
💰 Бесплатный доступ:
Все пользователи ChatGPT смогут пользоваться GPT‑5 без ограничений на базовом уровне.
💎 Платные подписки:
• ChatGPT Plus (~$20/мес.) — доступ к более мощной версии GPT‑5, сниженная задержка ответов, приоритет в нагрузке на серверы.
• ChatGPT Pro (~$200/мес) — вероятно, включит доступ к улучшенному голосовому чату, продвинутым инструментам для бизнеса и API без ограничений.
🌍 GPT Store:
OpenAI активно развивает свою экосистему — GPT Store, где разработчики смогут монетизировать кастомные GPT-модели, предлагая их пользователям по подписке или за разовую плату.
📌 Основные плюсы и вызовы:
✅ Преимущества:
– Упрощённый интерфейс и единый API для разработчиков.
– Бесплатный доступ для всех пользователей.
– Возможность зарабатывать на кастомных GPT через GPT Store.
❗️ Проблемы:
– Обучение модели обходится в сотни миллионов долларов.
– Недостаток качественных данных вынуждает создавать синтетические наборы, что замедляет процесс.
– Внутренние перестановки и конкуренция за таланты влияют на сроки разработки.
OpenAI отказывается от разрозненных моделей в пользу единой системы. GPT‑4.5 — запуск в ближайшие недели, а GPT‑5 появится через несколько месяцев. Базовый доступ будет бесплатным, но для продвинутых возможностей потребуется подписка. Новая стратегия упрощает использование ИИ и помогает OpenAI сохранить лидерство на фоне растущей конкуренции.
#chatgpt #gpt-5 #openai #llm
💡 OpenAI меняет стратегию — вместо множества специализированных моделей создаётся единая система GPT‑5, чтобы избавиться от запутанного выбора для пользователей. Сэм Альтман объяснил, что цель – «единственный интеллект, который просто работает».
📌 Новая линейка моделей:
• GPT‑4.5 ("Orion")
Это промежуточная версия без технологии «цепочки мыслей». Запуск GPT‑4.5 ожидается уже в ближайшие недели и станет тестом для новых наработок.
• GPT‑5
Унифицированная модель, включающая голосовое управление, обработку изображений, улучшенный поиск и алгоритмы рассуждения. Базовая версия будет бесплатной для всех пользователей, а подписчики Plus и Pro получат расширенные возможности. По большинству источников (Reuters, Business Insider, WSJ и др.) GPT‑5 может появиться в ближайшие месяцы, хотя точные даты пока не объявлены. Некоторые публикации отмечают, что проект уже столкнулся с задержками и высокими затратами.
📌 Как будет организован доступ и монетизация?
💰 Бесплатный доступ:
Все пользователи ChatGPT смогут пользоваться GPT‑5 без ограничений на базовом уровне.
💎 Платные подписки:
• ChatGPT Plus (~$20/мес.) — доступ к более мощной версии GPT‑5, сниженная задержка ответов, приоритет в нагрузке на серверы.
• ChatGPT Pro (~$200/мес) — вероятно, включит доступ к улучшенному голосовому чату, продвинутым инструментам для бизнеса и API без ограничений.
🌍 GPT Store:
OpenAI активно развивает свою экосистему — GPT Store, где разработчики смогут монетизировать кастомные GPT-модели, предлагая их пользователям по подписке или за разовую плату.
📌 Основные плюсы и вызовы:
✅ Преимущества:
– Упрощённый интерфейс и единый API для разработчиков.
– Бесплатный доступ для всех пользователей.
– Возможность зарабатывать на кастомных GPT через GPT Store.
❗️ Проблемы:
– Обучение модели обходится в сотни миллионов долларов.
– Недостаток качественных данных вынуждает создавать синтетические наборы, что замедляет процесс.
– Внутренние перестановки и конкуренция за таланты влияют на сроки разработки.
OpenAI отказывается от разрозненных моделей в пользу единой системы. GPT‑4.5 — запуск в ближайшие недели, а GPT‑5 появится через несколько месяцев. Базовый доступ будет бесплатным, но для продвинутых возможностей потребуется подписка. Новая стратегия упрощает использование ИИ и помогает OpenAI сохранить лидерство на фоне растущей конкуренции.
#chatgpt #gpt-5 #openai #llm
VisoMaster Portable by Neurogen v 0.1.3 | DeepFake | Nvidia
VisoMaster — мощная и простая в использовании программа для замены лиц (DeepFake) и редактирования видео, которая объединяет современные нейросетевые технологии для создания реалистичных эффектов. Программа разработана для работы с изображениями и видео и включает следующие основные возможности:
Face Swap
• Поддержка нескольких моделей замены лиц, включая модели, обученные с помощью DeepFaceLab (DFM)
• Многолицевая замена с индивидуальными настройками маскирования для каждой части лица
• Поддержка occlusion masking (DFL XSeg Masking)
• Совместимость с популярными детекторами лиц и алгоритмами определения ключевых точек
• Восстановление оригинальных выражений (Expression Restorer)
• Улучшение качества изображений лиц с помощью моделей масштабирования (Face Restoration)
Face Editor (LivePortrait Models)
• Ручная настройка выражений и поз
• Точная корректировка цветовой гаммы для лица, волос, бровей и губ через RGB-редактирование
Другие мощные функции
• Live Playback – предпросмотр видео в реальном времени
• Использование эмбеддингов лиц для повышения точности и сходства при замене
• Возможность живой замены лиц через веб-камеру для стриминга (Twitch, YouTube, Zoom и т.д.)
• Интуитивно понятный интерфейс
• Видео-маркеры для детальной настройки параметров по кадру
• Поддержка TensorRT для ускорения обработки на совместимых GPU
• И многое другое
---
Что нового:
v0.1.3:
- Добавлена поддержка загрузки изображений с путей, содержащих символы Unicode (неанглийские букв, такие как кириллица и др. )
- Добавлены кнопки для загрузки папок с целевыми и входными медиа
- Последние загруженные пути для целевых файлов, входных медиа и эмбеддингов теперь запоминаются
- Параметры сохраняются в файле рабочего пространства даже при отсутствии целевых лиц
- Другие мелкие исправления и улучшения
v0.1.2:
- Исправлены проблемы с невидимыми элементами в Dark-Blue теме
- Устранена проблема с автопрокруткой на списках
- Скорректированы отступы в панели параметров
- Перемещены переключатели «Face Compare» и «Mask View» в видеопанель
- Опция «Save Image» теперь напрямую сохраняет изображение в выходную папку
- Другие незначительные багфиксы и улучшения
Также были обновлены CuDNN и TensorRT до последних версий.
Сборка доступна для загрузки для тех, кто поддержал канал финансово.
Поддержать можно:
Boosty [Карта]| Приватный Telegram [USDT]
#deepfake #portable #rope
VisoMaster — мощная и простая в использовании программа для замены лиц (DeepFake) и редактирования видео, которая объединяет современные нейросетевые технологии для создания реалистичных эффектов. Программа разработана для работы с изображениями и видео и включает следующие основные возможности:
Face Swap
• Поддержка нескольких моделей замены лиц, включая модели, обученные с помощью DeepFaceLab (DFM)
• Многолицевая замена с индивидуальными настройками маскирования для каждой части лица
• Поддержка occlusion masking (DFL XSeg Masking)
• Совместимость с популярными детекторами лиц и алгоритмами определения ключевых точек
• Восстановление оригинальных выражений (Expression Restorer)
• Улучшение качества изображений лиц с помощью моделей масштабирования (Face Restoration)
Face Editor (LivePortrait Models)
• Ручная настройка выражений и поз
• Точная корректировка цветовой гаммы для лица, волос, бровей и губ через RGB-редактирование
Другие мощные функции
• Live Playback – предпросмотр видео в реальном времени
• Использование эмбеддингов лиц для повышения точности и сходства при замене
• Возможность живой замены лиц через веб-камеру для стриминга (Twitch, YouTube, Zoom и т.д.)
• Интуитивно понятный интерфейс
• Видео-маркеры для детальной настройки параметров по кадру
• Поддержка TensorRT для ускорения обработки на совместимых GPU
• И многое другое
---
Что нового:
v0.1.3:
- Добавлена поддержка загрузки изображений с путей, содержащих символы Unicode (неанглийские букв, такие как кириллица и др. )
- Добавлены кнопки для загрузки папок с целевыми и входными медиа
- Последние загруженные пути для целевых файлов, входных медиа и эмбеддингов теперь запоминаются
- Параметры сохраняются в файле рабочего пространства даже при отсутствии целевых лиц
- Другие мелкие исправления и улучшения
v0.1.2:
- Исправлены проблемы с невидимыми элементами в Dark-Blue теме
- Устранена проблема с автопрокруткой на списках
- Скорректированы отступы в панели параметров
- Перемещены переключатели «Face Compare» и «Mask View» в видеопанель
- Опция «Save Image» теперь напрямую сохраняет изображение в выходную папку
- Другие незначительные багфиксы и улучшения
Также были обновлены CuDNN и TensorRT до последних версий.
Сборка доступна для загрузки для тех, кто поддержал канал финансово.
Поддержать можно:
Boosty [Карта]| Приватный Telegram [USDT]
#deepfake #portable #rope
Илон Маск официально анонсировал Grok 3 — новую версию чат-бота, которая, по его словам, станет «самым умным искусственным интеллектом на Земле».
- Улучшенные возможности понимания контекста
- Расширенные способности к творческому письму
- Глубокая интеграция с X (Twitter)
Grok разрабатывается компанией xAI и уже конкурирует с ChatGPT от OpenAI и Gemini от Google. Маск заявляет, что Grok 3 будет значительно превосходить предшественников по интеллекту и автономности.
Please open Telegram to view this post
VIEW IN TELEGRAM
Microsoft анонсировала MatterGen — модель на базе ИИ которая может революционизировать процесс разработки новых материалов Вместо того чтобы исследователи тратили годы на эксперименты, MatterGen помогает ускорить этот процесс до недель и месяцев, минимизируя затраты и риски.
MatterGen использует глубокое обучение для анализа миллиардов данных о материалах и их поведении в разных условиях. Он способен предсказать, как материал будет вести себя в реальном мире, даже до начала его физического тестирования.
Понимание свойств новых материалов — это основа множества прорывных технологий, от энергетики до медицины. Например, с помощью ИИ можно создавать сверхпрочные и легкие материалы для космических путешествий или новые энергоэффективные батареи.
- Устойчивые материалы для энергии снижение воздействия на экологию за счет улучшенной энергетической эффективности.
- Новые сверхпрочные сплавы для авиа- и автомобильной промышленности.
- Медицинские импланты создание материалов, совместимых с человеческим телом для более долгосрочных и безопасных решений.
Создание материалов — это основной элемент технологического прогресса. Каждое новое открытие открывает двери для новых инноваций, и теперь с помощью ИИ этот процесс станет быстрее и доступнее.
Итог: MatterGen может не просто ускорить научные открытия, а изменить сам подход к научным исследованиям, превращая ИИ в партнера ученых в поисках новых решений для глобальных проблем.
Что думаете о будущем, где ИИ поможет открыть материалы, о которых мы даже не мечтали?
Please open Telegram to view this post
VIEW IN TELEGRAM
Neurogen
Grok-3 уже доступен.
Модель доступна для премиум пользователей Х, но можно протестировать и бесплатно на lmarena:
Идем на https://lmarena.ai > Выбираем Direct Chat > Выбираем groq-3
Сама же модель обходит всех конкурентов в рейтинге LMSYS
Модель доступна для премиум пользователей Х, но можно протестировать и бесплатно на lmarena:
Идем на https://lmarena.ai > Выбираем Direct Chat > Выбираем groq-3
Сама же модель обходит всех конкурентов в рейтинге LMSYS
Yuewen text-to-video
Новый видео генератор от китайцев с открытым кодом.
🟡 80gb VRAM
🟡 Длительность видео - до 10сек
🟡 544px992
🐱 Открытый код
🆓 Протестировать
Новый видео генератор от китайцев с открытым кодом.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Основная информация по Grok-3
🟡 Grok-3 — новая версия чат-бота от xAI, представленная Илоном Маском, значительно умнее предыдущей модели Grok-2 (в 10 раз).
🟡 Тесты: Grok-3 обходит такие модели, как GPT-4o, Claude 3.5, Sonnet, Gemini-2 Pro и DeepSeek-V3 в областях математики, кодирования и научной работы.
🟡 Способности рассуждения: Grok-3 демонстрирует высокие возможности для рассуждения, с признаками креативности, и способен рассчитывать сложные задачи, такие как полёт на Марс.
🟡 Технологическая база: Grok-3 обучали на суперкомпьютере Colossus с 200,000 чипами Nvidia H100.
🟡 Функция DeepSearch: ИИ анализирует весь интернет для точных ответов на запросы, а если ответ не найден, даёт обоснованные предположения по любому вопросу.
🟡 Генерация игр: Grok-3 может создавать игры на ходу, как показано на примере Тетриса и Три-в-ряд.
🟡 Статус: Grok-3 находится на стадии бета-тестирования, есть мини-версия модели. Также запланирован голосовой режим, который будет выпущен через неделю.
🟡 Отзывы: Андрей Карпаты (бывший сотрудник OpenAI и Tesla) отметил, что Grok-3 демонстрирует отличные результаты на уровне сильнейших моделей и впечатляет быстротой разработки.
Статья
Статья
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
FastHynyuanVideo Portable by Neurogen
Сборка для генерации видео txt2video.
Сборка заточена для работы на видеокартах RTX 4090 и, теоретически, и 3090. Еще более ужатая версия для карт на 8-12 Гигабайт видеопамяти выйдет позже.
Качаете архив, распаковываете, затем запускаете файл run_nvidia_gpu.bat
Затем у вас откроется браузер и в этой вкладке нажмите W. Затем в появившемся окне выберите наш рабочий процесс (он всего один)
Для вас я специально выделил и подписал основные настройки в рамках одной группы, а также добавил подсказку по оптимальным параметрам.
Под капотом - полностью готовый к работе и настроенный ComfyUI, с кучей оптимизаций.
По производительности: генерация одного видео в несколько секунд хронометража генерируется на RTX 4090 примерно 80-90 секунд (что, как по мне, ну очень быстро).
Сборка поддерживает возможность выбора LoRA, специально для вас я закинул несколько, в том числе и для генерации NSFW контента😁 .
Дополнительные вы можете скачать на civit.ai, их там по моему целая сотня.
Рекомендуемые разрешения это 848x480, 960x544 и 1280x720, но на 24 GB VRAM наиболее адекватно работает 848x480, 960x544. Количество кадров от 25 до 129. В среднем, генерация ролика в таком случае занимает до двух минут.
Скачать сборку бесплатно можно с:
C моего сервера | С зеркала (Яндекс Диск)
P.S. Для тех, кто не работал с ComfyUI, видеообзор будет на днях.
Сборка для меня пробная, при наличии ошибок просьба писать сколько у вас оперативной памяти и какая модель видеокарты.
Сборка для генерации видео txt2video.
Сборка заточена для работы на видеокартах RTX 4090 и, теоретически, и 3090. Еще более ужатая версия для карт на 8-12 Гигабайт видеопамяти выйдет позже.
Качаете архив, распаковываете, затем запускаете файл run_nvidia_gpu.bat
Затем у вас откроется браузер и в этой вкладке нажмите W. Затем в появившемся окне выберите наш рабочий процесс (он всего один)
Для вас я специально выделил и подписал основные настройки в рамках одной группы, а также добавил подсказку по оптимальным параметрам.
Под капотом - полностью готовый к работе и настроенный ComfyUI, с кучей оптимизаций.
По производительности: генерация одного видео в несколько секунд хронометража генерируется на RTX 4090 примерно 80-90 секунд (что, как по мне, ну очень быстро).
Сборка поддерживает возможность выбора LoRA, специально для вас я закинул несколько, в том числе и для генерации NSFW контента
Дополнительные вы можете скачать на civit.ai, их там по моему целая сотня.
Рекомендуемые разрешения это 848x480, 960x544 и 1280x720, но на 24 GB VRAM наиболее адекватно работает 848x480, 960x544. Количество кадров от 25 до 129. В среднем, генерация ролика в таком случае занимает до двух минут.
Скачать сборку бесплатно можно с:
C моего сервера | С зеркала (Яндекс Диск)
P.S. Для тех, кто не работал с ComfyUI, видеообзор будет на днях.
Сборка для меня пробная, при наличии ошибок просьба писать сколько у вас оперативной памяти и какая модель видеокарты.
Please open Telegram to view this post
VIEW IN TELEGRAM
text-to-spench модель от Zyphra
Команда Zyphra анонсировала выпуск бета-версии Zonos v0.1, включающей две модели для преобразования текста в речь (TTS) с клонированием голоса в реальном времени. Модели 1.6B Transformer и 1.6B Hybrid доступны под лицензией Apache 2.0.
- Клонирование голоса
- Поддерживает английский, японский, китайский, французский и немецкий языки, русского нет
- Контроль скорости речи, высоты тона, максимальной частоты, качества звука
- Возможность контроля эмоция
- Открытый Playground и API
- 200,000 часов речевых данных для обучения: английский, китайский, японский и другие языки.
- Поддержка быстрой генерации речи с низкими задержками (200-300 мс) на RTX 4090.
- Модели обучаются с использованием автокодера DAC и параметров (скорость речи, высота тона, эмоции).
Please open Telegram to view this post
VIEW IN TELEGRAM