Neurogen
22.6K subscribers
565 photos
187 videos
17 files
582 links
Популяризатор нейросетей, разработчик-энтузиаст, блогер.

СEO NeuroIMG.ART
Реклама: https://telega.in/c/neurogen_news
По остальному: @roman_neurogen

Портативные сборки: https://boosty.to/neurogen

Live канал: @neurogen_blog
Реестр РКН: №4777528086
Download Telegram
Forwarded from эйай ньюз
OpenAI выпустили o3-mini - бесплатно

Лимиты бесплатным пользователям пока непонятные, Pro подписчикам дают безлимит, Team и Plus - 150 сообщений в день. Также к o3-mini, в качестве эксперимента, прикрутили поиск.

Модель доступна одновременно как и в чате так и в API, куда добавили поддержку function calling и structured output для этой модели. Цену скинули в три раза - стоит новая модель $1.10/$4.40 за миллион токенов, что лишь немногим дороже R1 с официального API (и дешевле многих неофициальных).

У новой модели есть три режима работы:
(1) быстрый режим low compute,
(2) обходящий o1-mini режим medium (всё равно на 24% быстрее),
(3) и опережающий o1 на большинстве бенчей, более медленный режим high compute.

Есть и нюансы - как и оригинальная o1-mini, o3-mini не поддерживает мультимодальный ввод, а одну из требующих агентности задач модель полностью провалила - использовала bash вместо питона не смотря на все попытки уговорить её это не делать.

Модель очень интересная, классно что бесплатным пользователям наконец-то дали reasoning модель. Ощущается как OpenAI задвигались, когда появилась конкуренция - и цены сбрасывают, и доступ бесплатным юзерам дают, и поиск прикручивают.

@ai_newz
VisoMaster Portable by Neurogen | Бывший Rope | DeepFake

VisoMaster - профессиональный DeepFake видеоредактор от разработчиков Rope и RopeMod. Так как оригинальный разработчик Rope уже около полугода не выпускал обновлений, комьюнити решило отделиться и сделать свой "ремастер" для Rope.

Программа практически полностью повторяет функционал RopeMod, такие как тонкая настройка маски и замена видео с вебкамеры, но возможно некоторые функции буду добавлены позже.
Самое главное в программе - что графический интерфейс для пользователя стал еще более удобным и быстрым - теперь все быстро отзывается, вы можете работать не только папками но и единичными файлами, а также подросла скорость работы отдельных элементов.
От себя, я пересобрал сборку на основе Cuda 12.6 и библиотек, а также добавил все необходимые модели.

Сборка доступна для загрузки для поддержавших канал финансово на:

Boosty | Приватный ТГ канал со сборками

#portable #rope #deepfake
Нейросети пока не сделают за вас всё, но сделают многое!

А чтобы найти идеальную нейросеть для ваших задач —
подписывайтесь на GPT DO IT - здесь, ясно, чётко, актуально 💪
@gptdoit
🔥 OpenAI объединяет все технологии в GPT‑5: что нас ждёт?

💡 OpenAI меняет стратегию — вместо множества специализированных моделей создаётся единая система GPT‑5, чтобы избавиться от запутанного выбора для пользователей. Сэм Альтман объяснил, что цель – «единственный интеллект, который просто работает».

📌 Новая линейка моделей:

GPT‑4.5 ("Orion")
Это промежуточная версия без технологии «цепочки мыслей». Запуск GPT‑4.5 ожидается уже в ближайшие недели и станет тестом для новых наработок.

GPT‑5
Унифицированная модель, включающая голосовое управление, обработку изображений, улучшенный поиск и алгоритмы рассуждения. Базовая версия будет бесплатной для всех пользователей, а подписчики Plus и Pro получат расширенные возможности. По большинству источников (Reuters, Business Insider, WSJ и др.) GPT‑5 может появиться в ближайшие месяцы, хотя точные даты пока не объявлены. Некоторые публикации отмечают, что проект уже столкнулся с задержками и высокими затратами.

📌 Как будет организован доступ и монетизация?

💰 Бесплатный доступ:
Все пользователи ChatGPT смогут пользоваться GPT‑5 без ограничений на базовом уровне.

💎 Платные подписки:
ChatGPT Plus (~$20/мес.) — доступ к более мощной версии GPT‑5, сниженная задержка ответов, приоритет в нагрузке на серверы.
ChatGPT Pro (~$200/мес) — вероятно, включит доступ к улучшенному голосовому чату, продвинутым инструментам для бизнеса и API без ограничений.

🌍 GPT Store:
OpenAI активно развивает свою экосистему — GPT Store, где разработчики смогут монетизировать кастомные GPT-модели, предлагая их пользователям по подписке или за разовую плату.

📌 Основные плюсы и вызовы:

Преимущества:
– Упрощённый интерфейс и единый API для разработчиков.
– Бесплатный доступ для всех пользователей.
– Возможность зарабатывать на кастомных GPT через GPT Store.

❗️ Проблемы:
– Обучение модели обходится в сотни миллионов долларов.
– Недостаток качественных данных вынуждает создавать синтетические наборы, что замедляет процесс.
– Внутренние перестановки и конкуренция за таланты влияют на сроки разработки.

OpenAI отказывается от разрозненных моделей в пользу единой системы. GPT‑4.5 — запуск в ближайшие недели, а GPT‑5 появится через несколько месяцев. Базовый доступ будет бесплатным, но для продвинутых возможностей потребуется подписка. Новая стратегия упрощает использование ИИ и помогает OpenAI сохранить лидерство на фоне растущей конкуренции.

#chatgpt #gpt-5 #openai #llm
После увиденного в трендах Reels/Shorts видео с ИИсусом, невольно задумаешься, а тот ли контент ты делаешь...

#ai #юмор
VisoMaster Portable by Neurogen v 0.1.3 | DeepFake | Nvidia

VisoMaster — мощная и простая в использовании программа для замены лиц (DeepFake) и редактирования видео, которая объединяет современные нейросетевые технологии для создания реалистичных эффектов. Программа разработана для работы с изображениями и видео и включает следующие основные возможности:

Face Swap
• Поддержка нескольких моделей замены лиц, включая модели, обученные с помощью DeepFaceLab (DFM)
• Многолицевая замена с индивидуальными настройками маскирования для каждой части лица
• Поддержка occlusion masking (DFL XSeg Masking)
• Совместимость с популярными детекторами лиц и алгоритмами определения ключевых точек
• Восстановление оригинальных выражений (Expression Restorer)
• Улучшение качества изображений лиц с помощью моделей масштабирования (Face Restoration)

Face Editor (LivePortrait Models)
• Ручная настройка выражений и поз
• Точная корректировка цветовой гаммы для лица, волос, бровей и губ через RGB-редактирование

Другие мощные функции
• Live Playback – предпросмотр видео в реальном времени
• Использование эмбеддингов лиц для повышения точности и сходства при замене
• Возможность живой замены лиц через веб-камеру для стриминга (Twitch, YouTube, Zoom и т.д.)
• Интуитивно понятный интерфейс
• Видео-маркеры для детальной настройки параметров по кадру
• Поддержка TensorRT для ускорения обработки на совместимых GPU
• И многое другое

---

Что нового:
v0.1.3:
- Добавлена поддержка загрузки изображений с путей, содержащих символы Unicode (неанглийские букв, такие как кириллица и др. )
- Добавлены кнопки для загрузки папок с целевыми и входными медиа
- Последние загруженные пути для целевых файлов, входных медиа и эмбеддингов теперь запоминаются
- Параметры сохраняются в файле рабочего пространства даже при отсутствии целевых лиц
- Другие мелкие исправления и улучшения

v0.1.2:
- Исправлены проблемы с невидимыми элементами в Dark-Blue теме
- Устранена проблема с автопрокруткой на списках
- Скорректированы отступы в панели параметров
- Перемещены переключатели «Face Compare» и «Mask View» в видеопанель
- Опция «Save Image» теперь напрямую сохраняет изображение в выходную папку
- Другие незначительные багфиксы и улучшения

Также были обновлены CuDNN и TensorRT до последних версий.

Сборка доступна для загрузки для тех, кто поддержал канал финансово.
Поддержать можно:

Boosty [Карта]| Приватный Telegram [USDT]

#deepfake #portable #rope
🚀 Grok 3: Илон Маск запускает «самый умный ИИ»

Илон Маск официально анонсировал Grok 3 — новую версию чат-бота, которая, по его словам, станет «самым умным искусственным интеллектом на Земле». 🌐

🗓 Дата запуска: 18 февраля 2025 года

🔄 Что нового?
- Улучшенные возможности понимания контекста
- Расширенные способности к творческому письму
- Глубокая интеграция с X (Twitter)

Grok разрабатывается компанией xAI и уже конкурирует с ChatGPT от OpenAI и Gemini от Google. Маск заявляет, что Grok 3 будет значительно превосходить предшественников по интеллекту и автономности.

Как думаете, сможет ли Grok 3 потеснить OpenAI и Google? Делитесь мнением в комментариях! 💬
Please open Telegram to view this post
VIEW IN TELEGRAM
▶️ Microsoft запускает MatterGen: ИИ, который ускоряет открытия в области новых материалов! 🔬

Microsoft анонсировала MatterGenмодель на базе ИИ которая может революционизировать процесс разработки новых материалов Вместо того чтобы исследователи тратили годы на эксперименты, MatterGen помогает ускорить этот процесс до недель и месяцев, минимизируя затраты и риски.

Что такое MatterGen?
MatterGen использует глубокое обучение для анализа миллиардов данных о материалах и их поведении в разных условиях. Он способен предсказать, как материал будет вести себя в реальном мире, даже до начала его физического тестирования.

⚙️ Зачем это нужно?
Понимание свойств новых материалов — это основа множества прорывных технологий, от энергетики до медицины. Например, с помощью ИИ можно создавать сверхпрочные и легкие материалы для космических путешествий или новые энергоэффективные батареи.

📎 Примеры возможных применений:
- Устойчивые материалы для энергии снижение воздействия на экологию за счет улучшенной энергетической эффективности.
- Новые сверхпрочные сплавы для авиа- и автомобильной промышленности.
- Медицинские импланты создание материалов, совместимых с человеческим телом для более долгосрочных и безопасных решений.

💡 Почему это важно
Создание материалов — это основной элемент технологического прогресса. Каждое новое открытие открывает двери для новых инноваций, и теперь с помощью ИИ этот процесс станет быстрее и доступнее.

Итог: MatterGen может не просто ускорить научные открытия, а изменить сам подход к научным исследованиям, превращая ИИ в партнера ученых в поисках новых решений для глобальных проблем. 🌍

Что думаете о будущем, где ИИ поможет открыть материалы, о которых мы даже не мечтали? 👀💬
Please open Telegram to view this post
VIEW IN TELEGRAM
Neurogen
🚀 Grok 3: Илон Маск запускает «самый умный ИИ» Илон Маск официально анонсировал Grok 3 — новую версию чат-бота, которая, по его словам, станет «самым умным искусственным интеллектом на Земле». 🌐 🗓 Дата запуска: 18 февраля 2025 года 🔄 Что нового? …
Grok-3 уже доступен.

Модель доступна для премиум пользователей Х, но можно протестировать и бесплатно на lmarena:

Идем на https://lmarena.ai > Выбираем Direct Chat > Выбираем groq-3

Сама же модель обходит всех конкурентов в рейтинге LMSYS
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Основная информация по Grok-3

🟡 Grok-3 — новая версия чат-бота от xAI, представленная Илоном Маском, значительно умнее предыдущей модели Grok-2 (в 10 раз).

🟡 Тесты: Grok-3 обходит такие модели, как GPT-4o, Claude 3.5, Sonnet, Gemini-2 Pro и DeepSeek-V3 в областях математики, кодирования и научной работы.

🟡 Способности рассуждения: Grok-3 демонстрирует высокие возможности для рассуждения, с признаками креативности, и способен рассчитывать сложные задачи, такие как полёт на Марс.

🟡 Технологическая база: Grok-3 обучали на суперкомпьютере Colossus с 200,000 чипами Nvidia H100.

🟡 Функция DeepSearch: ИИ анализирует весь интернет для точных ответов на запросы, а если ответ не найден, даёт обоснованные предположения по любому вопросу.

🟡 Генерация игр: Grok-3 может создавать игры на ходу, как показано на примере Тетриса и Три-в-ряд.

🟡 Статус: Grok-3 находится на стадии бета-тестирования, есть мини-версия модели. Также запланирован голосовой режим, который будет выпущен через неделю.

🟡 Отзывы: Андрей Карпаты (бывший сотрудник OpenAI и Tesla) отметил, что Grok-3 демонстрирует отличные результаты на уровне сильнейших моделей и впечатляет быстротой разработки.

Статья
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
FastHynyuanVideo Portable by Neurogen

Сборка для генерации видео txt2video.
Сборка заточена для работы на видеокартах RTX 4090 и, теоретически, и 3090. Еще более ужатая версия для карт на 8-12 Гигабайт видеопамяти выйдет позже.

Качаете архив, распаковываете, затем запускаете файл run_nvidia_gpu.bat

Затем у вас откроется браузер и в этой вкладке нажмите W. Затем в появившемся окне выберите наш рабочий процесс (он всего один)

Для вас я специально выделил и подписал основные настройки в рамках одной группы, а также добавил подсказку по оптимальным параметрам.

Под капотом - полностью готовый к работе и настроенный ComfyUI, с кучей оптимизаций.

По производительности: генерация одного видео в несколько секунд хронометража генерируется на RTX 4090 примерно 80-90 секунд (что, как по мне, ну очень быстро).

Сборка поддерживает возможность выбора LoRA, специально для вас я закинул несколько, в том числе и для генерации NSFW контента 😁.

Дополнительные вы можете скачать на civit.ai, их там по моему целая сотня.

Рекомендуемые разрешения это 848x480, 960x544 и 1280x720, но на 24 GB VRAM наиболее адекватно работает 848x480, 960x544. Количество кадров от 25 до 129. В среднем, генерация ролика в таком случае занимает до двух минут.

Скачать сборку бесплатно можно с:

C моего сервера | С зеркала (Яндекс Диск)

P.S. Для тех, кто не работал с ComfyUI, видеообзор будет на днях.

Сборка для меня пробная, при наличии ошибок просьба писать сколько у вас оперативной памяти и какая модель видеокарты.
Please open Telegram to view this post
VIEW IN TELEGRAM
🎙Бета-версия Zonos-v0.1
text-to-spench модель от Zyphra

Команда Zyphra анонсировала выпуск бета-версии Zonos v0.1, включающей две модели для преобразования текста в речь (TTS) с клонированием голоса в реальном времени. Модели 1.6B Transformer и 1.6B Hybrid доступны под лицензией Apache 2.0.

👀Что может:
- Клонирование голоса
- Поддерживает английский, японский, китайский, французский и немецкий языки, русского нет
- Контроль скорости речи, высоты тона, максимальной частоты, качества звука
- Возможность контроля эмоция
- Открытый Playground и API

⚙️Производительность и архитектура:
- 200,000 часов речевых данных для обучения: английский, китайский, японский и другие языки.
- Поддержка быстрой генерации речи с низкими задержками (200-300 мс) на RTX 4090.
- Модели обучаются с использованием автокодера DAC и параметров (скорость речи, высота тона, эмоции).

🐱Код - открытый код
🆓Демо - потестить, можно зайти через гугл
🖥Блог - почитайте, там интересно, если вниз листнете можно найти сравнение с конкурентами
Please open Telegram to view this post
VIEW IN TELEGRAM