Neurogen
22.6K subscribers
565 photos
187 videos
17 files
582 links
Популяризатор нейросетей, разработчик-энтузиаст, блогер.

СEO NeuroIMG.ART
Реклама: https://telega.in/c/neurogen_news
По остальному: @roman_neurogen

Портативные сборки: https://boosty.to/neurogen

Live канал: @neurogen_blog
Реестр РКН: №4777528086
Download Telegram
Neurogen
🚀 Grok 3: Илон Маск запускает «самый умный ИИ» Илон Маск официально анонсировал Grok 3 — новую версию чат-бота, которая, по его словам, станет «самым умным искусственным интеллектом на Земле». 🌐 🗓 Дата запуска: 18 февраля 2025 года 🔄 Что нового? …
Grok-3 уже доступен.

Модель доступна для премиум пользователей Х, но можно протестировать и бесплатно на lmarena:

Идем на https://lmarena.ai > Выбираем Direct Chat > Выбираем groq-3

Сама же модель обходит всех конкурентов в рейтинге LMSYS
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Основная информация по Grok-3

🟡 Grok-3 — новая версия чат-бота от xAI, представленная Илоном Маском, значительно умнее предыдущей модели Grok-2 (в 10 раз).

🟡 Тесты: Grok-3 обходит такие модели, как GPT-4o, Claude 3.5, Sonnet, Gemini-2 Pro и DeepSeek-V3 в областях математики, кодирования и научной работы.

🟡 Способности рассуждения: Grok-3 демонстрирует высокие возможности для рассуждения, с признаками креативности, и способен рассчитывать сложные задачи, такие как полёт на Марс.

🟡 Технологическая база: Grok-3 обучали на суперкомпьютере Colossus с 200,000 чипами Nvidia H100.

🟡 Функция DeepSearch: ИИ анализирует весь интернет для точных ответов на запросы, а если ответ не найден, даёт обоснованные предположения по любому вопросу.

🟡 Генерация игр: Grok-3 может создавать игры на ходу, как показано на примере Тетриса и Три-в-ряд.

🟡 Статус: Grok-3 находится на стадии бета-тестирования, есть мини-версия модели. Также запланирован голосовой режим, который будет выпущен через неделю.

🟡 Отзывы: Андрей Карпаты (бывший сотрудник OpenAI и Tesla) отметил, что Grok-3 демонстрирует отличные результаты на уровне сильнейших моделей и впечатляет быстротой разработки.

Статья
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
FastHynyuanVideo Portable by Neurogen

Сборка для генерации видео txt2video.
Сборка заточена для работы на видеокартах RTX 4090 и, теоретически, и 3090. Еще более ужатая версия для карт на 8-12 Гигабайт видеопамяти выйдет позже.

Качаете архив, распаковываете, затем запускаете файл run_nvidia_gpu.bat

Затем у вас откроется браузер и в этой вкладке нажмите W. Затем в появившемся окне выберите наш рабочий процесс (он всего один)

Для вас я специально выделил и подписал основные настройки в рамках одной группы, а также добавил подсказку по оптимальным параметрам.

Под капотом - полностью готовый к работе и настроенный ComfyUI, с кучей оптимизаций.

По производительности: генерация одного видео в несколько секунд хронометража генерируется на RTX 4090 примерно 80-90 секунд (что, как по мне, ну очень быстро).

Сборка поддерживает возможность выбора LoRA, специально для вас я закинул несколько, в том числе и для генерации NSFW контента 😁.

Дополнительные вы можете скачать на civit.ai, их там по моему целая сотня.

Рекомендуемые разрешения это 848x480, 960x544 и 1280x720, но на 24 GB VRAM наиболее адекватно работает 848x480, 960x544. Количество кадров от 25 до 129. В среднем, генерация ролика в таком случае занимает до двух минут.

Скачать сборку бесплатно можно с:

C моего сервера | С зеркала (Яндекс Диск)

P.S. Для тех, кто не работал с ComfyUI, видеообзор будет на днях.

Сборка для меня пробная, при наличии ошибок просьба писать сколько у вас оперативной памяти и какая модель видеокарты.
Please open Telegram to view this post
VIEW IN TELEGRAM
🎙Бета-версия Zonos-v0.1
text-to-spench модель от Zyphra

Команда Zyphra анонсировала выпуск бета-версии Zonos v0.1, включающей две модели для преобразования текста в речь (TTS) с клонированием голоса в реальном времени. Модели 1.6B Transformer и 1.6B Hybrid доступны под лицензией Apache 2.0.

👀Что может:
- Клонирование голоса
- Поддерживает английский, японский, китайский, французский и немецкий языки, русского нет
- Контроль скорости речи, высоты тона, максимальной частоты, качества звука
- Возможность контроля эмоция
- Открытый Playground и API

⚙️Производительность и архитектура:
- 200,000 часов речевых данных для обучения: английский, китайский, японский и другие языки.
- Поддержка быстрой генерации речи с низкими задержками (200-300 мс) на RTX 4090.
- Модели обучаются с использованием автокодера DAC и параметров (скорость речи, высота тона, эмоции).

🐱Код - открытый код
🆓Демо - потестить, можно зайти через гугл
🖥Блог - почитайте, там интересно, если вниз листнете можно найти сравнение с конкурентами
Please open Telegram to view this post
VIEW IN TELEGRAM
Последнее время я замечаю, что большинство проектов лучше всего и легче развернуть внутри ComfyUI, чем в отдельной оболочке.

И тут у меня появилась дилемма. Делать под каждый проект отдельную сборку ComfyUI мне кажется странным. А если просто выкладывать воркфлоу, то людям, кто не работали с комфи будет непонятно что и куда тыкать. Все таки, мне кажется, что большинство моей аудитории обходит нодовый интерфейс ComfyUI стороной

Делать "мега сборку" тоже не вариант - она будет весить под 100 гигабайт.

Поэтому вопрос к вам: Какой из этих вариантов вам кажется оптимальным? Или может у вас есть какое-то свое предложение?
NotebookLM - очень недооцененный ИИ-помощник от Google

По тестам пользователей, notebooklm это ребенок ChatGPT + Perplexity + Notion AI еще и с реальными ссылками на источники. Создан на основе Gemini 2.0. К сожалению код как и API закрыты. Но в конце поста я оставил альтернативу гугловскому помощьнику с открытым кодом "📌".

Отличия от других:
🟡Читает и резюмирует PDF-файлы, документы и заметки
🟡Автоматически ссылается на источники (прощайте галлюцинации)
🟡Запоминает загруженные файлы и контекст лучше, чем ChatGPT
🟡Делает структурированное исследование безболезненным

Он идеально подойдет любой категории пользователей которые работают с большим количеством данных. Когда нужны точные свединия из документов notebook просто незаменимая вещь.

🆓Протестировать

📌Альтернативный помощник с открытым кодом и API
Please open Telegram to view this post
VIEW IN TELEGRAM
Expanding your horizons! 🌐

Due to the expansion of the team, we continue to maintain our English-language Telegram channel. Basically, all the same posts will be duplicated there, but in English and with minor edits. If anyone is interested, we are looking forward to seeing you!

В связи с расширением команды мы продолжаем вести наш англоязычный телеграм канал. В основном туда будут дублироваться все те же посты но на английском языке и с небольшими правками. Если кому интересно, с радостью ждем вас!

🖥Neurogen [EN]
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Онлайн-интервью с нулевым знанием с использованием AI Interview Hammer

Interview Hammer нейронка с помощью которой можно пройти собеседование или придти с ним на какую то конференцию, попробовать ради интереса можно, в серьез воспринимать бы не стал...

Есть бесплатная пробная версия и можно скачать на телефон

🆓Пробная версия - нужно зарегистрироваться
⬇️Скачать приложение
Please open Telegram to view this post
VIEW IN TELEGRAM
‼️Grok 3 стал бесплатным

Компания xAI объявила о запуске Grok 3 — самой продвинутой версии своего искусственного интеллекта, которую теперь можно попробовать абсолютно бесплатно. Однако разработчики предупреждают: доступ открыт «до тех пор, пока наши серверы не расплавятся от нагрузки»

Grok 3 уже доступен для тестирования через платформу X по ссылке. Пользователи с подпиской X Premium+ и SuperGrok получат расширенный доступ к новейшему ИИ, а также эксклюзивную возможность опробовать передовые функции, такие как голосовой режим (Voice Mode), раньше остальных.

Кроме того, для удобства пользователей xAI выпустила отдельное приложение Grok, которое уже доступно для скачивания в США через App Store для iOS. скачать его можно по ссылке. В ближайшее время ожидается выход приложения в Google Play для Android, однако пока точные сроки и список других стран, где оно станет доступно, не уточняются.

Спешите испытать Grok 3 — пока серверы не расплавились!

🆓Попробовать Grok 3
🍏Приложение для IOS
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Новый прорыв от Microsoft 🏳️‍🌈

Компания Microsoft представила свою инновационную модель Muse - это ИИ для генерации игрового процесса. Модель была создана исследовательским подразделением Microsoft Research в сотрудничестве со студией Ninja Theory, известной по игре Bleeding Edge. Muse способна генерировать игровые окружения, понимая физику и динамику 3D-мира, а также реакции на действия игроков. Ее обучали на семилетнем объеме данных реального геймплея Bleeding Edge.

Разрабы негодуют, так как боятся что такими "инновациями" многолетний труд художников и разработчиков находится под угрозой и возможно сокращение рабочих мест в индустрии. Microsoft признает опасения и заявляет, что Muse предназначена для дополнения, а не замены человека.

⚙️Технические данные:
🟡 Качество генерации: На текущем этапе Muse генерирует визуальные данные с разрешением 300×180 пикселей при 10 кадрах в секунду, что соответствует 1 секунде реального игрового процесса.
🟡 Обучение: Изначально обучение проводилось на кластере V100, что позволило масштабировать процесс до 100 GPU. Позднее обучение было перенесено на H100, что обеспечило более высокую производительность и эффективность.
🟡 Архитектура: Muse использует трансформерную архитектуру, адаптированную для обработки визуальных данных и действий контроллера. Для эффективного представления изображений и действий контроллера были приняты ключевые проектные решения, заимствованные из сообщества больших языковых моделей (LLM).

Статьи: xbox wire, wired, microsoft
Please open Telegram to view this post
VIEW IN TELEGRAM
Neurogen
VisoMaster Portable by Neurogen v 0.1.3 | DeepFake | Nvidia VisoMaster — мощная и простая в использовании программа для замены лиц (DeepFake) и редактирования видео, которая объединяет современные нейросетевые технологии для создания реалистичных эффектов.…
VisoMaster Portable by Neurogen v 0.1.4 | DeepFake | Nvidia

Начиная с данной версии, сборка поддерживает видеокарты серии RTX 50XX (RTX 5080, RTX 5090 и другие).

Для этого Cuda была обновлена до версии 12.8, TensorRT до версии 10.8 и CuDNN до версии 9.7.1

Обновление v0.1.4. Что нового:
Горячие клавиши:

F11: Переключение полноэкранного режима
V: Перемотка видео на 1 кадр вперед
C: Перемотка видео на 1 кадр назад
D: Перемотка видео на 30 кадров вперед
A: Перемотка видео на 30 кадров назад
Z: Переход к началу видео
Пробел: Воспроизведение/Пауза видео
R: Начало/Остановка записи
F: Добавление/удаление маркера (Alt+F для удаления)
W: Переход к следующему маркеру
Q: Переход к предыдущему маркеру
S: Переключение замены лиц

Дополнительно:

Добавлено контекстное меню для удаления элементов из разделов "Целевые медиа" и "Входные лица"
Добавлена опция вставки артефактов JPEG-сжатия в вывод для повышения реалистичности при работе с низкокачественными целевыми медиа
Обновлено управление параметрами с поддержкой резервного варианта
Автоматическая генерация эскизов для всех ранее загруженных целевых файлов
Горизонтальная прокрутка для списка эмбеддингов
Применение восстановителя выражений до восстановителя лиц в конвейере замены

Сборка доступна при поддержке проекта. Проект можно поддержать:

Boosty (Картой)

Telegram (USDT, ЮMoney, Telegram Stars)

#deepfake #portable #visomaster