Нейронавт | Нейросети в творчестве
11.7K subscribers
5.46K photos
4.6K videos
49 files
5.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

РКН: https://hf.ru/link8e56d
Download Telegram
GPT Image 2: повторное тестирование на arena.ai.

Сейчас, вероятно, тестируются четыре разные модели:

• duct-tape-1
• duct-tape-2
• duct-tape-3

Эти модели являются новыми версиями GPT Image 2. Вероятно, это средняя версия, так как результаты хоть и крутые, но хуже, чем у maskingtape-alpha.

Радует то, что по сравнению с тем, что было 11 числа, эти модели избавились от ужасного шума, который сильно мешал.

Порог знаний у этих моделей выше, чем у maskingtape-alpha.

Ещё одна более сильная версия была добавлена через несколько минут:

• maskingtape-alpha

Обновленная версия старой maskingtape-alpha. Вероятно, это самая сильная версия GPT Image 2 с мышлением.

Все четыре модели превосходят в логических рассуждениях, данных и знаниях такие популярные модели, как nano banana 2 / pro.

Единственная проблема в GPT Image - отрисовка мелких деталей: всё ещё есть галлюцинации, например, 6 пальцев, но это гораздо круче, чем раньше.

🌌 Geometry90
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
6
This media is not supported in your browser
VIEW IN TELEGRAM
Больше не нужно ждать билд Flash Attention.

HuggingFace открыл репозиторий готовых кернелов для различных видеокарт, ОС и версий PyTorch.

#tools #optimization
🔥11👍2
ClawGUI

Фреймворк для обучения, оценки и развёртывания GUI-агентов

Использует параллельные Docker-эмуляторы Android или реальные устройства. Воспроизводит бенчмарки с точностью 95,8 %. Поддерживает Android, HarmonyOS, iOS. Управление через 12+ чат-платформ. Полный тест одной командой без скриптов.

Гитхаб
HF

#agent #computeruse
👍5
Однажды Эрнест Хэмингуэй наспор написал самый короткий и самый грустный рассказ

#humor
😁18
DisCa

Tencent изобрел метод кэширования обучаемых признаков, который ускоряет видеогенерацию в 11,8 раза при сохранении качества генерации. Совместим с дистилляцией

Применяют подход Restricted MeanFlow для стабильной дистилляции моделей

сохраняет качество генерации при ускорении инференса.

Эксперименты проведены на HunyuanVideo-1.0 и HunyuanVideo-1.5. Модель обещает ускорение без потери качества, но есть простор для оптимизации

Гитхаб

#video #optimization
👍3🔥2
YoreSpot

Какая-то "альтернатива Civitai"

Генерация, обучение моделей, социальные функции и геймификация
Выбор моделей пока скудный

— генерация изображений и видео в разных стилях (аниме, реализм, высокое разрешение)
— обучение и обмен собственными LoRA-моделями
— хаб моделей (поиск, фильтры, скачивание, оценки, отзывы)
— ежедневные конкурсы и аукционы для заработка внутриигровых кредитов
— социальные взаимодействия: галерея, лайки, комментарии, подписки, чаевые
— создание и общение с AI-персонажами, генерация их образов, отслеживание отношений
— система достижений, бинго и лидербордов с наградам;
— работа в браузере без установки ПО и локального GPU

#gallery #training #finetuning #online #hub
👀5👍2🤔1🍌1
This media is not supported in your browser
VIEW IN TELEGRAM
Audio Flamingo Next

Новая версия модели от NVIDIA для работы с речью, звуками и музыкой - понимания и описания

— Поддержка файлов до 30 минут и 128 тыс. токенов.
— Анализ длинных записей с несколькими говорящими и шумами.
— Точные ответы с привязкой к временным меткам.
— Специализированные версии для ответов, описаний и рассуждений.

AF-Next-Captioner - описывающая модель
AF-Next-Instruct - универсальная инструктивная версия
AF-Next-Think - рассуждающая версия

Гитхаб
HF
Демо:
https://huggingface.co/spaces/nvidia/audio-flamingo-next
https://huggingface.co/spaces/nvidia/audio-flamingo-next-think
https://huggingface.co/spaces/nvidia/audio-flamingo-next-captioner

#cot #reasoning #alm #captioning #audio2text
👍3🔥21
GitHub-звёзды больше не показатель качества, их покупают

6 млн новых звёзд накручены (18 617 репозиториев, 300 000+ аккаунтов).

• Цена: $0.03–$0.85 за звезду.
• купить можно в Fiverr, Telegram.
• Цель: имитация роста при запуске.
Инвесторы и алгоритмы всё ещё используют звёзды как сигнал качества.

Реальный индикатор — расхождение метрик:
• Много звёзд, но мало форков и подписчиков.
• Код не копируется, обновления не отслеживаются.
• Нет активности в issues и PR.

Плюс накрутки вне гитхаба

Особо отличился накруткой в соцсетях угадайте кто

#news
😱9🔥2😁1🤯1
Google выпустил #SOTA говорилку

Ключевая особенность: точный контроль интонации, стиля, темпа и ударений через теги.

— поддерживает многоголосие с сохранением стиля персонажей для озвучки фильмов

— поддерживает более 70 языков

— позволяет настраивать голоса и экспортировать параметры в Google AI Studio

— добавляет водяной знак SynthID для идентификации AI-аудио

Доступна:

Через Gemini API и Google AI Studio
На Vertex AI
На Workspace через Google Vids

#tts #dubbing #voicecloning #russian
👍5🤷‍♂1