ERNIE‑Image
Baidu (китайский Гугл) вчера выпустили свой генератор изображений.
✔️ Есть base и turbo - 8-шаговая дистилляция
✔️ Prompt Enhancer - вспомогательная LLM на 3B параметров
Доступен по ссылкам:
Гитхаб
HF
ComfyOrg
AI STudio
Демо
📱 Делитесь с друзьями
@aidivision
Baidu (китайский Гугл) вчера выпустили свой генератор изображений.
8B параметров. Из коробки работает на 24 ГБ VRAM.
Качественно отображает текст, выполняет сложные запросы с несколькими объектами, постеры, раскадровки, комиксы.
Доступен по ссылкам:
Гитхаб
HF
ComfyOrg
AI STudio
Демо
@aidivision
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
Релизнулся самый доступный генератор речи — MOSS-TTS-Nano можно развернуть хоть на тостере: он работает на процессорах любой мощности!
Демка лежит — тут.
Код на GitHub — здесь.
📱 Делитесь @aidivision
• GPU вообще не нужен! Нейронка работает на процессоре в 4 ядра — можно запустить хоть на микроконтроллере.
• При этом озвучивает любые тексты без задержек — работает очень шустро.
• Знает 20 языков, включая русский.
• Моделька всего на 100 млн параметров, но выдает шикарный звук в 48 кГц.
• Клонирует любые голоса и озвучивает даже длинные тексты.
Демка лежит — тут.
Код на GitHub — здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
Microsoft выпустили лучшую нейросеть для ВРАЧЕЙ — DxGPT
ИИ анализирует ваши симптомы и анамнез, а в ответ выдаёт возможные диагнозы.
Инструмент проверенный — тысячи врачей по всей Европе уже пользуются.
При этом сервис доступен Бесплатно
ИИ анализирует ваши симптомы и анамнез, а в ответ выдаёт возможные диагнозы.
Идея инструмента зародилась у инженера Microsoft, ребенку которого не смогли диагностировать редкое неврологическое заболевание, что привело к очень неприятным и болезненным последствиям. После этого обеспокоенный отец психанул и начал собирать команду для разработки DxGPT, а Сатья Наделла поддержал идею и выделил ресурсы.
Инструмент проверенный — тысячи врачей по всей Европе уже пользуются.
При этом сервис доступен Бесплатно
mint
DxGPT goes live: Satya Nadella showcases AI tool's potential in diagnosing rare diseases | Mint
Microsoft's CEO, Satya Nadella, announced the launch of Dxgpt, an AI-driven tool to aid healthcare workers in diagnosing and planning treatments. The tool promises improved efficiency and accuracy in patient management.
❤7⚡3👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Свежерелизнутый Claude Opus 4.7 оказался невероятно мощным для автоматизации CAD — нейронка заняла первое место в бенчмарках для дизайна САПР-моделей.
На видео модель сгенерировала палец для робо-руки! Механизм двигается и функционирует в реальной жизни.
Еще год назад это было практически невыполнимой задачей для генеративок.
Claude Opus 4.7 уже доступен в софте для CAD
1. тут
2. тут
На видео модель сгенерировала палец для робо-руки! Механизм двигается и функционирует в реальной жизни.
Еще год назад это было практически невыполнимой задачей для генеративок.
Claude Opus 4.7 уже доступен в софте для CAD
1. тут
2. тут
🔥4⚡2
Очень полезная штука для работы с LLM в энтерпрайзе и с клиентскими данными.
Раньше для этого применяли спец софт, всякие NLP библиотечки или маленькие локальные модели.
Что под капотом:
✔️ Архитектура на базе gpt-oss✔️ 1.5B параметров всего, 50M активных✔️ Контекстное окно 128k✔️ Запускается в браузере или на ноутбуке
Детектит 8 категорий: имена, адреса, email, телефоны, URL, даты, номера счетов и секреты (API-ключи, токены и пр.).
Маскирует и потом их разворачивает обратно.
У всех, кто строит AI-продукты с обработкой клиентских данных, болит одно и то же – перед отправкой в LLM-провайдера нужно вычищать перс данные, а регулярки и классический spaCy NER ловят далеко не всё.
Локальная модель, которая может бегать на ноутбуке, закрывает реальную дыру – особенно для тех, кто работает в GDPR-периметре или хочет on-prem.
Ссылка на модель:
https://huggingface.co/openai/privacy-filter
Делитесь с теми кто строит ИИ системы для бизнеса
#длябизнеса
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥2⚡1
Вышел новый DeepSeek V4
Сегодня китайская лаборатория, которая год назад обрушила акции NVIDIA, представила сразу две модели: DeepSeek-V4-Pro (1.6T параметров, 49B активных) и DeepSeek-V4-Flash (284B параметров, 13B активных).
Главная инновация — гибридная архитектура внимания, которую они назвали Compressed Sparse Attention + Heavily Compressed Attention.
На практике это означает, что при контексте в 1M токенов V4-Pro требует лишь 27% FLOPs и 10% KV-кэша по сравнению с предыдущей V3.2.
По бенчмаркам V4-Pro бьёт все существующие open-source модели и вплотную подбирается к закрытым лидерам.
▫️На Codeforces модель набирает 3206 — это выше GPT-5.4.
▫️На SWE-Verified (реальные баги на GitHub) — 80.6, практически наравне с Claude Opus 4.6.
▫️На математических бенчмарках вроде IMOAnswerBench — 89.8, уступая только GPT-5.4.
▫️При этом в задачах на общие знания модель пока отстаёт от Gemini-3.1-Pro, и DeepSeek честно это признаёт.
Цены в разы ниже западных:
🔻V4-Flash: $0.14 за миллион входных токенов, $0.28 за выходные.
🔻V4-Pro: $1.74 / $3.48.
Для сравнения Claude Opus 4.6 стоит $5 за 1 млн входных токенов и $25 за 1 млн выходных токенов по стандартному API-тарифу.
Модель поддерживает три режима рассуждений: Non-think, Think High и Think Max.
Уже интегрирована с OpenClaw и OpenCode для агентного кодинга.
Сегодня китайская лаборатория, которая год назад обрушила акции NVIDIA, представила сразу две модели: DeepSeek-V4-Pro (1.6T параметров, 49B активных) и DeepSeek-V4-Flash (284B параметров, 13B активных).
Обе — Mixture-of-Experts, обе с контекстным окном в 1 миллион токенов, обе под лицензией Apache 2.0 с открытыми весами на Hugging Face.
Главная инновация — гибридная архитектура внимания, которую они назвали Compressed Sparse Attention + Heavily Compressed Attention.
На практике это означает, что при контексте в 1M токенов V4-Pro требует лишь 27% FLOPs и 10% KV-кэша по сравнению с предыдущей V3.2.
По бенчмаркам V4-Pro бьёт все существующие open-source модели и вплотную подбирается к закрытым лидерам.
▫️На Codeforces модель набирает 3206 — это выше GPT-5.4.
▫️На SWE-Verified (реальные баги на GitHub) — 80.6, практически наравне с Claude Opus 4.6.
▫️На математических бенчмарках вроде IMOAnswerBench — 89.8, уступая только GPT-5.4.
▫️При этом в задачах на общие знания модель пока отстаёт от Gemini-3.1-Pro, и DeepSeek честно это признаёт.
Цены в разы ниже западных:
🔻V4-Flash: $0.14 за миллион входных токенов, $0.28 за выходные.
🔻V4-Pro: $1.74 / $3.48.
Для сравнения Claude Opus 4.6 стоит $5 за 1 млн входных токенов и $25 за 1 млн выходных токенов по стандартному API-тарифу.
Модель поддерживает три режима рассуждений: Non-think, Think High и Think Max.
Уже интегрирована с OpenClaw и OpenCode для агентного кодинга.
X (formerly Twitter)
DeepSeek (@deepseek_ai) on X
🚀 DeepSeek-V4 Preview is officially live & open-sourced! Welcome to the era of cost-effective 1M context length.
🔹 DeepSeek-V4-Pro: 1.6T total / 49B active params. Performance rivaling the world's top closed-source models.
🔹 DeepSeek-V4-Flash: 284B total…
🔹 DeepSeek-V4-Pro: 1.6T total / 49B active params. Performance rivaling the world's top closed-source models.
🔹 DeepSeek-V4-Flash: 284B total…
🔥5❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Энтузиасты добавили SAM 3D BODY в Комфи.
Получился нейромокап, который восстанавливает скелет из видео и может использовать его для анимации референсной картинки.
Есть экспорт скелета в FBX
Доступно на GitHub
https://github.com/tori29umai0123/ComfyUI-SAM3DBody_utills/tree/main
Получился нейромокап, который восстанавливает скелет из видео и может использовать его для анимации референсной картинки.
Есть экспорт скелета в FBX
Доступно на GitHub
https://github.com/tori29umai0123/ComfyUI-SAM3DBody_utills/tree/main
❤1🔥1
"Кому продавать свой продукт?" — вопрос, который ставит в тупик 90% начинающих фаундеров. Делают продукт для всех, а покупает никто.
Нашел бота, который за 2 минуты создаёт маркетинговую персону — описание твоего идеального клиента: боли, мотивация, возражения, каналы, где его искать.
Бесплатно. Просто пишешь боту, что за продукт — получаешь готовую персону.
🔗 Попробовать: @Marketing_persona_bot
Нашел бота, который за 2 минуты создаёт маркетинговую персону — описание твоего идеального клиента: боли, мотивация, возражения, каналы, где его искать.
Бесплатно. Просто пишешь боту, что за продукт — получаешь готовую персону.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤1🔥1
Вы мне после каждого эфира пишите, "запиши уже курс"
Можно конечно заморочиться, но зачем? Есть же масса хороших курсов от Google, MIT, Microsoft.
Вот, например, 5 дневный интенсив по вайб-кодингу от Google и Kaggle
В программе:
Регистрируйтесь, курс полностью бесплатный, занятия будут проходить 15-19 июня, записаться можно здесь.
✅ Также полезно будет посмотреть записи ноябрьского интенсива по GenAI от Google и Kaggle — лекции лежат на YouTube.
📱 делитесь @aidivision
Можно конечно заморочиться, но зачем? Есть же масса хороших курсов от Google, MIT, Microsoft.
Вот, например, 5 дневный интенсив по вайб-кодингу от Google и Kaggle
В программе:
-как создавать ИИ-агентов
-эффективно использовать нейросети для программирования
-управлять контекстом
-не оставлять «дыр» в ИИ-коде
- масштабировать проекты
Регистрируйтесь, курс полностью бесплатный, занятия будут проходить 15-19 июня, записаться можно здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍4❤2⚡2
WeClone нейросетевой инструмент, предназначенный для создания цифрового аватара, имитирующего стиль общения пользователя, путем тонкой настройки больших языковых моделей (LLM) на основе его истории чатов.
Дополнительно, WeClone поддерживает работу с различными платформами обмена сообщениями и предоставляет гибкие настройки для персонализации модели в соответствии с предпочтениями пользователя.
Склонировать себя, или самого злобного троля на форуме можно скачав репу по ссылке:
https://github.com/xming521/WeClone
Ключевые функции включают в себя импорт и предварительную обработку данных чатов, обучение модели с учетом индивидуальных особенностей общения и интеграцию полученного аватара с различными чат-ботами для оживления цифровой личности.
Дополнительно, WeClone поддерживает работу с различными платформами обмена сообщениями и предоставляет гибкие настройки для персонализации модели в соответствии с предпочтениями пользователя.
Склонировать себя, или самого злобного троля на форуме можно скачав репу по ссылке:
https://github.com/xming521/WeClone
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Sato: AI UV
Авторы генератора Rodin, выкатили новую работу по генерации UV-разверток.
Сайт проекта (там же примеры разверток):
https://ruixu.me/html/SATO/index.html
Делитесь @aidivision
Авторы генератора Rodin, выкатили новую работу по генерации UV-разверток.
Strips as Tokens (SATO) — создает последовательность в виде связанной цепочки граней, явно кодирующей границы UV-координат, наш метод естественным образом сохраняет организованный поток ребер и семантическую структуру, характерные для сеток, созданных художниками.
Сайт проекта (там же примеры разверток):
https://ruixu.me/html/SATO/index.html
Делитесь @aidivision
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Google выкатил конструктор агентов для тех, кто не кодит
Что умеет:
• Сам планирует шаги под вашу цель
• Собирается из блоков — можно подключить генерацию картинок, видео, поиск в интернете
• Запоминает контекст между сессиями — не нужно каждый раз объяснять заново
• Умеет задавать уточняющие вопросы, если чего-то не хватает
• Через @ можно направить агента на конкретный шаг
Пока это эксперимент, но протестировать уже можно по ссылке: opal.google
Opal от Google обновился — и теперь это, пожалуй, самый простой способ собрать себе ИИ-агента.
Описываешь задачу обычным языком, а агент сам разбирается: строит план, выбирает инструменты и выполняет. Никакого кода.
Что умеет:
• Сам планирует шаги под вашу цель
• Собирается из блоков — можно подключить генерацию картинок, видео, поиск в интернете
• Запоминает контекст между сессиями — не нужно каждый раз объяснять заново
• Умеет задавать уточняющие вопросы, если чего-то не хватает
• Через @ можно направить агента на конкретный шаг
Пока это эксперимент, но протестировать уже можно по ссылке: opal.google
❤5👍4
HiDream-O1-Image
Новая открытая модель для генерации картинок прыгнула сразу на 8-е место в Artificial Analysis Arena
Oбогнала весь опенсорс и значительную часть закрытых конкурентов.
Версии две: полная на 50 шагов и Dev — облегчённая дистилляция на 28 шагов.
Веса лежат на HuggingFace, исходники на GitHub, а для домашнего запуска уже есть ноды для ComfyUI.
#tools
📱 @aidivision
Новая открытая модель для генерации картинок прыгнула сразу на 8-е место в Artificial Analysis Arena
Oбогнала весь опенсорс и значительную часть закрытых конкурентов.
Что умеет:
— Всего 8 миллиардов параметров, а тянет наравне с гигантами
— Делает 2048×2048 нативно — без апскейлеров
— Одна модель и для генерации, и для редактирования, и для сохранения персонажа в новых сценах
— Встроенный «думающий» агент, который сам дорабатывает кривой промпт
— Не стесняется ни купальников, ни анатомии — фильтров нет
Версии две: полная на 50 шагов и Dev — облегчённая дистилляция на 28 шагов.
Веса лежат на HuggingFace, исходники на GitHub, а для домашнего запуска уже есть ноды для ComfyUI.
#tools
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4❤3
This media is not supported in your browser
VIEW IN TELEGRAM
IOPaint — это бесплатный, полностью автономный инструмент для закрашивания и перерисовки с открытым исходным кодом.
Вы можете использовать различные модели в IOPaint для изменения изображений, включая такие модификации, как:
✔️ Delete: удалите нежелательные объекты, дефекты, водяные знаки и людей.
✔️ Inpainting: вносите изменения в определенные части изображения, добавляйте новые объекты или заменяйте что-либо на своих изображениях.
✔️ Outpainting: генерируйте новые пиксели вокруг изображений, чтобы увеличить их.
Делитесь с друзьями
📱 @aidivision
Вы можете использовать различные модели в IOPaint для изменения изображений, включая такие модификации, как:
Делитесь с друзьями
Please open Telegram to view this post
VIEW IN TELEGRAM
Для тех кто давно хотел локально запустить опенсорсную LLM, но не очень программист:
💫 Пошаговая инструкция по локальной установке LLaMA на ПК без кодинга.
Шаг 1: Установка Ollama
Шаг 2: Скачивание модели LLaMA
Шаг 3: Запуск LLaMA в терминале
Запуск Open Web UI:
🔜 Инструкция предполагает базовое знакомство с терминалом.
🔜 Процесс скачивания модели может занять значительное время.
🔜 Если вы не хотите использовать Docker и Open Web UI, вы можете взаимодействовать с LLaMA напрямую через терминал с помощью Ollama.
🔜 Для Windows PowerShell, может потребоваться разрешить запуск скриптов. Выполните команду: Set-ExecutionPolicy RemoteSigned.
🔜 Скорость (и возможность) работы модели зависит от железа
Не ожидайте чудес, если вы искали способ отписаться от GPT и сэкономить $20 в мес, то это не он ))
Шаг 1: Установка Ollama
Перейдите на сайт ollama.com и скачайте приложение Ollama для вашей ОС
Шаг 2: Скачивание модели LLaMA
Вернитесь на сайт ollama.com
В строке поиска "Search Models" найдите модель "llama-3.21-7b" (рекомендуется для слабого железа) или другую желаемую модель.
Скопируйте команду установки модели из блока справа
Шаг 3: Запуск LLaMA в терминале
Откройте терминал:Шаг 4 (Опционально): Установка интерфейса Open Web UI через Docker (для более удобного использования)
В macOS: Command + пробел, наберите "Терминал" и нажмите Enter.
В Windows:
Способ 1 (классический терминал): Нажмите Win + R, введите cmd и нажмите Enter.
Способ 2 (PowerShell): Нажмите Win + X, выберите "Windows PowerShell" или "Терминал Windows".
Способ 3 (поиск): Нажмите Win, начните набирать "cmd" или "powershell" и выберите соответствующее приложение.
Вставьте скопированную команду в терминал и нажмите Enter. Начнется скачивание модели. 3.12 весит 4.7gb
После завершения скачивания, вы можете задавать вопросы модели прямо в терминале. Введите: ollama run llama3.1 и затем ваш вопрос.
Установка Docker:
Перейдите на сайт docker.com и скачайте Docker Desktop для вашей операционной системы.
Установите Docker Desktop и создайте аккаунт (или войдите в существующий).
Установка Open Web UI:
Убедитесь, что Ollama не запущена (в терминале, где запущена модель, выполните команду /bye, затем закройте терминал).
Перейдите на сайт https://docs.openwebui.com/
Найдите инструкции по установке с Docker. Скопируйте команду для установки text-generation-webui (docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main).
Вставьте скопированную команду в терминал и нажмите Enter. Дождитесь завершения установки.
Запуск Open Web UI:
е.
После установки text-generation-webui в Docker, в терминале будет указан адрес для доступа к интерфейсу (начинается с http://localhost:). Скопируйте этот адрес.
Откройте браузер и вставьте скопированный адрес в адресную строку.
В интерфейсе Open Web UI выберите вашу модель LLaMA и начните общени
Не ожидайте чудес, если вы искали способ отписаться от GPT и сэкономить $20 в мес, то это не он ))
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥3
ТВОЙ БУСТ В IT И AI
Собрали с коллегами обновленную папку с каналами, которые реально прокачивают навыки и дают актуальные инструменты:
+ IT-направления: системный анализ, Python, JavaScript, frontend, тестирование
+ технологии и инструменты: всё, что ускоряет работу и рост в IT
+ AI для карьеры и бизнеса: как использовать нейросети, чтобы зарабатывать
+ обзор нейросетей: что сейчас работает и что стоит изучать
+ промты: готовые решения + логика создания своих
подписаться🎁 https://t.me/addlist/uyDjlf_VhiNjNWNi
Собрали с коллегами обновленную папку с каналами, которые реально прокачивают навыки и дают актуальные инструменты:
+ IT-направления: системный анализ, Python, JavaScript, frontend, тестирование
+ технологии и инструменты: всё, что ускоряет работу и рост в IT
+ AI для карьеры и бизнеса: как использовать нейросети, чтобы зарабатывать
+ обзор нейросетей: что сейчас работает и что стоит изучать
+ промты: готовые решения + логика создания своих
подписаться🎁 https://t.me/addlist/uyDjlf_VhiNjNWNi
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Gamma — Мой фаворит, сервис делает и презы и сайты. Можно подгрузить свой текст, а можно сгенерить, в том числе на русском языке. Мой топ.
Prezi.com - анимация презентаций просто огонь.
Slidesgpt – Продвинутый сервис с GPT для работы с текстом.
Magic Slides – Генерация слайдов по видео с ютуба, обработка идет примерно минуту.
Decktopus – Найдет картинки, инфу и соберет все в виде слайдов, от вас требуется только задать тему.
Wepik — Можно генерировать сколько угодно проектов с простым визуалом и экспортом в PDF.
GPT for Slides — Расширение генерирует слайды прямо в Google Презентациях.
Pitch — По вашему запросу сделает шаблон презентации, есть миллион настроек от шрифтов до анимаций.
Что интересно, всем сервисам много лет, они проверены временем, и по прежнему работают. Из старой подборки удалил только tommy.app
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥2❤1
Please open Telegram to view this post
VIEW IN TELEGRAM