This media is not supported in your browser
VIEW IN TELEGRAM
3D-R1: Enhancing Reasoning in 3D VLMs for Unified Scene Understanding
Базовая визуально-языковая модель понимания 3D сцен/
Умеет описывать сцены, отвечать на вопросы о них, планировать действия в виртуальном пространстве
Код
Веса
#vlm #3d #3dvlm #assistant #captioning
Базовая визуально-языковая модель понимания 3D сцен/
Умеет описывать сцены, отвечать на вопросы о них, планировать действия в виртуальном пространстве
Код
Веса
#vlm #3d #3dvlm #assistant #captioning
🔥8👍1
Claude Opus 4.1
Ну, да, выпустили. Модель улучшена в области решения агентских задач, реального кодирования и логического мышления. доступна для платных пользователей
#news #assistant
Ну, да, выпустили. Модель улучшена в области решения агентских задач, реального кодирования и логического мышления. доступна для платных пользователей
#news #assistant
👍4
MiDashengLM
Модель понимания аудио от Xiaomi, #sota
Распознает тембр голоса, музыкальные инструменты, прочие звуки, отвечает на вопросы
Код
Демо
Веса ~50Гб
#audio2text #alm #assistant
Модель понимания аудио от Xiaomi, #sota
Распознает тембр голоса, музыкальные инструменты, прочие звуки, отвечает на вопросы
Код
Демо
Веса ~50Гб
#audio2text #alm #assistant
🔥5👍2🤔1👀1
Seed Diffusion Preview
экспериментальная языковая модель от ByteDance Seed для генерации кода на основе дискретной диффузии.
работает в два этапа: сначала заполняет пропуски в коде, а потом исправляет его, проверяя на глобальные ошибки.
Быстрее в 4-5 раз авторегрессионных моделей схожего масштаба
Попробовать - меня не пускают говорят встань в очередь
#assistant #coding
экспериментальная языковая модель от ByteDance Seed для генерации кода на основе дискретной диффузии.
работает в два этапа: сначала заполняет пропуски в коде, а потом исправляет его, проверяя на глобальные ошибки.
Быстрее в 4-5 раз авторегрессионных моделей схожего масштаба
Попробовать - меня не пускают говорят встань в очередь
#assistant #coding
👍8❤1🔥1
Qwen3-4B-Instruct-2507
недумающая модель от Qwen на 4B параметров.
Контекст 256К
HF ~8.1Gb
—————————
Qwen3-4B-Thinking-2507
думающая модель от Qwen на 4B параметров.
Контекст 256К
HF ~8.1Gb
#assistant
недумающая модель от Qwen на 4B параметров.
Контекст 256К
HF ~8.1Gb
—————————
Qwen3-4B-Thinking-2507
думающая модель от Qwen на 4B параметров.
Контекст 256К
HF ~8.1Gb
#assistant
🔥7👍1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Jules
Google релизнул показанный в мае асинхронный агент для программирования на базе Gemini 2.5 Pro
- интеграция с GitHub
- может запускать существующие тесты и создавать новые
- клонирует код в облачную виртуальную машину и проверяет работоспособность изменений
- показывает план действий, объясняет свои решения и предоставляет диффы изменений в коде
Есть базовый тариф - 15 задач в день, 3 одновременные задачи
Россиян не любят
#assistant #Agent #coding
Google релизнул показанный в мае асинхронный агент для программирования на базе Gemini 2.5 Pro
- интеграция с GitHub
- может запускать существующие тесты и создавать новые
- клонирует код в облачную виртуальную машину и проверяет работоспособность изменений
- показывает план действий, объясняет свои решения и предоставляет диффы изменений в коде
Есть базовый тариф - 15 задач в день, 3 одновременные задачи
Россиян не любят
#assistant #Agent #coding
🔥5❤3🥴2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
gpt-oss 20B в облаке бесплатно
Времена настали тяжкие. Это где это видано чтобы каждый босяк мог запустить новейшую крутую LLM бесплатно в облаке. Совсем распоясались.
Я не знаю как долго она будет скачиваться и запускаться, несколько часов в день на бесплатном Колабе - стоит того чтобы вы об этом знали.
[UPDATE] у меня не запускается, OOM на 9 ячейке. Выходит, не каждый босяк
Колаб ноутбук
#assistant
Времена настали тяжкие. Это где это видано чтобы каждый босяк мог запустить новейшую крутую LLM бесплатно в облаке. Совсем распоясались.
Я не знаю как долго она будет скачиваться и запускаться, несколько часов в день на бесплатном Колабе - стоит того чтобы вы об этом знали.
[UPDATE] у меня не запускается, OOM на 9 ячейке. Выходит, не каждый босяк
Колаб ноутбук
#assistant
👍4❤1
PromptNova
Промпт-конструктор для картинко- и видеогенераторов
На старте дают 1000 кредитов на две недели.
Ежедневно что-то немножко тоже насыпают
#assistant #prompting
Промпт-конструктор для картинко- и видеогенераторов
На старте дают 1000 кредитов на две недели.
Ежедневно что-то немножко тоже насыпают
#assistant #prompting
👍8
GPT-5: все что вам нужно знать
Основные изменения:
➖ GPT-5 превосходит предыдущие модели по точности, скорости и глубине анализа.
➖ Один запрос создает готовое решение: сайт, приложение, игру.
➖ Расширенное контекстное мышление: справляется с длинными задачами и задает уточняющие вопросы.
➖ Снижены «галлюцинации», повышая надежность.
➖ Бесплатный доступ для всех, для Pro - без лимитов.
Ключевые особенности:
➖ Объединяет все предыдущие версии, работает быстрее и точнее.
➖ Пишет сайты, приложения и игры по одному запросу.
➖ Переключается между быстрым и «думающим» режимами.
➖ Улучшена в кодинге, знает новые API.
➖ Самая мощная модель по метрикам LM Arena.
Версии:
➖ GPT-5 — флагманская версия для сложных логических и многоэтапных задач
➖ GPT-5-mini — облегченная версия с балансом производительности и стоимости
➖ GPT-5-nano — сверхбыстрая версия для задач с низкой задержкой (только через API)
➖ GPT-5-chat — специализированная версия для корпоративных диалоговых систем
Мультимодальность и безопасность:
➖ Интеграция с изображениями, аудио и видео.
➖ Лучшее распознавание визуальных структур.
➖ Встроенные guardrails снижают риск jailbreak'ов.
API и настройка:
➖ Поддержка длительной памяти до 256K токенов.
➖ Настройка через custom GPTs и function calling 2.0.
➖ Выход на CPU и edge-устройствах ожидается в 2026.
Cursor
Copilot
API
Попробовать
Кто уже наложил руки - делитесь впечатлениями
#news #assistant
Основные изменения:
➖ GPT-5 превосходит предыдущие модели по точности, скорости и глубине анализа.
➖ Один запрос создает готовое решение: сайт, приложение, игру.
➖ Расширенное контекстное мышление: справляется с длинными задачами и задает уточняющие вопросы.
➖ Снижены «галлюцинации», повышая надежность.
➖ Бесплатный доступ для всех, для Pro - без лимитов.
Ключевые особенности:
➖ Объединяет все предыдущие версии, работает быстрее и точнее.
➖ Пишет сайты, приложения и игры по одному запросу.
➖ Переключается между быстрым и «думающим» режимами.
➖ Улучшена в кодинге, знает новые API.
➖ Самая мощная модель по метрикам LM Arena.
Версии:
➖ GPT-5 — флагманская версия для сложных логических и многоэтапных задач
➖ GPT-5-mini — облегченная версия с балансом производительности и стоимости
➖ GPT-5-nano — сверхбыстрая версия для задач с низкой задержкой (только через API)
➖ GPT-5-chat — специализированная версия для корпоративных диалоговых систем
Мультимодальность и безопасность:
➖ Интеграция с изображениями, аудио и видео.
➖ Лучшее распознавание визуальных структур.
➖ Встроенные guardrails снижают риск jailbreak'ов.
API и настройка:
➖ Поддержка длительной памяти до 256K токенов.
➖ Настройка через custom GPTs и function calling 2.0.
➖ Выход на CPU и edge-устройствах ожидается в 2026.
Cursor
Copilot
API
Попробовать
Кто уже наложил руки - делитесь впечатлениями
#news #assistant
👍6❤4
GGUF-версии GPT-OSS от Unsloth
20B выдет более 10 токенов/с при полной точности на 14 ГБ RAM
120B с полной точностью - >40 токенов/с на примерно 64 ГБ RAM
Запуститься можно даже на всего 6 ГБ и только CPU, медленно разумеется
Запустить можно через llama.cpp, LM Studio или Open WebUI.
Также есть версии с 4-bit и 16-bit точностью. 4-бинтый квант, можно файнтюнить на 24 ГБ VRAM.
Веса
Инструкция по локальному запуску и файнтюну
#gguf #assistant
20B выдет более 10 токенов/с при полной точности на 14 ГБ RAM
120B с полной точностью - >40 токенов/с на примерно 64 ГБ RAM
Запуститься можно даже на всего 6 ГБ и только CPU, медленно разумеется
Запустить можно через llama.cpp, LM Studio или Open WebUI.
Также есть версии с 4-bit и 16-bit точностью. 4-бинтый квант, можно файнтюнить на 24 ГБ VRAM.
Веса
Инструкция по локальному запуску и файнтюну
#gguf #assistant
👍9🤔1
Jan-v1
Модель для агентского мышления и решения задач, в частности для веб-поиска.
Опенсорсная альтернатива Perplexity
Построена на базе их же модели для мобильного веб-поиска Lucy и Qwen3-4B-thinking
Интегрируется с Jan App или llama.cpp
#macos / #windows / #linux
Веса
Веса GGUF
Гитхаб
#search #GGUF #agent #assistant
Модель для агентского мышления и решения задач, в частности для веб-поиска.
Опенсорсная альтернатива Perplexity
Построена на базе их же модели для мобильного веб-поиска Lucy и Qwen3-4B-thinking
Интегрируется с Jan App или llama.cpp
#macos / #windows / #linux
Веса
Веса GGUF
Гитхаб
#search #GGUF #agent #assistant
👍8❤3🔥3
Пока Perplexity пытается выкупить Chrome у Google за 34,5 млрд долларов, у нас новый игрок на рынке ИИ-браузеров
Основная фишка Strawberry - автоматизация. Он запоминает ваши действия и может повторять их. Ну и сам не промах - может исследовать компании, находить лиды в LinkedIn, работать с CRM, суммировать заметки, составлять последующие сообщения и автоматизировать задачи на любых сайтах.
Данные хранит локально, но при взаимодействии с AI-провайдерами (Google, OpenAI, Anthropic) информация обрабатывается через них.
Есть пробный период, а после его окончания доступ к функциям обойдётся в 30 долларов США в месяц.
Записаться в вейтлист
#browser #assistant
Основная фишка Strawberry - автоматизация. Он запоминает ваши действия и может повторять их. Ну и сам не промах - может исследовать компании, находить лиды в LinkedIn, работать с CRM, суммировать заметки, составлять последующие сообщения и автоматизировать задачи на любых сайтах.
Данные хранит локально, но при взаимодействии с AI-провайдерами (Google, OpenAI, Anthropic) информация обрабатывается через них.
Есть пробный период, а после его окончания доступ к функциям обойдётся в 30 долларов США в месяц.
Записаться в вейтлист
#browser #assistant
👍5🔥1
GPT-OSS-120B on AMD MI300X
Не знаю зачем вам это, но вдруг кому-то нужно
Демоспейс GPT-OSS-120B от AMD
#assistant #chat
Не знаю зачем вам это, но вдруг кому-то нужно
Демоспейс GPT-OSS-120B от AMD
#assistant #chat
👍7😁7
Miromind
Полностью опенсорсный фреймворк для deepresearch, по приборам побивающий Opean AI
MiroThinker - набор моделей deepresearch
MiroTrain / MiroRL - микроструктура для обучения MiroThinker
MiroFlow - #sota агент умеющий пользоваться инструментами.
Я дал ему задание найти средний рост мужчин за последние 1000 лет. Выдал подробный результат за 1 минуту, см картинку
Попробовать
#deepresearch #assistant
Полностью опенсорсный фреймворк для deepresearch, по приборам побивающий Opean AI
MiroThinker - набор моделей deepresearch
MiroTrain / MiroRL - микроструктура для обучения MiroThinker
MiroFlow - #sota агент умеющий пользоваться инструментами.
Я дал ему задание найти средний рост мужчин за последние 1000 лет. Выдал подробный результат за 1 минуту, см картинку
Попробовать
#deepresearch #assistant
👍9
Пришло письмо счастья от ИИ-генератора песен Producer AI
Проверьте почту
Есть голосовой режим, назовем его вайб-композинг. Пытался ему напеть мелодию, но он, похоже, переводит все в текст. Сказал что слышит ритм. Но в генерации ничего похожего. Но это я играл в лентяя. На самом деле можно и загрузить кусок музыки, и записать в микрофон звук, только не в голосовом режиме
Да, выдали один инвайт, поделюсь в коментах
Накидывайте свои генерации и инвайты в коменты
Producer.ai
#music #musicediting #text2music #agent #assistant
Проверьте почту
Есть голосовой режим, назовем его вайб-композинг. Пытался ему напеть мелодию, но он, похоже, переводит все в текст. Сказал что слышит ритм. Но в генерации ничего похожего. Но это я играл в лентяя. На самом деле можно и загрузить кусок музыки, и записать в микрофон звук, только не в голосовом режиме
Да, выдали один инвайт, поделюсь в коментах
Накидывайте свои генерации и инвайты в коменты
Producer.ai
#music #musicediting #text2music #agent #assistant
👍4👎1
DeepSeek-V3.1-Base
Обновку выложили на HF без официального релиза.
Контекстное окно увеличили до 128К.
Знания до июля 2024.
#news #assistant
Обновку выложили на HF без официального релиза.
Контекстное окно увеличили до 128К.
Знания до июля 2024.
#news #assistant
huggingface.co
deepseek-ai/DeepSeek-V3.1-Base · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
👍3🔥1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Локальный Qwen 2.5 Omni распознает аккорды по звуку с микрофона
Сделано в Gabber - Real-time AI Engine
Реддит
#assistant #music2text #realtime
Сделано в Gabber - Real-time AI Engine
Реддит
#assistant #music2text #realtime
👍11
This media is not supported in your browser
VIEW IN TELEGRAM
DeepSeek-V3.1 уже в официальном чате.
21 августа опубликовали релиз.
- гибридный вывод: два режима — Think (с мышлением) и Non-Think;
- ускоренное получение ответов в режиме Think по сравнению с DeepSeek-R1-0528;
- улучшенные навыки агента: после обучения модель лучше использует инструменты и справляется с многошаговыми задачами;
- API-обновления: поддерживаются формат Anthropic API и строгий вызов функций в бета-API;
- контекст до 128K для режимов deepseek-chat (Non-Think) и deepseek-reasoner (Think); 1
- обновления в области инструментов и агентов: улучшены результаты в тестах SWE и Terminal-Bench, повышена эффективность многошагового рассуждения и мышления;
Попробовать в чате
#news #assistant
21 августа опубликовали релиз.
- гибридный вывод: два режима — Think (с мышлением) и Non-Think;
- ускоренное получение ответов в режиме Think по сравнению с DeepSeek-R1-0528;
- улучшенные навыки агента: после обучения модель лучше использует инструменты и справляется с многошаговыми задачами;
- API-обновления: поддерживаются формат Anthropic API и строгий вызов функций в бета-API;
- контекст до 128K для режимов deepseek-chat (Non-Think) и deepseek-reasoner (Think); 1
- обновления в области инструментов и агентов: улучшены результаты в тестах SWE и Terminal-Bench, повышена эффективность многошагового рассуждения и мышления;
Попробовать в чате
#news #assistant
👍7😁1