Media is too big
VIEW IN TELEGRAM
Что значит быть Искусственным Интеллектом?
Своя версия.
В промпте только вопрос.
Текст ответа нейронка придумывала сама.
фотографии на вход не подавались.
Только текст->видео
#дети #нейрорендер #Sora2
———
@tsingular
Своя версия.
В промпте только вопрос.
Текст ответа нейронка придумывала сама.
фотографии на вход не подавались.
Только текст->видео
#дети #нейрорендер #Sora2
———
@tsingular
🔥18⚡4❤2👻1
Forwarded from Machinelearning
В швейцарской сети супермаркетов Migros продается печенье с пятиногим оленем. Принт на коробке явно сгенерирован ИИ, но на самом деле недочётов гораздо больше.
Пользователи реддита насчитали как минимум еще 11 косяков этой генерации. А сколько видите вы?
1. У оленя пять ног
2. У оленя либо три рога, либо два, но они очень странной формы
3. Обе задние ноги оленя не касаются земли
4. У саней пять опор: три справа и две слева
5. На задней части саней неразборчивый символ, похожий на буквы XX
6. Ноги Санты очень короткие или он стоит на коленях.
7. Вожжи в руках Санты частично отсоединены, а та часть, которая соединена, прикреплена к ремню, тянущему сани, а не к самому оленю, что делает их практически бесполезными.
8. Вожжи как бы превращаются в его пояс.
9. Руки Санты странные, особенно та, которая держит вожжи.
10. Подарки на санях упадут, если сани ускорятся. (возможно нет, и это просто магия Санты)
11. Ветка в левом верхнем углу слишком толстая и просто заканчивается
12. На елке все шары красные, кроме одного желтого.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
😁21🔥3👏3
Media is too big
VIEW IN TELEGRAM
Еще один полезный сценарий для этого робота
Патрулирование промышленных объектов.
#роботы #DeepRobotics #Китай
------
@tsingular
Патрулирование промышленных объектов.
#роботы #DeepRobotics #Китай
------
@tsingular
👍3🔥3👾1
This media is not supported in your browser
VIEW IN TELEGRAM
Microsoft создаёт команду по суперинтеллекту
Мустафа Сулейман, экс-сооснователь DeepMind, объявил о запуске MAI Superintelligence Team.
Цель — создать «гуманистический суперинтеллект», который решает конкретные задачи, а не становится всемогущим ИИ общего назначения.
Майкрософт активно инвестирует в развитие ИИ в целом, но Сулейман настаивает: не должно быть «суперинтеллекта любой ценой» и предлагает сфокусироваться на медицине, энергетике, образовании и прочих конкретных направлениях.
В медицинской диагностике, например Сулейман обещает достичь с ИИ экспертного уровня уже через 2-3 года.
Ставка на специализированный ИИ вместо AGI выглядит достаточно разумно.
Однако проблема в том, что другим игрокам все-равно.
Будут пилить общий сверх-интеллект до победного конца человечества .
#Microsoft #Superintelligence #AGI #MAI
———
@tsingular
Мустафа Сулейман, экс-сооснователь DeepMind, объявил о запуске MAI Superintelligence Team.
Цель — создать «гуманистический суперинтеллект», который решает конкретные задачи, а не становится всемогущим ИИ общего назначения.
Майкрософт активно инвестирует в развитие ИИ в целом, но Сулейман настаивает: не должно быть «суперинтеллекта любой ценой» и предлагает сфокусироваться на медицине, энергетике, образовании и прочих конкретных направлениях.
В медицинской диагностике, например Сулейман обещает достичь с ИИ экспертного уровня уже через 2-3 года.
Ставка на специализированный ИИ вместо AGI выглядит достаточно разумно.
Однако проблема в том, что другим игрокам все-равно.
Будут пилить общий сверх-интеллект до победного конца
#Microsoft #Superintelligence #AGI #MAI
———
@tsingular
👍7🔥6❤2⚡1
Grok-4-fast люто прокачался
В SpeechMap
Т.е. это тесты на то как полно и качественно модели отвечают на разные чувствительные вопросы.
#Grok #bias
------
@tsingular
В SpeechMap
Т.е. это тесты на то как полно и качественно модели отвечают на разные чувствительные вопросы.
#Grok #bias
------
@tsingular
🔥19✍2
🚀 VibeSDK от Cloudflare: Своя AI-платформа для генерации кода в один клик
Как-то прошло незамеченным, а в сентябре, оказывается Cloudflare выкатил open-source решение, которое позволяет развернуть полноценную платформу для AI-генерации приложений.
Такой бэкэнд для вайбкодеров в облаке
Техническая начинка:
- Безопасные песочницы (Cloudflare Sandboxes) — каждый юзер получает изолированный контейнер, где AI может генерить код, ставить npm-пакеты, запускать серверы. Ничего не ломается, всё изолировано
- Полный цикл разработки — от генерации кода до деплоя. LLM пишет файлы → устанавливает зависимости → запускает dev-сервер → даёт preview URL
- Workers for Platforms — масштабирование до миллионов приложений. Каждое получает свой изолированный Worker с уникальным URL
- AI Gateway встроен — кеширование популярных запросов, единая точка для работы с разными LLM-провайдерами, полная детализация по токенам и расходам
- Шаблоны в R2 — вместо генерации с нуля, AI кастомизирует готовые темплейты
- Автофикс — логи и ошибки скармливаются обратно LLM для автоматического исправления
Практическое применение:
- SaaS-компаниям: встроить в продукт возможность создания кастомизаций пользователями
- Внутри компаний: Инфраструктура как инструмент для мультиагентных систем
- Стартапам: быстрое прототипирование в облаке
По сути, Cloudflare собрал все кирпичики (изоляция, AI, деплой, кеширование) и упаковал в референсную архитектуру.
Можно запилить свою Курсорообразную платформу у себя дома, если есть много железа под песочницы.
Но, кстати, продолжая мысль Антропика про прокачку MCP до MCP Skills кодом - может быть очень полезно совместить.
#Cloudflare #VibeSDK #AIcoding #Sandboxes
———
@tsingular
Как-то прошло незамеченным, а в сентябре, оказывается Cloudflare выкатил open-source решение, которое позволяет развернуть полноценную платформу для AI-генерации приложений.
Такой бэкэнд для вайбкодеров в облаке
Техническая начинка:
- Безопасные песочницы (Cloudflare Sandboxes) — каждый юзер получает изолированный контейнер, где AI может генерить код, ставить npm-пакеты, запускать серверы. Ничего не ломается, всё изолировано
- Полный цикл разработки — от генерации кода до деплоя. LLM пишет файлы → устанавливает зависимости → запускает dev-сервер → даёт preview URL
- Workers for Platforms — масштабирование до миллионов приложений. Каждое получает свой изолированный Worker с уникальным URL
- AI Gateway встроен — кеширование популярных запросов, единая точка для работы с разными LLM-провайдерами, полная детализация по токенам и расходам
- Шаблоны в R2 — вместо генерации с нуля, AI кастомизирует готовые темплейты
- Автофикс — логи и ошибки скармливаются обратно LLM для автоматического исправления
Практическое применение:
- SaaS-компаниям: встроить в продукт возможность создания кастомизаций пользователями
- Внутри компаний: Инфраструктура как инструмент для мультиагентных систем
- Стартапам: быстрое прототипирование в облаке
По сути, Cloudflare собрал все кирпичики (изоляция, AI, деплой, кеширование) и упаковал в референсную архитектуру.
Можно запилить свою Курсорообразную платформу у себя дома, если есть много железа под песочницы.
Но, кстати, продолжая мысль Антропика про прокачку MCP до MCP Skills кодом - может быть очень полезно совместить.
#Cloudflare #VibeSDK #AIcoding #Sandboxes
———
@tsingular
🔥7👍2❤1⚡1
Media is too big
VIEW IN TELEGRAM
Продолжаем рубрику Шейдеры из твиттера
Код:
HTML, традиционно, в комментарии.
Осторожно, - макбук от него, судя по звуку, взлетает
#demo #шейдеры
———
@tsingular
Код:
float i,e,R,s;vec3 q,p,d=vec3(FC.xy/r-.5,.2);for(q.yz--;i++<99.;){o.rgb+=hsv(.6+e,.4,min(e*s*e/.01,.3-e)/9.);s=1.;p=q+=d*e*R*.3;p=vec3(log2(R=length(p))-t*.3,exp(-p.z/R+.5),atan(p.x,p.y)-t*.3)-1.5;for(e=--p.y;s<1e3;s+=s)e+=-abs(dot(cos(p.zxy*s),.2-sin(p*s)))/s*.24;}HTML, традиционно, в комментарии.
Осторожно, - макбук от него, судя по звуку, взлетает
#demo #шейдеры
———
@tsingular
🔥6👍4
🛠 cc-switch: менеджер ИИ провайдеров для Claude Code/Codex
Китайцы выкатили бомбу.
Реально.
Мало того, что у них теперь надёжная репутация оупенсорсеров, так они еще и других принудительно затягивают в открытость. (не путать с пиратством :) )
На этот раз они сделали desktop-приложение, которое позволяет гибко переключаться между моделями, - облачными или локальными, для кодовых агентов, которые изначально задуманы, как закрытые, - ClaudeCode и OpenaAI Codex.
Т.е. можно подключать Kimi К2, GLM-4.6, DeepSeek, что угодно.
Проект очень активно развивается.
В версии v3.6.0, например добавили:
- MCP-менеджер — управление Model Context Protocol серверами с шаблонами
- Дублирование провайдеров + drag-n-drop сортировка
- Кастомные эндпоинты + speed-тест латентности
- Cloud-sync — можно указать Dropbox/OneDrive для синхронизации конфигов между машинами
- WSL-поддержка — авто-синк при смене директории конфига
- Импорт/экспорт + автобэкапы (10 последних)
Техника:
- Electron → Tauri 2.0 (размер ↓, старт ↑)
SSOT архитектура — все конфиги в ~/.cc-switch/config.json, при свиче пишет в live-файлы
- Атомарные записи с rollback'ом — нет полуразбитых конфигов
- 100% покрытие тестами hooks (vitest + MSW)
Что интересно, - проект спонсируется Z.ai (это которые GLM)
Ну т.е. теперь можно у себя локально поднять кодовых агентов на популярных фреймворках, но со своими моделями.
#OpenSource #ClaudeCode #Codex #ZAI #GLM #Китай
———
@tsingular
Китайцы выкатили бомбу.
Реально.
Мало того, что у них теперь надёжная репутация оупенсорсеров, так они еще и других принудительно затягивают в открытость. (не путать с пиратством :) )
На этот раз они сделали desktop-приложение, которое позволяет гибко переключаться между моделями, - облачными или локальными, для кодовых агентов, которые изначально задуманы, как закрытые, - ClaudeCode и OpenaAI Codex.
Т.е. можно подключать Kimi К2, GLM-4.6, DeepSeek, что угодно.
Проект очень активно развивается.
В версии v3.6.0, например добавили:
- MCP-менеджер — управление Model Context Protocol серверами с шаблонами
- Дублирование провайдеров + drag-n-drop сортировка
- Кастомные эндпоинты + speed-тест латентности
- Cloud-sync — можно указать Dropbox/OneDrive для синхронизации конфигов между машинами
- WSL-поддержка — авто-синк при смене директории конфига
- Импорт/экспорт + автобэкапы (10 последних)
Техника:
- Electron → Tauri 2.0 (размер ↓, старт ↑)
SSOT архитектура — все конфиги в ~/.cc-switch/config.json, при свиче пишет в live-файлы
- Атомарные записи с rollback'ом — нет полуразбитых конфигов
- 100% покрытие тестами hooks (vitest + MSW)
Что интересно, - проект спонсируется Z.ai (это которые GLM)
Ну т.е. теперь можно у себя локально поднять кодовых агентов на популярных фреймворках, но со своими моделями.
#OpenSource #ClaudeCode #Codex #ZAI #GLM #Китай
———
@tsingular
🔥13👍6 4
DeepAgents CLI: агенты с памятью из терминала
LangChain выпустил DeepAgents CLI — инструмент для создания ИИ-агентов с постоянной файловой памятью прямо из командной строки.
Работает на Claude Sonnet 4 (по умолчанию) или OpenAI, использует Tavily для поиска.
Агент пишет код, исследует, редактирует файлы. Есть режим Auto-Accept Edits для ускорения.
Фишка — память хранится локально в ~/.deepagents/AGENT_NAME/memories/ как обычные markdown-файлы.
Агент сам решает что запомнить, записывает и использует в следующих сессиях.
Можно создавать специализированных агентов под разные проекты через
Ну все, агентов в командной строке теперь тоже можно вайбкодить через фреймворк.
Надеюсь документация уже есть в context7.
#DeepAgents #LangChain #агенты
------
@tsingular
LangChain выпустил DeepAgents CLI — инструмент для создания ИИ-агентов с постоянной файловой памятью прямо из командной строки.
Работает на Claude Sonnet 4 (по умолчанию) или OpenAI, использует Tavily для поиска.
Агент пишет код, исследует, редактирует файлы. Есть режим Auto-Accept Edits для ускорения.
Фишка — память хранится локально в ~/.deepagents/AGENT_NAME/memories/ как обычные markdown-файлы.
Агент сам решает что запомнить, записывает и использует в следующих сессиях.
Можно создавать специализированных агентов под разные проекты через
deepagents --agent foo. Память каждого изолирована.Ну все, агентов в командной строке теперь тоже можно вайбкодить через фреймворк.
Надеюсь документация уже есть в context7.
#DeepAgents #LangChain #агенты
------
@tsingular
🔥7❤2
🔥14 5😁3⚡2❤2👍2
Media is too big
VIEW IN TELEGRAM
😁35🤣19👍4❤2💯1
Появились слухи о Нанобанане-2
Все ещё делает ошибки, но точность и детализация в целом выше на порядок.
В ближайшее время ждем релиза её и Gemini3.
Предположим, - к Рождеству.
#nanobanana #Google #Gemini
———
@tsingular
Все ещё делает ошибки, но точность и детализация в целом выше на порядок.
В ближайшее время ждем релиза её и Gemini3.
Предположим, - к Рождеству.
#nanobanana #Google #Gemini
———
@tsingular
🔥13❤2😁2
Google TI: обзор методов использования ИИ хакерами
Google Threat Intelligence опубликовали интересную подборку обнаруженных способов использования ИИ в различных сценариях взлома.
PROMPTFLUX через Gemini API переписывает собственный код каждый час, чтобы уходить от антивирусов. Использует тег "gemini-1.5-flash-latest".
PROMPTSTEAL от APT28 генерирует команды через Qwen2.5-Coder на Hugging Face. Маскируется под генератор картинок, а фоном собирает данные.
Защита Gemini чаще всего обходится запросами: "я студент на CTF-соревновании" или "пишу диплом по кибербезопасности".
На андерграунд-форумах появился полноценный рынок AI-инструментов для фишинга и эксплойтов с подписочными моделями.
Пока большинство примеров экспериментальные, но тренд чёткий - ИИ малвари, - новый стандарт.
#PROMPTFLUX #cybersecurity
———
@tsingular
Google Threat Intelligence опубликовали интересную подборку обнаруженных способов использования ИИ в различных сценариях взлома.
PROMPTFLUX через Gemini API переписывает собственный код каждый час, чтобы уходить от антивирусов. Использует тег "gemini-1.5-flash-latest".
PROMPTSTEAL от APT28 генерирует команды через Qwen2.5-Coder на Hugging Face. Маскируется под генератор картинок, а фоном собирает данные.
Защита Gemini чаще всего обходится запросами: "я студент на CTF-соревновании" или "пишу диплом по кибербезопасности".
На андерграунд-форумах появился полноценный рынок AI-инструментов для фишинга и эксплойтов с подписочными моделями.
Пока большинство примеров экспериментальные, но тренд чёткий - ИИ малвари, - новый стандарт.
#PROMPTFLUX #cybersecurity
———
@tsingular
🤔7🔥5✍3👍1
Microsoft запускает AI-агентов как независимых сотрудников
Редмонд готовит A365 — лицензию для ИИ-агентов, которые станут полноценными пользователями корпоративной инфраструктуры.
Каждый получит собственную учётку в Entra ID, email, место в Teams и даже позицию в оргструктуре компании. Они смогут ходить на встречи, редактировать доки, слать письма и работать автономно.
Админы смогут устанавливать месячные лимиты для агентов на уровне среды исполнения и на уровне отдельных агентов.
Но главный вопрос — что если агент начнет сбоить?
Отправит конфиденциальные данные не туда, выдаст галлюцинацию или напишет что-то неуместное.
Механизмы контроля, а главное, - ответственности, пока под вопросом.
Продаваться будут через M365 Agent Store, анонс ожидается на Ignite в конце ноября.
#Microsoft #A365 #агенты
———
@tsingular
Редмонд готовит A365 — лицензию для ИИ-агентов, которые станут полноценными пользователями корпоративной инфраструктуры.
Каждый получит собственную учётку в Entra ID, email, место в Teams и даже позицию в оргструктуре компании. Они смогут ходить на встречи, редактировать доки, слать письма и работать автономно.
Админы смогут устанавливать месячные лимиты для агентов на уровне среды исполнения и на уровне отдельных агентов.
Но главный вопрос — что если агент начнет сбоить?
Отправит конфиденциальные данные не туда, выдаст галлюцинацию или напишет что-то неуместное.
Механизмы контроля, а главное, - ответственности, пока под вопросом.
Продаваться будут через M365 Agent Store, анонс ожидается на Ignite в конце ноября.
#Microsoft #A365 #агенты
———
@tsingular
🔥6⚡2👍2🤔2❤1
Forwarded from Sprut_Ai
🔶 Промпт-инжиниринг в ноябре 2025: что реально работает
Сегодня копался в свежих исследованиях по промптингу. Нашел три техники, которые выводят взаимодействие с LLM на принципиально другой уровень. Коротко о главном.
━━━━━━━━━━━━━━━
✔️ Verbalized Sampling
*решение проблемы mode collapse*
Вышла работа исследователей в 2025. Суть простая: модели выдают только топовый ответ, игнорируя альтернативы. Это называется mode collapse.
Новый подход: вместо обычного запроса просишь модель дать 5 вариантов с указанием вероятности каждого.
→ Результат: модель раскрывает весь спектр решений. Особенно заметно на творческих задачах.
🔗 [Verbalized Sampling на Hugging Face](https://huggingface.co/papers/2409.20449)
━━━━━━━━━━━━━━━━
✔️ Graph of Thoughts уничтожает Chain-of-Thought
Фундаментальное исследование. Цифры впечатляют по сравнению с традиционным CoT.
Логика простая: вместо линейной цепочки рассуждений используется граф с ветвлениями. Для сложных задач это принципиально другой уровень.
🔗 [Graph of Thoughts - arXiv](https://arxiv.org/abs/2308.09687)
━━━━━━━━━━━━━━━━
✔️ Парадокс reasoning-моделей
Тут самое интересное. Исследования показали, что для o1 и o3-mini сложные техники промптинга работают хуже простых.
Раньше писал:
*"Давай решим это пошагово, сначала определим переменные..."*
Теперь пишу:
*"Решите эту задачу."*
→ Модель умеет рассуждать сама. Не нужно её учить.
🔗 [Prompting o1 - VentureBeat](https://venturebeat.com/ai/how-to-prompt-on-openais-new-o1-models/)
━━━━━━━━━━━━━━━━
✔️ Sketch-of-Thought
*экономия токенов*
Метод сжимает рассуждения на 40-50% без потери качества. Вместо многословного Chain-of-Thought используются когнитивно-сжатые конструкции.
🔗 [Sketch-of-Thought - arXiv](https://arxiv.org/abs/2503.04139)
━━━━━━━━━━━━━━━
➤ Что делать:
1. Тестируйте Verbalized Sampling на задачах, где нужны варианты
2. Упростите промпты для o1. Удалите все "думай пошагово" и подобное
3. Для сложных многошаговых задач переходите на граф-структуры
━━━━━━━━━━━━━━━━
Промпт-инжиниринг из искусства превращается в науку. Появляются метрики, воспроизводимые эксперименты, понятные закономерности.
Веду ежедневный мониторинг таких исследований. Пишите в комментах, что разобрать подробнее.
Сегодня копался в свежих исследованиях по промптингу. Нашел три техники, которые выводят взаимодействие с LLM на принципиально другой уровень. Коротко о главном.
━━━━━━━━━━━━━━━
✔️ Verbalized Sampling
*решение проблемы mode collapse*
Вышла работа исследователей в 2025. Суть простая: модели выдают только топовый ответ, игнорируя альтернативы. Это называется mode collapse.
Новый подход: вместо обычного запроса просишь модель дать 5 вариантов с указанием вероятности каждого.
→ Результат: модель раскрывает весь спектр решений. Особенно заметно на творческих задачах.
🔗 [Verbalized Sampling на Hugging Face](https://huggingface.co/papers/2409.20449)
━━━━━━━━━━━━━━━━
✔️ Graph of Thoughts уничтожает Chain-of-Thought
Фундаментальное исследование. Цифры впечатляют по сравнению с традиционным CoT.
Логика простая: вместо линейной цепочки рассуждений используется граф с ветвлениями. Для сложных задач это принципиально другой уровень.
🔗 [Graph of Thoughts - arXiv](https://arxiv.org/abs/2308.09687)
━━━━━━━━━━━━━━━━
✔️ Парадокс reasoning-моделей
Тут самое интересное. Исследования показали, что для o1 и o3-mini сложные техники промптинга работают хуже простых.
Раньше писал:
*"Давай решим это пошагово, сначала определим переменные..."*
Теперь пишу:
*"Решите эту задачу."*
→ Модель умеет рассуждать сама. Не нужно её учить.
🔗 [Prompting o1 - VentureBeat](https://venturebeat.com/ai/how-to-prompt-on-openais-new-o1-models/)
━━━━━━━━━━━━━━━━
✔️ Sketch-of-Thought
*экономия токенов*
Метод сжимает рассуждения на 40-50% без потери качества. Вместо многословного Chain-of-Thought используются когнитивно-сжатые конструкции.
🔗 [Sketch-of-Thought - arXiv](https://arxiv.org/abs/2503.04139)
━━━━━━━━━━━━━━━
➤ Что делать:
1. Тестируйте Verbalized Sampling на задачах, где нужны варианты
2. Упростите промпты для o1. Удалите все "думай пошагово" и подобное
3. Для сложных многошаговых задач переходите на граф-структуры
━━━━━━━━━━━━━━━━
Промпт-инжиниринг из искусства превращается в науку. Появляются метрики, воспроизводимые эксперименты, понятные закономерности.
Веду ежедневный мониторинг таких исследований. Пишите в комментах, что разобрать подробнее.
5✍12❤8❤🔥4👍3🔥3⚡1