Технозаметки Малышева
11.5K subscribers
4.81K photos
1.78K videos
42 files
4.84K links
Новости инноваций из мира Искусственного Интеллекта. 🤖 [РКН: 7021469833 ]

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸: https://pay.cloudtips.ru/p/c8960bbb
Download Telegram
😁38😢32💯2
В Корее придумали гениальный сервис для эпохи позднего капитализма: фейковый интернет-магазин.

- Заходите, выбираете товары, читаете отзывы, добавляете в корзину, оформляете заказ.
- Даже курьер к вам едет, следите на карте, но только ничего не происходит: курьер не приедет, деньги не списываются, товаров не существует.

То есть это онлайн-шопинг без покупки, чистый дофамин для зависимых от шопинга, для шопоголиков.

Звучит как полная дурка, а на самом деле идеальный формат для зависимых. Скоро в России. Сейчас Wildberries удалят из App Store и можно запускать 😂

Вот один из таких магазинов https://dopamineshopping.com/en-us
😁27🔥95🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
В Китае с небоскрёбов увлажняют воздух во дворах.
Позволяет понизить температуру на 3-6 градусов и повысить комфорт для жителей и растений.

Всё гениальное, - просто. :)

#Китай #увлажнители
———
@tsingular
🔥49👍1222
Mac Studio с M5 Ultra на подходе с 36 ядрами CPU и до 768 ГБ памяти

Apple готовит к выходу венец линейки М5, - M5 Ultra — перед переходом на M6 и M7. По материалам Bloomberg нас ожидают 36 ядер CPU, 80 ядер GPU и возможно до 768 ГБ unified memory.
Есть правда риск, что из-за дефицита чипов памяти эта цифра останется только в теории и тестах, а цены, которые уже поползли вверх сделают эту топовую модель недоступной для обывателей.

📋 Ключевые цифры:
• M5 Ultra: ~36 ядер CPU (+4 к M3 Ultra), 80 ядер GPU (без изменений), до 768 ГБ unified memory
• 25 июня Apple подняла цены на всю линейку: Mac Studio 96 ГБ с $3 999 до $5 299 (+$1 300, или 32%)
• MacBook Air: +$200, MacBook Pro M5 Max: +$500, iPad Pro: +$200
• M5 Ultra Mac Studio с 768 ГБ может стоить больше $10 000

💡 Запуск Mac Studio изначально планировался на начало 2026, но был отложен, - Bloomberg сейчас прогнозирует, что релиз будет в октябре.
Причина: дефицит чипов памяти и скачок цен на компоненты.
Тим Кук назвал рост дефицита «беспрецедентным по скорости и масштабу» и заявил, что Apple — «больше не может поглощать эти издержки».

Параллельно компания пропускает high-end версии M6 Pro/Max, чтобы ускорить разработку и вывод M7 под AI-нагрузки, — M5 Ultra становится последним «классическим» чипом перед фундаментальное переработкой архитектуры для следующих релизов.

💼 Последствия для рынка:
• Mac Studio остаётся главной AI-машиной Apple для локального инференса — 768 ГБ unified memory закрывает потребности даже крупных моделей
• Рост цен на 20–32% по всей линейке смещает Mac из «дорого» в «очень дорого», - что, в принципе, позволит развернуться конкурентам на Intel и AMD

Начинаем экономить на обедах, к октябрю как раз накопим :)

#Apple #M5 #Ultra #MacStudio #AI
———
@tsingular
🔥82🤯21😐1
Forwarded from ИИволюция 👾
Обычно новость про еще одну open source модель, которая бьет все бенчмарки, прилетает из Китая, но тут новость из США!

Вышла Ornith-1.0 — открытая LLM для agentic coding.

В линейке есть 9B, 31B, 35B MoE и 397B MoE. Старшая модель показывает очень сильные цифры:

77.5 в Terminal-Bench
82.4 в SWE-bench Verified
62.2 в SWE-bench Pro
78.9 в SWE-bench Multilingual
77.1 в ClawEval

Фишка в обучении: модель учат не только искать ответ, но и самой выстраивать план решения под задачу.

И все это под MIT лицензией, то есть можно использовать в коммерческих продуктах.

Похоже, в гонке open source моделей для кодинга США решили напомнить, что они тоже умеют. Похвально!

Детали:
https://deep-reinforce.com/ornith_1_0.html
и на хаггингфейсе https://huggingface.co/collections/deepreinforce-ai/ornith-10
21552🆒1
Forwarded from Machinelearning
OpenAI показала GPT-5.6 Sol.

Это новый флагман в линейке GPT-5.6. Вместе с ним идут Terra - более сбалансированная модель для повседневной работы, и Luna - быстрый и дешёвый вариант.

Главный фокус Sol: сложные агентные задачи, кодинг, биология и кибербезопасность.

Появляются два важных режима:

max — больше времени на глубокое рассуждение
ultra — работа через субагентов для сложных процессов

Пока GPT-5.6 доступен только в ограниченном preview для доверенных партнёров через API и Codex. Более широкий запуск в ChatGPT, Codex и API обещают позже.

https://openai.com/index/previewing-gpt-5-6-sol/
🤔43👍2
Hermes Agent получил Mixture of Agents — виртуального провайдера, собирающего консилиум из моделей

Nous Research встроила в Hermes Agent механизм, который выглядит как обычная модель, но под капотом собирает совет из нескольких LLM.
Называется Клуб Что? Где? Когда? Mixture of Agents (MoA),- реализован как полноценный самостоятельный виртуальный провайдер с собственной логикой агрегации результата.

⚡️ Как работает: вы выбираете MoA-пресет как обычную модель — через /model, Dashboard или TUI. Hermes запускает reference-модели (например, GPT-5.5 и DeepSeek V4 Pro), они анализируют задачу, а aggregator (скажем, Claude Opus 4.8) пишет финальный ответ и вызывает инструменты. Агентский цикл не ломается: tool calls, follow-up итерации, прерывания, транскрипт — всё работает как с обычной моделью.

🦀 Пресеты настраиваются в config.yaml — можно смешивать провайдеров, задавать отдельно температуру для reference и aggregator, лимитировать токены.

Команда /moa работает как алиас: без аргументов переключает на дефолтный пресет, с именем пресета — на конкретный, с произвольным текстом — выполняет one-shot запрос через MoA и возвращает предыдущую модель.

📦 MoA компонуется с остальной экосистемой автоматически: /goal, gateway-сессии, TUI, Desktop — везде, где выбирается модель. В списке провайдеров появляется отдельная строка Mixture of Agents, а её модели — это ваши пресеты.

Вектор интересный: вместо гонки за одной супер-моделью — консилиум из нескольких, где агрегатор получает размеченный анализ и принимает итоговое решение.
На сложных задачах можно получить результат лучше, чем от самых сильных моделей поодиночке.

Похожий подход недавно реализовал OpenRouter: Fusion Router запускает панель моделей параллельно, судья сравнивает ответы и выдаёт структурированный JSON-анализ — консенсус, противоречия, пробелы, слепые зоны.
Разница лишь в том, что Fusion Router — это API-слой, а MoA встроен прямо в агентский цикл Hermes: aggregator не просто читает анализ, а продолжает работать с инструментами, файлами и контекстом сессии.

Такими темпами, глядишь, архитектура мультимодельных совещаний станет стандартом.

Fable и GPT-5.6 можно не ждать, а добиться схожего результата через совет агентов.

#Hermes #MoA #агенты #OpenRouter
———
@tsingular
🔥205🏆21👍1🤔1👌1
Media is too big
VIEW IN TELEGRAM
Разговоры о будущем с Игорем Никитиным

Провели очень интересную беседу с Игорем Никитиным.
Разговор не про «очередные ИИ новости», а про то, как сегодня меняется логика работы с технологиями, моделями, агентами и цифровыми инструментами.

Обсудили, почему привычный подход «вопрос - ответ» устарел и что приходит ему на смену.
О том, как ИИ постепенно перестаёт быть просто помощником в чате и превращается в рабочую среду, в которой можно проектировать, делегировать, проверять гипотезы и собирать реальные результаты.

Отдельно затронули тему, которая мне кажется одной из самых важных на ближайшие годы: как человеку не потеряться в этой новой реальности, а наоборот — занять в ней более сильную позицию, - научиться управлять системами, которые заведомо сильнее и разумнее, чем один человек или даже небольшая команда.

Разговор получился живой, местами спорный, с практическими примерами и попыткой нащупать контуры будущего, которое где-то уже наступило, - но по-прежнему неравномерно распределено.

Игорь Никитин:
tg: @Nikitinwmt

Rutube | VKVideo | YouTube

Кстати, насчёт прямых эфиров напоминаю, что есть еще один канал ИИзбранное, с подписчиками которого мы проводим прямые эфиры и разбираем вопросы по ИИ вживую.
Ближайший эфир завтра в 19 мск.
Подписаться можно тут

#эфиры #Никитин #WMT
———
@tsingular
🔥20👍1033🤝1🗿1
Forwarded from Machinelearning
✔️ DeepSeek выложила DSpark - новый метод speculative decoding для V4 Flash и V4 Pro.

Заявленный прирост throughput: от 51% до 400% в зависимости от модели и случаев использования.

Смысл speculative decoding простой: маленькая или более быстрая модель заранее предлагает несколько следующих токенов, а основная модель проверяет их пачкой. Если предсказание совпадает, генерация идёт быстрее, потому что дорогих проходов большой модели становится меньше.

DeepSeek показывает ускорение не только на своих V4 Flash и Pro, но и на других моделях, включая Gemma и Qwen.

Это потенциально довольно полезный inference-подход для разных open-weight моделей.

Для продакшена это важная история.

Если качество ответа остаётся близким, а throughput растёт в разы, можно обслуживать больше запросов на том же железе или снижать стоимость генерации.

GitHub:
https://github.com/deepseek-ai/DeepSpec

Paper:
https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf

HF:
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro-DSpark

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥17331
This media is not supported in your browser
VIEW IN TELEGRAM
Если б у меня такая рогатка была бы в детстве, я бы наверное не вырос 😀😃🙂🙃

Не, ну до чего техника дошла.

#юмор #рогатка
------
@tsingular
72🔥6818😁11👍6❤‍🔥53👀3
А я правильно понял, что про рогатки вам интереснее читать, чем про ИИ? 😀
2💯118😁69👍84🙏1
DeepSeek напомнил, что мы используем Preview версию, а полноценный Дипсик мы еще даже не видели, - он выйдет в середине июля и в нем будет еще больше крутых фич и улучшенная производительность.

И это повлияет на цену.
Обычная цена останется $0.87 за 1 млн в Про версии, а вот в час пик цена вырастет до $1.74

#DeepSeek #цены
———
@tsingular
👍318🫡6
Media is too big
VIEW IN TELEGRAM
Обещал вчера вам море показать :)

интересно даже, - что больше наберёт реакций, - новость про ИИ или море :)

а то может пора тревел блог заводить... 🤔

#море
———
@tsingular
18227🔥19🐳12😁4👍3💯1
Akrites: крупнейшая коалиция в истории для защиты открытого кода

📋 Что произошло
25 июня Linux Foundation запустила Akrites — крупнейшую в истории программу скоординированного поиска, исправления и ответственного раскрытия уязвимостей в критическом открытом ПО. Участники: Amazon, Anthropic, Chainguard, Cisco, Citi, Endor Labs, Ericsson, Google, IBM, JPMorganChase, Microsoft и GitHub, NVIDIA, OpenAI, RapidFort, Red Hat, Rust Foundation, Sonatype, Vodafone, Zscaler — плюс CNCF, LF Energy, OpenInfra, OpenJS, OpenSSF и PyTorch Foundation.

💡 Почему это важно
Появление сильных ИИ-моделей изменило цикл поиска уязвимостей в открытом коде. То, на что раньше уходили недели работы эксперта, теперь делается за минуты, причём модель часто находит несколько уязвимостей одновременно.
Цикл «обнаружение → исправление» ускорился настолько, что мейнтейнеры физически не успевают закрывать дыры.

Anthropic в этой коалиции занимает особое место, - их модель Claude Mythos в рамках Project Glasswing просканировала более тысячи открытых проектов и нашла 23 019 проблем, из которых 6 202 — высокой и критической тяжести.
Разработчикам передано 1 596 отчётов, а исправлено всего 97!!!

Именно этот разрыв между скоростью обнаружения и скоростью устранения стал отправной точкой для запуска Akrites.

💼 Как это работает
Во-первых у альянса будет единое конфиденциальное пространство: уязвимости не раскрываются публично до появления исправления.
Во-вторых, принцип upstream-first: все правки вносятся в исходные репозитории. Специализированная группа реагирования работает как единый партнёр для мейнтейнеров.
В третьих, - ключевая метрика безопасности оупенсорс репозитория станет не публикация патча, а его развёртывание у потребителей.
Для пакетов без активного сопровождения Akrites выполняет роль «последней надежды».

📎 Ссылки

https://akrites.org/letter/
https://www.anthropic.com/news/project-glasswing-may-2026

#Akrites #OpenSource #CyberSecurity
———
@tsingular
👍17🔥6321
Forwarded from _rnd
⚡️ Как оценивать агентский harness

Одной LLM недостаточно, чтобы понять качество AI-агента. На итоговый результат влияет агентский harness — как он управляет инструментами, памятью, сообщениями, восстановлением после ошибок.

Чтобы разобраться в этой теме, мы провели ряд экспериментов. И выкатили в open source Harness Bench — открытый фреймворк для сравнения связок «модель + harness».

А в новой мощной статье на Хабре рассказали про архитектуру фреймворка, адаптацию классических бенчмарков под системы агентов, поделились инженерными находками и результатами сравнений разных связок.

↗️ Читайте статью
↗️ Тестируйте бенч

Автор и статьи, и бенчмарка, Андрей Иванов — NLP-инженер в R&D red_mad_robot.
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍842🔥2
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Comfy MCP

Если вы ещё не освоили Comfy и до сих пор генерите на аггрегаторах, самое время пересаживаться. Я ещё нигде не видел нормальной реализации воркфлоу, а здесь как бы первоисточник. Хоть и API может выходить немного дороже подписки в сухом пересчёте, часто все может быть наоборот из-за сгоревших в конце месяца остатков токенов и очередей на генерации.

Поддержка MCP исключает необходимость погружаться во все тонкости спагетиобразных пайплайнов. Теперь агент может сам находить нужные ноды и собирать любой воркфлоу.

Блогпост

@ai_newz
👍6🔥511