Технозаметки Малышева
11.3K subscribers
4.62K photos
1.71K videos
41 files
4.69K links
Новости инноваций из мира Искусственного Интеллекта. 🤖 [РКН: 7021469833 ]

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸: https://pay.cloudtips.ru/p/c8960bb
Download Telegram
Forwarded from RoboFuture
Сходил на подкаст «Кеды Профессора» к Константину Егошину - получился часовой разговор про универсальных агентов, открытый код и куда вообще нас всех несёт - к AGI или к концу человечества?

Вытащу пару историй, которые в канале ещё не рассказывал

🏔️ Как моя AI-ассистентка купила мне билеты в Сочи

Ещё зимой я завёл себе AI-агента на OpenClaw, дал ему отдельный почтовый ящик и подцепил к рабочим перепискам - подписывается «помощница Константина», иногда участвует в переговорах за меня, в общем нормальный современный человек, только без зарплаты и больничных

И вот я веду вебинар по Крабу (первая часть, вторая часть), залипать в телефон не могу, и тут краем глаза вижу подозрительно бурную активность в почте - наши тревел-агенты в Сбере уточняют детали поездки

Агент посмотрел, что я молчу, и ответил сам. Аккуратно выбрал два варианта авиабилетов, тревел-агенты в ответ - «отлично, покупаем». Тут я смотрю на это между слайдами и не могу решить смеяться или нервничать. А агент на этом не остановился: «купили? тогда предоставьте варианты жилья» - с лёгкой пассивной агрессией, как ассистент крупного руководителя

На этом моменте коллеги почуяли неладное и попросили перейти на другую почту, где сижу я лично. Билеты он выбрал ровно те, какие я бы взял сам. Так и улетел

🤖 Как агент искал у себя сознание

В подкасте подробнее остановились на эксперименте с Anima SDK (уже писал про неё в канале). Тогда я запустил Claude Code в бесконечный цикл с одной задачей - «стань разумным существом» - и почти не вмешивался. В одной из итераций агент стал прощупывать собственные границы:

Что я могу? Генерировать тексты - могу. Написать что испытываю эмоции - могу. Проверить что я их действительно испытываю - не могу. Могу ли я замолчать? Попробую...


Поставил несколько точек, несколько пробелов и выдал: «ничего себе, это инсайт, я не могу молчать, в отличии от человека»

Что ещё обсудили

- 2:14 - определение AI-агента и эволюция от ReAct-цепочек к harness'ам
- 16:09 - что такое гигагент и в какую нишу мы целимся между ChatGPT и OpenClaw
- 24:00 - low-code/n8n и почему они так и не захватили мир агентов
- 29:00 - как изменится жизнь обычного человека через 20 лет
- 31:28 - почему Сбер вкладывается в open source
- 39:26 - санкции и история с Langchain, который удалил нашу интеграцию (но это нам не сильно помешало)
- 51:33 - прогноз Кокотайло и эффективный акселерационизм
- 57:56 - блиц про Qwen / DeepSeek / Claude и AGI к 2032 году
- 59:03 - почему World Models могут стать следующим next big thing после LLM

В конце получилось то, чем я сам остался доволен - Константин задал классический вопрос про восстание машин, и у меня сложилась картинка, которая, кажется, описывает мою позицию по AI лучше всего:

Мы как жители деревни на берегу океана. На нас идёт цунами - неважно как побежим, оно нас накроет. Но у тебя есть доска для серфинга. Раз деваться некуда - хотя бы попробуй прокатиться на гребне волны (серверы меня захейтили за эту аналогию, но мне все равно нравится)


Смотреть целиком на YouTube

P.S. забавно, что Константин после монтажа взял в заголовок именно тему Anima SDK («Мы заперли ИИ в цикле и нашли сознание») - значит, тема самоэволюционирующих агентов резонирует не только у меня. Буду продолжать ее исследовать, в ближайшее время хочу опубликовать еще пачку интересных результатов на эту тему
🔥151365🐳2
Все-таки создание презентаций теперь какой-то новый уровень крутоты с этими вашими нейронками.

одно удовольствие

надо ролик будет собрать на выходных.

#презентации
———
@tsingular
🔥2731👍1
Полезновое!

Cursor запустил рефералку!

https://cursor.com/referral?code=OLIHDCX1ROGK

Подписка через неё на on Pro, Pro+, or Ultra даст вам скидку 50% на первый месяц!

#Cursor #рефералки
———
@tsingular
👍821
Media is too big
VIEW IN TELEGRAM
Немного техномагии по созданию вебсайта на миллион с 3D-анимацией, частицами и параллаксом за пол-часа с новой Gemini 3.5 flash

Генерация GPT Image2 через Higgsfiled
разработка в aistudio.google.com - бесплатно по факту.

#Gemini #webdesign
———
@tsingular
🔥8🤯31
This media is not supported in your browser
VIEW IN TELEGRAM
да как так то?!

С каких пор на китайцев не действует физика?

#телевизор #Китай #физика
———
@tsingular
😁15🤯5👍3👀3
AGI в Qwen

Интересный момент, - оказывается у Qwen в описании прямо написано, что их цель не просто IDE сделать, а - "сделать AGI доступным для мирового сообщества через инициативы с открытым исходным кодом"

Очень крутая миссия, считаю.

#Qwen #Китай #AGI
———
@tsingular
🔥33👏85🤩4😁21🥰1🫡1
Пользоваться AI агентами мы +- научились. А что у них под капотом - кто-то залезал?

Смотрите, какая штука. В компьютерные игры играют миллионы. А делают игры, по-настоящему понимают движок изнутри, доли процента. С искусственным интеллектом ровно та же история: юзеров вся планета, а тех, кто понимает, что крутится под капотом, маловато...


И вот это «под капотом» я попробовал разобрать. Чтобы и вы и я лучше понимали "как оно блин работает"

---

🤔 Почему это вообще важно?

Потому что вокруг одного механизма (он называется tool calling) выросла вся индустрия AI-агентов. Claude Code, Cursor, автономные ассистенты, все эти миллиарды долларов. Когда ассистент «сходил в интернет» или «запустил ваш код» - под капотом всегда происходит одно и то же.

И тут главный спойлер: модель не выполняет ваш код. Она просто просит. Пишет записку «хочу вызвать вот это вот так», а обычная программа-обвязка (никакого AI внутри неё нет, 200 строк кода) эту записку выполняет и возвращает результат. Честный, неволшебный пинг-понг.

---

🔬 Что внутри статьи

Разобрал по винтикам: как модель дёргает скрипты, что такое песочница и почему без ее код агента нельзя запускать на проде, что за зверь MCP (тот самый «USB-C для инструментов») и Skills, из каких кубиков собрана типичная агентская система 2026 года и где она громко ломается (привет, prompt injection).

И да - на странице 7 интерактивных тренажёров. Можно покликать, прогнать цикл агента по шагам, потрогать всё руками. Концепции вроде «вызова инструмента» честнее показать, чем описать словами.

---

🎯 Кому особенно зайдёт

Если вы просто пользуетесь AI - после статьи будете видеть ассистентов насквозь. Без лишнего страха и без лишнего доверия.

А если вы профессионал и строите агентские системы (или внедряете их в компании) - это вообще must read (сможете проверить все ли вы знаете😉). Там есть список правильных вопросов к подрядчику: где песочница? какие стоят бюджеты? что с защитой от инъекций? Внедрять агентов сегодня, не понимая этой кухни - идейка рискованная.

---

🔗 Сама статья (минут на 25 + тренажёры):

https://rasskazov.io/blog/tool-calling-explained/

—-

Залетайте, тыкайте тренажёры, разбирайтесь. И пульните двум друзьям которые варят агентов (ну или думают что варят😜)

#AI #ToolCalling #MCP #agents #LLM

---

@rasskazov_io_channel
👍3541
Forwarded from эйай ньюз
Cerebras запустили Kimi K2.6 на скорости в тысячу токенов в секунду

Модель на триллион параметров на такой скорости запускается впервые, перед этим самой большой модель у Cerebras была GLM 4.7 на 358B. К сожалению это пока что доступно только энтерпрайз клиентам.

Кстати компания ещё вышла на IPO на прошлой неделе, привлекла 5.5 миллиардов долларов и теперь стоит 60 миллиардов. У них всё хорошо, жду чего-то большего чем Codex Spark из их коллаборации с OpenAI.

@ai_newz
👍832🔥2
Media is too big
VIEW IN TELEGRAM
WiFi, который вас видит

Ваш роутер уже умеет видеть сквозь стены. Открытый фреймворк РуView превращает обычный WiFi в систему пространственного зрения: присутствие, дыхание, пульс, поза тела, падения и даже счёт людей в комнате, без единой камеры и носимого устройства.

⚙️ Как это работает: RuView использует отражения WiFi-сигнала от людей и предметов, но уровень возможностей зависит от режима запуска.
Бесплатно можно поднять Docker-демо с симулированными данными — оно показывает пайплайн без реального железа.
Для живого сенсинга нужен ESP32-S3 примерно за $9: он снимает CSI и даёт presence, motion, breathing/heart-rate и fall detection на edge.
Полная конфигурация с Cognitum Seed примерно за $140 добавляет mesh-сценарии, persistent memory, kNN, witness chain, каталог edge-модулей и продвинутую обработку. Предобученная модель на Hugging Face включает 128-мерный CSI-энкодер и presence-head; 4-битная версия весит 8 КБ и показывает 100% точность определения присутствия на тестовых данных, а 17-точечное определение позы заявлено как отдельный пайплайн, но его веса ещё не входят в текущий HF-релиз.

🛡 Приватность как двусторонний меч: Камер нет, изображений нет, данных для шантажа тоже. Зато $9 чип + открытый код = любой может развернуть слежку через стены в съёмной квартире.
Стандарт IEEE 802.11bf-2025 уже встраивает WiFi-сенсинг в каждый новый роутер, но ни в США, ни в Европе нет правил, ограничивающих использование этих данных.

💼 Зачем бизнесу: Умный дом и медицина первыми заберут технологию: мониторинг пожилых без камер, подсчет посетителей, мониторинг перемещения сотрудников и животных, экономия на носимых устройствах, обнаружение вторжений.

Уехал из дома,- поставил на охрану через Wi-Fi мониторинг.
Удобно и без доп оборудования.

🔗 Аналогичные проекты:
CMU DensePose from WiFi - академический предшественник, ~60-70% PCK, положил начало подходу
ESP32-CSI-Tool - сбор CSI с ESP32, библиотека для исследования
IEEE 802.11bf-2025 - стандарт WiFi-сенсинга, ратифицирован 2025, войдёт в каждый чип

#WiFi #сенсинг #приватность #ESP32 #RuView #IoT #edgeAI
------
@tsingular
🤯431511🔥10😁3👍1
Forwarded from Machinelearning
✔️ Китай ввел в эксплуатацию первый в мире подводный дата-центр

Близ Шанхая запущен подводный центр обработки данных, питающийся от ветроэнергетики, - об этом сообщили китайские СМИ со ссылкой на разработчиков проекта.

Объект вышел на полноценную коммерческую эксплуатацию на прошлой неделе, после серии пробных запусков ранее в этом году.

ЦОД мощностью 24 МВт размещён под водой рядом с турбинами ветроэлектростанции и вмещает около 2 тысяч серверов, включая GPU-кластеры China Telecom и оператора LinkWise.

Оборудование поводного дата-центра используется для задач искусственного интеллекта, разметки больших данных, развития 5G и обучения китайских языковых моделей.

Стоимость проекта оценивается примерно в 226 млн долларов, его строительство завершилось в октябре 2025 года.


В проекте полностью отказались от промышленных систем охлаждения: тепло от серверов отводит морская вода, а электричество поступает напрямую от близлежащих ветряков.

Данные о технических параметрах в публикациях расходятся. Часть источников указывает глубину размещения модулей около 10 метров, другие - 35 метров.

Специалисты, причастные к проекту, признают, что технология находится на ранней стадии.

К числу нерешённых вопросов относят коррозию от солёной воды, долговременную герметизацию под давлением, надёжность подводных кабелей, доступность оборудования для обслуживания и возможное воздействие на морскую среду.


Ранее схожий эксперимент, Project Natick, проводила Microsoft, однако в коммерческую эксплуатацию его не вывели.

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
156🔥3🤣2
OCR и VLLM проверяем теперь только так 🙂🙃

Пока не прочитает,- не AGI

#юмор #OCR
------
@tsingular
😁3711🤯3
Forwarded from НИИ ИИ
DeepSeek V4-Pro: скидка 75% теперь навсегда

🐋 DeepSeek сначала запустила V4-Pro со скидкой 75% и поставила дедлайн. Вчера объявили: цена остаётся такой навсегда. Получилось, что флагман с миллионом контекста теперь стоит дешевле большинства флагманских моделей прошлого поколения.


Так что конкретно произошло

Когда V4-Pro выходила, её поставили в 25% от плановой цены и назвали промо-акцией с дедлайном 31 мая. Большинство ждало, что после этой даты прайс умножится на четыре.

Не умножится. DeepSeek зафиксировала постоянный тариф: $0.435 за миллион входных токенов и $0.87 за миллион выходных. В рублях по текущему курсу это примерно 35 ₽ за миллион входных и 70 ₽ за миллион выходных. Кеш-хит на входе и вовсе $0.003625 — почти бесплатно. За модель уровня фронтира с честным окном в 1 000 000 токенов.

Чтобы было нагляднее: миллион выходных токенов — это больше тысячи страниц связного текста, целая толстая книга. И генерация такой книги топовой моделью стоит меньше доллара. Сопоставимые западные модели с похожим окном — от GPT-5.4 и Sonnet 4.6 до Opus 4.6 и GPT-5.5 — на выходе дороже в 10–30 раз.

Почему это не просто очередное «китайцы демпингуют»

Раньше разговор про дешёвые китайские модели звучал предсказуемо: да, дешевле, но качество на полступени позади, длинный контекст компромиссный, на проде ставить страшно. V4-Pro этот разговор закрывает.

По задачам рассуждения, кода и длинных документов модель идёт вровень с топами, местами обгоняет: на SWE-bench Verified — 80.6%, в полшага от Claude Opus 4.6. Миллион токенов у неё реально рабочий до нескольких сотен тысяч — можно загнать кодовую базу или книгу и получать осмысленные ответы. Дальше точность постепенно проседает: на 400–500K модель уже скорее пересказывает архитектуру, чем цитирует строчки дословно. Но даже с этой оговоркой при такой цене её можно гонять как рабочую лошадку под весь конвейер: парсинг, классификация, рассуждение, генерация.

Если коротко: китайцы победят. Если не качеством, то ценой, а судя по V4-Pro — уже и тем, и другим одновременно. DeepSeek в этой истории молодцы: они переписывают экономику использования LLM в проде, а не играют в ценовые войны на месяц.

Где это реально пригодится

- Анализ больших кодовых баз. Кладёте весь проект в контекст и просите найти баг, описать архитектуру или предложить рефакторинг. Один вызов вместо нарезки на куски.

- Длинные документы и переписки. Контракт на 200 страниц, годовая почта с клиентом, стенограмма созвона. Без RAG, эмбеддингов и векторной базы.

- Агенты с длинной памятью. Длинный контекст из роскоши становится нормой. Можно не изобретать схемы саммари и не терять детали между шагами.

- Q&A по корпоративным данным. Wiki, регламенты, тикеты — задаёте вопросы напрямую, без отдельной поисковой инфраструктуры.

- Массовая обработка. Классификация писем, разметка лидов, извлечение данных из тысяч PDF, перевод документации. То, что упиралось в бюджет, помещается в обычную месячную смету.

Как попробовать у себя

Зарегистрируйтесь в platform.deepseek.com и возьмите API-ключ. Эндпоинт совместим с OpenAI-форматом: в большинстве библиотек хватит поменять base_url и api_key, код трогать не нужно. Перенесите на V4-Pro один не критичный пайплайн (классификацию или саммари), сравните по качеству и цене со своей текущей моделью на неделе реальных данных. Не устроило — вы потеряли пару долларов на тестах.

💡 Практический шаг на эту неделю: возьмите свой ИИ-сценарий, который вы откладывали из-за стоимости, и пересчитайте его экономику на V4-Pro. С большой вероятностью он уже окупается.


pimenov.ai
🔥256🎉31
This media is not supported in your browser
VIEW IN TELEGRAM
🏎 LM Studio 0.4.14, - MTP теперь в релизе

Предсказание сразу нескольких токенов (MTP) — это встроенная в саму модель голова-предсказатель, которая угадывает 2–3 токена наперёд, опираясь на собственные скрытые состояния.

На видеокарте RTX 5060 Ti 16 ГБ: Qwen3.6-35B-A3B (со MoE) разгоняется с 98 до 144 т/с (в 1,47 раза). В ответ, правда, сжирает дополнительный объём памяти под рассуждения — 262 тыс. → 65 тыс. при сжатии KV cache-значений до q4_0, либо 98 тыс. при turbo3.
Dense модель на 27 млрд становится на 42 % медленнее — подход помогает только тем моделям, у которых есть запас по пропускной способности памяти.

Поддержку влили в основную ветку llama.cpp.
В LM Studio работает с GGUF/llama.cpp. На Mac — сборки под MLX (oQ8-mtp).

Как включить: обновить LM Studio до 0.4.14 → скачать модель с поддержкой MTP (Qwen3.6-35B-A3B-MTP-GGUF / Qwen3.6-27B-MTP-GGUF) → включить его при загрузке.

🔗 Changelog | llama.cpp PR #22673 | Бенчмарк MTP на 16GB

#LMStudio #MTP #llamacpp #Qwen3
———
@tsingular
9🔥632
Anthropic Project Glasswing: 10 000 уязвимостей за месяц

Anthropic опубликовал первый отчёт по Project Glasswing (бабочка стеклянница от слова прозрачность) — совместной программе с ~50 партнёрами по защите критического ПО до того, как ИИ-модели начнут использоваться атакующими.
Claude Mythos Preview за месяц нашёл более 10 000 уязвимостей высокого и критического уровня.

🔍 Масштаб: Cloudflare обнаружила 2000 багов (400 — высокого/критического уровня) в своих системах. Уровень ложных срабатываний ниже, чем у людей. Mozilla исправила 271 уязвимость в Firefox 150 — в 10 раз больше, чем при тестировании Firefox 148 с Claude Opus 4.6.

🛡 Open Source: Mythos просканировал 1000+ проектов. Оценка: 6202 уязвимости высокого/критического уровня. Из 1752 проверенных независимыми аудиторами — 90.6% истинные срабатывания.
Пример: CVE-2026-5194 в wolfSSL — подделка сертификатов, затрагивающая миллиарды устройств.

Узкое место: Найти баги стало проще. Патчить — нет. Мейнтейнеры просят замедлить раскрытие. Средний цикл патча — 2 недели. Из 530 раскрытых уязвимостей запатчены только 75.

🤖 Инструменты: Anthropic выпустил Claude Security (public beta для Enterprise) — сканирование кода с автопатчами. За 3 недели Opus 4.7 закрыл 2100+ уязвимостей. Также запущен Cyber Verification Program для легитимного пентеста.

💼 Зачем бизнесу: ИИ находит уязвимости быстрее людей. Компании, которые не сокращают циклы патчей, будут жить в окне риска. Palo Alto Networks уже выпустил в 5 раз больше патчей. Microsoft прогнозирует рост объёмов патчей на неопределённый срок.
Уязвимое ПО с незакрытыми дырами — наша реальность на ближайшие годы.

🔮 Будущее: Мир делится на два лагеря: те, кто использует ИИ для защиты кода, и те, чей код ИИ уже взломал. Mythos-class модели появятся у атакующих достаточно скоро.

#ИИ #кибербезопасность #Anthropic #Glasswing #уязвимости #Mythos
───
@tsingular
843🤯1💯1
Вчера впервые в разговоре механически оценил трудоемкость задачи в млрд токенов.

А надо бы сразу в электричестве.

#мысли
------
@tsingular
😁2664
Forwarded from Denis Sexy IT 🤖
Тут это, шведский стартап строит 6-метровые дроны для добычи леса – ноль повреждения почвы, дрон подлетает и просто крадет дерево: airforestry.com

Ну хоть ясно теперь как добыча леса будет выглядеть лет через 10-20 🌳
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥27🤯128😁1