Технозаметки Малышева
10.6K subscribers
4.33K photos
1.58K videos
41 files
4.41K links
Новости инноваций из мира Искусственного Интеллекта. 🤖 [РКН: 7021469833 ]

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bb
Download Telegram
Forwarded from Data Secrets
⚡️ Вышел ARC-AGI-3 – новая версия бенчмарка Шолле и первый интерактивный тест для эвала агентов

В первых двух версиях задачки были статичные. А тут фишка как раз в динамике: бенчмарк полностью состоит из игровых сред.

Каждая из игр устроена так, что ее правила, цели и механики неизвестны участнику заранее. Человек справляется с такими задачками легко, с абсолютным скором 100% (требуются только базовые знания). А вот агенты с треском проваливаются и в основном выбивают меньше 1 процента.

Вот здесь примеры, как тест проходит Gemini 3.1: с некоторыми задачками она справляется нормально, с некоторыми – очень плохо.

Самостоятельно поиграть можно здесь.

Ключевые проверяемые способности – самостоятельное исследование, быстрое обучение, адаптация к новым ситуациям, умение планировать и гибко перестраиваться.

В общем, команда продолжает выискивать именно то, что делает интеллект человека по-настоящему сильным, и что пока недоступно моделям.

Ну и стартовало традиционное соревнование по обновленной версии. Призовой фонд на этот раз – 2 миллиона долларов.

Хотя больше интересно, когда опубликуют лидерборд фронтиров
Please open Telegram to view this post
VIEW IN TELEGRAM
1133😁3🏆1
This media is not supported in your browser
VIEW IN TELEGRAM
AutoGaze: мгновенные анализ видео от NVIDIA

Ученые из NVlabs (NVIDIA) и UC Berkeley представили AutoGaze. Компактная модель на 3 млн параметров повторяет механику человеческого глаза. Она находит важные фрагменты и отсекает фон до передачи данных в основную нейросеть.

👁 Эмуляция внимания: Человек воспринимает мир фрагментарно. Мы фокусируемся на движении и контурах, игнорируя статичное окружение. AutoGaze копирует этот паттерн: он адаптивно выбирает минимальный набор фрагментов для сохранения смысла. Похожим образом работают различные кодеки для видео, - фиксируя только дельту изменений в кадре.

🚀 Глубокая оптимизация: Алгоритм снижает вычислительную нагрузку в 4-100 раз. Модели ViT и MLLM ускоряются до 19 раз. Это открывает возможность анализировать 4K-видео на 1000 кадров на доступном железе.

📊 Бенчмарк HLVid: Исследователи ввели High-Resolution Long-Form Video QA — первый тест для длинных роликов высокого качества. Модель NVILA-8B в связке с AutoGaze работает на 10% точнее базовой версии при кратном ускорении.

💼 Зачем бизнесу: Снижение стоимости распознавания видео потоков сверхвысокой четкости.
- мониторинг безопасности,
- автономный транспорт,
- складская логистика,
- машинное зрение у роботов и дронов.
Все это получает стократный буст.
Т.е. теперь нужно или в сто раз меньше мощностей, чтобы распознавать видео или можно работать с видеопотоком максимального качества без лишних расходов на железо.

Paper | GitHub | HF | Demo

#NVIDIA #AI #ComputerVision #AutoGaze
───
@tsingular
19👍8🔥85
Forwarded from Machinelearning
This media is not supported in your browser
VIEW IN TELEGRAM
✔️ DeepMind сделала браузер-генератор сайтов на Gemini 3.1 Flash-Lite.

Концепт, который работает внутри AI Studio, пишет HTML и CSS прямо в процессе серфинга вместо загрузки готовых страниц с серверов. Внешний вид и контент формируются на основе промптов, кликов и контекста навигации.

Технология органично вписывается в концепцию автономных ИИ-агентов, которым может понадобиться быстро собрать временный дашборд или вспомогательный инструмент для текущей задачи.

До идеала еще очень далеко. Поскольку верстка и контент полностью генерируются на не лучшей версии Gemini, браузер уязвим, склонен немного галлюцинировать, искажать стили и тратит прорву токенов на инференс.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👀8🤔52👍1🤯1
Forwarded from PIMENOV.RU
Suno обновилось до 5.5 и теперь каждый может обучить свою кастомную модель на нужных песнях и делать такие же.

Типа NotebookLM, только для музыки.

Это же просто офигеть, что творится.
17🔥146
Счёт 1:0 в пользу Anthropic — судья заблокировала бан Пентагона

Суд в Сан-Франциско встал на сторону Anthropic, вынеся предварительный судебный запрет (preliminary injunction) против администрации Трампа. Клеймо «угрозы нацбезопасности» и бан на использование Claude федеральными ведомствами заморожены.

⚖️ Первая поправка против Пентагона: Судья Рита Лин назвала действия властей «классической незаконной местью» и оруэлловщиной.

🛡 Статус-кво: Решение блокирует директиву Трампа о прекращении использования Claude. Пентагону запрещено клеймить компанию как «supply chain risk» для наказания за её этическую позицию, пока идёт основное разбирательство.

⚙️ Суть спора: Конфликт начался в сентябре: Пентагон требовал «полного доступа» к моделям для любых целей, а Anthropic настаивала на запрете использования Claude для массовой слежки и автономного летального оружия.

📺 Аналогия: Момент из «Железного человека 2»: Тони Старк на слушаниях в Сенате отказывается передавать чертежи костюма государству.

А вообще больше похоже на заранее спланированный отмыв репутации после использования Клода в нападении на Иран.

#Anthropic #Pentagon #суд #Claude #Trump #FirstAmendment
───
@tsingular
🤨8🔥6👍4❤‍🔥1
Claude Mythos: Антропик готовит новую модель

Утечка 3000 файлов из CMS Anthropic раскрыла дорожную карту новой флагманской нейросети.

В документах фигурируют два имени — Mythos и Capybara. Судя по черновикам, нас ждет новая иерархия моделей, которая встанет над нынешним Opus.

🐆 Новый тир Capybara: В Anthropic вводят новый уровень (tier) моделей. Capybara — это «самая большая и умная» архитектура за всю историю. Она официально позиционируется как замена Opus в качестве самого мощного и дорогого решения.

📊 Бенчмарки и отрыв: По сравнению с текущим лидером Opus 4.6, новая модель Mythos/Capybara показывает «драматически более высокие» результаты в трех областях:

Software Coding: автоматизация разработки сложных систем.
Academic Reasoning: логические выводы на уровне эксперта.
Cybersecurity: поиск 0-day уязвимостей и генерация эксплойтов.

💀 Экстремальные риски: Уровень кибер-способностей Mythos настолько высок, что Anthropic классифицирует её как «беспрецедентную угрозу». Модель способна находить дыры в софте и на лету генерировать атаки, которые опережают возможности защитников. Это — полноценное кибероружие, которое компания боится выпускать в широкий паблик.

🛡 Стратегия защиты: Чтобы смягчить удар, Anthropic планирует выдать ранний доступ (Early Access) крупным организациям и «белым хакерам», чтобы те успели закрыть дыры в своих кодобазах до того, как начнется волна AI-атак нового поколения.

Пишут, что утечка в том числе произошла из-за того, что CMS была навайбкожена.
Вопрос, конечно, почему самую умную модель не использовали для закрытия собственных дыр 😂

#Anthropic #Claude #Mythos #Capybara #CyberSecurity
───
@tsingular
😁2932🔥21
This media is not supported in your browser
VIEW IN TELEGRAM
Сегодня на GlobalTechForum
https://globaltechforum.ru/

В кластере Ломоносов

Обнаружен Unitree посетитель :)

Если кто тут,- пишите, пообщаемся.

#GTF #Unitree
------
@tsingular
👍6👾31
Как дети :)

#Unitree
------
@tsingular
👍20😁15👾1
Андрей Себрант ( @techsparks )  Директор по стратегическому маркетингу Яндекс, - на открытии

Что сейчас происходит с ИИ и как нам с этим жить

- опасно опираться на линейные прогнозы, потому что рост экспоненциальный
- цифра всерьез меняет мир тогда, когда она прорастает в офлайн
- на смену вайбкодингу приходит понятие vibeworking и agentic engineering
- команда из 1 человека и 30 агентов уже все чаще за неделю показывает результат, который раньше потребовал бы 15-30 человек и месяцы работы
- технология по-настоящему меняет бизнес не тогда, когда внедрена сама по себе, а когда под её влиянием меняются бизнес-процессы и сама структура компании.

#GTF #Себрант
------
@tsingular
6👾51🤣1👨‍💻1
шиза крепчала.

появились блейды и датацентры на макмини

так выглядит ваш следующий департамент цифровых сотрудников.

#macmini #datacenter
———
@tsingular
🤔10👀8🔥5🗿41
Бизнес и государство смотрят в одну сторону - о мерах поддержки в сфере ИИ и автоматизации.

Д. Медников: в РФ в области медиа уже активно внедряется ИИ на уровне не хуже мирового, есть уже и ИИ артисты и продакшен, но гиперперсонализация и формирование личных настроений требует значительных мощностей и тут требуется поддержка государства.

И. Скобелев: регуляцию в области ИИ нужно проводить аккуратно и минимально, чтобы не увеличить разрыв в отставании.

А. Шойтов: законопроект по ИИ еще в работе, уже многие мнения учтены, но основное, - вопросы качества ИИ, безопасность, функциональная надёжность, суверенитет (этика, ценности) и технологическая независимость. Тебования по закону будут приоритетно предъявляться в КИИ, гос и массовых сервисах (например более 100тыс пользователей в день как пример к обсуждению).
Обеспечение - безопасная разработка, тестирование.
У ИИ пока нет права как у гражданина и его можно и нужно цензурировать.

А. Смирнова:
Московский инновационный кластер выдает гранты и субсидии на стартапы в ИИ. Приглашают сотрудничать всех желающих.

Н. Дмитриевская:
Серьезная задача на государственном уровне - импортозамещение. ИнтерРАО для решения этой задачи проводит хакатоны, готовит данные, пилотирования (скаутинг) на внутренних песочницах и посчитать экономическую эффективность.
Так же уже более 20 задач определены для внедрения робототехники.
ИИ (LLM) пока это около 10 %, остальное - МЛ и автоматизация.

#GTF
------
@tsingular
😁75🤔311
Как ИИ-ассистенты и новые технологии радикально изменят работу компаний к 2030 году

В. Верещагин:
- 20% пользователей теряют квалификацию после общения с ИИ ассистентами
- Контур.Ассистент - 60-90% бухгалтеров готовы использовать ИИ в своих задачах. Рост почти от 0% за год.

В. Губарев:
- некоторые компании издают приказы "запретить пользоваться ИИ в рабочее время"
- результат которые локальные открытые модели выдают ниже пользовательских ожиданий
- корпоративный шлюз должен быть интереснее и полезнее для сотрудников, чем прямой заход в GPT за счет интеграции с внутренними корпоративными системами
- Openclaw - новый уровень "магии". В Крок создали онпремис платфому, чтобы можно было высаживать цифровых работников.

А. Васильев:
- ИИ агенты это конвейеры по обработке информации. Как и на конвейере ключевое тут, - контроль качества (%брака)

#GTF
———
@tsingular
👍432🐳1
Переход от точечных пилотов к комплексной интеграции ИИ во все бизнес-процессы

Г. Шатиров:
- люди дешевле, поэтому ИИ нужно внедрять туда, где ИТ пока нет. Т.е. создавать новые направления и их сразу с ИИ делать, а не заменять людей.
- для пилотов берут облако, но потом все-равно переползают в онпрем, потому, что безопасность не дает отдавать данные наружу.

К. Андреев:
- важный фактор - коммуникационный. любое масштабирование требует донабора людей, ответственных за коммуникации внутри. ИИ агенты эту задачу решают. Позволяют не наращивать коммуникативную сложность при масштабировании.
- ИИ это поисковик и интерпретатор. Не могут проводить глубокие исследования без инструкций от человека. Это исключительно инструмент.
- Нужно поднимать локальные модели на своем железе чтобы не тратить токены и не отдавать свои данные наружу
- Многие запускают пилоты на облачных ИИ, все устраивает, потом спотыкаются о безопасников - ставят локальную модель и все рушится, пилоты не взлетают.

А. Орлов:
- как только появляется "человек с блокнотом" - все ломается.
- подъем данных снизу наверх должен быть без участия человека
- первый вопрос цифровизации всегда - сколько ПШЕ мы сократим после автоматизации. я говорю - никого, так как человек должен остаться у "рубильника"
- помните раньше блокчейн обсуждали? в СДО хотели внедрять. Следа не осталось.
- люди дешевле, чем ИИ :)

Г. Романов:
- важно, чтобы у бизнеса была ярко выраженная боль, тогда трансформация возможна.
- есть ли регулярный и повторяемый процесс
- автоматизация это возможность роста как для компании, так и для людей, которые смогут скинуть с себя рутину.
- Установка мощного сервера это 15 киловатт на стойку. ни один датацентр вам в свободном режиме столько не даст.
- люди дороже, чем ИИ :)

П. Бабин:
- всегда нужно рисовать карту процессов по сложности и бизнес-эффектам. оптимизировать в первую очередь то, что покажет мгновенный эффект
- Мы тут Кими К2 недавно запускали, - пришлось закупить видеокарт на 290млн. поэтому все разговоры про запуск моделей локально для большинства неподъемно. Поэтому бизнес все-равно придет в облачные сервисы если ему не поиграться нужно а выкатить в прод на большую аудиторию.

#GTF
———
@tsingular
84👨‍💻1
Forwarded from Machinelearning
GitVerse стал полноценной средой для разработки с участием ИИ

Платформа GitVerse интегрировала ИИ-помощника GigaCode, который теперь помогает управлять проектами через чат. Автономные агенты сами создают репозитории и настраивают пайплайны, упрощая технические процессы.

Старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев подчеркнул, что ИИ стал активным партнером, который берет на себя рутину и позволяет инженерам сосредоточиться на творчестве. Безопасность тоже автоматизировали: система сама ищет уязвимости в коде. Дополнительно в платформе появился сервис Pages для быстрого запуска сайтов и документации прямо из репозитория.

#AI #ML #aiagents #gitverse
😐4322👍2
Защита данных при внедрении ИИ в работу компаний, риски ошибок

А. Шепилов:
- Вызов для ИТ и ИБ возник одновременно.
- Создали у себя нейрошлюз.
- идеальной архитектуры безопасности не существует

Е. Кудина:
- конкретика в согласии. забудьте фразу "передача третьим лицам". должно быть точное указание компании в которую передаются личные данные
- передавать только те данные которые согласованы
- технологический шит - передача ПДН в сторону Китая проще, чем в сторону США.
- внедрение ИИ начинать с инвентаризации, юридического аудита, затем классификация рисков и только потом техническое вредрение и дальше обучение сотрудников под роспись.
- приходили подрядчики, показывали отличный ИИ сервис, но модель у них оказалась облачная зарубежная, - попрощались.

Р. Мезенцев:
- если чатГПТ используют для переписывания входящих писем в краткий вид, может проще отправителей научить точнее и кратко формулировать мысль?
- если в пятницу обучаешь сотрудников, - в понедельник они удивлённо ничего не помянят (риски :) )

В. Каськов:
- если вы читали проект федерального закона по ИИ, - то скорее всего желание разрабатывать и внедрять ИИ у вас пропадет
- все системы взламываются. поэтому мы делаем ставку на скорость восстановления данных, инфраструктуры и приложений.
- однажды сотрудник прислал мне письмо со следами ИИ. теперь у него нет доступа к ИИ и ему приходится писать письма руками.

Е. Озерова:
- прежде чем подписывать NDA, - проведите пилотный проект, желательно бесплатно.

#GTF
———
@tsingular
🤯311🔥1
Прикольно что термин "Цифровой сотрудник" плотно входит в обиход.

#GTF
------
@tsingular
🤔4👍321👾1