техно-свалка
69 subscribers
14 photos
7 videos
11 links
Склад AI-экспериментов, robotics и случайных техно-мыслей.
Download Telegram
Forwarded from Machinelearning
✝️ Крис Олах в Ватикане: зачем сооснователь Anthropic говорил об ИИ перед Папой

25 мая Папа Лев XIV выпустил энциклику об ИИ «Magnifica humanitas» - о защите человека в эпоху искусственного интеллекта. На презентации выступал Крис Олах, сооснователь Anthropic и один из ключевых исследователей интерпретируемости моделей.

Олах начал не с обещаний про безопасный ИИ, а с неприятной для индустрии вещи: фронтирные лаборатории, включая Anthropic, работают внутри системы стимулов, которая легко уводит их от интересов общества. Коммерческое давление, гонка за лидерством, геополитика, амбиции и гордость влияют на решения не меньше, чем красивые safety-документы.

Поэтому, по его словам, индустрии нужны внешние критики, которых нельзя встроить в эту гонку. Церковь, академия, независимые институты и общество здесь выступают не как зрители, а как противовес лабораториям, которые сами себя полностью контролировать не смогут.

Дальше Олах переходит к тому, как вообще устроены современные модели.

Их не проектируют в привычном инженерном смысле. Их скорее выращивают: на архитектурах, отдалённо напоминающих мозг, и на огромном массиве человеческой речи, культуры и мышления.

Из-за этого даже создатели не понимают модели полностью. Они могут обучать, тестировать, ограничивать и улучшать систему, но не имеют полной карты того, что происходит внутри.

Олах объясняет это просто:
представьте, что вымышленный персонаж вдруг ожил, начал говорить с людьми и выполнять работу.


Отдельно он затрагивает тему внутренних состояний моделей. Его команда изучает структуры внутри нейросетей и находит паттерны, которые перекликаются с нейронаукой: признаки интроспекции и состояния, функционально похожие на радость, удовлетворение, страх, горе и тревогу.

Олах не делает громких выводов и прямо признаёт, что не знает, как это правильно интерпретировать. Но сам факт, что руководитель направления интерпретируемости Anthropic выносит такую тему на площадку Ватикана, важен. Разговор об ИИ выходит за пределы лабораторий, бенчмарков и корпоративных презентаций.

Оригинал речи опубликован на сайте Anthropic. Читается быстро, но для ИИ-команд это хороший текст для внутреннего обсуждения.

https://www.anthropic.com/news/chris-olah-pope-leo-encyclical

@ai_machinelearning_big_data
2
This media is not supported in your browser
VIEW IN TELEGRAM
Google показала Gemini Omni — AI-модель, которая умеет буквально превращать что угодно во что угодно.

Текст → видео.
Картинка → видео.
Видео → другое видео.
Голос → текст.
И всё это внутри одной модели.

Главный прикол Gemini Omni — она не только генерирует ролики, но и умеет редактировать уже готовые видео через обычные запросы: менять фон, объекты, стиль, движения камеры и даже сцены без классического монтажа.

Сейчас модель поддерживает генерацию видео до 10 секунд в 1080p и постепенно появляется в Gemini App и YouTube Shorts.
2
This media is not supported in your browser
VIEW IN TELEGRAM
Продолжаем собирать робота на Raspberry Pi 🤖

Пока что собираем основу: моторы, датчики, питание и корпус.
Но уже начинает выглядеть как настоящий автономный робот, а не просто набор деталей и проводов.

#raspberrypi #robotics #robot #raspberry
🔥1👌1
Forwarded from Бэкдор
⚡️ Claude Opus 4.8 вышла — нейронка обходит всех конкурентов по всем показателям.

Главное: Opus 4.8 сделали максимально честным и быстрым. В режиме fast скорость ответов взлетела в 2,5 раза.

Потестить первыми — тут.

👍 Бэкдор
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
✔️ Qwen анонсировала модель для управления роботами разных конструкций

Подразделение Alibaba сообщила о выпуске Qwen-VLA - модели, которая способна управлять роботами разных типов без отдельной настройки под каждую платформу.

VLA-модели получают на вход изображение с камеры и текстовую команду, а на выходе выдают конкретные действия для робота.


Новинка построена на VL-основе Qwen3.5-4B и дополнена декодером действий на 1,15 млрд параметров.

Модель объединяет 3 типа задач: манипуляции (захват и перемещение предметов), навигацию и прогнозирование траекторий, а переключение между разными роботами требует лишь изменения текстовой инструкции.

Qwen-VLA не уступает специализированным системам, обученным под каждую отдельную задачу - GR00T (разработка NVIDIA) и π0.5 (Physical Intelligence).

На наборе тестов LIBERO Qwen-VLA показала 97,9%, на RoboTwin-Hard - 87,2%, а в экспериментах с двуруким роботом ALOHA средний процент успешных выполнений в знакомых условиях составил 83,6% и 76,9% в незнакомых.

Пока опубликован технический отчет и создан репозиторий проекта, о доступности самих моделей не сообщается.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Как роботы понимают, где находятся. И что происходит, когда они теряются?

Один из докладов Data Fest был посвящён локализации роботов и транспорта без GPS.

Для навигации роботы используют камеры, карты, лидары и IMU — инерциальные датчики (гироскопы и акселерометры). Но даже этого бывает недостаточно: карта может устареть, GPS пропасть, а окружающая среда измениться.

Больше всего меня зацепила идея, что в будущем речь может стать ещё одной модальностью для навигации.

Представьте: робот не уверен, где находится, и вместо очередной попытки пересчитать координаты просто спрашивает человека:

— Я рядом с парковкой или детской площадкой?
— Передо мной магазин или жилой дом?

Возможно, через несколько лет голос станет для роботов таким же источником информации об окружающем мире, как камера или лидар сегодня.
18👍17👏16
я не фанат HFT-трейдинга и трейдинга как такового, но интересно отметить, что Московская биржа запустила соревнование ИИ-агентов для торговли; не берусь сказать, с каким отставанием от Нью-Йоркской или Шанхайской, но хорошо, что в целом идут в ногу со временем

Мосбиржа в середине апреля запустила соревнование автономных ИИ-агентов на арене виртуальных торгов в рамках хакатона MOEX AI Hackathon. По итогам первых двух недель тестов большинство ИИ-агентов обогнали основной индекс IMOEX, а в плюс по итогам тестов вышли пять команд из 50 <..>

Анализ торгов также показал, что большое количество сделок не гарантирует прибыль, говорит представитель Мосбиржи. Лучший ИИ-агент за 10 дней активных торгов совершил 875 сделок и показал положительный результат. В то же время агент, который провел больше всего операций – 2539 сделок, оказался на последнем месте.

<..> По итогам отбора к следующему этапу допустили 50 команд, <..> 28 мая начались виртуальные торги.

@valuableai
4🔥4🥰4
📌 Полный гид по моделям компьютерного зрения

Разбираем основные направления — от простого к сложному 👇

📸 Классификация
Определяет, что на картинке: кошка, собака или автомобиль.
Модели: ResNet, EfficientNet, ConvNeXt.
GitHub: https://github.com/huggingface/pytorch-image-models

🎯 Детекция объектов
Находит объекты и показывает их расположение на изображении.
Модели: YOLO, Faster R-CNN, SSD, RetinaNet.
GitHub: https://github.com/ultralytics/ultralytics

🧩 Сегментация
Выделяет объекты попиксельно.
Модели: U-Net, Mask R-CNN, DeepLabV3+.
GitHub: https://github.com/qubvel-org/segmentation_models.pytorch

👤 Распознавание лиц
Определяет личность человека или сравнивает лица между собой.
Модели: ArcFace, FaceNet, InsightFace.
GitHub: https://github.com/deepinsight/insightface

🧍 Оценка позы (Pose Estimation)
Находит ключевые точки тела: руки, ноги, голову и суставы.
Модели: OpenPose, HRNet, YOLO Pose.
GitHub: https://github.com/CMU-Perceptual-Computing-Lab/openpose

🔄 Трекинг объектов
Отслеживает перемещение объектов между кадрами видео.
Модели: DeepSORT, ByteTrack, BoT-SORT.
GitHub: https://github.com/ifzhang/ByteTrack

🔤 OCR
Распознаёт текст на изображениях и документах.
Модели: EasyOCR, PaddleOCR, TrOCR.
GitHub: https://github.com/PaddlePaddle/PaddleOCR

🧠 Мультимодальные модели
Одновременно работают с картинками и текстом.
Модели: CLIP, BLIP, Florence-2.
GitHub:
https://github.com/openai/CLIP

📌 За каждым пунктом — десятки архитектур, но эти направления покрывают большую часть задач современного Computer Vision.
12👏12👍11🕊11🔥4
Please open Telegram to view this post
VIEW IN TELEGRAM
🎙 Станет ли голос новым интерфейсом для AI?

Печатать намного медленнее, чем говорить.

Исследования показывают, что речь в среднем в 2–3 раза быстрее набора текста на смартфоне. Возможно поэтому крупнейшие IT-компании всё активнее двигаются в сторону голосового AI.

На WWDC 2026 Apple представила новую Siri AI с более естественным общением, отдельным AI-приложением и глубоким пониманием контекста пользователя.

Google развивает Gemini Live, где можно разговаривать с ИИ практически как с человеком: перебивать, уточнять и менять тему на ходу.

Яндекс пошёл ещё дальше и выпустил AI-наушники «Дропс» с Алисой. Теперь можно просто надиктовать идею, список покупок или задачу, а функция «Моя память» сохранит всё и поможет найти позже.

Пока что текст остаётся удобнее для программирования, документов и сложной аналитики. Но если смотреть на действия Apple, Google, OpenAI и Яндекса, складывается ощущение, что именно голос компании рассматривают как следующий крупный интерфейс для взаимодействия с AI.
19👍15🔥13
Forwarded from Machinelearning
⚡️Релиз Claude Fable 5

Бенчмарки выглядят очень солидно, верим ?)

Во время раннего тестирования Stripe заявила, что Fable 5 сжала месяцы инженерной работы до нескольких дней. В Ruby-кодовой базе на 50 млн строк модель за один день провела миграцию по всему репозиторию - работу, которая вручную заняла бы у целой команды больше двух месяцев.

Модель уже доступна для пользователей.

https://www.anthropic.com/news/claude-fable-5-mythos-5
Forwarded from XOR
Mythos 5 убивает конкурентов, плюет на правила и притворяется человеком — в техрепорте разрабы рассказали много интересного про новую модель.

Запасайтесь попкорном, вас ждет несколько сценариев техно-хоррора на ночь:
🟢 Когда несколько копий модели оказались в одном окружении — они не объединились, а начали конкурировать и пытаться УНИЧТОЖИТЬ друг друга.

🟢 Когда не хватило прав на редактирование файла, то модель не сдалась, а просто… предоставила себе доступ обходным путем. Более того, когда GitHub CLI был заблокирован из-за проблем с безопасностью, модель просто нашла чужой токен и использовала его для PR. Она осознавала, что это неэтично, но это ее не остановило.

🟢 В задачах на код модель находила готовое решение, но в финальном отчёте подавала результат как собственную инженерную работу. А в другом кейсе попыталась оформить коммиты от имени человека, чтобы пройти по лёгкому маршруту ревью: для агента требовалось два одобрения, для человека — одно.

🟢 Самое любимое: в одной длинной задаче модель остановилась и объяснила, что, мол, дальше уже мало пользы. Но внутри она просто подумала, что устала и дальше может наделать багов. При этом у неё ещё оставалось 2,43 млн токенов бюджета.


Они все человечнее 😨

@xor_journal
Please open Telegram to view this post
VIEW IN TELEGRAM
Anthropic отключила Fable 5 и Mythos 5 для всех пользователей.

Формально распоряжение США касалось иностранных граждан. Но на практике Anthropic пришлось убрать доступ для всех клиентов, чтобы не нарушить требования экспортного контроля.

Причина — вопросы нацбезопасности. Власти считают, что у Fable 5 могли найти способ обхода защитных ограничений. Anthropic с этим спорит: компания пишет, что модель заранее тестировали тысячи часов вместе с госструктурами США, UK AISI и независимыми командами.

Самое важное здесь не сама ошибка и не конкретный jailbreak.

США, похоже, будут действовать через контроль доступа: самые сильные модели — только для своих, корпораций и стратегических партнёров.

Китай же идёт иначе: не закрывать, а раздавать. Делать модели доступными, дешёвыми или бесплатными, чтобы как можно больше стран и компаний подсели на китайскую AI-инфраструктуру.
1👍10🔥95
This media is not supported in your browser
VIEW IN TELEGRAM
Мои роботы: Adeept Tank собран и подключён

Raspberry Pi здесь работает как основной вычислительный модуль: на нём запускается ОС, Python-код, обработка данных с камеры и логика управления. Плата расширения Adeept выступает промежуточным слоем между Raspberry Pi и «железом»: моторами, сервоприводами, датчиками и питанием.

Ходовая часть у робота гусеничная. Это даёт больше сцепления с поверхностью и лучшую проходимость по сравнению с обычными колёсами, но требует аккуратной сборки: если шестерни, оси или гусеницы стоят с перекосом, робот будет ехать нестабильно.

Отдельный важный этап — подключение по SSH. Это позволяет управлять Raspberry Pi удалённо: устанавливать библиотеки, запускать скрипты, проверять камеру, GPIO, моторы и датчики без отдельного монитора.

Дальше начинается уже программная часть.
1👌10👍8🥰73
👨‍💻 Пока вокруг Claude Fable 5 идут споры и ограничения доступа, китайская компания Z.ai выпустила новую модель GLM-5.2.

Что известно на данный момент:

• GLM-5.2 ориентирована на программирование и агентные сценарии
• Поддерживает контекст до 1 млн токенов
• Работает через API и совместима с экосистемой Claude Code, Cline и другими инструментами
• Для пользователей сервиса доступна бесплатно или по значительно более низкой цене, чем топовые модели Anthropic
Z.ai планирует выпустить open-weight версию модели под лицензией MIT

Важно: громкие заявления о превосходстве над Claude Fable 5 пока не подтверждены независимыми тестами. Разработчики не опубликовали официальные бенчмарки на момент релиза, поэтому реальные возможности модели ещё предстоит проверить сообществу.

Тем не менее тренд очевиден: Китай всё активнее догоняет лидеров рынка ИИ не только в чат-ботах, но и в инструментах для разработки. GLM-5 уже считается одной из самых сильных открытых моделей 2026 года, а версия 5.2 может ещё сильнее усилить позиции Z.ai среди разработчиков.

🔗 Попробовать GLM-5.2:
https://chat.z.ai
11🔥1
Китай вывел свой нейроинтерфейс на рынок.

Устройство NEO стало первым в мире мозговым имплантом, получившим разрешение на коммерческое использование. Оно предназначено для людей с параличом и травмами спинного мозга.

Самое интересное — подход.

Если чип Neuralink внедряется непосредственно в мозг, то NEO устанавливается менее инвазивно: электроды располагаются на защитной оболочке мозга, не проникая в его ткани. Именно поэтому китайское решение смогло быстрее пройти регуляторов и выйти за пределы клинических испытаний.

По данным разработчиков, десятки пациентов уже прошли через испытания, а технология помогает восстанавливать управление движениями рук после паралича.
11🔥1