o1-pro появился в API и цены абсолютно прокляты!
Как вам $600 за 1 млн токенов?
По сравнению с $1.1 за млн в o3-mini или $2.19 у DeepSeek R1
Или даже $22 у GigaChat2 Max
Т.е. конечно, понятно, что с точки зрения OpenAI - это уже не игрушка, а вроде как Доктор Наук в предметной области вопроса изволит отвечать вам 24/7, но для начала страшновато.
Скорее всего на его ответах сейчас насамогонят R2 и будет у нас O1pro за 2 бакса на китайском.
#OpenAI #prices
———
@tsingular
Как вам $600 за 1 млн токенов?
По сравнению с $1.1 за млн в o3-mini или $2.19 у DeepSeek R1
Или даже $22 у GigaChat2 Max
Т.е. конечно, понятно, что с точки зрения OpenAI - это уже не игрушка, а вроде как Доктор Наук в предметной области вопроса изволит отвечать вам 24/7, но для начала страшновато.
Скорее всего на его ответах сейчас насамогонят R2 и будет у нас O1pro за 2 бакса на китайском.
#OpenAI #prices
———
@tsingular
😁10🔥1
🔥 EXAONE Deep: LG врывается в гонку рассуждающих ИИ
На арене появился неожиданный игрок из Кореи — LG, как оказалось, умеет не только в холодильники и телевизоры, но и в ИИ.
EXAONE Deep от LG AI Research — новая линейка моделей (32B, 7.8B и 2.4B параметров), заточенных под математику, научное мышление и программирование. И, судя по бенчмаркам, получается вполне сносно.
• 32B версия работает наравне с такими лидерами, как Qwen 32B, QwQ 32B и даже DeepSeek-R1 671B в CSAT Math.
• Уже доступна на Hugging Face — можно пощупать прямо сейчас.
По бенчмаркам:
• AIME 2024/2025 (американские математические олимпиады) — 32B версия набирает 90 баллов, 7.8B — 83.3.
• Китайский экзамен CSAT 2025 по математике — 94.5 балла у 32B версии.
• GPQA Diamond (PhD-уровень задач по физике, химии, биологии) — 66.1 у 32B.
• LiveCodeBench (кодинг) — стабильно высокие результаты у всех версий.
Оптимизирована под корейский язык.
Требует специальную команду для запуска режима рассуждений в промпте: нужно добавлять
#reasoning #LG #EXAONE
———
@tsingular
На арене появился неожиданный игрок из Кореи — LG, как оказалось, умеет не только в холодильники и телевизоры, но и в ИИ.
EXAONE Deep от LG AI Research — новая линейка моделей (32B, 7.8B и 2.4B параметров), заточенных под математику, научное мышление и программирование. И, судя по бенчмаркам, получается вполне сносно.
• 32B версия работает наравне с такими лидерами, как Qwen 32B, QwQ 32B и даже DeepSeek-R1 671B в CSAT Math.
• Уже доступна на Hugging Face — можно пощупать прямо сейчас.
По бенчмаркам:
• AIME 2024/2025 (американские математические олимпиады) — 32B версия набирает 90 баллов, 7.8B — 83.3.
• Китайский экзамен CSAT 2025 по математике — 94.5 балла у 32B версии.
• GPQA Diamond (PhD-уровень задач по физике, химии, биологии) — 66.1 у 32B.
• LiveCodeBench (кодинг) — стабильно высокие результаты у всех версий.
Оптимизирована под корейский язык.
Требует специальную команду для запуска режима рассуждений в промпте: нужно добавлять
<thought>\n.#reasoning #LG #EXAONE
———
@tsingular
🤔4🔥1
🦉 OWL: Открытый AI-агент, обгоняющий Manus AI
Наконец-то! Достойная бесплатная альтернатива закрытым AI-агентам вроде Manus AI, о котором все говорят, но попасть куда можно только по инвайту.
OWL (Optimized Workforce Learning) — мультиагентный фреймворк с открытым кодом, набравший более 6000 звёзд на GitHub всего за 2 дня и занявший 1-е место среди опенсорсных систем в бенчмарке GAIA со средним баллом 58.18.
В чём фишка OWL?
Система состоит из трёх типов агентов:
- User Agents — разбивают сложные задачи на простые шаги
- Assistant Agents — создают стратегии выполнения и работают с инструментами
- Tool Agents — соединяются с API, поисковиками и другими сервисами
Это позволяет OWL делать всё — от автономных исследований и веб-серфинга до программирования. И главное — всё работает локально, ваши данные в безопасности.
Технические особенности:
1. Поддержка популярных LLM-моделей: GPT-4, Claude, Gemini, Mistral, DeepSeek, Qwen и Groq
2. Встроенные инструменты:
- Поиск через Google, DuckDuckGo, Wiki, Bocha, Baidu
- Браузерная автоматизация через Playwright
- Парсинг документов (Word, Excel, PDF, PowerPoint)
- Обработка изображений, видео и аудио
- Выполнение Python-кода
- Работа с GitHub, Reddit, арXiv и даже Notion!
3. Простое развёртывание через conda, uv или Docker
Интересно, что последние коммиты от 19-20 марта связаны с обновлением max_token в примерах и добавлением поддержки Azure и Groq в веб-приложение. Команда явно работает над совместимостью с разными провайдерами.
Для бизнеса:
В отличие от закрытых систем за $20-200/месяц, OWL абсолютно бесплатен. Если у вас уже есть ключи API к моделям вроде GPT-4, вы можете автоматизировать исследования, анализ данных и веб-взаимодействия без дополнительных затрат.
Плюс открытая архитектура позволяет настроить OWL под конкретные бизнес-задачи — например, интегрировать с внутренними базами данных или API.
Команда сейчас собирает примеры использования (дедлайн 31 марта), так что можно не только попробовать, но и получить признание сообщества за интересный кейс.
#OpenSource #Agents #Automation
———
@tsingular
Наконец-то! Достойная бесплатная альтернатива закрытым AI-агентам вроде Manus AI, о котором все говорят, но попасть куда можно только по инвайту.
OWL (Optimized Workforce Learning) — мультиагентный фреймворк с открытым кодом, набравший более 6000 звёзд на GitHub всего за 2 дня и занявший 1-е место среди опенсорсных систем в бенчмарке GAIA со средним баллом 58.18.
В чём фишка OWL?
Система состоит из трёх типов агентов:
- User Agents — разбивают сложные задачи на простые шаги
- Assistant Agents — создают стратегии выполнения и работают с инструментами
- Tool Agents — соединяются с API, поисковиками и другими сервисами
Это позволяет OWL делать всё — от автономных исследований и веб-серфинга до программирования. И главное — всё работает локально, ваши данные в безопасности.
Технические особенности:
1. Поддержка популярных LLM-моделей: GPT-4, Claude, Gemini, Mistral, DeepSeek, Qwen и Groq
2. Встроенные инструменты:
- Поиск через Google, DuckDuckGo, Wiki, Bocha, Baidu
- Браузерная автоматизация через Playwright
- Парсинг документов (Word, Excel, PDF, PowerPoint)
- Обработка изображений, видео и аудио
- Выполнение Python-кода
- Работа с GitHub, Reddit, арXiv и даже Notion!
3. Простое развёртывание через conda, uv или Docker
Интересно, что последние коммиты от 19-20 марта связаны с обновлением max_token в примерах и добавлением поддержки Azure и Groq в веб-приложение. Команда явно работает над совместимостью с разными провайдерами.
Для бизнеса:
В отличие от закрытых систем за $20-200/месяц, OWL абсолютно бесплатен. Если у вас уже есть ключи API к моделям вроде GPT-4, вы можете автоматизировать исследования, анализ данных и веб-взаимодействия без дополнительных затрат.
Плюс открытая архитектура позволяет настроить OWL под конкретные бизнес-задачи — например, интегрировать с внутренними базами данных или API.
Команда сейчас собирает примеры использования (дедлайн 31 марта), так что можно не только попробовать, но и получить признание сообщества за интересный кейс.
#OpenSource #Agents #Automation
———
@tsingular
🔥9👍5
Исследование METR: Время решения задач AI-моделями удваивается каждые 7 месяцев
Исследователи из Model Evaluation & Threat Research (METR) выпустили 19 марта интересную работу, показывающую, что временной горизонт задач, которые могут решать AI-агенты, растёт экспоненциально.
Что измеряли и как
Команда из 24 исследователей разработала метрику "50% time horizon" — это продолжительность задач (в человеко-часах), которые AI может решить с 50% вероятностью успеха. Простыми словами: "Насколько долгую человеческую работу может заменить AI?"
Они провели 800+ базовых измерений с реальными людьми-экспертами для калибровки сложности 170 задач (от простых как "какой файл содержит пароль?" до сложных вроде "оптимизируй CUDA-ядро для бэктестинга") и протестировали на них 13 моделей от GPT-2 (2019) до Claude 3.7 Sonnet (2025).
Основные результаты
1. Claude 3.7 Sonnet сейчас может решать задачи, занимающие у опытного человека около 59 минут.
2. Скорость роста: временной горизонт стабильно удваивается каждые ~7 месяцев последние 6 лет.
3. Разница между 50% и 80% надёжностью: Для Claude 3.7 Sonnet горизонт падает с 59 минут до 15 минут при требовании более высокой надёжности.
4. Основные улучшения моделей: более надёжное выполнение, адаптация к ошибкам, улучшенное логическое мышление и использование инструментов.
Прогнозы на будущее
Если тренд сохранится, то к концу 2029 года мы получим модели, способные самостоятельно выполнять месячные проекты. Это потенциально может автоматизировать значительную часть работы программистов и исследователей.
Практические соображения
1. Стоимость: Успешный запуск AI-агента стоит <10% от зарплаты человека-эксперта для той же задачи — экономически очень выгодно.
2. Контекст важен: Разработчики репозитория решают те же задачи в 5-18 раз быстрее контрактников (наёмные аутсорсеры) без контекста. AI пока ближе к контрактникам по эффективности.
3. "Грязные" задачи: AI хуже справляется с неструктурированными задачами, где нет чёткой обратной связи или требуется проактивный поиск информации.
Интересное сравнение в плане выбора - кого нанять - субподрядчика контрактника человека или ИИ.
И те и те должны "въезжать" в чужеродную для них задачу без контекста.
И умнее "контрактники" не становятся, а вот ИИ умнеет быстрее закона Мура. х2 каждые 7 месяцев
Исследование
#metr #research #futurology
———
@tsingular
Исследователи из Model Evaluation & Threat Research (METR) выпустили 19 марта интересную работу, показывающую, что временной горизонт задач, которые могут решать AI-агенты, растёт экспоненциально.
Что измеряли и как
Команда из 24 исследователей разработала метрику "50% time horizon" — это продолжительность задач (в человеко-часах), которые AI может решить с 50% вероятностью успеха. Простыми словами: "Насколько долгую человеческую работу может заменить AI?"
Они провели 800+ базовых измерений с реальными людьми-экспертами для калибровки сложности 170 задач (от простых как "какой файл содержит пароль?" до сложных вроде "оптимизируй CUDA-ядро для бэктестинга") и протестировали на них 13 моделей от GPT-2 (2019) до Claude 3.7 Sonnet (2025).
Основные результаты
1. Claude 3.7 Sonnet сейчас может решать задачи, занимающие у опытного человека около 59 минут.
2. Скорость роста: временной горизонт стабильно удваивается каждые ~7 месяцев последние 6 лет.
3. Разница между 50% и 80% надёжностью: Для Claude 3.7 Sonnet горизонт падает с 59 минут до 15 минут при требовании более высокой надёжности.
4. Основные улучшения моделей: более надёжное выполнение, адаптация к ошибкам, улучшенное логическое мышление и использование инструментов.
Прогнозы на будущее
Если тренд сохранится, то к концу 2029 года мы получим модели, способные самостоятельно выполнять месячные проекты. Это потенциально может автоматизировать значительную часть работы программистов и исследователей.
Практические соображения
1. Стоимость: Успешный запуск AI-агента стоит <10% от зарплаты человека-эксперта для той же задачи — экономически очень выгодно.
2. Контекст важен: Разработчики репозитория решают те же задачи в 5-18 раз быстрее контрактников (наёмные аутсорсеры) без контекста. AI пока ближе к контрактникам по эффективности.
3. "Грязные" задачи: AI хуже справляется с неструктурированными задачами, где нет чёткой обратной связи или требуется проактивный поиск информации.
Интересное сравнение в плане выбора - кого нанять - субподрядчика контрактника человека или ИИ.
И те и те должны "въезжать" в чужеродную для них задачу без контекста.
И умнее "контрактники" не становятся, а вот ИИ умнеет быстрее закона Мура. х2 каждые 7 месяцев
Исследование
#metr #research #futurology
———
@tsingular
🔥7✍4
This media is not supported in your browser
VIEW IN TELEGRAM
🧠 Урок по GraphRAG на Google Spanner и LangChain
Интересный урок про Google Spanner Graph для создания GraphRAG-приложений. Полезно, когда нужно извлекать не только контент, но и понимать связи между данными!
В примере классический RAG находит по запросу "нужен дрон для начинающих" только основную информацию о дроне SkyHawk Zephyr:
А вот GraphRAG выдаёт намного больше полезного:
Техническая начинка:
Проект строится на трёх блоках:
1. Spanner Graph — база данных от Google с поддержкой графов
2. LangChain — для построения RAG-пайплайнов
3. LLMGraphTransformer — автоматически превращает документы в графовые структуры
Техпроцесс:
Полезные библиотеки:
-
-
-
Примеры для бизнеса:
- Интернет-магазины: покупатель видит не только товар, но и совместимые аксессуары, бандлы, акции
- CRM: можно анализировать не только клиента, но и его связи с другими людьми/компаниями
- Рекомендательные системы: понимание контекста на более глубоком уровне
Классический RAG хорош, но GraphRAG круче, когда важны взаимосвязи между сущностями. Правда, технология ещё сыровата — приходится вручную фильтровать некорректные связи, которые создаёт LLM при преобразовании документов.
Не факт, что вы будете строить решение именно на Гугле, но урок очень наглядный. С примерами и визуальным рядом. Поможет разобраться.
GitHub
#GraphRAG #GoogleSpanner #LangChain #обучение #RAG
———
@tsingular
Интересный урок про Google Spanner Graph для создания GraphRAG-приложений. Полезно, когда нужно извлекать не только контент, но и понимать связи между данными!
В примере классический RAG находит по запросу "нужен дрон для начинающих" только основную информацию о дроне SkyHawk Zephyr:
- Цена $129.99
- Что подходит для начинающих
- Основные характеристики
А вот GraphRAG выдаёт намного больше полезного:
- Те же данные о базовой модели
- Текущую акцию ($109.99 вместо $129.99)
- Доступные бандлы (Starter Package за $129.99 и Explorer Package за $179.99)
- Совместимые аксессуары (Extended Battery, Propeller Guards)
- Возможность апгрейда до модели Zephyr 2.0
Техническая начинка:
Проект строится на трёх блоках:
1. Spanner Graph — база данных от Google с поддержкой графов
2. LangChain — для построения RAG-пайплайнов
3. LLMGraphTransformer — автоматически превращает документы в графовые структуры
Техпроцесс:
Документы → LLMGraphTransformer → Граф с узлами и связями → Поиск по графу → Ответ LLM
Полезные библиотеки:
-
langchain-google-spanner — интеграция с Spanner-
langchain-experimental для графовых трансформеров-
spanner-graph-notebook — визуализацияПримеры для бизнеса:
- Интернет-магазины: покупатель видит не только товар, но и совместимые аксессуары, бандлы, акции
- CRM: можно анализировать не только клиента, но и его связи с другими людьми/компаниями
- Рекомендательные системы: понимание контекста на более глубоком уровне
Классический RAG хорош, но GraphRAG круче, когда важны взаимосвязи между сущностями. Правда, технология ещё сыровата — приходится вручную фильтровать некорректные связи, которые создаёт LLM при преобразовании документов.
Не факт, что вы будете строить решение именно на Гугле, но урок очень наглядный. С примерами и визуальным рядом. Поможет разобраться.
GitHub
#GraphRAG #GoogleSpanner #LangChain #обучение #RAG
———
@tsingular
👍10✍4⚡2❤1
Media is too big
VIEW IN TELEGRAM
StarVector: модель для генерации SVG-кода из изображений и текста
StarVector — мультимодальная модель, обрабатывающая как изображения, так и текстовые запросы.
В отличие от стандартных векторизаторов, StarVector создает SVG-код и точно использует примитивы вроде эллипсов, полигонов и текста.
Доступны версии на 1B и 8B параметров, оптимизированные для иконок, логотипов, диаграмм и графиков.
Авторы представили также SVG-Bench — комплексный бенчмарк для оценки качества векторизации.
HuggingFace
#SVG #Multimodal #Vector
-----
@tsingular
StarVector — мультимодальная модель, обрабатывающая как изображения, так и текстовые запросы.
В отличие от стандартных векторизаторов, StarVector создает SVG-код и точно использует примитивы вроде эллипсов, полигонов и текста.
Доступны версии на 1B и 8B параметров, оптимизированные для иконок, логотипов, диаграмм и графиков.
Авторы представили также SVG-Bench — комплексный бенчмарк для оценки качества векторизации.
HuggingFace
#SVG #Multimodal #Vector
-----
@tsingular
✍8🔥6🆒2
Forwarded from Machinelearning
This media is not supported in your browser
VIEW IN TELEGRAM
Unitree постоянно совершенствуют алгоритмы управления, позволяя роботу обучаться и осваивать всё более сложные и точные движения.
Модель G1 обладает 23 степенями свободы, это гарантирует исключительную устойчивость и координацию.
Робот оснащён 3D-лидаром, камерой глубины и комплектом микрофонов с функцией шумоподавления для надёжного распознавания голосовых команд.
Его «сердцем» является 8-ядерный процессор, обеспечивающий такую высокую манёвренность ❤️
G1 оборудован легко заменяемой батареей ёмкостью 9000 мА·ч, что позволяет ему работать до двух часов, с возможностью оперативной замены источника питания. Максимальная скорость робота достигает 7,2 км/ч.
При росте 1,32 метра и весе 35 кг, гуманоидный робот может компактно складываться, занимая пространство в контейнере размером всего 69 × 44 × 30 см.
На этапе первичного обучения G1 использует симулятор Isaac от Nvidia, который с помощью методов обучения с подкреплением помогает осваивать сложнейшие алгоритмы поведения в контролируемой цифровой среде.
Затем отработанные действия плавно переносятся в физическую модель с использованием процесса Sim2Real, что обеспечивает высокую точность выполнения движений в реальном мире.
Unitree выпустила открытый датаяет, предназначенный для повышения эффективности управления и координации движений человекоподобных роботов.
Набор данных, созданный с применением технологии захвата движения LAFAN1, полностью совместим с гуманоидными системами Unitree.
Он включает усовершенствованный алгоритм перенаправления, который оптимизирует планирование движений через интерактивную обработку и обратную кинематику с учётом ограничений позы, сочленений суставов и параметров скорости.
Кстати, цена такого робота начинается от 16к$
https://www.unitree.com/g1
@ai_machinelearning_big_data
#ai #robots #news #unitree #ArtificialIntelligence #HumanoidRobot
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9🤯6👏3❤1
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI теперь поддерживает Hunyuan3D 2.0 из коробки
Обновите ComfyUI до последней версии и генерируйте высококачественные 3D-модели прямо из интерфейса. Поддерживаются и Hunyuan3D 2.0, и версия Multiview. Модель легкая (1.1B параметров), работает даже на Mac и создаёт геометрически точные модели с реалистичными текстурами. Просто откройте шаблоны "Hunyuan3D", скачайте модель по подсказке и начните генерацию. Готовые модели появятся в папке output/mesh.
#Hunyuan #ComfyUI
------
@tsingular
Обновите ComfyUI до последней версии и генерируйте высококачественные 3D-модели прямо из интерфейса. Поддерживаются и Hunyuan3D 2.0, и версия Multiview. Модель легкая (1.1B параметров), работает даже на Mac и создаёт геометрически точные модели с реалистичными текстурами. Просто откройте шаблоны "Hunyuan3D", скачайте модель по подсказке и начните генерацию. Готовые модели появятся в папке output/mesh.
#Hunyuan #ComfyUI
------
@tsingular
🔥6✍3❤1⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
По Гроку новости 2:
1. Маск спойлерит редактор картинок. Делают по следам последнего функционала Gemini. См ролик. У меня в Вебе пока не доступно, но видимо появится в ближайшее время.
2. В телеге обнаружили @GrokAI работает на движке 2 грока - слабоват, без поиска пока и без фактов - пишет что сегодня 23 ноября 2023 года, но судя по тому, что у аккаунта нет приставки bot в имени - его сделал сам телеграм и возможно скоро мы увидим больше настоящих ИИ интерфейсов от разработчиков.
#Grok #GrokAI
———
@tsingular
1. Маск спойлерит редактор картинок. Делают по следам последнего функционала Gemini. См ролик. У меня в Вебе пока не доступно, но видимо появится в ближайшее время.
2. В телеге обнаружили @GrokAI работает на движке 2 грока - слабоват, без поиска пока и без фактов - пишет что сегодня 23 ноября 2023 года, но судя по тому, что у аккаунта нет приставки bot в имени - его сделал сам телеграм и возможно скоро мы увидим больше настоящих ИИ интерфейсов от разработчиков.
#Grok #GrokAI
———
@tsingular
✍3🤔1
Tencent выпустил Hunyuan T1
Tencent выпустил свою передовую языковую модель с рассуждениями:
Hunyuan T1
Пишут, что лучше чем OpenAI GPT 4.5 и DeepSeek R1.
87.2 баллов в MMLU Pro против 84 у DeepSeek-R1, но меньше, чем 89.3 у OpenAI’s o1.
78.2 в AIME
Цены: US$0.14 за 1 млн. токенов
Web:
https://llm.hunyuan.tencent.com/#/chat/hy-t1
HF:
https://huggingface.co/spaces/tencent/Hunyuan-T1
#Tencent #Hunyuan #T1 #Китай
------
@tsingular
Tencent выпустил свою передовую языковую модель с рассуждениями:
Hunyuan T1
Пишут, что лучше чем OpenAI GPT 4.5 и DeepSeek R1.
87.2 баллов в MMLU Pro против 84 у DeepSeek-R1, но меньше, чем 89.3 у OpenAI’s o1.
78.2 в AIME
Цены: US$0.14 за 1 млн. токенов
Web:
https://llm.hunyuan.tencent.com/#/chat/hy-t1
HF:
https://huggingface.co/spaces/tencent/Hunyuan-T1
#Tencent #Hunyuan #T1 #Китай
------
@tsingular
👍6
Forwarded from Machinelearning
Американский ритейлер Connections опубликовал цены на серию RTX Pro Blackwell от Nvidia.
Флагманская модель RTX Pro 6000 стоит 8565 долларов, это на 26% дороже предыдущего поколения RTX 6000 Ada. В прайсе также перечислены еще невыпущенные модели RTX Pro 4000/4500/5000:
Цены, традиционно для американского ритейла, указаны до налогов, которые в каждом штате разные.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯5
Cloudflare запустил ловушку для ИИ ботов-скрейперов
Cloudflare создал новый инструмент "AI Labyrinth". Вместо блокировки ботов, которые игнорируют robots.txt и воруют контент для обучения ИИ, система заманивает их в лабиринт бесполезных AI-сгенерированных страниц.
Боты попадают в ловушки с правдоподобным, но бессмысленным контентом, тратя ресурсы и выдавая себя.
Ежедневно Cloudflare фиксирует более 50 млрд запросов от веб-скрейперов.
Включить защиту можно в настройках Bot Management на панели Cloudflare.
ИИ против ИИ.
#Cloudflare #security
———
@tsingular
Cloudflare создал новый инструмент "AI Labyrinth". Вместо блокировки ботов, которые игнорируют robots.txt и воруют контент для обучения ИИ, система заманивает их в лабиринт бесполезных AI-сгенерированных страниц.
Боты попадают в ловушки с правдоподобным, но бессмысленным контентом, тратя ресурсы и выдавая себя.
Ежедневно Cloudflare фиксирует более 50 млрд запросов от веб-скрейперов.
Включить защиту можно в настройках Bot Management на панели Cloudflare.
ИИ против ИИ.
#Cloudflare #security
———
@tsingular
👍9😈4😁3
This media is not supported in your browser
VIEW IN TELEGRAM
FigureAI запускает BotQ - новый завод по массовому производству роботов-гуманоидов
Стартап FigureAI запустил новое производство BotQ, которое сможет выпускать до 12,000 роботов-гуманоидов в год.
Компания полностью переосмыслила архитектуру своих роботов для масштабного производства, сократив время изготовления деталей с недели до секунд.
На заводе будет реализована концепция "роботы строят роботов" — гуманоиды Figure будут сами участвовать в сборке своих "собратьев" и перемещении материалов между станциями.
Для управления производством создана специальная внутренняя система MES, которая интегрируется с IoT-устройствами для контроля процесса сборки и тестирования всех компонентов.
Началось, да.
#HumanoidRobots #роботы
------
@tsingular
Стартап FigureAI запустил новое производство BotQ, которое сможет выпускать до 12,000 роботов-гуманоидов в год.
Компания полностью переосмыслила архитектуру своих роботов для масштабного производства, сократив время изготовления деталей с недели до секунд.
На заводе будет реализована концепция "роботы строят роботов" — гуманоиды Figure будут сами участвовать в сборке своих "собратьев" и перемещении материалов между станциями.
Для управления производством создана специальная внутренняя система MES, которая интегрируется с IoT-устройствами для контроля процесса сборки и тестирования всех компонентов.
Началось, да.
#HumanoidRobots #роботы
------
@tsingular
🔥29👾7👏3👻3✍2👍2🤔1👌1🆒1
Forwarded from e/acc
Еще важный датапоинт о мире: начиная с декабря 2024 года результаты решение самого сложного на тот момент теста на AGI (ARC challenge) выглядят абсолютно экспоненциально.
🤯13🔥6👍2❤1
Media is too big
VIEW IN TELEGRAM
🤖 Аполло: Шаг вперёд в революции гуманоидных роботов
Mercedes начал тест автономных роботов в реальном производстве.
В Берлине прошла первая публичная демонстрация гуманоидного робота Apollo от компании Apptronik, который полностью автономно выполнил реальную производственную задачу. При росте 173 см, робот способен поднимать до 25 кг и может выполнять повторяющиеся операции в условиях, которые считаются "скучными, грязными или опасными" для людей.
Технические особенности
• Антропоморфная конструкция — руки и ноги, имитирующие человеческие, позволяют использовать те же инструменты и рабочие пространства, что и люди
• Адаптивность — в отличие от традиционных промышленных роботов, Apollo можно перемещать между разными участками производства
• Сенсорное управление — использование сервоприводов для точных движений (в демонстрации соединял детали двигателя с поворотом запястья)
• Компьютерное зрение — для распознавания объектов и навигации в производственной среде
Бизнес-преимущества
Mercedes-Benz видит в таких роботах значительную экономическую выгоду:
1. Снижение капитальных затрат — не требуется полная перестройка производственных линий
2. Гибкость производства — одни и те же роботы могут выполнять разные задачи в разных частях завода
3. Возможность работы рядом с людьми — без необходимости создания отдельных роботизированных зон
Йорг Бурцер, руководитель производства Mercedes-Benz, отмечает: "Мы хотим понять, что действительно возможно, и как гуманоидные роботы могут интегрироваться в действующее производство вместе с нашими сотрудниками".
Перспективы и ограничения
Пока Apollo далек от полностью автономного робота общего назначения:
• Требует предсказуемой среды (работает только на заводе)
• Использует ограниченный набор алгоритмов машинного обучения
• Отсутствует полноценная "мировая модель" (world model) для понимания окружающей среды
Тем не менее, аналитики прогнозируют 20-кратный рост рынка гуманоидных роботов в ближайшие 8 лет. Apptronik сравнивает текущую стадию развития с ранними 80-ми в истории персональных компьютеров — мы только в начале пути.
Немцы, как всегда, прагматичны.
На контрасте с десятками тысяч роботов в Китае, конечно, не факт, что выдюжат, но на ограниченных сегментах производства, наверное будет полезно.
#роботы #производство #автоматизация
———
@tsingular
Mercedes начал тест автономных роботов в реальном производстве.
В Берлине прошла первая публичная демонстрация гуманоидного робота Apollo от компании Apptronik, который полностью автономно выполнил реальную производственную задачу. При росте 173 см, робот способен поднимать до 25 кг и может выполнять повторяющиеся операции в условиях, которые считаются "скучными, грязными или опасными" для людей.
Технические особенности
• Антропоморфная конструкция — руки и ноги, имитирующие человеческие, позволяют использовать те же инструменты и рабочие пространства, что и люди
• Адаптивность — в отличие от традиционных промышленных роботов, Apollo можно перемещать между разными участками производства
• Сенсорное управление — использование сервоприводов для точных движений (в демонстрации соединял детали двигателя с поворотом запястья)
• Компьютерное зрение — для распознавания объектов и навигации в производственной среде
Бизнес-преимущества
Mercedes-Benz видит в таких роботах значительную экономическую выгоду:
1. Снижение капитальных затрат — не требуется полная перестройка производственных линий
2. Гибкость производства — одни и те же роботы могут выполнять разные задачи в разных частях завода
3. Возможность работы рядом с людьми — без необходимости создания отдельных роботизированных зон
Йорг Бурцер, руководитель производства Mercedes-Benz, отмечает: "Мы хотим понять, что действительно возможно, и как гуманоидные роботы могут интегрироваться в действующее производство вместе с нашими сотрудниками".
Перспективы и ограничения
Пока Apollo далек от полностью автономного робота общего назначения:
• Требует предсказуемой среды (работает только на заводе)
• Использует ограниченный набор алгоритмов машинного обучения
• Отсутствует полноценная "мировая модель" (world model) для понимания окружающей среды
Тем не менее, аналитики прогнозируют 20-кратный рост рынка гуманоидных роботов в ближайшие 8 лет. Apptronik сравнивает текущую стадию развития с ранними 80-ми в истории персональных компьютеров — мы только в начале пути.
Немцы, как всегда, прагматичны.
На контрасте с десятками тысяч роботов в Китае, конечно, не факт, что выдюжат, но на ограниченных сегментах производства, наверное будет полезно.
#роботы #производство #автоматизация
———
@tsingular
👍7🔥3❤🔥2❤1
Forwarded from Анализ данных (Data analysis)
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Alibaba только что выпустила TaoAvatar на Hugging Face
Реалистичные говорящие аватары в полный рост для дополненной реальности с помощью 3D-гауссовых сплатов.
Он обеспечивает точное управление мимикой и движениями, работая в реальном времени даже на мобильных устройствах.
Метод использует нейросетевую дистилляцию, достигая 90 FPS на Apple Vision Pro.
🟡 Проект
🟡 Статья
🟡 Видео
🟡 Демка
@data_analysis_ml
Реалистичные говорящие аватары в полный рост для дополненной реальности с помощью 3D-гауссовых сплатов.
Он обеспечивает точное управление мимикой и движениями, работая в реальном времени даже на мобильных устройствах.
Метод использует нейросетевую дистилляцию, достигая 90 FPS на Apple Vision Pro.
@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9👾4
DeepSeek V3 обновился на HF.
Пока только файлы. Метрик нет.
163 файла по 4.3 гига :) (700 гигов VRAM)
#deepseek #Китай
———
@tsingular
Пока только файлы. Метрик нет.
163 файла по 4.3 гига :) (700 гигов VRAM)
#deepseek #Китай
———
@tsingular
🔥9❤🔥4
https://ollama.com/library/exaone-deep
#LG #Exaone
———
@tsingular
👍5🤔3
Народ уже попробовал как-то скачал развернул V3 новый и вот насколько он круче умеет программировать по сравнению с R1 (справа).
Похоже на локальный прорыв по качеству.
Очень хочется метрик уже.
Ну и тут:
https://chat.deepseek.com/
похоже именно он и есть.
Тут еще:
https://openrouter.ai/chat?models=deepseek/deepseek-chat-v3-0324:free
#deepseek #Китай
———
@tsingular
Похоже на локальный прорыв по качеству.
Очень хочется метрик уже.
Ну и тут:
https://chat.deepseek.com/
похоже именно он и есть.
Тут еще:
https://openrouter.ai/chat?models=deepseek/deepseek-chat-v3-0324:free
#deepseek #Китай
———
@tsingular
🔥7❤1
n8n + MCP = 💪
У n8n очень крутое сообщество.
Запилили n8n-nodes-mcp.
- Подключение к MCP-серверам через STDIO или SSE
- Запуск инструментов с параметрами
- Получение шаблонов и доступ к ресурсам
- Возможность использовать как инструмент в AI Agent нодах
Model Context Protocol (MCP) — это разработка Anthropic, которая очень хорошо зашла многим ИИ автоматизаторам. Универсальный протокол для мира ИИ, позволяющий моделям типа Claude подключаться к внешним сервисам без сложных интеграций.
MCP работает через клиент-серверную архитектуру:
Хосты запускают соединения (Claude Desktop, IDE)
Клиенты поддерживают соединения с серверами
Серверы предоставляют инструменты и ресурсы клиентам
Туториал на Youtube
#MCP #Claude #n8n
———
@tsingular
У n8n очень крутое сообщество.
Запилили n8n-nodes-mcp.
- Подключение к MCP-серверам через STDIO или SSE
- Запуск инструментов с параметрами
- Получение шаблонов и доступ к ресурсам
- Возможность использовать как инструмент в AI Agent нодах
Model Context Protocol (MCP) — это разработка Anthropic, которая очень хорошо зашла многим ИИ автоматизаторам. Универсальный протокол для мира ИИ, позволяющий моделям типа Claude подключаться к внешним сервисам без сложных интеграций.
MCP работает через клиент-серверную архитектуру:
Хосты запускают соединения (Claude Desktop, IDE)
Клиенты поддерживают соединения с серверами
Серверы предоставляют инструменты и ресурсы клиентам
Туториал на Youtube
#MCP #Claude #n8n
———
@tsingular
🔥6👍1
🤖 Microsoft добавит рой AI-агентов для своего Security Copilot
Microsoft расширяет возможности своего Security Copilot, представленного еще в 2023 году, добавляя 11 специализированных AI-агентов, из которых 6 разработаны Microsoft, а 5 — партнерами компании.
Агенты интегрируются с продуктами Microsoft: Defender, Purview, Entra и Intune
Основная функция: автоматизация обработки и приоритизации больших объемов данных о безопасности (фишинг-отчеты, предупреждения об угрозах)
Что умеют конкретные агенты:
Phishing Triage Agent в Microsoft Defender — сортирует сообщения о фишинге, отфильтровывая ложные срабатывания (95% всех отчетов)
Alert Triage Agents в Microsoft Purview — обрабатывает предупреждения о потере данных и внутренних рисках
Vulnerability Remediation Agent в Microsoft Intune — приоритезирует устранение уязвимостей
Threat Intelligence Briefing Agent в Security Copilot — курирует данные об угрозах
Партнерские агенты добавляют функции вроде анализа нарушений конфиденциальности (OneTrust) и сетевых проблем (Aviatrix).
Обучение агентов происходит локально — контекст пользователя не передается Microsoft и не используется для обучения базовой модели
Система всё еще требует человеческого контроля — агент предлагает решения, но окончательное действие выполняет человек
По словам Microsoft, существующая версия Security Copilot уже сократила время реагирования на инциденты на 30%
Команда безопасности компании упоминает, что:
Работают над ограничением cross-prompt injection (атака, когда злоумышленник может перенаправить запрос агента)
AI-модели уже имеют встроенные ограничения
Проводится red teaming перед запуском
Но конкретных метрик о частоте ложных срабатываний Microsoft не предоставила
В теории такие агенты должны высвободить время аналитиков безопасности, которые сейчас тратят около 30 минут на обработку каждого потенциального фишингового сообщения, 95% из которых оказываются ложными тревогами.
#Microsoft #Security #Copilot #агенты
———
@tsingular
Microsoft расширяет возможности своего Security Copilot, представленного еще в 2023 году, добавляя 11 специализированных AI-агентов, из которых 6 разработаны Microsoft, а 5 — партнерами компании.
Агенты интегрируются с продуктами Microsoft: Defender, Purview, Entra и Intune
Основная функция: автоматизация обработки и приоритизации больших объемов данных о безопасности (фишинг-отчеты, предупреждения об угрозах)
Что умеют конкретные агенты:
Phishing Triage Agent в Microsoft Defender — сортирует сообщения о фишинге, отфильтровывая ложные срабатывания (95% всех отчетов)
Alert Triage Agents в Microsoft Purview — обрабатывает предупреждения о потере данных и внутренних рисках
Vulnerability Remediation Agent в Microsoft Intune — приоритезирует устранение уязвимостей
Threat Intelligence Briefing Agent в Security Copilot — курирует данные об угрозах
Партнерские агенты добавляют функции вроде анализа нарушений конфиденциальности (OneTrust) и сетевых проблем (Aviatrix).
Обучение агентов происходит локально — контекст пользователя не передается Microsoft и не используется для обучения базовой модели
Система всё еще требует человеческого контроля — агент предлагает решения, но окончательное действие выполняет человек
По словам Microsoft, существующая версия Security Copilot уже сократила время реагирования на инциденты на 30%
Команда безопасности компании упоминает, что:
Работают над ограничением cross-prompt injection (атака, когда злоумышленник может перенаправить запрос агента)
AI-модели уже имеют встроенные ограничения
Проводится red teaming перед запуском
Но конкретных метрик о частоте ложных срабатываний Microsoft не предоставила
В теории такие агенты должны высвободить время аналитиков безопасности, которые сейчас тратят около 30 минут на обработку каждого потенциального фишингового сообщения, 95% из которых оказываются ложными тревогами.
#Microsoft #Security #Copilot #агенты
———
@tsingular
👍5✍1😈1