AI для каждого | AISferaic
171 subscribers
88 photos
29 videos
150 links
Откройте для себя возможности нейронных сетей.
Узнайте, как вы можете использовать эти технологии для улучшения своей жизни и работы. От теории до практики.
Download Telegram
CoWVLA объединяет временное рассуждение модели мира с представлением скрытого движения, показывая лучшие результаты на робототехнических тестах.

Type-Aware RAG обеспечивает исполняемость кода в задачах промышленной оптимизации, генерируя рабочие модели для производства аккумуляторов и планирования работы.
Обучение llm байесовскому выводу для улучшения рассуждений

Байесовский вывод — статистический вывод, в котором свидетельство и/или наблюдение используются, чтобы обновить или вновь вывести вероятность того, что гипотеза может быть верной.

Традиционные LLM часто испытывают трудности с заданиями, требующими вероятностного рассуждения и обновления убеждений, поскольку моделируют язык, а не вероятностные процессы.

Исследователи предлагают новый подход, основанный на обучении LLM имитировать байесовский вывод – статистический метод обновления убеждений о гипотезе на основе новых доказательств. Разработан набор данных с примерами, где LLM оценивают вероятность гипотезы, учитывая доказательства и пошаговые решения.

Эксперименты показали, что LLM, обученные новому подходу, превосходят традиционные в задачах вероятностного рассуждения и способны обобщать на новые сценарии. Подход может улучшить производительность LLM в диагностике, прогнозировании и принятии решений.
Yuanlab AI выпустили yuan 3.0 ultra

YuanLab AI представила Yuan 3.0 Ultra – новую многомодальную модель MoE, предназначенную для высокой производительности. Базовая модель доступна с 7B, 13B, 34B, 70B и 140B параметрами.

Yuan 3.0 Ultra обучена на 6 триллионах токенов данных и поддерживает обработку текста, изображений и аудио. Результаты на бенчмарках показали превосходство над Llama 3 70B и достижение 92,4% от производительности GPT-4.

Модель доступна на платформе Hugging Face.
👍2
OpenAI выпустила GPT-5.4 – самую мощную и эффективную модель для профессиональной работы.

Модель обладает передовыми возможностями в программировании, использовании компьютера, поиске инструментов и контекстом в 1 миллион токенов. Также представлена карта мышления GPT-5.4.

OpenAI представила CoT-Control и обнаружила, что модели рассуждения испытывают трудности с контролем за ходом своих мыслей, что укрепляет возможность мониторинга как гарантию безопасности ИИ.
👍2
Model Context Protocol - открытый стандарт, который позволяет ассистенту самому обращаться к нужным источникам данных. Вы формулируете задачу, он забирает данные и выполняет действие.

Написали небольшой обзор MCP: как устроен протокол, что можно подключить, где есть ограничения и кому это нужно.

👉 Ссылка на статью
🔥3
Liquid AI выпустила localcowork для конфиденциальных рабочих процессов

Liquid AI представила LocalCowork, работающий на базе LFM2-24B-A2B, для локального выполнения рабочих процессов, ориентированных на конфиденциальность, через протокол контекста модели (MCP). Решение позволяет запускать агентов ИИ непосредственно на устройствах пользователя, без передачи данных на внешние серверы.

LFM2-24B-A2B – большая языковая модель, разработанная Liquid AI. MCP обеспечивает эффективное управление контекстом и безопасное взаимодействие с локальными данными. Технология предназначена для областей, где важна конфиденциальность данных, таких как здравоохранение, финансы и государственное управление.

Liquid AI заявляет о производительности LocalCowork, сопоставимой с облачными решениями, при одновременном обеспечении безопасности данных.
Santander и Mastercard тестируют ИИ для обработки платежей

Santander и Mastercard запустили пилотный проект в Европе, использующий ИИ для самостоятельной обработки платежей. Это первый подобный проект, позволяющий ИИ автоматизировать одобрение платежей и оценивать риск мошенничества.

Проект реализуется в Испании и охватывает платежи по кредитным картам Mastercard. Santander ожидает улучшения качества обслуживания клиентов и снижения издержек благодаря использованию ИИ.

Mastercard отмечает важность развития инновационных платежных решений на базе искусственного интеллекта и планирует расширение проекта на другие европейские страны.
👍2
Принятие искусственного интеллекта в сфере финансовых услуг достигло точки невозврата.

Согласно недавнему исследованию, проведенному компанией Accenture, 87% руководителей финансовых организаций заявили, что ИИ существенно изменит способы ведения ими бизнеса в ближайшие три года.

Около 70% руководителей отметили, что ожидают снижения затрат благодаря внедрению ИИ, а 64% - увеличение доходов. Наиболее востребованными областями применения ИИ являются обнаружение мошенничества, управление рисками и обслуживание клиентов.

Исследование выявило, что финансовые организации активно инвестируют в технологии ИИ, включая машинное обучение и обработку естественного языка. Однако, внедрение ИИ сопряжено с рядом проблем, таких как нехватка квалифицированных кадров и проблемы с интеграцией ИИ-систем в существующую инфраструктуру.

Несмотря на эти трудности, большинство руководителей финансовых организаций уверены в будущем ИИ в финансовой сфере. Они считают, что ИИ станет ключевым фактором конкурентоспособности в ближайшие годы.
OpenAI представляет Codex Security для защиты кода

OpenAI представила Codex Security – исследовательскую предварительную версию для обнаружения, проверки уязвимостей и генерации исправлений в коде. Система призвана помочь разработчикам автоматизировать задачи по обеспечению безопасности кода и охватывает несколько языков программирования.

Codex Security обнаруживает уязвимости, такие как ошибки внедрения, переполнение буфера и XSS, предлагая исправления для просмотра и применения. Также предусмотрена валидация уязвимостей, позволяющая убедиться в их реальности и оценить потенциальное воздействие.

Система генерирует исправления для различных типов уязвимостей и может интегрироваться в IDE или применять их автоматически. Codex Security предоставляет контекстную информацию об уязвимостях, включая строку кода и потенциальное воздействие.
👍2
Microsoft представила Phi-4-Reasoning-Vision-15B – компактную многомодальную модель с 15 миллиардами параметров, основанную на архитектуре Phi-4.

Модель призвана понимать математику, науку и графические интерфейсы, объединяя обработку текста и изображений.

Phi-4-Reasoning-Vision-15B способна решать задачи, требующие рассуждений на основе визуальных и текстовых данных, демонстрируя эффективность в математических вычислениях, научном анализе и понимании интерфейсов.

Microsoft утверждает, что модель достигла результатов, сопоставимых с более крупными аналогами, при этом её небольшой размер позволяет использовать на оборудовании с ограниченными ресурсами.
👍2
Искусственный интеллект: как он сделает инженерию более человечной

Инженерия – это применение научных знаний с учетом ограничений, требующее творческих решений. Искусственный интеллект, особенно большие языковые модели, может помочь инженерам, автоматизируя рутинные задачи и предлагая новые решения, основанные на анализе больших данных.

ИИ способен анализировать данные о взаимодействии людей с продуктами, предлагая способы улучшения дизайна и функциональности. Это позволит создавать продукты, лучше отвечающие потребностям пользователей.

Несмотря на опасения, ИИ, вероятно, расширит возможности инженеров, а не заменит их. Инженеры будут необходимы для определения проблем, формулирования требований и оценки решений. ИИ станет инструментом, но не заменит человеческий опыт и творчество.
2
Luma запустила AI агентов для креативных рабочих процессов. AI Digital представила новую AI платформу, основанную на двух движках.

Обе компании предлагают новые решения в области искусственного интеллекта, предназначенные для оптимизации и автоматизации различных задач. Luma фокусируется на креативной сфере, а AI Digital – на создании платформы с использованием двух AI движков.
👍2
Глава робототехники OpenAI ушел из-за сделки с пентагоном

Руководитель направления робототехники OpenAI Питер Абрахам покинул компанию. Уход связан с его несогласием со сделкой OpenAI с Министерством обороны США. Абрахам выразил обеспокоенность по поводу использования технологий в военных целях.

Питер Абрахам возглавил направление робототехники OpenAI в 2022 году после приобретения им основанной им компании Greentext. Он отвечал за разработку и внедрение робототехнических решений на базе искусственного интеллекта.

Сделка с Пентагоном, о которой стало известно в феврале, вызвала критику. OpenAI заявила о решении задач национальной безопасности и важности ответственного использования ИИ.
😱2
IBM представила Granite 4.0 1B Speech – новую модель для корпоративных приложений с ограниченными ресурсами, предназначенную для автоматического распознавания и перевода речи. Модель на 50% меньше по размеру, чем предыдущая версия, но обеспечивает более высокую точность транскрипции английской речи и поддерживает английский, французский, немецкий, испанский, португальский и японский языки.

Granite 4.0 1B Speech заняла первое место в таблице лидеров OpenASR, демонстрируя высокие результаты на стандартных эталонах ASR при меньшем количестве параметров. Добавлены поддержка ASR для японского языка и смещение списка ключевых слов для повышения точности распознавания имён и аббревиатур. Модель доступна под лицензией Apache 2.0 и включает поддержку transformers и vLLM.
ByteDance выпустила DeerFlow 2.0 – открытый фреймворк SuperAgent, предназначенный для управления суб-агентами, памятью и "песочницами" при решении сложных задач.

Фреймворк позволяет разбивать задачи на этапы, управлять памятью для хранения информации и безопасно выполнять операции в "песочнице".

Разработчики могут использовать фреймворк для создания агентов, выполняющих написание текстов, ответы на вопросы и генерацию кода.

DeerFlow 2.0 поддерживает модели OpenAI и модели с открытым исходным кодом DeerFlow 2.0
👍2
Google AI представила Gemini Embedding 2 — мультимодальную модель встраивания, способную работать с текстом, изображениями, видео, аудио и документами в едином пространстве. Модель доступна через API Gemini и Vertex AI.

Gemini Embedding 2 превосходит предыдущие модели встраивания по задачам поиска по сходству и кластеризации. Особые улучшения наблюдаются при обработке мультимодальных запросов, включающих разные типы данных.
Nvidia создает открытые данные для искусственного интеллекта

NVIDIA создает открытые данные для развития и демократизации искусственного интеллекта, занимаясь сбором, очисткой и организацией данных, а также созданием инструментов для доступа к ним. Компания работает над наборами данных для обучения генеративного ИИ и инструментов для выявления предвзятости в данных.

NVIDIA предлагает платформу NeMo для создания, обучения и развертывания языковых моделей, а также доступ к серверам GPU для обучения ИИ на больших наборах данных. Разрабатываются инструменты для автоматической очистки и подготовки данных, а также инфраструктура для их хранения и распространения.

Компания считает открытые данные ключевым элементом будущего ИИ и продолжит инвестировать в это направление.
👍3
Fish Audio представила Fish Audio S2 – новое поколение систем преобразования текста в речь с возможностью абсурдно контролировать эмоции. Модель построена на собственной архитектуре и обучена на большом наборе данных, генерируя реалистичную и эмоциональную речь.

S2 предлагает улучшенную эмоциональную выразительность, естественное произношение и расширенные возможности настройки. Пользователи могут точно контролировать эмоции, создавая речь, подходящую для конкретного контекста, с детальной настройкой тона и выразительности.

Модель доступна как облачное API для интеграции в приложения, так и локальная версия для большего контроля и конфиденциальности.
Perplexity представляет агентов для конкуренции с OpenClaw

Perplexity представила новую функцию – "Perplexity Agents", автоматизированные рабочие процессы для решения задач от исследования до написания кода. Агенты создаются из "действий", включая поиск в интернете, работу с API и выполнение кода Python.

В отличие от OpenClaw, агенты Perplexity можно совместно использовать, делиться ими с другими пользователями и использовать готовые решения из Marketplace. Там уже доступны агенты для написания статей, анализа данных и создания изображений.

Функция находится в бета-версии и доступна подписчикам Pro и Team.
🔥2
Google разработал инструмент "Parameter-Efficient Fine-Tuning" (PEFT), позволяющий небольшим моделям искусственного интеллекта конкурировать с крупными. PEFT адаптирует существующие большие модели к конкретным задачам, используя лишь небольшую часть параметров.

PEFT добавляет небольшое количество новых параметров к предварительно обученной модели, которые обучаются для конкретной задачи, а оригинальные параметры остаются замороженными. Это снижает вычислительные требования и объем памяти, делая обучение доступным для небольших команд.

Инструмент включает методы, такие как LoRA, и представлен в библиотеке "Hugging Face". PEFT позволяет создавать специализированные модели для обработки естественного языка, компьютерного зрения и робототехники.