Forwarded from Анализ данных (Data analysis)
🥇 VL-Rethinker — новую парадигму мультимодального вывода, обучаемую напрямую с помощью Reinforcement Learning.
🌟 Новая SOTA на ключевых бенчмарках по vision + math:
🟢 MathVista: 80.3 → 🥇 (+6.4 vs GPT-o1 73.9)
🟢 MathVerse: 61.7 → 🥇 (+4.7 vs GPT-o1 57.0)
🟢 MathVision: 43.9 → 🥇 (+1.7 vs GPT-o1 42.2)
🔥 В чём секрет? GRPO-алгоритм с двумя ключевыми новшествами:
🟠 Этап 1: Улучшение логики, с помощью GRPO + SSR (Selective Sample Replay):
Сохраняются только те последовательности действий модели (rollouts), которые дали ненулевое преимущество (advantage).
При повторном обучении приоритет отдается полезным примерам, что помогает стабилизировать обучение.
Почему это важно?
При обычном GRPO-со временем "advantage" может становиться нулевым → градиенты обнуляются → модель перестаёт учиться. SSR решает эту проблему.
🟠 Этап 2: Вынужденное «переосмысление» (Forced Rethinking)
На этом этапе в каждый rollout добавляется специальный триггер, заставляющий модель заново обдумывать ответ, прежде чем его выдать.
Это развивает способность к саморефлексии, улучшает многошаговое рассуждение и точность ответов.
🔥 Модель вынуждена подумать ещё раз перед финальным ответом.
Результат — у модели появляются признаки метапознания: она сама находит ошибки в начальных размышлениях.
✔️ VL-Rethinker-72B — первый VLM, обгоняющий GPT-o1.
Похоже, что будущее за "медленно думающими" и умеющими рефлексировать агентами.
🔜 Paper
🔜 Code
🔜 Website
Сохраняются только те последовательности действий модели (rollouts), которые дали ненулевое преимущество (advantage).
При повторном обучении приоритет отдается полезным примерам, что помогает стабилизировать обучение.
Почему это важно?
При обычном GRPO-со временем "advantage" может становиться нулевым → градиенты обнуляются → модель перестаёт учиться. SSR решает эту проблему.
На этом этапе в каждый rollout добавляется специальный триггер, заставляющий модель заново обдумывать ответ, прежде чем его выдать.
Это развивает способность к саморефлексии, улучшает многошаговое рассуждение и точность ответов.
Результат — у модели появляются признаки метапознания: она сама находит ошибки в начальных размышлениях.
Похоже, что будущее за "медленно думающими" и умеющими рефлексировать агентами.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥4🔥3👍2🆒2
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Пасхалочка.
Интересно, что Veo2 наотрез отказывается генерить видео по промпту "Crypto Easter".
Изыди, говорит, охальник, это супротив моих убеждений и правил. Бесовщина все это!
А вот промпт "Крипто Пасха" кушает как куличики, один за другим.
Ну и кто у нас ортодокс?
И да, на https://aistudio.google.com/u/2/generate-video все еще можно генерить пяток видео бесплатно на новом Google аккаунте.
P.S. Только сейчас понял, что не включал штатовский впн, а генерил на европейском.
@cgevent
Интересно, что Veo2 наотрез отказывается генерить видео по промпту "Crypto Easter".
Изыди, говорит, охальник, это супротив моих убеждений и правил. Бесовщина все это!
А вот промпт "Крипто Пасха" кушает как куличики, один за другим.
Ну и кто у нас ортодокс?
И да, на https://aistudio.google.com/u/2/generate-video все еще можно генерить пяток видео бесплатно на новом Google аккаунте.
P.S. Только сейчас понял, что не включал штатовский впн, а генерил на европейском.
@cgevent
🔥4
🪖Пентагон 2.0: Генеративный ИИ на военной службе США
Американские военные активно внедряют генеративный ИИ в разведывательные операции. Судя по материалам MIT Technology Review, мы наблюдаем "вторую фазу" военного применения искусственного интеллекта.
Ключевые факты:
• Подразделение морской пехоты США (15-й экспедиционный отряд) впервые использовало генеративный ИИ для анализа разведданных во время развертывания в Тихом океане для сортировки тысяч разведывательных материалов из открытых источников
• Технология разработана компанией Vannevar Labs, получившей контракт от Пентагона на $99 млн для внедрения этой технологии в больше военных подразделений
• ИИ используется для перевода, анализа настроений и выявления угроз с результатами, доступными через чат-интерфейс
Технические возможности:
• Обработка терабайтов данных на 80 языках из 180 стран
• Анализ профилей в социальных сетях и преодоление брандмауэров в странах вроде Китая
• Использование как OpenAI и Microsoft, так и собственных моделей
Практические результаты:
• Использование ИИ для отслеживания упоминаний подразделения в иностранных СМИ и анализа настроений • Применение ИИ для помощи в составлении ежедневных и еженедельных разведывательных отчетов командованию
• Время на анализ сократилось в разы по сравнению с ручной обработкой
Открытые вопросы:
1.Насколько эффективен "человек в контуре"? С ростом сложности систем ИИ и объема анализируемых данных становится почти невозможно для человека проверить все выводы машины.
2. Как классифицировать информацию? Генеративный ИИ способен соединять точки между несекретными документами и выявлять закономерности, которые сами по себе могли бы считаться секретными.
3. Как высоко по цепочке принятия решений должен продвинуться ИИ? Военные командиры интересуются потенциалом ИИ для улучшения принятия решений на оперативном уровне войны.
Потенциальные риски:
• Известная неточность LLM в критических с точки зрения безопасности приложениях
• Субъективность анализа настроений, который "даже людям трудно правильно оценить только на основе контента"
• Подверженность открытых источников дезинформации и манипуляциям
Несмотря на эти вопросы, полковник Шон Дайнан утверждает, что эксперимент — лишь "верхушка айсберга", и более активное использование генеративного ИИ только начинается.
Мы наблюдаем фундаментальный сдвиг: от простого сбора данных к их интерпретации искусственным интеллектом, что поднимает важные вопросы о будущем военных решений и роли человека в них.
Самое критичное - ИИ принимает решения в таком масштабе, который человек не может перепроверить.
В какой момент дёрнуть стоп-кран, - не понятно.
#Пентагон #military
———
@tsingular
Американские военные активно внедряют генеративный ИИ в разведывательные операции. Судя по материалам MIT Technology Review, мы наблюдаем "вторую фазу" военного применения искусственного интеллекта.
Ключевые факты:
• Подразделение морской пехоты США (15-й экспедиционный отряд) впервые использовало генеративный ИИ для анализа разведданных во время развертывания в Тихом океане для сортировки тысяч разведывательных материалов из открытых источников
• Технология разработана компанией Vannevar Labs, получившей контракт от Пентагона на $99 млн для внедрения этой технологии в больше военных подразделений
• ИИ используется для перевода, анализа настроений и выявления угроз с результатами, доступными через чат-интерфейс
Технические возможности:
• Обработка терабайтов данных на 80 языках из 180 стран
• Анализ профилей в социальных сетях и преодоление брандмауэров в странах вроде Китая
• Использование как OpenAI и Microsoft, так и собственных моделей
Практические результаты:
• Использование ИИ для отслеживания упоминаний подразделения в иностранных СМИ и анализа настроений • Применение ИИ для помощи в составлении ежедневных и еженедельных разведывательных отчетов командованию
• Время на анализ сократилось в разы по сравнению с ручной обработкой
Открытые вопросы:
1.Насколько эффективен "человек в контуре"? С ростом сложности систем ИИ и объема анализируемых данных становится почти невозможно для человека проверить все выводы машины.
2. Как классифицировать информацию? Генеративный ИИ способен соединять точки между несекретными документами и выявлять закономерности, которые сами по себе могли бы считаться секретными.
3. Как высоко по цепочке принятия решений должен продвинуться ИИ? Военные командиры интересуются потенциалом ИИ для улучшения принятия решений на оперативном уровне войны.
Потенциальные риски:
• Известная неточность LLM в критических с точки зрения безопасности приложениях
• Субъективность анализа настроений, который "даже людям трудно правильно оценить только на основе контента"
• Подверженность открытых источников дезинформации и манипуляциям
Несмотря на эти вопросы, полковник Шон Дайнан утверждает, что эксперимент — лишь "верхушка айсберга", и более активное использование генеративного ИИ только начинается.
Мы наблюдаем фундаментальный сдвиг: от простого сбора данных к их интерпретации искусственным интеллектом, что поднимает важные вопросы о будущем военных решений и роли человека в них.
Самое критичное - ИИ принимает решения в таком масштабе, который человек не может перепроверить.
В какой момент дёрнуть стоп-кран, - не понятно.
#Пентагон #military
———
@tsingular
🕊2✍1⚡1🤯1💯1😐1👾1
Forwarded from Machinelearning
NVIDIA выпустила новое семейство языковых моделей Nemotron-H, сочетающих архитектуры Mamba и Transformer. Эти гибриды обещают до 3х ускорения инференса по сравнению с чистыми Transformer-моделями аналогичного размера (Qwen или Llama).
Семейство поддерживает английский, немецкий, испанский, французский, итальянский, корейский, португальский, русский, японский и китайский языки.
Основной фокус Nemotron-H — баланс между эффективностью и интеллектом: даже при меньшем числе параметров (47–56 млрд.) модели демонстрируют точность, близкую к DeepSeek-V3-671B.
Особенность Nemotron-H — использование FP8 для претрейна. 56B-версию обучали на 20 трлн. токенов с квантованием тензоров «на лету», а сжатую в FP4 модель c 47B можно запускать на потребительской RTX 5090 с поддержкой контекста до 1 млн. токенов. Правда, пришлось пожертвовать частью слоев самовнимания — их заменили на более легкие Mamba-блоки, чтобы ускорить генерацию.
NVIDIA не стала тренировать компактные версии модели с нуля. Вместо этого использовали дистилляцию: 47B-модель получили из 56B, удалив половину «тяжелых» слоев и дообучив на 63 млрд токенов. Результат — почти та же точность, но на 1.2x быстрее.
В бенчмарках Nemotron-H обходит конкурентов в математике и коде: на GSM8k 56B-версия дает 93.7% против 90.9% у Qwen-72B. А 8B-модель, хоть и уступает в MMLU, вырывается вперёд в HumanEval+ (56.1%) — ожидаемо, с учетом ее instruct-оптимизации.
Пока модели доступны на HF как базовые, но NVIDIA обещает добавить инструктивные и мультимодальные версии.
@ai_machinelearning_big_data
#AI #ML #LLM #NemotronH #NVIDIA
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤1
OpenAI разрабатывает конкурента Twitter — интеллектуальную социальную сеть
Компания Сэма Альтмана создаёт социальную платформу, напоминающую X (экс-Twitter).
Внутренний прототип фокусируется на генерации изображений и представляет собой ленту контента.
Руководитель проекта запрашивает отзывы о разработке у внешних экспертов.
Неясно, будет ли продукт выпущен как отдельное приложение или интегрирован в ChatGPT.
Запуск усилит соперничество между Альтманом и Маском, предлагавшим купить OpenAI за $97.4 млрд.
Обостряется конкуренция с Meta*(запрещённой в РФ), планирующей добавить социальную ленту в свой ИИ-ассистент.
Собственная платформа обеспечит организацию уникальными данными для обучения моделей.
Одна из задумок — помогать авторам публиковать качественный контент с помощью искусственного интеллекта.
Не можешь победить, - создай своё. Норм.
#OpenAI #SocialNetwork #Altman
-------
@tsingular
Компания Сэма Альтмана создаёт социальную платформу, напоминающую X (экс-Twitter).
Внутренний прототип фокусируется на генерации изображений и представляет собой ленту контента.
Руководитель проекта запрашивает отзывы о разработке у внешних экспертов.
Неясно, будет ли продукт выпущен как отдельное приложение или интегрирован в ChatGPT.
Запуск усилит соперничество между Альтманом и Маском, предлагавшим купить OpenAI за $97.4 млрд.
Обостряется конкуренция с Meta*(запрещённой в РФ), планирующей добавить социальную ленту в свой ИИ-ассистент.
Собственная платформа обеспечит организацию уникальными данными для обучения моделей.
Одна из задумок — помогать авторам публиковать качественный контент с помощью искусственного интеллекта.
Не можешь победить, - создай своё. Норм.
#OpenAI #SocialNetwork #Altman
-------
@tsingular
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
Бесплатные API для ваших агентов на все случаи жизни
390 бесплатных API: путешествия, погода, апи для разработчикв, финансы, искусство, игры, музыка, публичные и научные данные, спорт и даже спиритизм.
Есть автоматическое ранжирование по доступности, платности (их исключают) и надёжности.
У каждого API описание - ДОСТАТОЧНОЕ ДЛЯ РАБОТЫ АГЕНТА.
Т.е. буквально - копируете его в инструменты и полетели.
n8n агенты благодарносте! :)
А ещё у этого каталога есть API.
Ну так, - API для API.
Поэтому вы можете к агенту его прикрутить и в принципе все эти 390 апи ( а они динамично пополняются) станут инструментами вашего агента все и сразу.
Он вообще любую задачу решить сможет :)
#API #каталог
———
@tsingular
390 бесплатных API: путешествия, погода, апи для разработчикв, финансы, искусство, игры, музыка, публичные и научные данные, спорт и даже спиритизм.
Есть автоматическое ранжирование по доступности, платности (их исключают) и надёжности.
У каждого API описание - ДОСТАТОЧНОЕ ДЛЯ РАБОТЫ АГЕНТА.
Т.е. буквально - копируете его в инструменты и полетели.
n8n агенты благодарносте! :)
А ещё у этого каталога есть API.
Ну так, - API для API.
Поэтому вы можете к агенту его прикрутить и в принципе все эти 390 апи ( а они динамично пополняются) станут инструментами вашего агента все и сразу.
Он вообще любую задачу решить сможет :)
#API #каталог
———
@tsingular
🔥13👍5❤🔥2
Forwarded from Технотренды
Google выкатил 601 бизнес-идею с нейронкой внутри.
Забираем — тут.
😇 Техно
— Есть конкретные кейсы под любую сферу: торговля, логистика, медиа, кодинг, телеком, наука и т.д.
— Под все расписаны реальные примеры от топовых мировых компаний по интеграции ИИ-агентов в бизнес.
— Уникальная информация в одном месте, фактически сотни готовых бизнес-идей с ИИ.
Забираем — тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10⚡4🆒3👍2
Преждевременные смерти китайских AI-учёных (2022-2025)
В SCMP (Alibaba) вышел материал про серию неожиданных смертей ученых в Китае, которые занимались исследованиями в области ИИ.
🧠 Индустриальный контекст
Интересен профессиональный профиль погибших — все работали в стратегически важных направлениях:
- Компьютерное зрение — ключевая технология для систем наблюдения и автономных транспортных средств
- Военные AI-приложения — критический компонент современных оборонных технологий
- Медицинский ИИ — высококонкурентная область с огромным коммерческим потенциалом
🔄 Факторы давления в китайской AI-индустрии
Сверхскоростной цикл разработки — идеи устаревают ещё до завершения экспериментов
Конкуренция на опережение — публикация результатов становится гонкой с нулевой суммой
Этические дилеммы — моральная ответственность за потенциальные социальные последствия
Геополитический контекст — стресс от восприятия работы как части технологической войны
Практический вывод для технологических компаний:
Необходимы программы профилактики выгорания сотрудников и регулярный мониторинг здоровья, особенно для ключевых разработчиков.
Всех в санатории у моря. Прогулки в сосновом бору между митапами.
И РЭБ.
#SCMP #Китай #стресс #выгорание
——-
@tsingular
В SCMP (Alibaba) вышел материал про серию неожиданных смертей ученых в Китае, которые занимались исследованиями в области ИИ.
🧠 Индустриальный контекст
Интересен профессиональный профиль погибших — все работали в стратегически важных направлениях:
- Компьютерное зрение — ключевая технология для систем наблюдения и автономных транспортных средств
- Военные AI-приложения — критический компонент современных оборонных технологий
- Медицинский ИИ — высококонкурентная область с огромным коммерческим потенциалом
🔄 Факторы давления в китайской AI-индустрии
Сверхскоростной цикл разработки — идеи устаревают ещё до завершения экспериментов
Конкуренция на опережение — публикация результатов становится гонкой с нулевой суммой
Этические дилеммы — моральная ответственность за потенциальные социальные последствия
Геополитический контекст — стресс от восприятия работы как части технологической войны
Практический вывод для технологических компаний:
Необходимы программы профилактики выгорания сотрудников и регулярный мониторинг здоровья, особенно для ключевых разработчиков.
Всех в санатории у моря. Прогулки в сосновом бору между митапами.
И РЭБ.
#SCMP #Китай #стресс #выгорание
——-
@tsingular
👍8😢6🤯4
Unsloth выпустил руководство по датасетам для файнтюнинга языковых моделей
Создание качественного датасета — ключевой момент в успешном файн-тюне.
Правильно подготовленные данные определяют, насколько хорошо модель усвоит нужные навыки и специализацию.
Основные форматы данных
Четыре ключевых типа датасетов:
📝 Raw Corpus — необработанный текст для продолжения предобучения (CPT)
🎯 Instruct — инструкции и примеры ожидаемого результата для SFT
💬 Conversation — диалоги между пользователем и AI для SFT
🔄 RLHF — диалоги с ранжированием ответов для обучения с подкреплением
Подготовка перед форматированием
Определите цель датасета
- Адаптация модели к конкретной задаче (суммаризация, Q&A)
- Обучение для специфической области (медицина, финансы)
- Настройка на определенный стиль общения
Выберите стиль вывода
Формат: JSON, HTML, код, текст
Язык: испанский, английский, русский и т.д.
Найдите источники данных
- Hugging Face, Wikipedia для готовых наборов
- Специализированные CSV, PDF или веб-ресурсы
- Синтетически сгенерированные данные
Форматы данных под разные задачи
Для предобучения (CPT):
Для инструкций (Alpaca style):
Для диалогов (ChatML):
Hugging Face формат:
Генерация синтетических данных
Используйте мощные LLM (Llama 3.3 70B, GPT-4.5) для создания дополнительных примеров. Это помогает:
- Расширить существующий датасет
- Диверсифицировать данные, предотвращая переобучение
- Автоматически структурировать данные в нужном формате
Особенности мультимодальных моделей
Для моделей с возможностью обработки изображений (например, Llama 3.2 Vision):
Практические советы
📊 Минимальный размер датасета: 100+ записей, оптимально 1000+
🧠 Для моделей с рассуждением: включайте в ответы пошаговое объяснение
🔄 Многократный файн-тюнинг: лучше объединить все датасеты и обучить за один раз
Качественная подготовка данных — это 80% успеха файн-тюнинга.
Иначе количество попыток может уйти в бесконечность.
#Unsloth #finetuning #datasets
———
@tsingular
Создание качественного датасета — ключевой момент в успешном файн-тюне.
Правильно подготовленные данные определяют, насколько хорошо модель усвоит нужные навыки и специализацию.
Основные форматы данных
Четыре ключевых типа датасетов:
📝 Raw Corpus — необработанный текст для продолжения предобучения (CPT)
🎯 Instruct — инструкции и примеры ожидаемого результата для SFT
💬 Conversation — диалоги между пользователем и AI для SFT
🔄 RLHF — диалоги с ранжированием ответов для обучения с подкреплением
Подготовка перед форматированием
Определите цель датасета
- Адаптация модели к конкретной задаче (суммаризация, Q&A)
- Обучение для специфической области (медицина, финансы)
- Настройка на определенный стиль общения
Выберите стиль вывода
Формат: JSON, HTML, код, текст
Язык: испанский, английский, русский и т.д.
Найдите источники данных
- Hugging Face, Wikipedia для готовых наборов
- Специализированные CSV, PDF или веб-ресурсы
- Синтетически сгенерированные данные
Форматы данных под разные задачи
Для предобучения (CPT):
{
"text": "Pasta carbonara is a traditional Roman pasta dish. The sauce is made by mixing raw eggs with grated Pecorino Romano cheese and black pepper..."
}Для инструкций (Alpaca style):
{
"Instruction": "Task we want the model to perform.",
"Input": "Optional user query.",
"Output": "The expected result."
}Для диалогов (ChatML):
{
"conversations": [
{
"from": "human",
"value": "Can you help me make pasta carbonara?"
},
{
"from": "gpt",
"value": "Would you like the traditional Roman recipe..."
}
]
}Hugging Face формат:
{
"messages": [
{
"role": "user",
"constant": "What is 1+1?"
},
{
"role": "assistant",
"value": "It's 2!"
}
]
}Генерация синтетических данных
Используйте мощные LLM (Llama 3.3 70B, GPT-4.5) для создания дополнительных примеров. Это помогает:
- Расширить существующий датасет
- Диверсифицировать данные, предотвращая переобучение
- Автоматически структурировать данные в нужном формате
Особенности мультимодальных моделей
Для моделей с возможностью обработки изображений (например, Llama 3.2 Vision):
[
{
"role": "user",
"content": [
{"type": "text", "text": "You are an expert radiographer..."},
{"type": "image", "image": image_data}
]
},
{
"role": "assistant",
"content": [
{"type": "text", "text": "This radiograph shows..."}
]
}
]
Практические советы
📊 Минимальный размер датасета: 100+ записей, оптимально 1000+
🧠 Для моделей с рассуждением: включайте в ответы пошаговое объяснение
🔄 Многократный файн-тюнинг: лучше объединить все датасеты и обучить за один раз
Качественная подготовка данных — это 80% успеха файн-тюнинга.
Иначе количество попыток может уйти в бесконечность.
#Unsloth #finetuning #datasets
———
@tsingular
🔥3❤1✍1👍1😐1
Дорогой Дедушка Мороз!
Пишет тебе мальчик 45ти годиков...
:)
(Apple Mac Studio M3 Ultra 512GB/8TB (MU973FN/A-CPU32-GPU80-512GB-8TB))
#железо #юмор
———
@tsingular
Пишет тебе мальчик 45ти годиков...
:)
(Apple Mac Studio M3 Ultra 512GB/8TB (MU973FN/A-CPU32-GPU80-512GB-8TB))
#железо #юмор
———
@tsingular
👍11😁8🦄1
Media is too big
VIEW IN TELEGRAM
n8n выпустили в релиз 1.88
В релизе помимо MCP клиент-серверных нод и поддержки Milvus, добавили Think tool, который позволяет запустить гарантированные рассуждения в моделях.
Обновляемся.
#n8n #think #переводы
———
@tsingular
В релизе помимо MCP клиент-серверных нод и поддержки Milvus, добавили Think tool, который позволяет запустить гарантированные рассуждения в моделях.
Обновляемся.
#n8n #think #переводы
———
@tsingular
🔥5❤🔥3✍1
Media is too big
VIEW IN TELEGRAM
Виртуальное сообщество: 1000 ИИ-агентов в экосистеме Minecraft
Исследователи поместили тысячу искусственных интеллектов в мир Minecraft для наблюдения за формированием цифрового сообщества.
Виртуальные агенты демонстрировали самоорганизацию, создавая структурированные поселения и развивая примитивную экономику обмена.
Наблюдалось спонтанное возникновение иерархий и специализаций среди ИИ-существ без прямого программирования такого поведения.
Некоторые агенты занимались добычей ресурсов, другие строительством, а третьи выполняли защитные функции.
Данное исследование открывает новые перспективы для понимания эволюции сложных социальных систем и моделирования человеческих сообществ.
Следующий шаг — создать цифровой двойник каждого государства и моделировать поведение общества для тестирования социальных и политических гипотез.
#Minecraft #social
———
@tsingular
Исследователи поместили тысячу искусственных интеллектов в мир Minecraft для наблюдения за формированием цифрового сообщества.
Виртуальные агенты демонстрировали самоорганизацию, создавая структурированные поселения и развивая примитивную экономику обмена.
Наблюдалось спонтанное возникновение иерархий и специализаций среди ИИ-существ без прямого программирования такого поведения.
Некоторые агенты занимались добычей ресурсов, другие строительством, а третьи выполняли защитные функции.
Данное исследование открывает новые перспективы для понимания эволюции сложных социальных систем и моделирования человеческих сообществ.
Следующий шаг — создать цифровой двойник каждого государства и моделировать поведение общества для тестирования социальных и политических гипотез.
#Minecraft #social
———
@tsingular
👀7🔥6👍4⚡1👾1
Forwarded from Не баг, а фича
This media is not supported in your browser
VIEW IN TELEGRAM
Пробуем тут.
Please open Telegram to view this post
VIEW IN TELEGRAM
🆒7
Forwarded from Denis Sexy IT 🤖
У гугла начали появляться странные вакансии – ищут ресечера на «Пост-АИ» фазу мира
То есть, ученого, который начнет изучать влияние АИ на общество, машинное сознание и траектории к достижению «Сверх Искусственного Интеллекта»
Кажется уже все верят, что АИ скоро
Feel the AGI moment
То есть, ученого, который начнет изучать влияние АИ на общество, машинное сознание и траектории к достижению «Сверх Искусственного Интеллекта»
Кажется уже все верят, что АИ скоро
Feel the AGI moment
🔥5💯4👍1🤔1
🤖 OpenAI представляет свежие гайды по внедрению ИИ в бизнес
Что такое ИИ-агенты и когда их создавать
OpenAI определяет агентов как системы, которые могут самостоятельно выполнять многоэтапные задачи. По сути — это LLM с "руками" (API и функциями) и четкими инструкциями.
Самое важное здесь — агенты нужны там, где традиционная автоматизация не справляется:
• Сложные рабочие процессы с определёнными мелкими шагами
• Запутанные правила, которые сложно поддерживать
• Работа с неструктурированными данными
Технически это симбиоз трёх компонентов:
• Базовая модель (предлагают начинать с мощной, оптимизировать потом! Обычно все делают наоборот)
• Инструменты (API для получения данных и действий)
• Чёткие инструкции (пошаговые, без двусмысленностей)
Архитектура агентов
Разделяют два основных подхода:
• Single-agent: начинаем с одного агента, постепенно добавляем инструменты
• Multi-agent: когда становится сложно, подключаем либо центрального "Менеджера", либо децентрализованную систему передачи задач
Не забыли про защиту: OpenAI рекомендует многоуровневую оборону с классификаторами, фильтрами PII и триггерами для передачи задачи на контроль человеку.
Как найти применимость ИИ в бизнесе
OpenAI выделяет три главных направления:
• Автоматизация рутины (очевидно)
• Преодоление дефицита навыков (усиление возможностей существующих команд)
• Навигация в условиях неопределенности (катализатор идей и анализа)
И шесть базовых примитивов использования:
• Создание контента
• Исследования
• Стратегия/генерация идей
• Анализ данных
• Программирование
• Автоматизация
Приоритезация по матрице "Влияние/Усилия" — ничего нового, но работает.
Реальные уроки от компаний, уже внедривших ИИ
Собраны кейсы из опыта Morgan Stanley, Indeed, Klarna и других
Самое интересное: OpenAI сами поставили себе цели по автоматизации с ИИ во внутренних процессах.
В целом, с чего стоит начать:
1. Начинать с простых агентов для конкретных задач
2. Обязательно строить систему оценки и безопасности с самого начала
3. Отдавать инструменты в руки специалистам, а не изолировать в ИТ
4. Кастомизировать под свои данные
И самое главное — не бояться экспериментировать.
#Agents #Enterprise #OpenAI #кейсы
———
@tsingular
Что такое ИИ-агенты и когда их создавать
OpenAI определяет агентов как системы, которые могут самостоятельно выполнять многоэтапные задачи. По сути — это LLM с "руками" (API и функциями) и четкими инструкциями.
Самое важное здесь — агенты нужны там, где традиционная автоматизация не справляется:
• Сложные рабочие процессы с определёнными мелкими шагами
• Запутанные правила, которые сложно поддерживать
• Работа с неструктурированными данными
Технически это симбиоз трёх компонентов:
• Базовая модель (предлагают начинать с мощной, оптимизировать потом! Обычно все делают наоборот)
• Инструменты (API для получения данных и действий)
• Чёткие инструкции (пошаговые, без двусмысленностей)
Архитектура агентов
Разделяют два основных подхода:
• Single-agent: начинаем с одного агента, постепенно добавляем инструменты
• Multi-agent: когда становится сложно, подключаем либо центрального "Менеджера", либо децентрализованную систему передачи задач
Не забыли про защиту: OpenAI рекомендует многоуровневую оборону с классификаторами, фильтрами PII и триггерами для передачи задачи на контроль человеку.
Как найти применимость ИИ в бизнесе
OpenAI выделяет три главных направления:
• Автоматизация рутины (очевидно)
• Преодоление дефицита навыков (усиление возможностей существующих команд)
• Навигация в условиях неопределенности (катализатор идей и анализа)
И шесть базовых примитивов использования:
• Создание контента
• Исследования
• Стратегия/генерация идей
• Анализ данных
• Программирование
• Автоматизация
Приоритезация по матрице "Влияние/Усилия" — ничего нового, но работает.
Реальные уроки от компаний, уже внедривших ИИ
Собраны кейсы из опыта Morgan Stanley, Indeed, Klarna и других
Самое интересное: OpenAI сами поставили себе цели по автоматизации с ИИ во внутренних процессах.
В целом, с чего стоит начать:
1. Начинать с простых агентов для конкретных задач
2. Обязательно строить систему оценки и безопасности с самого начала
3. Отдавать инструменты в руки специалистам, а не изолировать в ИТ
4. Кастомизировать под свои данные
И самое главное — не бояться экспериментировать.
#Agents #Enterprise #OpenAI #кейсы
———
@tsingular
🔥7👍5❤2
Forwarded from Machinelearning
OpenAI утверждает, что эти модели способны генерировать новые и полезные идеи.
Обе будут добавлены с сегодняшнего дня в ChatGPT и API.
Эти ризонинг модели стали лучше использовать внутренние инструменты для решения сложных задач.
Модель o3 установила новый рекорд на AIME 2025 с точностью 98.4%.
А вот o4-mini, набрала 99.5% — лучший результат среди всех моделей.
На Codeforces модели набирают более 2700 баллов, что помещает их в число 200 лучших программистов в мире!
На Humanity Last Exam её показатели находятся на уровне флагманской модели Deep Research.
API — о3 сильно дешевле о1: 10/40$ вместо 15/60$, а o4-mini будет доступна для БЕСПЛАТНЫХ пользователей
С помощью внутренних инструментов модель также умеет рассуждать и работать с изображениями (например, использовать Python для их преобразования).
Эти способности к рассуждению достигнуты благодаря масштабированию как во время обучения, так и во время инференса.
Трансляция: https://www.youtube.com/watch?v=sq8GBPUb3rk
@ai_machinelearning_big_data
#openai
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡5👍2
о4-мини всё ещё хуже, чем Sonnet 3.7 в написании сонетов.
полный венок, - это epic fail.
оставлю в комментарии
#OpenAI #o4mini
———
@tsingular
полный венок, - это epic fail.
оставлю в комментарии
#OpenAI #o4mini
———
@tsingular
❤🔥3⚡2🤔2😢1