Технозаметки Малышева

Интересный отрывок из интервью про ближайшее будущее решений OpenAI и агентов в принципе.

Всё, что мы видим сейчас работает на уровне студента-хорошиста.
В ближайшее время в релизе будут ИИ уровня доктора наук и они смогут сами пользоваться сайтами и другими инструментами.
А с голосовыми возможностями - вы не отличите их в общении от обычных людей. Мы уже имеем доступ к API, где они выглядят очень достоверно.

David Sacks, - со-основатель Craft Ventures, PayPal, Yammer и нового AI стартапа - Glue.

#Glue #agents @Sacks
———
@tsingular

👀13🔥5❤1

6.53K views04:26

Технозаметки Малышева

Новые оценки O1: модель превосходит средний человеческий IQ

Модель прогнали через IQ тест Mensa Norway
ИИ верно ответил на 25 из 35 вопросов, набрав 120 баллов, что значительно превосходит средний человеческий показатель.

Ключевое преимущество достигнуто за счёт способности рассуждать и объяснять свои ответы на сложные задачи.
Модель успешно прошла и офлайн-версию IQ теста, исключающую возможность 'читерства'.

Ну, что ж, - ждём Opus 3.5 и дальше агентов на нём.
Сдаётся мне IQ 140 мы увидим уже в этом году.
Санта-AGI стучится в дом. В каждый! :)

Тут кстати вышла новая страшилка-триллер с Меган Фокс, - Subservience.
Как раз про ИИ в человеческой форме и сверх интеллектом.
Уже не смотрится как фантастика, скорее тупо документалка.
Трейлер на тормозном :) ютубе

#OpenAI #IQ #test #Subservience
-------
@tsingular

👍29🤯15🔥6❤1😁1😢1🎉1

6.63K viewsedited 06:09

Технозаметки Малышева

Как тренируют модели с рефлексией.
Филип Шмид. техлид HuggingFace

Реализация
1️⃣ Подготовка данных: соберите набор данных математических задач или задач кодирования
2️⃣ Сгенерируйте размышления: для каждой проблемы (пары вопрос-ответ) сгенерируйте альтернативные рассуждения, которые используют разные подходы или перспективы для решения и последующего рассуждения, которое является аналогиями, связанными с исходной проблемой.
3️⃣ Расширение данных: интегрируйте размышления в обучающие примеры. Теперь каждый обучающий экземпляр будет содержать исходную задачу, ее решение и раздел размышлений.
4️⃣ Тонкая настройка: тонкая настройка LLM с использованием расширенного набора данных, гарантирует, что модель изучит как прямые рассуждения для быстрых решений, так и рефлексивные рассуждения.

Результаты:
🧠 Повышает точность математических ответов на 6,8 балла
💻 Повышает производительность в написании кода на +3,5 балла в метрике Pass@1
👀 +81,11% в исправлении ошибок с использованием рефлексии > DeepSeek Math
🔬 Превосходит традиционную цепочку мыслей (CoT) в задачах на рассуждение
📈 С увеличением количества обучающих данных производительность улучшается

🚀 Выпущен код, подсказки, набор данных и скрипты:

paper HF
GitHub

#HF #Reflection #training #guide
———
@tsingular

👍8❤2🔥1

4.76K views07:01

Технозаметки Малышева

говорю же, о1, - не модель, а агентские скрипты.

#o1
———
@tsingular

👍5

2.4K views13:38

Технозаметки Малышева

1:09

This media is not supported in your browser

VIEW IN TELEGRAM

Microsoft расширяет возможности Copilot AI в Office

- Интеграция Python в Excel позволяет отдать часть управления в Copilot, открывая новые горизонты для анализа данных.
- PowerPoint обзаведется улучшенным AI-генератором презентаций, способным использовать корпоративные шаблоны.
- Word усовершенствует AI-черновики, добавит возможность включать данные из писем и встреч.
- Outlook получит функцию приоритизации входящих сообщений с помощью Copilot.
- Teams обогатится возможностью суммировать чаты и голосовые беседы.
- OneDrive позволит сравнивать до пяти файлов, выявляя различия между ними.

Ещё добавили Pages - пространство для совместной работы с ИИ генерациями

Microsoft

Похоже, скоро офисным работникам останется только кофе варить. Хотя, постойте-ка... 🤖☕️

#Microsoft #Copilot #OfficeApps
-------
@tsingular

😁2

1.65K viewsedited 06:24

Технозаметки Малышева

ИИ в кинопроизводстве: от организации фестивалей до переработки сценариев сериалов

Прошедший фестиваль ИИ-фильмов продемонстрировал потенциал искусственного интеллекта в киноиндустрии.
Технология рассматривается как инструмент улучшения, а не угроза традиционному творчеству.
Преимущества ИИ в кино:
• Увеличение объема и качества контента
• Адаптация сюжетов под реакцию зрителей (скоро в реальном времени)
• Переписывание существующих сюжетов.
• Сокращение времени между сезонами в сериалах
ИИ вполне может обновить киноиндустрию, предоставив новые возможности для творческого самовыражения.

Наконец-то у Игры Престолов напишут нормальную концовку. 🐉🎬

#AIcinema #MovieTech #AdaptiveStories
-------
@tsingular

👍5🔥5😁1🆒1

1.3K viewsedited 09:52

Технозаметки Малышева

Forwarded from NN

Исследователи заплатят по $5000 за сложные вопросы для ИИ. Они необходимы для создания бенчмарков, по которым оценят развитие искусственного интеллекта.

Проект «Последний экзамен человечества» собирает вопросы из разных научных областей, на которые не могут ответить даже лучшие из современных языковых моделей. За 500 лучших вопросов исследователи заплатят по $500. Авторы лучших 50 вопросов получат по $5000.

«Существующие тесты стали слишком простыми, и мы больше не можем хорошо отслеживать прогресс ИИ и уровень его экспертности. Чтобы проследить, насколько далеки системы ИИ от уровня эксперта, мы разрабатываем самый сложный тест для ИИ в мире», — объяснили авторы исследования.

Вопросы должны быть сложными для не-экспертов. Ответы не должны быть доступны в интернете. Чтобы составить сложный и интересный вопрос, авторам рекомендуют иметь хотя бы 5 лет опыта в технической области (например, в SpaceX).

Присылать вопросы можно до 1 ноября. Авторы удачных вопросов также войдут в списки соавторов исследования.

🔥9❤1

1.19K views18:09

Технозаметки Малышева

Mistral AI: бесплатный доступ и новые модели

Mistral AI открыла бесплатный API для разработчиков на платформе La Plateforme.

Представлены:
Mistral Small v24.09 - 22-миллиардная модель для корпоративного применения.

Pixtral 12B - модель компьютерного зрения, теперь доступна в бесплатном чат-боте le Chat.

Снижены цены на все модели через API.

Тренд на снижение цен на инференс - добро.
Больше похоже на борьбу за разработчиков. На какую платформу подсядут, - та и в плюсе будет. 🤖👨‍💻

#MistralAI #LaPlateforme #Pixtral
-------
@tsingular

👍6

1.83K viewsedited 06:29

Технозаметки Малышева

G42 и Microsoft открывают ИИ-центры в Абу-Даби

Компании G42 и Microsoft объединяют усилия для запуска двух центров искусственного интеллекта в Абу-Даби.
Первый центр сфокусируется на разработке стандартов ответственного использования ИИ для Ближнего Востока и стран Глобального Юга.
Второй станет расширением исследовательской лаборатории Microsoft AI for Good.
Проект поддержан Советом по ИИ и передовым технологиям ОАЭ (AIATC).
Центры займутся развитием языковых моделей для редких языков и исследованиями в области продовольственной безопасности и климатической устойчивости.
G42 внедрит политики ответственного ИИ от Microsoft.
Инициатива укрепит позиции ОАЭ как глобального хаба искусственного интеллекта.

Developers! Developers! Developers! По заветам Балмера. 🏜️💻

#G42 #Microsoft #UAE
-------
@tsingular

🗿3🔥1

2.02K views06:46

Технозаметки Малышева