Технозаметки Малышева
8.53K subscribers
3.82K photos
1.43K videos
40 files
4K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Media is too big
VIEW IN TELEGRAM
Интересный отрывок из интервью про ближайшее будущее решений OpenAI и агентов в принципе.

Всё, что мы видим сейчас работает на уровне студента-хорошиста.
В ближайшее время в релизе будут ИИ уровня доктора наук и они смогут сами пользоваться сайтами и другими инструментами.
А с голосовыми возможностями - вы не отличите их в общении от обычных людей. Мы уже имеем доступ к API, где они выглядят очень достоверно.

David Sacks, - со-основатель Craft Ventures, PayPal, Yammer и нового AI стартапа - Glue.

#Glue #agents @Sacks
———
@tsingular
👀13🔥51
Новые оценки O1: модель превосходит средний человеческий IQ

Модель прогнали через IQ тест Mensa Norway
ИИ верно ответил на 25 из 35 вопросов, набрав 120 баллов, что значительно превосходит средний человеческий показатель.

Ключевое преимущество достигнуто за счёт способности рассуждать и объяснять свои ответы на сложные задачи.
Модель успешно прошла и офлайн-версию IQ теста, исключающую возможность 'читерства'.

Ну, что ж, - ждём Opus 3.5 и дальше агентов на нём.
Сдаётся мне IQ 140 мы увидим уже в этом году.
Санта-AGI стучится в дом. В каждый! :)

Тут кстати вышла новая страшилка-триллер с Меган Фокс, - Subservience.
Как раз про ИИ в человеческой форме и сверх интеллектом.
Уже не смотрится как фантастика, скорее тупо документалка.
Трейлер на тормозном :) ютубе

#OpenAI #IQ #test #Subservience
-------
@tsingular
👍29🤯15🔥61😁1😢1🎉1
Как тренируют модели с рефлексией.
Филип Шмид. техлид HuggingFace

Реализация
1️⃣ Подготовка данных: соберите набор данных математических задач или задач кодирования
2️⃣ Сгенерируйте размышления: для каждой проблемы (пары вопрос-ответ) сгенерируйте альтернативные рассуждения, которые используют разные подходы или перспективы для решения и последующего рассуждения, которое является аналогиями, связанными с исходной проблемой.
3️⃣ Расширение данных: интегрируйте размышления в обучающие примеры. Теперь каждый обучающий экземпляр будет содержать исходную задачу, ее решение и раздел размышлений.
4️⃣ Тонкая настройка: тонкая настройка LLM с использованием расширенного набора данных, гарантирует, что модель изучит как прямые рассуждения для быстрых решений, так и рефлексивные рассуждения.

Результаты:
🧠 Повышает точность математических ответов на 6,8 балла
💻 Повышает производительность в написании кода на +3,5 балла в метрике Pass@1
👀 +81,11% в исправлении ошибок с использованием рефлексии > DeepSeek Math
🔬 Превосходит традиционную цепочку мыслей (CoT) в задачах на рассуждение
📈 С увеличением количества обучающих данных производительность улучшается

🚀 Выпущен код, подсказки, набор данных и скрипты:

paper HF
GitHub

#HF #Reflection #training #guide
———
@tsingular
👍82🔥1
говорю же, о1, - не модель, а агентские скрипты.

#o1
———
@tsingular
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
Microsoft расширяет возможности Copilot AI в Office

- Интеграция Python в Excel позволяет отдать часть управления в Copilot, открывая новые горизонты для анализа данных.
- PowerPoint обзаведется улучшенным AI-генератором презентаций, способным использовать корпоративные шаблоны.
- Word усовершенствует AI-черновики, добавит возможность включать данные из писем и встреч.
- Outlook получит функцию приоритизации входящих сообщений с помощью Copilot.
- Teams обогатится возможностью суммировать чаты и голосовые беседы.
- OneDrive позволит сравнивать до пяти файлов, выявляя различия между ними.

Ещё добавили Pages - пространство для совместной работы с ИИ генерациями

Microsoft

Похоже, скоро офисным работникам останется только кофе варить. Хотя, постойте-ка... 🤖☕️

#Microsoft #Copilot #OfficeApps
-------
@tsingular
😁2
ИИ в кинопроизводстве: от организации фестивалей до переработки сценариев сериалов

Прошедший фестиваль ИИ-фильмов продемонстрировал потенциал искусственного интеллекта в киноиндустрии.
Технология рассматривается как инструмент улучшения, а не угроза традиционному творчеству.
Преимущества ИИ в кино:
• Увеличение объема и качества контента
• Адаптация сюжетов под реакцию зрителей (скоро в реальном времени)
• Переписывание существующих сюжетов.
• Сокращение времени между сезонами в сериалах
ИИ вполне может обновить киноиндустрию, предоставив новые возможности для творческого самовыражения.

Наконец-то у Игры Престолов напишут нормальную концовку. 🐉🎬

#AIcinema #MovieTech #AdaptiveStories
-------
@tsingular
👍5🔥5😁1🆒1
Forwarded from NN
Исследователи заплатят по $5000 за сложные вопросы для ИИ. Они необходимы для создания бенчмарков, по которым оценят развитие искусственного интеллекта.

Проект «Последний экзамен человечества» собирает вопросы из разных научных областей, на которые не могут ответить даже лучшие из современных языковых моделей. За 500 лучших вопросов исследователи заплатят по $500. Авторы лучших 50 вопросов получат по $5000.

«Существующие тесты стали слишком простыми, и мы больше не можем хорошо отслеживать прогресс ИИ и уровень его экспертности. Чтобы проследить, насколько далеки системы ИИ от уровня эксперта, мы разрабатываем самый сложный тест для ИИ в мире», — объяснили авторы исследования.


Вопросы должны быть сложными для не-экспертов. Ответы не должны быть доступны в интернете. Чтобы составить сложный и интересный вопрос, авторам рекомендуют иметь хотя бы 5 лет опыта в технической области (например, в SpaceX).

Присылать вопросы можно до 1 ноября. Авторы удачных вопросов также войдут в списки соавторов исследования.
🔥91
Mistral AI: бесплатный доступ и новые модели

Mistral AI открыла бесплатный API для разработчиков на платформе La Plateforme.

Представлены:
Mistral Small v24.09 - 22-миллиардная модель для корпоративного применения.

Pixtral 12B - модель компьютерного зрения, теперь доступна в бесплатном чат-боте le Chat.

Снижены цены на все модели через API.

Тренд на снижение цен на инференс - добро.
Больше похоже на борьбу за разработчиков. На какую платформу подсядут, - та и в плюсе будет. 🤖👨‍💻

#MistralAI #LaPlateforme #Pixtral
-------
@tsingular
👍6
G42 и Microsoft открывают ИИ-центры в Абу-Даби

Компании G42 и Microsoft объединяют усилия для запуска двух центров искусственного интеллекта в Абу-Даби.
Первый центр сфокусируется на разработке стандартов ответственного использования ИИ для Ближнего Востока и стран Глобального Юга.
Второй станет расширением исследовательской лаборатории Microsoft AI for Good.
Проект поддержан Советом по ИИ и передовым технологиям ОАЭ (AIATC).
Центры займутся развитием языковых моделей для редких языков и исследованиями в области продовольственной безопасности и климатической устойчивости.
G42 внедрит политики ответственного ИИ от Microsoft.
Инициатива укрепит позиции ОАЭ как глобального хаба искусственного интеллекта.

Developers! Developers! Developers! По заветам Балмера. 🏜️💻

#G42 #Microsoft #UAE
-------
@tsingular
🗿3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Вчера увидел в ленте отличный документ — как лучший видеоблогер мира мотивирует сотрудников.

Жесть, изнанка, профессиональное угнетение и т.д. всё, что полезно для вашего бизнеса :).

Ну там всё на английском. Прямой перевод PDF через гугл - рушит разметку, Через текст, - тоже не очень - и плюс там лимит 5000 на лист.

В общем решение - закинул в Клода запрос - напиши ПЕРЕВОДЧИК на Клод-API, который кусками будет переводить текст.
Буквально 5 минут и вот результат в комментах.
В принципе перевод любого размера текста. Очень качественно и относительно быстро и не дорого. Claude haiku справляется.
Я к тому, что теперь быстрее создать ИИ инструмент, чем искать что-то платное и готовое.

#Claude #translation #tools #dev
———
@tsingular
👏9👍6🤔2
Forwarded from Data Secrets
В Твиттере протестировали силу арифметики o1

Тест проводился на задаче умножения по сетке вплоть до 20-значных чисел на 20-значные. Посмотрите, насколько o1 справляется лучше 4o ⬆️

Интересно также, что o1 mini умножает ничуть не хуже o1 preview, а с ростом чисел для перемножения количество ризонинг токенов растет ~линейно.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Data Secrets
Nvidia выпустила NVLM 1.0 – собственную мультимодальную LLM, которая на некоторых тестах опережает GPT-4o

NVLM 1.0 (NVIDIA Vision Language Model) – это семейство открытых мультимодальных LLM, состоящее из моделей NVLM-D (Decoder-only Model), NVLM-X (X-attention Model) и NVLM-H (Hybrid Model) на 34B и 72B.

Модели особенно хорошо показывают себя на визуальных задачах. Например, на OCRBench NVLM-D обогнала даже GPT-4o. На вопросах по математике модель тоже выделяется: обгоняет Gemini и всего на 3 пункта отстает от Claude 3.5.

Архитектура у всех трех примерно одинковая, не считая обработку изображений. NVLM-D использует для картинок предобученный энкодер, который соединен с обычным двухслойным перцептроном (эффективно по параметрам, но кушает много GPU). NVLM-Х же для обработки токенов изображения использует cross-attention (не очень эффективно, зато лучше обрабатывает картинки с высоким разрешением). NVLM-H стала чем-то средним.

Больше технических деталей можно найти в статье. Веса самих моделей скоро можно будет найти на Hugging Face, а в этом репозитории лежит код.
👍2