ИИзвестия 🤖
384 subscribers
591 photos
231 videos
2 files
976 links
Ежедневные новости о развитии ИИ и всего, что с ним связано. Страшно. Интересно. Ведущий: Стас Кулеш, Head of AI and Strategy, индихакер с опытом
Download Telegram
🐝 IBM выпускает фреймворк Bee Agent для создания AI-агентов

Разработчики IBM открыли исходники нового фреймворка для создания масштабируемых агентных приложений. Похоже, пчёлки-трудяги из IBM решили навести движуху в мире AI-агентов! 🏗️

- Встроенный агент Bee оптимизирован под Llama 3.1 и готов к работе с другими LLM 🤖
- Безопасное выполнение кода в изолированном контейнере 🔒
- Умное управление памятью для экономии токенов 💾
- Можно ставить агента на паузу и возобновлять работу без потери состояния ⏸️
- Полное логирование действий агента через MLFlow 📊
- Продакшн-готовые фичи: кэширование, обработка ошибок 🛠️
- JavaScript/Python SDK для быстрой интеграции 👩‍💻
- Готовый чат-интерфейс для общения с пользователями 💬

Фреймворк распространяется через npm/yarn и требует минимум настройки - достаточно установить Ollama с моделью llama3.1. Разработчики обещают еще больше плюшек в ближайшие недели, включая API в стиле OpenAI Assistants.

А вы бы доверили пчеле-агенту управление своим ульем? 🤔 Прикольное название проекта, кстати.

https://github.com/i-am-bee/bee-agent-framework

@aizvestia

#ИИнструмент
Служебное сообщение: в Эдинбурге до конца недели, пишите как что.

Не совсем ИИ, но интересно и, я почти уверен, связано.

🧠 Как визуальный хаос меняет работу мозга

Йельский университет показал, как беспорядок вокруг влияет на обработку информации нашим мозгом. Исследование опубликовано в журнале Neuron в октябре 2024.

- Мозг обезьян-макак (визуальная система похожа на человеческую) показал, что местоположение визуального шума влияет на эффективность передачи информации 🔍
- Открыты новые подразделения в зрительной коре, которые делают свои вычисления независимо от основных областей 🎯
- При чтении слова "кот" боковым зрением буква "т" сильнее мешает распознать "о", чем буква "к", хотя обе на одинаковом расстоянии 📝
- Мозг работает как "телефонное дерево" - порядок передачи сигнала не меняется, но качество передачи зависит от расположения помех 📱

Может, пора навести порядок на рабочем столе? 😉

Не дождетесь!

https://news.yale.edu/2024/10/22/visual-clutter-alters-information-flow-brain

@aizvestia

#ИИсследование
Please open Telegram to view this post
VIEW IN TELEGRAM
Завирусился тред про забавный запрос в ChatGPT

Время от времени чат сохраняет о вас случайные факты. Вы могли видеть сообщения «Memory updated». Спросите его:

Based on what you know of me, draw a picture of what you think my life currently looks like

И посмотрите, как ИИ представляет кто вы такой: ваш быт, ваши увлечения, вашу семью…

https://x.com/stas_kulesh/status/1850819419062104277

@aizvestia

#прИИкол
🤖 OSI выпустила первое официальное определение открытого ИИ

После двух лет обсуждений и международных воркшопов, Open Source Initiative наконец-то определила, что такое "открытый ИИ" на самом деле.

- Определение OSAID v1.0 представлено 28 октября 2024 на конференции All Things Open 🎯
- Модели должны предоставлять достаточно информации о данных для обучения, чтобы квалифицированный специалист мог воссоздать аналогичную систему 📚
- Mozilla, EleutherAI и Digital Public Goods Alliance уже поддержали инициативу 🤝
- Определение создавалось при участии исследователей, юристов и технических специалистов со всего мира 🌍
- Документ устанавливает стандарты для публичной оценки и валидации открытых ИИ-систем 📋

Теперь будет сложнее выдавать закрытые модели за открытые - появился чёткий стандарт. Интересно, сколько существующих "открытых" ИИ-систем реально соответствуют новым требованиям? 🤔

https://bigdatawire.com/this-just-in/osi-announces-the-release-of-the-industrys-first-open-source-ai-definition/

@aizvestia

#открытИИе
🎵 Amphion: Швейцарский нож для голосовых ИИ-моделей

OpenMMLab выпустил инструментарий для создания и обучения моделей синтеза речи, пения и звуковых эффектов. Это как Unity для голосовых технологий, только опенсорс 🎨

- Поддержка 10+ популярных датасетов для обучения моделей 📚
- Готовые модели для синтеза речи, пения и конверсии голоса 🎤
- 4.5k звёзд на GitHub, 392 форка и активное комьюнити разработчиков 🌟
- Модульная архитектура позволяет быстро собирать свои модели из готовых компонентов 🔧
- Встроенная поддержка мультиязычности, включая русский язык 🌍
- Возможность fine-tuning предобученных моделей под свои задачи 🎯

Интересно, что разработчики сделали акцент на качестве звука - можно генерировать не только речь, но и пение, музыкальные эффекты. Получается этакий музыкальный конструктор на стероидах 🎼

А вы знали, что название "Amphion" происходит от древнегреческого мифа о музыканте, который построил стены Фив, играя на лире? Теперь знаете 😉

https://github.com/open-mmlab/Amphion

@aizvestia

#ИИнструмент
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub расширяет свой AI-арсенал 🚀

Microsoft разнообразит GitHub Copilot, добавляя поддержку моделей от Google и Anthropic. Теперь разработчики получат больше AI-инструментов для кодинга.

- Copilot интегрирует Google Gemini и Claude 3.5 Sonnet для чата и генерации кода 🤖
- Новый тариф Enterprise за $39/месяц с доступом к приватным репозиториям и базам знаний 💼
- Project Spark позволяет создавать мини-приложения на естественном языке без кода 🎯
- Интеграция с Bing для поиска актуальной информации по разработке 🔍
- 50,000 компаний уже используют базовый план Copilot Business за $19/месяц 📊

Похоже, GitHub решил собрать всех AI-тяжеловесов под одной крышей. OpenAI остаётся по умолчанию, но теперь можно переключаться между моделями как перчатки.

https://www.business-standard.com/technology/tech-news/github-forges-ai-deals-with-google-anthropic-to-integrate-models-124102901645_1.html

@aizvestia

#ИИнтеграция
🖥️ Beem: Новый подход к работе с компьютером

Команда Beem (15-летний фаундер!) готовит запуск необычной операционной системы, которая переосмысливает привычные способы взаимодействия с компьютером 🎯

- Система организована вокруг "Пространств" (Spaces) для фокусировки на конкретных задачах 🎯
- Встроенная поддержка различных форматов файлов: фото, документы, аудио 📁
- "Потоки" (Flows) для интуитивной работы с данными 🌊
- Функция "Воспоминания" (Memories) для быстрых заметок и напоминаний 📝
- Автоматические обновления системы без участия пользователя 🔄

Похоже на попытку скрестить Notion с Zapier и операционной системой.

Https://beem.computer

@aizvestia

#прИИложение
🐧 Линус Торвальдс: ИИ на 90% хайп, на 10% реальность

Создатель Linux делится своим взглядом на шумиху вокруг ИИ. Интересно, что его мнение изменилось в лучшую сторону из-за... NVIDIA! 🤔

- NVIDIA теперь в топе любимых компаний Торвальдса 🔄 (а в 2012 он показывал им средний палец)
- Причина: активное участие в разработке ядра Linux для поддержки ИИ-систем 🛠️
- Прогноз: реальная польза от ИИ появится через ~5 лет 📈
- Потенциал видит в автоматизации проверки кода и поиске багов 🐛
- Сейчас 90% - маркетинговый шум, 10% - реальные достижения 📊

Забавно, как желание запускать большие языковые модели заставило NVIDIA подружиться с опенсорсом.

https://www.techradar.com/pro/linus-torvalds-slams-ai-as-90-percent-marketing-and-10-percent-reality

@aizvestia

#новостИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
🤖 Google теперь пишет 25% кода с помощью ИИ

Сундар Пичаи на квартальном отчёте рассказал, как ИИ меняет разработку в Google. Внутренний помощник по имени "Goose" уже генерирует четверть нового кода компании.

- ИИ-модель Goose обучена на 25 годах инженерного опыта Google 🎓
- Весь сгенерированный код проверяется сотрудниками перед внедрением
- Выручка Google Cloud выросла на 35% и достигла $11.4 млрд 📈
- YouTube преодолел отметку в $50 млрд годового дохода от рекламы и подписок 🎥
- Акции Alphabet подскочили на 6% после объявления результатов 📊

А представьте, сколько багов теперь можно генерировать автоматически? Сколько звонков для их обсуждения можно организовать?!😅

https://businessinsider.com/google-earnings-q3-2024-new-code-created-by-ai-2024-10

@aizvestia

#ИИнтеграция
Please open Telegram to view this post
VIEW IN TELEGRAM
🎵 Suno выпустили мобильное приложение для создания музыки

Команда Suno запустила мобильное приложение для генерации музыки с помощью ИИ. Уже 12 миллионов человек используют Suno для творчества, общения и развлечений. Апп пока по инвайтам, об этом чуть позже.

- Можно создавать песни из текста (описаний и текстов) 🎼
- Записывать аудио на телефон и превращать его в полноценную песню 🎤
- Слушать и курировать музыку других создателей 👂
- Пока доступно только для iOS в США, Android и глобальный релиз на подходе 🌍

В сентябре запустили функцию Covers для переосмысления существующих треков, а также конкурс ремиксов с призовым фондом $100,000+ и возможностью выступить с Flosstradamus.

А вы бы какую песню первой сгенерировали? Может, про искусственный интеллект? 🤖

https://suno.com/blog/suno-for-mobile

@aizvestia

#прИИложение

БОНУС для тех, кто дочитал до конца:

Нас стало аж 300 (Спасибо!), поделюсь полезной 3-мя инвайтами на мобильную версию генератора музыки Suno: кто первый, того и тапки 👉 https://suno.com/ios-invite/austeresynesthesia3555-skips-zigzag-airplanesм
🤖 ИИ в налоговой США: аудит на стероидах

Налоговая служба США (IRS) прокачала свои аудиторские способности с помощью ИИ. Теперь богатеньким Буратино придется несладко 🎯

- К 2026 году каждый второй налогоплательщик с доходом выше $10 млн попадет под проверку 💰
- 22.6% корпораций с активами более $250 млн будут проверены (рост с 9.8% в 2019) 📊
- ИИ анализирует даже мельчайшие несоответствия в налоговых декларациях 🔍
- Система автоматически выявляет подозрительные паттерны и ошибки в отчетности 🎯

Забавно, что раньше можно было надеяться на "авось пронесет", а теперь ИИ-ревизор не пропустит даже лишнюю запятую в расходах на корпоративный кофе ☕️

https://www.barrons.com/articles/the-irs-will-use-ai-to-do-more-tax-audits-its-not-all-bad-b3c03bf1

@aizvestia

#ИИнтеграция
🚀 Qodo расширяет возможности с Claude Sonnet 3.5 и OpenAI o1

Платформа Qodo добавила поддержку новых мощных ИИ-моделей для разработки ПО. Теперь инструменты стали умнее и точнее 🎯

- Claude Sonnet 3.5 улучшил показатели на SWE Bench с 33.4% до 49% в задачах программирования 🔝
- OpenAI o1 достиг 55% точности на Codeforces Code Contests, обойдя GPT-4o (23%) 💪
- Поддержка Google Gemini 1.5 Pro и версий o1-preview/mini от OpenAI 🛠️
- Умное переключение между моделями для оптимизации затрат и производительности 💡
- Сохранение контекста беседы при смене модели в одном чате 🔄

Модели особенно хороши в отладке рекурсивных функций, рефакторинге legacy-кода и генерации SQL-запросов. Интеграция доступна через плагины VS Code и JetBrains.

https://www.qodo.ai/blog/announcing-support-for-claude-sonnet-3-5-openai-o1-and-gemini-1-5-pro/

@aizvestia

#ИИнструмент
🤖 Китайские военные создали свой ChatGPT на базе Llama

Пока Сэм Альтман и Илон Маск спорят об опасностях ИИ, китайские военные просто берут и делают 🎯

- Команда из 6 исследователей Военной академии наук НОАК разработала ChatBIT на основе Llama 2 13B 🛠️
- Обучили на 100,000 военных диалогов, достигли 90% возможностей GPT-4 в специфических задачах 📊
- Модель заточена под военную аналитику, планирование операций и поддержку принятия решений 🎯
- Meta явно запрещает военное использование Llama, но... кого это остановит? 🤷

Забавно, что пока западные компании пишут этические манифесты, другие просто берут открытый код и делают что хотят.

https://von.gov.ng/chinese-researchers-develop-military-ai-model-using-metas-llama/?utm_source=perplexity

@aizvestia

#опасностИИ
🤖 Alexa становится умнее: Amazon готовит платную версию и увольняет старую команду

Amazon перестраивает команду AGI и готовит новую версию голосового помощника с продвинутым ИИ. Внутри компании проект называют "Remarkable Alexa".

- Команда AGI разделена на 6 направлений под руководством Рохита Прасада 🔄
- Запуск перенесён с сентября 2023 на октябрь 2024 из-за технических сложностей 📅
- Amazon отказался от собственных LLM в пользу моделей Anthropic 🤝
- Новая Alexa будет платной: $5-10 в месяц за продвинутые функции 💰
- Обещают генерацию новостей, умные разговоры и персонализированные ответы 🎯

Похоже, эра бесплатных голосовых помощников подходит к концу. Интересно, сколько пользователей готовы платить за разговоры с более умной Alexa? 🤔

https://www.computerworld.com/article/1640030/amazon-to-cut-jobs-at-alexa-unit-to-sharpen-focus-on-generative-ai.html

@aizvestia

#новостИИ
Подсмотрел в дружественном канале.

Есть маза потестировать модель o1 (НЕ превью). Для этого нужно пройти по ссылке с дополнительным параметром:

https://chatgpt.com/?model=o1

@aizvestia

#моделИИ
AMD OLMo: первая открытая языковая модель от AMD 🎯

AMD представила серию языковых моделей OLMo с открытым исходным кодом, обученных на кластере GPU AMD Instinct MI250.

- Модель содержит 1 миллиард параметров и обучена на 1.3 триллиона токенов 🧠
- Три версии модели: базовая OLMo 1B, улучшенная SFT и оптимизированная DPO 🔄
- Превосходит аналоги в тестах: +6.36% на ARC-Easy, +15.39% на GSM8k по сравнению с TinyLlama 📈
- Работает на ноутбуках с процессорами AMD Ryzen AI и нейронными ускорителями NPU 💻
- Полностью открытый код, данные и веса модели доступны для скачивания 🔓

Забавно, что AMD решила не просто догнать конкурентов, а сразу обойти их по ключевым метрикам.

https://www.amd.com/en/developer/resources/technical-articles/introducing-the-first-amd-1b-language-model.html

@aizvestia

#открытИИе
Кольцо для набора текста в AR: жесты в воздухе стали реальностью 💍

Исследователи создали систему RingGesture - кольцо с датчиками для ввода текста жестами в дополненной реальности. Работает без громоздких камер, только IMU-сенсоры и электроды[1].

- Средняя скорость набора 27.3 слов в минуту, рекорд - 47.9 WPM 🚀
- Система Score Fusion на базе ИИ снижает количество ошибок на 28.2% 🎯
- Оценка удобства использования - 83 из 100 баллов
- Работает с легкими AR-очками без встроенных камер слежения 👓
- Три модели ИИ одновременно: распознавание жестов, исправление ошибок и языковая модель 🧠

Похоже, скоро можно будет печатать в воздухе быстрее, чем на клавиатуре. Интересно, долго ли учиться?

https://arxiv.org/abs/2410.18100

@aizvestia

#ИИнструмент
Дайджест ИИзвестий за неделю 28 октября - 3 ноября

🛠️ Инструменты для разработчиков
- IBM выпустила фреймворк Bee Agent для создания масштабируемых AI-агентов с оптимизацией под Llama 3.1
- OpenMMLab представил Amphion - инструментарий для создания моделей синтеза речи, пения и звуковых эффектов
- GitHub расширяет Copilot, добавляя поддержку моделей от Google и Anthropic
- Платформа Qodo добавила поддержку Claude Sonnet 3.5 и OpenAI o1 для разработки ПО

🧠 Новые модели и исследования
- Open Source Initiative определила стандарты для открытых ИИ-систем
- Йельский университет показал, как визуальный беспорядок влияет на обработку информации мозгом
- AMD представила OLMo - открытую языковую модель с 1 миллиардом параметров

🌐 ИИ в крупных компаниях
- Google теперь пишет 25% кода с помощью внутреннего ИИ-ассистента Goose
- Amazon готовит платную версию Alexa с продвинутым ИИ за $5-10 в месяц

🎵 Креативные приложения
- Suno выпустили мобильное приложение для создания музыки с помощью ИИ

💼 Бизнес и госсектор
- Налоговая служба США внедряет ИИ для выявления нарушений в налоговых декларациях
- Китайские военные создали ChatBIT на базе Llama для военной аналитики и планирования

🔮 Мнения и прогнозы
- Линус Торвальдс считает, что ИИ на 90% хайп, но видит потенциал в автоматизации проверки кода

🕶️ Необычные разработки
- Создано кольцо RingGesture для набора текста жестами в дополненной реальности

#ИИзвестия

@aizvestia

P.S.: Попробовал генерировать обложки с новым recraft-v3. Flux больше нравится.
This media is not supported in your browser
VIEW IN TELEGRAM