🔵 В программе - доклады о самых эффективных алгоритмах обучения, межкультурном машинном переводе с дополненным поиском, стратегиях обновления моделей (LLM Evolution), ранжировании детализации, создании универсальных управляемых наборов данных для обучения LLM и многом другом.
Среди докладчиков – ученые, разработчики, энтузиасты ИИ и, конечно, стартаперы.
Интересно, что покажут.
#AI #Apple #EMNLP
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥2❤1
🔵 Модель Hunyuan 3D-1.0 - первая большая модель для генерации 3D с открытым исходным кодом. Использует двухэтапный метод генерации.
🔹 На первом этапе облегченная версия модели может генерировать изображения примерно за 4 секунды. На выходе – богатые текстуры и геометрически правильные ракурсы.
🔹 На втором - использует эти изображения и создает 3D-объекты примерно за 3 секунды. Хорошо справляется с шумом и дисбалансом, восстанавливает трехмерную структуру, используя информацию, добытую из картинок.
Качество, мощь, перспектива.
#AI #Hunyuan3D
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - Tencent-Hunyuan/Hunyuan3D-1: Tencent Hunyuan3D-1.0: A Unified Framework for Text-to-3D and Image-to-3D Generation
Tencent Hunyuan3D-1.0: A Unified Framework for Text-to-3D and Image-to-3D Generation - Tencent-Hunyuan/Hunyuan3D-1
🔥3👍2👏1
Cosmos Tokenizer – набор токенизаторов для картинок и видео с высокой степенью сжатия при сохранении качества.
🔵 Параметры вызывают уважение: 8x или 16x для пространственного сжатия изображений и 4x или 8x для временного сжатия видео, при этом работает раз в 10 быстрее, чем другие.
🔹 По результатам тестирования Cosmos Tokenizer бьет конкурентов по качеству реконструкции и шустрости.
🔹 Собрать самому можно на GitHub
#AI #NVIDIA #CosmosTokenizer
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - NVIDIA/Cosmos-Tokenizer: A suite of image and video neural tokenizers
A suite of image and video neural tokenizers. Contribute to NVIDIA/Cosmos-Tokenizer development by creating an account on GitHub.
👍2🔥2❤1
🔵 К московской платформе «МосМедИИ» продолжают присоединяться регионы России.
🔷 «МосМедИИ» – это нейросетевой сервис для дистанционного анализа лучевых исследований.
🔹 После подключения им можно пользоваться из любой точки РФ. Сервис анализирует снимки, показывает точность диагностики до 95%, видит огромное количество данных, дает полноценное врачебное заключение.
🔹 Провел уже больше полумиллиона успешных исследований.
Да, разумеется, за ним присматривают люди. А все-таки круто.
#AI #МосмедИИ
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤2🔥2
🌎 Mistral AI выпустила API для модерации контента.
🔵 Он выявляет нежелательный текст и нещадно с ним борется. Помимо оскорбительных сообщений распознает угрозы, «опасные запросы» и вот это вот всё.
🔷 Сервис Le Chat, для которого создан модератор – французский, но модель в основе API обучена на 11 языках, умеет анализировать контекст беседы и диалоги.
🔹 В целом же это означает, что вопросы безопасности ИИ постепенно выходят на первый план и помимо новых моделей и сервисов на их основе в моду входят разные системные меры защиты.
Посмотрим, что предложат остальные компании.
#AI #MistralAI
🙂 Artificial Intelion
🔵 Он выявляет нежелательный текст и нещадно с ним борется. Помимо оскорбительных сообщений распознает угрозы, «опасные запросы» и вот это вот всё.
🔷 Сервис Le Chat, для которого создан модератор – французский, но модель в основе API обучена на 11 языках, умеет анализировать контекст беседы и диалоги.
🔹 В целом же это означает, что вопросы безопасности ИИ постепенно выходят на первый план и помимо новых моделей и сервисов на их основе в моду входят разные системные меры защиты.
Посмотрим, что предложат остальные компании.
#AI #MistralAI
Please open Telegram to view this post
VIEW IN TELEGRAM
mistral.ai
Mistral Moderation API | Mistral AI
We are introducing our new moderation service enabling our users to detect undesirable text content along several policy dimensions.
👍2❤1🔥1
Фонд Andreessen Horowitz, который следит за всеми интересными процессами в мире технологий, считает, что развитие ИИ-моделей «скоро достигнет потолка».
🔵 По мнению экспертов фонда, пару лет назад модели от OpenAI сильно опережали аналоги, сейчас появилось несколько сопоставимых по мощности, и скоро их станет еще больше. Одним из основных препятствий для разработчиков ИИ называют глобальную нехватку GPU.
🔷 Ну, и открытый код в сумме с доступностью данных не способствуют жесткой конкуренции. Правда, в последнее время доступ к базам данных снижается и лабораториям ИИ приходится набирать людей для сбора обучающих данных.
А как же Super Intelligence?
#AI #Models #Horowitz
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3🔥3💯2
🔷 В чем суть: компания Microsoft добавила поддержку чат-ботов с ИИ в Windows Terminal. Правила и подробности, как водится, на ГитХабе.
🔹 После установки Windows Terminal Canary включаем «Terminal Chat» в меню и добавляем ключ API от OpenAI, GitHub или Azure. Готово, вы восхитительны.
🔹 И все шаманство для того, чтобы использовать все возможности ChatGPT, не покидая среды терминала.
Больше коллабораций хороших и разных!
#AI #Microsoft #WindowsTerminal
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - microsoft/terminal: The new Windows Terminal and the original Windows console host, all in the same place!
The new Windows Terminal and the original Windows console host, all in the same place! - microsoft/terminal
❤2👍2🔥2
🔵 Компания ByteDance предлагает добавить жизни в ваш фотоальбом с помощью ИИ-сервиса “X-Portrait 2”. Он не просто заставит лица на фото поморгать или улыбнуться, но добавит эмоций, драмы, динамики и вообще снимет маленькое кино, потому что обучен на сценах из фильмов.
🔷 Можно собственным лицом исполнить сцены из блокбастеров, ужастиков и всего, на что хватит фантазии.
🔹 Развлекательные цели понятны, но ведь есть еще реклама, лендинги и бесконечные творческие возможности.
Предыдущая версия выдавала мультипликацию, а эта обещает шедевры.
#AI #XPortrait2 #ByteDance
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3❤2👍1
🌎 Давно ли вы были в библиотеке? Мы вот только что.
Google не так давно открыл доступ к Gemini через библиотеку OpenAI и там появляется все больше интересного.
🔵 Разработчики могут использовать модели Gemini от Google через библиотеку OpenAI и REST API. Поддерживаются API завершения чата и API эмбедингов. Google обещал расширить совместимость в самое ближайшее время.
🔷 Есть примеры кода на разных языках: Python, Typescript/Javascript и REST для взаимодействия с Gemini API. По совету Google те, кто не использует, библиотеки OpenAI, могут сразу обращаться к Gemini API.
Читательский билет не требуют)
#AI #GoogleAI #Gemini
🙂 Artificial Intelion
Google не так давно открыл доступ к Gemini через библиотеку OpenAI и там появляется все больше интересного.
🔵 Разработчики могут использовать модели Gemini от Google через библиотеку OpenAI и REST API. Поддерживаются API завершения чата и API эмбедингов. Google обещал расширить совместимость в самое ближайшее время.
🔷 Есть примеры кода на разных языках: Python, Typescript/Javascript и REST для взаимодействия с Gemini API. По совету Google те, кто не использует, библиотеки OpenAI, могут сразу обращаться к Gemini API.
Читательский билет не требуют)
#AI #GoogleAI #Gemini
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4❤3👍2
🔷 Недавно релизнули GigaСhat MAX с доступом в tg-боте, веб-версии, через API - в режиме раннего доступа.
🔹 Новая модель понимает картинки, неплохо выглядит по бенчмаркам:
— 3 место на MERA, за gpt-4o и Llama-405B
— 92% правильных ответов на GSM-8k, 80% на MMLU и 75% на MMLU-RU
— на SBS с учётом красоты ответов модель выигрывает в 61% случаев у GPT-4 turbo и в 67% случаев у YaGPT-4 Pro.
— на Arena-Hard модель достигает 51% скора против GPT-4-0314
— на Vkhr Arena-General-RU модель достигает 90%, в то время как YaGPT-4 Pro достигает 59%.
🔹 И еще есть в ней что-то такое, душевное. Хвалёнушка там, кот Баюн, хорошее понимание естественного русского.
Ни к чему не призываем, просто вносим разнообразие)
#AI #GigaChat
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍1👎1😁1
🔷 По сути – теперь можно дообучить генератор в контексте промта с Lora (In-Context LoRA for Diffusion Transformers).
Создатели уверяют, что придумали «удивительно простой конвейер» со следующими функциями:
🔹 объединять изображения вместо токенов;
🔹 выполнять совместное субтитрование нескольких изображений;
🔹 применять настройку LoRA для конкретных задач с использованием небольших наборов данных (например, 20 образцов) вместо полной настройки с большими наборами данных.
В результате – раскадровка фильмов, портретные серии, создание «визуальной идентичности», шрифтов, фонов, спецэффектов и брендовых картинок. Стильно, модно, молодежно.
Подробности и код - здесь.
#AI #LoRA #DiT
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤1🔥1
🔷 Фактически, это означает, что музыку, странные звуки и фоны для роликов теперь можно будет добывать из самых фантастических промтов text2audio.
🔹 В релизе подмечено, что большие модели ограничены исключительно объёмом данных, т. к. сами аудиофайлы не содержат инструкции по их генерации.
🔹 А для Fugatto обещают «специализированный подход к генерации данных, оптимизированный для всего спектра задач по генерации и преобразованию аудиосигнала», что фактически обеспечит соответствие данных между аудио и естественным языком.
🔹 Подробности о технологии вывода, классификаторах и параметрах – здесь.
А для хейтеров сказано, что электронная музыка уже лет 50 как никого не смущает, только теперь, благодаря ИИ, она станет реально общим полем для творчества.
#AI #Nvidia #Fugatto
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤1🔥1
Как вечный ученик мудрости, наша модель подходит к каждой проблеме — будь то математика, код или знание нашего мира — с подлинным удивлением и сомнением. QwQ воплощает древний философский дух: она знает, что ничего не знает, и именно это движет еe любопытством. Прежде чем остановиться на каком-либо ответе, она обращается внутрь себя, подвергая сомнению свои собственные предположения, исследуя различные пути мысли, всегда ища более глубокую истину.
🔹 Поэму целиком можно прочитать в их блоге.
🔹 А всякую прозу вроде кода, параметров (кстати, весьма приличных), количества слоев, уровней внимания и показателей производительности смотрим здесь.
#AI #Alibaba #QwQ
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍2🔥1😁1
❄️ Декабрь на пороге, а это значит, что можно открывать рубрику #прогнозы2025, в которой каждый уважающий себя инфлюенсер от мира ИИ выскажет свое мнение о перспективах развития отрасли в новом году.
🔹 Начнем с Сэма Альтмана, который как раз взялся пророчествовать.
🔹 Если коротко, в наступающем году нас ждет релиз AGI (Artificial General Intelligence) – и с ним все будет ОК, несмотря на то, что прогресс в фундаментальных элементах GPT замедлился в последние месяцы. AGI превзойдет человеческий интеллект почти во всех аспектах, будет иметь возможность учиться, рассуждать, адаптироваться и выполнять любые интеллектуальные задачи.
🔹По мнению Альтмана, путь к AGI «в целом ясен»: брейнстормы и прорывы больше не нужны, впереди инженерная работа. А вообще, «прогресс только начинается».
🔹 В своем последнем эссе Альтман предсказал также искусственный суперинтеллект (ASI) для создания которого понадобится еще несколько лет.
🔹 Что же касается модели «Orion» от OpenAI, в компании сформировали новую «команду по основам» для устранения ключевых препятствий, включая нехватку высококачественных данных для обучения, и обещают показать результат все в том же 2025-м.
Ну а мы скоро вернемся с новыми прогнозами!)
#AI #OpenAI #Forecast2025
🙂 Artificial Intelion
🔹 Начнем с Сэма Альтмана, который как раз взялся пророчествовать.
🔹 Если коротко, в наступающем году нас ждет релиз AGI (Artificial General Intelligence) – и с ним все будет ОК, несмотря на то, что прогресс в фундаментальных элементах GPT замедлился в последние месяцы. AGI превзойдет человеческий интеллект почти во всех аспектах, будет иметь возможность учиться, рассуждать, адаптироваться и выполнять любые интеллектуальные задачи.
🔹По мнению Альтмана, путь к AGI «в целом ясен»: брейнстормы и прорывы больше не нужны, впереди инженерная работа. А вообще, «прогресс только начинается».
🔹 В своем последнем эссе Альтман предсказал также искусственный суперинтеллект (ASI) для создания которого понадобится еще несколько лет.
🔹 Что же касается модели «Orion» от OpenAI, в компании сформировали новую «команду по основам» для устранения ключевых препятствий, включая нехватку высококачественных данных для обучения, и обещают показать результат все в том же 2025-м.
Ну а мы скоро вернемся с новыми прогнозами!)
#AI #OpenAI #Forecast2025
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2❤1🔥1
🔷 В ближайшее время ждем Olympus – модель от Amazon, которая, по мнению инсайдеров, будет представлена на конференции AWS re:Invent.
🔹 Конференция началась сегодня в Лас-Вегасе и продлится
🔹 В программе – сессии, посвященные трендам AI/ML, погружение в инженерию облачных сервисов от Amazon, встречи с интересными людьми и ответы на вопросы.
🔹 Что же касается LLM Olympus, обещают, что модель сможет анализировать изображения и видео, находить определенные сцены с помощью текстовых подсказок (например, выигрышный бросок в баскетболе или ключевая сцена в фильме) и сможет составить достойную конкуренцию решениям на базе OpenAI.
Ждем, пока подвезут подробности.
#AI #AMS #Olympus
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍1🔥1
🔵 Максим Вязников, генеральный директор компании Intelion Cloud, принял участие в круглом столе IT-World, объединившем ведущих участников рынка.
🔹 Готова ли наша страна к внедрению ИИ? Достаточно ли у нас ресурсов? Какой помощи рынок ждет от государства? Чего ждать от экономики данных? И главное – с какими сложностями сталкивается отрасль прямо сейчас?
Если российская компания нанимает ML-разработчика, использует датасеты, обученные на объектах из США и ЕС, и внедряет решение на отечественном рынке, очевидно, результат будет не самым блестящим. При этом на рынке еще не выработаны стандарты качества, сложно найти специалиста, который знает, что и как делать правильно, – говорит Максим Вязников.
🔹 Мнения других экспертов по этому поводу, а также полная запись дискуссии – по ссылке.
#AI #IntelionCloud #ITWorld
Please open Telegram to view this post
VIEW IN TELEGRAM
ИТ Медиа | ИТ-рынок
Какой инфраструктуры для искусственного интеллекта не хватает в России?
Готова ли Россия к массовому внедрению ИИ, какими ресурсами для этого располагает, каких не хватает? Какой помощи рынок ждет от государства, объединят ли Сбер и «Яндекс» вычислительные мощности как будет развиваться инфраструктура для ИИ и чего ждать от экономики…
👍3🔥2
🔹 Скажем на Hugging Face открыли новый бесплатный обучающий (все слова хорошие!) курс по тюнингу языковых моделей под ваши конкретные задачи.
🔹 Пишут, что курс сугубо практический, требования к GPU минимальные,
🔹 Для участия переходите по ссылке, отправляете запрос - и приступаете. Репозиторий, упражнения, быстрые отклики рецензентов, обсуждение всех процессов в отдельной ветке – все как мы любим.
🔹Курс охватывает все этапы от начального обучения модели до релиза.
🔹 Речь именно о малых моделях, так как LLM, по мнению создателей курса, конечно, впечатляют, но часто требуют значительных вычислительных ресурсов и могут быть избыточными для специализированных приложений.
В целом, звучит логично.
#AI #HuggingFace #SmolLM2
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍1👏1
В OpenAI начался «насыщенный праздничный период анонсов в сфере ИИ». И да, он называется “shipmas”.
Суть в том, что каждый день из ближайших 12-ти компания будет выкатывать какой-то продукт или обновление, чтобы создать всем праздничное настроение 🎄
Обещают включить в анонсы долгожданный text2video видео Sora, новую «модель рассуждений» и многое другое.
Генеральный директор OpenAI Сэм Альтман подтвердил 12 дней анонсов на сцене конференции The New York Times “DealBook”.
В целом, новость отличная. Интересно только, почему все же анонсов именно 12, а не 21 или 64?
#Shipmas #OpenAI
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👏2😁2
А он, напомним, содержит 100 тысяч графических ускорителей Nvidia и, очевидно, жалуется на стабильную нехватку мощности.
Теперь команда xAI решила увеличить мощь интеллекта Colossus, догнав количество GPU до 1 миллиона. Работы по расширению уже ведутся с такой силой, что рядом с дата-центром xAI появятся офисы Nvidia, Dell и Supermicro.
Не совсем понятно, правда, зачем покупать GPU, если можно по хорошей цене взять в аренду у нас? Отправили Илону Маску спецпредложение со скидкой, надеемся, прочитает на выходных 😎
#AI #xAI #GPU
Please open Telegram to view this post
VIEW IN TELEGRAM
Ft
Elon Musk plans to expand Colossus AI supercomputer tenfold
Facility in Memphis expected to incorporate more than 1mn GPUs as billionaire’s xAI aims to catch up with rivals
👍3🔥2😁2❤1
Что она умеет: собственно, генерирует 3D пот текстовым промтам (по изображениям тоже, но в демоверсии на изображения иногда ругается). По тексту взаимопонимания больше. Результат экспортируется в GLB, что полезно для дальнейшего использования в различных редакторах.
На сегодняшний день заявлено 1.2 млрд параметров. В ближайшем будущем обещают версии с 342 млн, 1.1 млрд и 2 млрд параметров.
Обучена на наборе данных из 500 тысяч 3D-объектов.
Для полноразмерной версии нужна лицензия MIT, код и подробности можно посмотреть на ГитХабе.
#AI #Microsoft #TRELLIS
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥2🥰1