274K subscribers
3.94K photos
674 videos
17 files
4.53K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
⭐️ PaliGemma by Google is out! A family of 116 new models.

Еще один ништячок от Google, - "PaliGemma"! 🚀

Семейство из 116 новых моделей, которые могут подписывать изображения, отвечать на вопросы, распознавать объекты, сегментировать изображения и многое другое!

PaliGemma (Github) - это семейство моделей визуализации с архитектурой, состоящей из SIGLIP-So 400m в качестве кодера изображений и Gemma-2B в качестве декодера текста.

SigLIP - это современная модель, которая может распознавать как изображения, так и текст. Как и CLIP, он состоит из кодера изображений и текста. Как и в случае с PALI-3, комбинированная модель Paligemma работает на основе графических и текстовых данных, а затем может быть легко адаптирована для последующих задач, таких как создание субтитров.

Gemma - это модель для генерации текста, предназначенная только для декодера. Сочетание графического кодера Siglip и линейного адаптера Gemma позволяет использовать Paligemma в качестве мощной модели визуализации.

Блог: https://hf.co/blog/paligemma
Модели: https://hf.co/collections/google/paligemma-release-6643a9ffbf57de2ae0448dda
Demo: https://hf.co/spaces/google/paligemma

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍196🔥3😴2
This media is not supported in your browser
VIEW IN TELEGRAM
🪄 И снова Google, они только что анонсировали Illuminate → https://illuminate.withgoogle.com

Illuminate использует ИИ для переосмысления процесса обучения, превращая сложные исследовательские работы в увлекательные беседы.

Обсуждения создаются с помощью искусственного интеллекта и основаны на загруженных научных статьях.

Illuminate - это экспериментальная технология, которая использует ИИ для адаптации контента к вашим предпочтениям в обучении.

📌 Бегом записываться в лист ожидания, тут же можно послушать примеры: https://illuminate.withgoogle.com/home

@ai_machinelearning_big_data
👍43🔥125
⚡️ Lobe Chat — open-source фреймворк ChatGPT/LLM

Поддерживает синтез речи, разные режимы и расширяемую (вызов функций) систему плагинов.
Позволяет реализовать развертывание в один клик частного чат-приложения OpenAI ChatGPT/Claude/Gemini/Groq/Ollama.

🖥 GitHub

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍28🔥43👏1
⚡️ Continue — open-source расширение для VS Code и продуктов JetBrains для удобного внедрения AI-чатботов в свои рабочие процессы

Continue помогает очень удобно организовать использование AI в таких рабочих задачах как:
— Объяснение отдельных мест кода
— Автодополнение, рефакторинг функций
— Получение ответов на вопросы о своей кодовой базе
— Быстрое использование документации (и просто отдельных файлов) в качестве контекста
— Быстрый запуск действий с помощью /-команд
— Мгновенное объяснение ошибок прямо в терминале

Continue позволяет использовать подходящую LLM для работы, будь то открытый или закрытый исходный код, локальная или удаленная работа, использование чата или автозаполнения.
Можно очень гибко настроить расширение в соответствии с существующими рабочими процессами.

🖥 GitHub
🟡 Доки

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍35🔥42
This media is not supported in your browser
VIEW IN TELEGRAM
Это круто!

ИИ-агент Google просматривает демонстрацию агентов Openai и комментирует ее 🤯

@ai_machinelearning_big_data
😁50👍9🤬7🥱42🔥2
Zeus Новый инструмент экосистемы Pytorch

Глубокое обучение потребляет довольно много энергии.

Например, обучение одного 200B LLM на инстансах AWS p4d потребляет около 11,9 ГВт-ч (источник: CIDR 2024 keynote), это же количество энергии позволяет в одиночку обеспечивать энергией более тысячи домохозяйств в среднем по США в течение года.

📌 Zeus - это инструмент с открытым исходным кодом от Pytorch, для измерения и оптимизации энергопотребления рабочих нагрузок при обучении моделей.

- Cредства измерения энергопотребления графического процессора
- Несколько инструментов оптимизации энергопотребления, которые позволяют найти наилучшие конфигурации ML и/или GPU

Zeus может принести пользу тем, кто хотел бы:
- измерить и оптимизировать затраты на электроэнергию
- снизить тепловыделение GPU (за счет снижения энергопотребления)

Github
Подробнее
Docs

@ai_machinelearning_big_data
👍35🥱12🔥65🌭3
🌟 LibreChat — улучшенный свободный клон ChatGPT

LibreChat — open-source клон ChatGPT:
— предоставляет удобный API
— работает с Groq, GPT-4 Vision, Mistral, Bing, Anthropic, OpenRouter, Vertex AI, Gemini и другими моделями
— можно запустить полностью локально

Запуск локально:
git clone https://github.com/danny-avila/LibreChat.git
cd LibreChat
cp .env.example .env
docker compose up -d


🖥 GitHub
🟡 Подробнее о локальном запуске
🟡 Использовать онлайн

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
26👍21🔥9❤‍🔥2
🔥 Исследование «AlphaMath Almost Zero: process Supervision without process» — прорыв в области решения математических задач с помощью LLM

Недавние достижения в области LLM значительно расширили их способности к математическим рассуждениям. Однако эти модели все еще не справляются со сложными задачами, требующими множества шагов рассуждения, что часто приводит к логическим или числовым ошибкам.
В данном исследовании представляется инновационный подход, который устраняет необходимость в ручном аннотировании, при помощи фреймворка Monte Carlo Tree Search (MCTS) для автоматического контроля и оценки процесса.
В работе показано, что усовершенствование LLM с помощью MCTS значительно повышает эффективность модели при решении сложных математических задач.

В отличие от других методов, таких как Program-of-thought и Chain-of-thought, при использовании MCTS не требуется никаких готовых решений.

📎 Arxiv
🟡 Обсуждение в треде X

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍338🔥7😁3
This media is not supported in your browser
VIEW IN TELEGRAM
🖥 Так можно использовать API GPT-4o vision в Jupyter Notebook

Удобство Python и мощь GPT-4o.
GPT-4o распознаёт вводимые жесты и подбирает максимально подходящие по виду графики кривых и генерирует код.

Распознаются даже довольно сложные композиции из разных линий и текста.

Github

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍36🔥147
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Grounding DINO 1.5: Most Capable Open-World Object Detection Model Series.

DINO 1.5: самая мощная серия моделей IDEA Research для обнаружения объектов.

Это наиболее эффективный опенсорс инструмент для запуска на edge девайсах, с хорошей оптимизацией и высокой скоростью работы.

Исходный код выпущен в версии Apache 2.0. 💙

Github
Paper
Demo

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥54👍154
😐 Toon3D: Seeing Cartoons from a New Perspective

Новый инструмент для реконструкции сцен из мультфильмов и аниме.

Toon 3D может восстанавливать ракурсы камеры и плотную геометрию помещений.

Такие методы, как COLMAP, не могут реконструировать негеометрические изображения, нарисованные от руки, но Toon 3D справляется с этой задачей. Вы только посмотрите на примеры выше!

Github: https://github.com/ethanweber/toon3d
Paper: https://arxiv.org/abs/2405.10320
Dem
Proj: https://toon3d.studio

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20👍64🤔2🥰1
🌟 ChatGPT теперь поддерживает Google Drive и OneDrive

OpenAI расширила возможности анализа данных в ChatGPT с использованием Google Drive и OneDrive.

Теперь файлы в чат-бот можно будет загружать напрямую из Google Drive и Microsoft OneDrive.
ChatGPT получит доступ к сервисам Google, таким как таблицы, документы, презентации и платформам Microsoft, таким как Excel, Word и PowerPoint.

Кроме того, в чат-бот внедрят расширяемое представление для таблиц и диаграмм. Когда пользователи добавляют набор данных, ChatGPT создаст интерактивную таблицу, которую можно развернуть в полноэкранном режиме. Наконец, можно будет кликать на определённые области таблицы, чтобы задать дополнительные вопросы или выбрать подсказки.

Например, пользователи смогут попросить ChatGPT объединить несколько электронных таблиц, содержащих ежемесячные расходы, и создать сводную с классификацией по типам расходов. Чат-бот также предлагает настраиваемые и интерактивные диаграммы, включая гистограммы, линии, круговые и точечные диаграммы. Все их можно будет загружать для использования в презентациях или документах.

Улучшения будут доступны пользователям ChatGPT Plus, Team и Enterprise в ближайшие недели.

📎 Подробнее

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3710🔥9👏2
Media is too big
VIEW IN TELEGRAM
🔥 Встречайте CAT3D от Google

CAT3D позволяет создавать что угодно в 3D с помощью диффузионных моделей.

Достижения в области 3D-реконструкции позволили осуществить высококачественную 3D-съемку, однако для создания 3D-сцены пользователю приходилось собирать от сотен до тысяч изображений.
Теперь процесс 3D-реконструкции сильно упрощается.
CAT3D использует под капотом воссоздание реального мира с помощью многоракурсной диффузионной модели.
CAT3D может создавать целые 3D-сцены всего за одну минуту и превосходит существующие методы создания 3D-сцен.

▶️ Страничка CAT3D
🟡 Arxiv

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍377🔥5🥰3😎2👏1