225K subscribers
3.82K photos
635 videos
17 files
4.46K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
⚡️ Continue — open-source расширение для VS Code и продуктов JetBrains для удобного внедрения AI-чатботов в свои рабочие процессы

Continue помогает очень удобно организовать использование AI в таких рабочих задачах как:
— Объяснение отдельных мест кода
— Автодополнение, рефакторинг функций
— Получение ответов на вопросы о своей кодовой базе
— Быстрое использование документации (и просто отдельных файлов) в качестве контекста
— Быстрый запуск действий с помощью /-команд
— Мгновенное объяснение ошибок прямо в терминале

Continue позволяет использовать подходящую LLM для работы, будь то открытый или закрытый исходный код, локальная или удаленная работа, использование чата или автозаполнения.
Можно очень гибко настроить расширение в соответствии с существующими рабочими процессами.

🖥 GitHub
🟡 Доки

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍35🔥42
This media is not supported in your browser
VIEW IN TELEGRAM
Это круто!

ИИ-агент Google просматривает демонстрацию агентов Openai и комментирует ее 🤯

@ai_machinelearning_big_data
😁50👍9🤬7🥱42🔥2
Zeus Новый инструмент экосистемы Pytorch

Глубокое обучение потребляет довольно много энергии.

Например, обучение одного 200B LLM на инстансах AWS p4d потребляет около 11,9 ГВт-ч (источник: CIDR 2024 keynote), это же количество энергии позволяет в одиночку обеспечивать энергией более тысячи домохозяйств в среднем по США в течение года.

📌 Zeus - это инструмент с открытым исходным кодом от Pytorch, для измерения и оптимизации энергопотребления рабочих нагрузок при обучении моделей.

- Cредства измерения энергопотребления графического процессора
- Несколько инструментов оптимизации энергопотребления, которые позволяют найти наилучшие конфигурации ML и/или GPU

Zeus может принести пользу тем, кто хотел бы:
- измерить и оптимизировать затраты на электроэнергию
- снизить тепловыделение GPU (за счет снижения энергопотребления)

Github
Подробнее
Docs

@ai_machinelearning_big_data
👍35🥱12🔥65🌭3
🌟 LibreChat — улучшенный свободный клон ChatGPT

LibreChat — open-source клон ChatGPT:
— предоставляет удобный API
— работает с Groq, GPT-4 Vision, Mistral, Bing, Anthropic, OpenRouter, Vertex AI, Gemini и другими моделями
— можно запустить полностью локально

Запуск локально:
git clone https://github.com/danny-avila/LibreChat.git
cd LibreChat
cp .env.example .env
docker compose up -d


🖥 GitHub
🟡 Подробнее о локальном запуске
🟡 Использовать онлайн

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
26👍21🔥9❤‍🔥2
🔥 Исследование «AlphaMath Almost Zero: process Supervision without process» — прорыв в области решения математических задач с помощью LLM

Недавние достижения в области LLM значительно расширили их способности к математическим рассуждениям. Однако эти модели все еще не справляются со сложными задачами, требующими множества шагов рассуждения, что часто приводит к логическим или числовым ошибкам.
В данном исследовании представляется инновационный подход, который устраняет необходимость в ручном аннотировании, при помощи фреймворка Monte Carlo Tree Search (MCTS) для автоматического контроля и оценки процесса.
В работе показано, что усовершенствование LLM с помощью MCTS значительно повышает эффективность модели при решении сложных математических задач.

В отличие от других методов, таких как Program-of-thought и Chain-of-thought, при использовании MCTS не требуется никаких готовых решений.

📎 Arxiv
🟡 Обсуждение в треде X

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍338🔥7😁3
This media is not supported in your browser
VIEW IN TELEGRAM
🖥 Так можно использовать API GPT-4o vision в Jupyter Notebook

Удобство Python и мощь GPT-4o.
GPT-4o распознаёт вводимые жесты и подбирает максимально подходящие по виду графики кривых и генерирует код.

Распознаются даже довольно сложные композиции из разных линий и текста.

Github

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍36🔥147
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Grounding DINO 1.5: Most Capable Open-World Object Detection Model Series.

DINO 1.5: самая мощная серия моделей IDEA Research для обнаружения объектов.

Это наиболее эффективный опенсорс инструмент для запуска на edge девайсах, с хорошей оптимизацией и высокой скоростью работы.

Исходный код выпущен в версии Apache 2.0. 💙

Github
Paper
Demo

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥54👍154
😐 Toon3D: Seeing Cartoons from a New Perspective

Новый инструмент для реконструкции сцен из мультфильмов и аниме.

Toon 3D может восстанавливать ракурсы камеры и плотную геометрию помещений.

Такие методы, как COLMAP, не могут реконструировать негеометрические изображения, нарисованные от руки, но Toon 3D справляется с этой задачей. Вы только посмотрите на примеры выше!

Github: https://github.com/ethanweber/toon3d
Paper: https://arxiv.org/abs/2405.10320
Dem
Proj: https://toon3d.studio

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20👍64🤔2🥰1
🌟 ChatGPT теперь поддерживает Google Drive и OneDrive

OpenAI расширила возможности анализа данных в ChatGPT с использованием Google Drive и OneDrive.

Теперь файлы в чат-бот можно будет загружать напрямую из Google Drive и Microsoft OneDrive.
ChatGPT получит доступ к сервисам Google, таким как таблицы, документы, презентации и платформам Microsoft, таким как Excel, Word и PowerPoint.

Кроме того, в чат-бот внедрят расширяемое представление для таблиц и диаграмм. Когда пользователи добавляют набор данных, ChatGPT создаст интерактивную таблицу, которую можно развернуть в полноэкранном режиме. Наконец, можно будет кликать на определённые области таблицы, чтобы задать дополнительные вопросы или выбрать подсказки.

Например, пользователи смогут попросить ChatGPT объединить несколько электронных таблиц, содержащих ежемесячные расходы, и создать сводную с классификацией по типам расходов. Чат-бот также предлагает настраиваемые и интерактивные диаграммы, включая гистограммы, линии, круговые и точечные диаграммы. Все их можно будет загружать для использования в презентациях или документах.

Улучшения будут доступны пользователям ChatGPT Plus, Team и Enterprise в ближайшие недели.

📎 Подробнее

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3710🔥9👏2
Media is too big
VIEW IN TELEGRAM
🔥 Встречайте CAT3D от Google

CAT3D позволяет создавать что угодно в 3D с помощью диффузионных моделей.

Достижения в области 3D-реконструкции позволили осуществить высококачественную 3D-съемку, однако для создания 3D-сцены пользователю приходилось собирать от сотен до тысяч изображений.
Теперь процесс 3D-реконструкции сильно упрощается.
CAT3D использует под капотом воссоздание реального мира с помощью многоракурсной диффузионной модели.
CAT3D может создавать целые 3D-сцены всего за одну минуту и превосходит существующие методы создания 3D-сцен.

▶️ Страничка CAT3D
🟡 Arxiv

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍377🔥5🥰3😎2👏1
🧠 Awesome AGI Survey

Как Далеко Мы Находимся От AGI?

AGI (artificial general intelligence) – это область теоретических исследований искусственного интеллекта, которая стремится создать программное обеспечение с интеллектом, подобным человеческому, и способностью к самообучению.

AGI, отличается способностью выполнять разнообразные задачи в реальном мире с эффективностью, сравнимой с человеческим интеллектом, отражает важнейшую веху в развитии искусственного интеллекта.

Здесь представлен большой структурированный список обязательных к прочтению статей по AGI, на которые стоит обратить внимание.

Github

@ai_machinelearning_big_data
👍33🔥64🤨2🤣1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Moondream WebGPU — небольшая VLM, поддерживающая обработку изображений, работает локально в браузере

Moondream WebGPU — это VLM (Vision-Language Model) с 1.86 миллиардами параметров.
После загрузки модель (1.8 ГБ) будет кэширована и повторно использована при повторном посещении страницы.

Все выполняется непосредственно в браузере с помощью Transformers.js и ONNX Runtime Web, то есть ваши разговоры не отправляются на сервер.

🤗 Hugging Face

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍37🔥51🗿1
🌟 Verba — open-source приложение для обеспечения сквозного, оптимизированного и удобного интерфейса для Retrieval-Augmented Generation

pip install goldenverba

Verba — это полностью настраиваемый AI-помощник для запросов и взаимодействия с вашими данными, как локальными, так и развернутыми в облаке.
Отвечает на вопросы, связанные с вашими документами, получает информацию из существующих баз знаний. Verba сочетает в себе современные технологии RAG и контекстно-зависимую базу данных Weaviate. Выбирайте между различными фреймворками RAG, типами данных, методами разбивки и поиска и поставщиками LLM в зависимости от конкретного случая использования.

Позволяет использовать разные LLM: как от HuggingFace и Ollama, так и от OpenAI, Cohere и Google.

🖥 GitHub

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍45🥰62🤔2🍾1