Machinelearning

⚡️ ExecuTorch Alpha: Taking LLMs and AI to the Edge

PyTorch выпустили новую версию своего инструмента - ExecuTorch alpha.

Он предназначен для развертывания больших языковых моделей и запуска моделей на Edge девайсах.

Edge ML - это технология, которая приближает алгоритмы машинного обучения к источнику данных, что значительно сокращает задержку и улучшает возможности обработки данных в реальном времени.

ExecuTorch позволяет эффективно запускать Llama 2 7B и Llama 3 8B (и другие модели) на телефонах iPhone 15 Pro, iPhone 15 ProMax, Samsung Galaxy S22, S23 и S24 и других современных устройствах.

Разработчики постоянно улучшают производительность на разных edge девайсах и добавляют новые модели.
Здесь можно посмотреть тесты производительности.

• Announce
• Github

@ai_machinelearning_big_data

❤14👍10🔥6

9.51K viewsedited 08:58

Machinelearning

⚡️

llamafile — утилита для быстрого запуска ИИ-моделей

⏩Инструмент llamafile от Mozilla даёт возможность упаковать веса LLM в исполняемый файл, который без установки можно запустить практически на любой современной платформе. Поддерживаются архитектуры x86-64 и ARM64, а также системы macOS, Windows, Linux, FreeBSD, OpenBSD и NetBSD.

⏩llamafile работает практически со всеми LLM, недавно была добавлена поддержка модели Phi-3 Mini 4k, а также LLaMA3, Grok, Mixtral 8x22b и Command-R.

🖥

GitHub

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍24🔥9❤4

11.8K views09:12

Machinelearning

🌟

OSWorld — среда для оценки мультимодальных AI-агентов

OSWorld — это первая в своем роде масштабируемая среда для мультимодальных агентов, поддерживающая постановку задач, оценку на основе выполнения и интерактивное обучение в разных операционных системах.
OSWorld может служить унифицированной средой для оценки бессрочных компьютерных задач, включающих произвольные
приложения.

🖥

GitHub

🟡

Arxiv

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤10👍8🔥4🎉1

11.3K views13:02

Machinelearning

🖥

Похоже, что OpenAI собирается занять позиции Google и запустить свои поисковик.

Это может быть самой серьезной угрозой, с которой Google когда-либо сталкивался.

В журналах регистрации SSL-сертификатов Openai добавили домен http://search.chatgpt.com

Это не слишком удивительно, учитывая:
1. В OpenAI есть веб сканер GPTBot.
2. Пользователи ChatGPT Plus имеет функциб Browse для поиска информации в Интернете.
3. Microsoft Bing использует движок GPT-4 от OpenAI, настроенный для поиска.

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍54🔥14❤7❤‍🔥2🤔2

10.2K views14:18

Machinelearning

🔥 Prometheus-Eval 🔥

Prometheus 2: Языковая модель с открытым исходным кодом, специализирующаяся на оценке других языковых моделей.

По сравнению с Prometheus 1 (13B), Prometheus 2 (8x7B) - обеспечивает более точные оценки моделей и также поддерживает оценку в формате попарного ранжирования (относительной классификации)!

На 8 бенчмарках Prometheus 2 демонстрирует наивысшую корреляцию с оценками, сделанными экспертами.

⚡ Поддерживает оценку Prometheus, GPT-4 и Claude-3 🚀 ⚡


pip install prometheus-eval

• Github: https://github.com/prometheus-eval/prometheus-eval
• Paper: arxiv.org/abs/2405.01535

@ai_machinelearning_big_data

👍19❤4🔥4

9.85K viewsedited 08:46

Machinelearning

🚀 AI2 presents WildChat: 1M ChatGPT Interaction Logs in the Wild

Новый крутой датасет - Wild Chat, состоящий 1 миллиона реальных взаимодействий пользователей с ChatGPT, характеризующихся широким спектром языков и разнообразием промптов.

Он был собран путем предоставления бесплатного доступа всем желающим к ChatGPT и GPT-4 в обмен на сбор истории чатов.

Используя этот датасет, разработчики создали бота WildLlama-7b-user-assistant на базе Llama-2, который способен предсказывать как промптов пользователя, так и ответы, которые может выбрать Chatgpt.

Пользуйтесь )

• proj: https://wildchat.allen.ai
• abs: https://arxiv.org/abs/2405.01470

@ai_machinelearning_big_data

👍22🥰3❤2🔥1

9.12K viewsedited 12:16

Machinelearning

⭐️

StoryDiffusion: Consistent Self-Attention for Long-Range Image and Video Generation

StoryDiffusion - новый инструмент, для создания, последовательных историй: изображений и видео.

Модель позволяет создавать комиксы в различных стилях, с акцентом на последовательное повествование и поддержание единого стиля окружения, персонажей и их одежды.

StoryDiffusion совместим со всеми моделями на базе SD1.5 и SDXL.

• Github: https://github.com/HVision-NKU/StoryDiffusion
• Paper: https://arxiv.org/abs/2405.01434
• Demo: https://storydiffusion.github.io

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍28🔥13❤4👏2

12.6K views16:54

Machinelearning

⚡️ Google just dropped Code Gemma 1.1 7B IT 🔥

СЮРПРИЗ: Google только что выпустила Code Gemma 1.1 7B IT 🔥

Модели постепенно становятся все совершеннее в генерации кода .

Значительный прогресс достигнут для C#, Go, Python 🐍

Вместе с версией 7B они также выпустили обновленную базовую модель 2B.

Наслаждайтесь!

• 7B: https://huggingface.co/google/codegemma-1.1-7b-it
• 2B: https://huggingface.co/google/codegemma-1.1-2b
• Report: https://storage.googleapis.com/deepmind-media/gemma/codegemma_report.pdf

@ai_machinelearning_big_data

👍36🔥8🤔3❤2

15.4K viewsedited 09:57

Machinelearning

⚡️ Finetuning for Text Classification

Если вы ищете чем занаться на выходных и хотите немного почитать и покодить,- вот свежая глава из книги Build an LLM from Scratch, по настройке GPT-модели для классификации СПАМ-сообщений с точностью до 96%.

Модель небольшая и обучение на MacBook Air M3 занимает ~ 5 минут.

▪ Github

#book #tutorial #llm

@ai_machinelearning_big_data

👍30🔥10❤3😁1

11.5K viewsedited 16:21

Machinelearning

🧑‍💻

StarCoder2-Instruct: Fully Transparent and Permissive Self-Alignment for Code Generation

StarCoder2-Instruct - это первый полностью самонастраивающийся LLM-разработчик кода с помощью конвейера Hugging Face.

Этот конвейер использует StarCoder2-15B для генерации тысяч пар "промпт-ответ", которые затем используются для точной настройки StarCoder-15B без каких-либо человеческих аннотаций или дистиллированных данных из огромных и проприетарных LLM.

StarCoder2-15B-Instruct набрал 72,6 балла по шкале HumanEval и даже превосходит CodeLlama-70B-Instruct с ее 72,0 балла !

Оценки на LiveCodeBench показывают, что самонастраивающаяся модель работает даже лучше, чем та же модель, обученная на основе данных, полученных из GPT-4, это означает, что LLM может более эффективно учиться на собственных данных.

▪Blog: https://huggingface.co/blog/sc2-instruct
▪Model: https://huggingface.co/bigcode/starcoder2-15b-instruct-v0.1
▪Dataset: https://huggingface.co/datasets/bigcode/self-oss-instruct-sc2-exec-filter-50k
▪Code: https://github.com/bigcode-project/starcoder2-self-align

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍25❤8🔥7😁1

11.3K views09:34

📌 The Possibilities of AI [Entire Talk] - Sam Altman (OpenAI)

3 дня назаю в Стэнфорде Сэм Альтман поделился своими мыслями об искусственном интеллекте.
Сложно остановиться и перестать пересматривать некоторые моменты.

Вот 6 ключевых мыслей:

🟡"Мне все равно, сожжём ли мы 500 миллионов долларов или 50 миллиардов... мы создадим AGI, и это будет того стоить".

🟡"В краткосрочной перспективе все меняется меньше, чем мы думаем. В долгосрочной перспективе все изменится сильнее, чем мы думаем".

🟡"GPT-5 будет намного умнее GPT-4 в общем смысле. И я думаю, что серьезность этого утверждения недооценивается".

🟡"Глобальный доступ к вычислениям — это право человека, и наша задача — понять, как обеспечить большее число людей этой возможностью".

🟡"Не ко всему можно заранее подготовиться. Вы учитесь управлять стартапом во время управления стартапом".

🟡"ChatGPT в лучшем случае вызывает легкое недоумение. GPT-4 — самая тупая модель из всех, чем вы сможете пользоваться скоро... очень скоро".

▶️

Вот этот разговор в Стэнфорде

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍44🔥12😁7🤔7❤6👏1

15.2K viewsedited 13:52

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️

Quivr — "Obsidian" с ИИ

Quivr — это open-source локальная и приватная альтернатива OpenAI GPTs и ChatGPT.

Позволяет извлекать информацию из локальных файлов (PDF, CSV, Excel, Word, аудио, видео...), используя Langchain, GPT 3.5/4 turbo, Private, Anthropic, VertexAI, Ollama, LLMs, Groq.
Даёт возможность легко делится своей базой знаний через публичную ссылку.

Quivr работает в автономном режиме, поэтому вы можете получить доступ к своим данным в любое время и в любом месте.

🖥

GitHub

🟡

Страничка Quivr

#llm #local

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍27🔥16❤5🥰1

11.5K viewsedited 07:04

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️OpenDevin

OpenDevin — это open-source проект, цель которого - воспроизвести Devin, автономного AI-программиста, способного выполнять сложные инженерные задачи и активно сотрудничать с пользователями в проектах по разработке ПО.

OpenDevin стремится повторить, улучшить и усовершенствовать Devin.

Запуск OpenDevin с помощью Docker:


# The directory you want OpenDevin to modify. MUST be an absolute path!
export WORKSPACE_BASE=$(pwd)/workspace


docker run \
    --pull=always \
    -e SANDBOX_USER_ID=$(id -u) \
    -e WORKSPACE_MOUNT_PATH=$WORKSPACE_BASE \
    -v $WORKSPACE_BASE:/opt/workspace_base \
    -v /var/run/docker.sock:/var/run/docker.sock \
    -p 3000:3000 \
    --add-host host.docker.internal=host-gateway \
    ghcr.io/opendevin/opendevin:0.5

▪GitHub
▪Страничка OpenDevin

@ai_machinelearning_big_data

🔥21👍12❤2❤‍🔥1

12.4K views10:02

About

Blog

Apps

Platform