Arena-Hard — создание высококачественных тестов для оценки LLM
Arena-Hard позволяет оценивать ответы LLM по 7 конкретным показателям; критерии на изображении
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10❤3🔥2⚡1😁1🎉1
🐇📚 Alice’s Adventures in a
differentiable wonderland: Aprimer on designing neural networks
Алиса отправляется в дифференцируемую страну чудес!* 🔥
Новая бесплатная книга по проектированию нейронных сетей.
Отправляемся в увлекательное приключение по миру математики нс, от самых азов до трансформеров.
Отличный баланс между теорией и кодом, с историческими справками и описанием современных тенденций развития нс.
Приятный бонус это красивый дизайн и приятные иллюстрации.
Отличное приключение на выходные)
.
📓 Book
👉 А здесь полный репозиторий с бесплатными книгами по всем языкам
@ai_machinelearning_big_data
differentiable wonderland: Aprimer on designing neural networks
Алиса отправляется в дифференцируемую страну чудес!* 🔥
Новая бесплатная книга по проектированию нейронных сетей.
Отправляемся в увлекательное приключение по миру математики нс, от самых азов до трансформеров.
Отличный баланс между теорией и кодом, с историческими справками и описанием современных тенденций развития нс.
Приятный бонус это красивый дизайн и приятные иллюстрации.
Отличное приключение на выходные)
.
📓 Book
👉 А здесь полный репозиторий с бесплатными книгами по всем языкам
@ai_machinelearning_big_data
👍31🔥14❤9❤🔥3🥱1
This media is not supported in your browser
VIEW IN TELEGRAM
Имеет удобное API для обращения из Python, вот примеры такого использования
— Mistral 7B (v0.1 и v0.2)
— Gemma
— Llama, включая Llama 3
— Mixtral 8x7B
— Phi 2, Phi 3
— Qwen 2
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19🔥6❤3😁2
⚡️ ExecuTorch Alpha: Taking LLMs and AI to the Edge
PyTorch выпустили новую версию своего инструмента - ExecuTorch alpha.
Он предназначен для развертывания больших языковых моделей и запуска моделей на Edge девайсах.
Edge ML - это технология, которая приближает алгоритмы машинного обучения к источнику данных, что значительно сокращает задержку и улучшает возможности обработки данных в реальном времени.
ExecuTorch позволяет эффективно запускать Llama 2 7B и Llama 3 8B (и другие модели) на телефонах iPhone 15 Pro, iPhone 15 ProMax, Samsung Galaxy S22, S23 и S24 и других современных устройствах.
Разработчики постоянно улучшают производительность на разных edge девайсах и добавляют новые модели.
Здесь можно посмотреть тесты производительности.
• Announce
• Github
@ai_machinelearning_big_data
PyTorch выпустили новую версию своего инструмента - ExecuTorch alpha.
Он предназначен для развертывания больших языковых моделей и запуска моделей на Edge девайсах.
Edge ML - это технология, которая приближает алгоритмы машинного обучения к источнику данных, что значительно сокращает задержку и улучшает возможности обработки данных в реальном времени.
ExecuTorch позволяет эффективно запускать Llama 2 7B и Llama 3 8B (и другие модели) на телефонах iPhone 15 Pro, iPhone 15 ProMax, Samsung Galaxy S22, S23 и S24 и других современных устройствах.
Разработчики постоянно улучшают производительность на разных edge девайсах и добавляют новые модели.
Здесь можно посмотреть тесты производительности.
• Announce
• Github
@ai_machinelearning_big_data
❤14👍10🔥6
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍24🔥9❤4
OSWorld — это первая в своем роде масштабируемая среда для мультимодальных агентов, поддерживающая постановку задач, оценку на основе выполнения и интерактивное обучение в разных операционных системах.
OSWorld может служить унифицированной средой для оценки бессрочных компьютерных задач, включающих произвольные
приложения.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤10👍8🔥4🎉1