# клонируем репо и перемещаемся в папку
git clone https://github.com/OpenBMB/MiniCPM-V.git
cd MiniCPM-V
# создаём conda-окружение
conda create -n MiniCPM-V python=3.10 -y
conda activate MiniCPM-V
pip install -r requirements.txt
MiniCPM-Llama3-V 2.5 имеет 8 млрд параметров и может принимать на вход изображения и текст.
Имея всего 8 млрд параметров, эта модель в некоторых тестах превосходит GPT-4V-1106, Gemini Pro, Claude 3 Qwen-VL-Max и MLLM на базе Llama 3.
Модель может обрабатывать изображения с количеством пикселей до 1.8 млн, показывает всего 10.3% галлюцинаций на Object HalBench, поддерживает ~30 языков (русский тоже), активно используется квантование для общей оптимизации.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Elia — удобный терминальный UI для взаимодействия с LLM.
Корректно отображает вывод от ChatGPT, Claude, Llama 3, Phi 3, Mistral, Gemma и не только.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Установка Sweep CLI:
pip install sweepai
Работает очень просто: нужно описать ошибки, функции, которые необходимо реализовать, и Sweep:
— прочитает вашу кодовую базу
— спланирует изменения
— создаст pull request с нужным кодом
Особенно удобно использовать Sweep для написания тестов
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Open WebUI — это расширяемый и удобный в использовании веб-интерфейс, предназначенный для работы полностью в автономном режиме.
Без проблем отображает выводы от разных LLM, включая Ollama, работает с OpenAI-совместимыми API.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Большой список из более чем 50 учебников по машинному обучению, искусственному интеллекту, глубокому обучению, компьютерному зрению и т.д.
Книги со ссылками для скачивания в PDF и в веб формате.
📚 BOOKS: https://franknielsen.github.io/Books/CuratedBookLists.html
#books #книги
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
На днях Yizhou Zhao, Tuanfeng Y. Wang и ещё несколько ребят из Adobe представили работу по SynCHMR — реконструкции движения камеры на основе видео.
Представленный ими метод позволяет восстанавливать траекторию движения камеры и облака точек сцены по видео.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Релиз YandexGPT 3 Lite
Яндекс представил облегченную версию генеративной модели третьего поколения. Нейросеть лучше справляется со сценариями, в которых важна скорость ответа. Например, чат-бот на сайте, исправление орфографических ошибок в текстах, анализ данных и так далее.
YandexGPT 3 Lite доступна клиентам Yandex Cloud для интеграции через API. Модель можно протестировать в демо-режиме бесплатно.
▪️Подробнее
@ai_machinelearning_big_data
Яндекс представил облегченную версию генеративной модели третьего поколения. Нейросеть лучше справляется со сценариями, в которых важна скорость ответа. Например, чат-бот на сайте, исправление орфографических ошибок в текстах, анализ данных и так далее.
YandexGPT 3 Lite доступна клиентам Yandex Cloud для интеграции через API. Модель можно протестировать в демо-режиме бесплатно.
▪️Подробнее
@ai_machinelearning_big_data
npm i -g @janhq/cortex
cortex init
cortex models pull janhq/TinyLlama-1.1B-Chat-v1.0-GGUF
cortex models start janhq/TinyLlama-1.1B-Chat-v1.0-GGUF
cortex chat --model janhq/TinyLlama-1.1B-Chat-v1.0-GGUF
Cortex — это open-source AI-движок для создания LLM-приложений.
Можно импортировать в виде библиотеки Cortex или использовать как сервер.
В настоящее время Cortex поддерживает:
— Llama.cpp
— TensorRT-LLM
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
import ChatTTS
from IPython.display import Audio
chat = ChatTTS.Chat()
chat.load_models()
texts = ["<PUT YOUR TEXT HERE>",]
wavs = chat.infer(texts, use_decoder=True)
Audio(wavs[0], rate=24_000, autoplay=True)
ChatTTS — это модель преобразования текста в речь, разработанная специально для сценариев диалога, таких как LLM-ассистент.
ChatTTS поддерживает как английский, так и китайский языки (если кому актуально).
🤗 Погонять в Hugging Face
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Scribble SDXL создан на основе SDXL ControlNet и его можно без проблем запустить на Hugging Face (спасибо
linoy_tsaban
из X).Можно выбирать разные стили и экспериментировать
🤗 Scribble SDXL
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Модель основана на GPT-4o, она может работать с текстовой и визуальной информациией, поддерживает передовые инструменты анализа данных.
ChatGPT Edu включает в себя средства безопасности и контроля корпоративного уровня для образовательных учреждений.
Новая модель дает возможность создавать пользовательские версии ChatGPT, и делиться ими для совместных исследований и обучения.
- Значительно более высокие лимиты на количество сообщений, чем в бесплатной версии ChatGPT
- Улучшены языковые возможности по качеству и скорости работы, поддерживается более 50 языков
- Надежная защита информации,конфиденциальность данных и продвинутые административные средства управления ИИ.
ChatGPT Edu призван заменить репетиторов и предоставляет:
* Обратную связь и поддержку
* Обучение и выставление оценок
* Интеграцию с образовательными ресурсами
openai.com/index/introducing-chatgpt-edu/
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
—
ollama run codestral:22b
29 мая Mistral представили Codestral с 22 миллиардами параметров.
Это генеративная модель с открытыми весами, предназначенная в первую очередь для задач генерации кода.
Умеет писать и рефакторить код, подсказывает наилучшие решения задач и даже паттерны проектирования. Её можно интегрировать в свои проекты с помощью API или просто использовать в VS Code. Нейросеть знает даже Fortran и COBOL.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Победителями жюри выбрало три работы:
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
InstaDrag — подход, позволяющий редактировать изображение с помощью простого жеста перетаскивания за ~1 секунду.
При этом InstaDrag справляется и со сложными деформациями части изображения, не представленными в обучающих данных (такие деформации — это, например, удлинение волос, искривление радуги и т. д.).
В будущем планируется интеграция InstaDrag с SDXL
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Это быстрая версия Scribble SDXL, о которой мы недавно писали.
Использует SDXL Flash и Scribble SDXL, что позволяет ещё быстрее получать качественные изображения из простых набросков и каракулей
🤗 Запустить на Hugging Face
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Devil70B — это модель без цензуры и ограничений, во всяком случае так заявляют разработчики. Она отвечает на любой вопрос и поддерживает русский язык.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM