# клонируем репо и перемещаемся в папку
git clone https://github.com/OpenBMB/MiniCPM-V.git
cd MiniCPM-V
# создаём conda-окружение
conda create -n MiniCPM-V python=3.10 -y
conda activate MiniCPM-V
pip install -r requirements.txt
MiniCPM-Llama3-V 2.5 имеет 8 млрд параметров и может принимать на вход изображения и текст.
Имея всего 8 млрд параметров, эта модель в некоторых тестах превосходит GPT-4V-1106, Gemini Pro, Claude 3 Qwen-VL-Max и MLLM на базе Llama 3.
Модель может обрабатывать изображения с количеством пикселей до 1.8 млн, показывает всего 10.3% галлюцинаций на Object HalBench, поддерживает ~30 языков (русский тоже), активно используется квантование для общей оптимизации.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍60🔥17❤4🥰3😁2
This media is not supported in your browser
VIEW IN TELEGRAM
Elia — удобный терминальный UI для взаимодействия с LLM.
Корректно отображает вывод от ChatGPT, Claude, Llama 3, Phi 3, Mistral, Gemma и не только.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍34❤16🔥5
Установка Sweep CLI:
pip install sweepai
Работает очень просто: нужно описать ошибки, функции, которые необходимо реализовать, и Sweep:
— прочитает вашу кодовую базу
— спланирует изменения
— создаст pull request с нужным кодом
Особенно удобно использовать Sweep для написания тестов
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥58👍33❤3
This media is not supported in your browser
VIEW IN TELEGRAM
Open WebUI — это расширяемый и удобный в использовании веб-интерфейс, предназначенный для работы полностью в автономном режиме.
Без проблем отображает выводы от разных LLM, включая Ollama, работает с OpenAI-совместимыми API.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍26❤10🥰3
Большой список из более чем 50 учебников по машинному обучению, искусственному интеллекту, глубокому обучению, компьютерному зрению и т.д.
Книги со ссылками для скачивания в PDF и в веб формате.
📚 BOOKS: https://franknielsen.github.io/Books/CuratedBookLists.html
#books #книги
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍46🔥13❤7🐳1😨1
This media is not supported in your browser
VIEW IN TELEGRAM
На днях Yizhou Zhao, Tuanfeng Y. Wang и ещё несколько ребят из Adobe представили работу по SynCHMR — реконструкции движения камеры на основе видео.
Представленный ими метод позволяет восстанавливать траекторию движения камеры и облака точек сцены по видео.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍33🔥17❤7😁1👌1
Релиз YandexGPT 3 Lite
Яндекс представил облегченную версию генеративной модели третьего поколения. Нейросеть лучше справляется со сценариями, в которых важна скорость ответа. Например, чат-бот на сайте, исправление орфографических ошибок в текстах, анализ данных и так далее.
YandexGPT 3 Lite доступна клиентам Yandex Cloud для интеграции через API. Модель можно протестировать в демо-режиме бесплатно.
▪️Подробнее
@ai_machinelearning_big_data
Яндекс представил облегченную версию генеративной модели третьего поколения. Нейросеть лучше справляется со сценариями, в которых важна скорость ответа. Например, чат-бот на сайте, исправление орфографических ошибок в текстах, анализ данных и так далее.
YandexGPT 3 Lite доступна клиентам Yandex Cloud для интеграции через API. Модель можно протестировать в демо-режиме бесплатно.
▪️Подробнее
@ai_machinelearning_big_data
🤣33👍20❤7🔥6🥰5😭4🙈2
npm i -g @janhq/cortex
cortex init
cortex models pull janhq/TinyLlama-1.1B-Chat-v1.0-GGUF
cortex models start janhq/TinyLlama-1.1B-Chat-v1.0-GGUF
cortex chat --model janhq/TinyLlama-1.1B-Chat-v1.0-GGUF
Cortex — это open-source AI-движок для создания LLM-приложений.
Можно импортировать в виде библиотеки Cortex или использовать как сервер.
В настоящее время Cortex поддерживает:
— Llama.cpp
— TensorRT-LLM
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍26❤11🔥4🤷♂1😁1
import ChatTTS
from IPython.display import Audio
chat = ChatTTS.Chat()
chat.load_models()
texts = ["<PUT YOUR TEXT HERE>",]
wavs = chat.infer(texts, use_decoder=True)
Audio(wavs[0], rate=24_000, autoplay=True)
ChatTTS — это модель преобразования текста в речь, разработанная специально для сценариев диалога, таких как LLM-ассистент.
ChatTTS поддерживает как английский, так и китайский языки (если кому актуально).
🤗 Погонять в Hugging Face
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍38❤7🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Scribble SDXL создан на основе SDXL ControlNet и его можно без проблем запустить на Hugging Face (спасибо
linoy_tsaban
из X).Можно выбирать разные стили и экспериментировать
🤗 Scribble SDXL
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍60🔥15🥰5❤3
Модель основана на GPT-4o, она может работать с текстовой и визуальной информациией, поддерживает передовые инструменты анализа данных.
ChatGPT Edu включает в себя средства безопасности и контроля корпоративного уровня для образовательных учреждений.
Новая модель дает возможность создавать пользовательские версии ChatGPT, и делиться ими для совместных исследований и обучения.
- Значительно более высокие лимиты на количество сообщений, чем в бесплатной версии ChatGPT
- Улучшены языковые возможности по качеству и скорости работы, поддерживается более 50 языков
- Надежная защита информации,конфиденциальность данных и продвинутые административные средства управления ИИ.
ChatGPT Edu призван заменить репетиторов и предоставляет:
* Обратную связь и поддержку
* Обучение и выставление оценок
* Интеграцию с образовательными ресурсами
openai.com/index/introducing-chatgpt-edu/
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍54❤13🔥8🤔6❤🔥1🤬1😢1
—
ollama run codestral:22b
29 мая Mistral представили Codestral с 22 миллиардами параметров.
Это генеративная модель с открытыми весами, предназначенная в первую очередь для задач генерации кода.
Умеет писать и рефакторить код, подсказывает наилучшие решения задач и даже паттерны проектирования. Её можно интегрировать в свои проекты с помощью API или просто использовать в VS Code. Нейросеть знает даже Fortran и COBOL.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍36🔥9❤4🕊1
Победителями жюри выбрало три работы:
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥25👍19❤3
InstaDrag — подход, позволяющий редактировать изображение с помощью простого жеста перетаскивания за ~1 секунду.
При этом InstaDrag справляется и со сложными деформациями части изображения, не представленными в обучающих данных (такие деформации — это, например, удлинение волос, искривление радуги и т. д.).
В будущем планируется интеграция InstaDrag с SDXL
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍54👏6❤4🤷♂1🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
Это быстрая версия Scribble SDXL, о которой мы недавно писали.
Использует SDXL Flash и Scribble SDXL, что позволяет ещё быстрее получать качественные изображения из простых набросков и каракулей
🤗 Запустить на Hugging Face
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍40🔥14❤5🥱2
Devil70B — это модель без цензуры и ограничений, во всяком случае так заявляют разработчики. Она отвечает на любой вопрос и поддерживает русский язык.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍39🔥12🌚7🤷♂3🤔3❤2🙊2🙈1