Код в мешке
250 subscribers
8.94K photos
1.58K videos
2.11K files
42.1K links
Код в мешке - про кодинг, и не только...
Это личная записная книжка

https://t.me/joinchat/AAAAAEIy6oGlr8oxqTMS5w
Download Telegram
Forwarded from Machinelearning
⚡️ LLaVA-NeXT: A Strong Zero-shot Video Understanding Model

LLaVA-NeXT - одна из самых мощных на сегодняшний день моделей для понимания видео, превосходящая все существующие VLM, с открытым исходным кодом.

Новая SoTA!

LLaVA-Next демонстрирует высокую скорость передачи данных и демонстрирует отличные результаты при zero-shot обучении.


git clone https://github.com/LLaVA-VL/LLaVA-NeXT


Github: https://github.com/LLaVA-VL/LLaVA-NeXT
Blog: https://llava-vl.github.io/blog/2024-04-30-llava-next-video/
HF: https://huggingface.co/shi-labs/CuMo-mistral-7b
Dataset: https://huggingface.co/datasets/shi-labs/CuMo_dataset

#llm #vlm

@ai_machinelearning_big_data
Forwarded from Machinelearning
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 DocsGPT — open-source AI-помощник для работы с документами и не только

DocsGPT — это функциональное решение на базе LLM и GPT с открытым исходным кодом, которое упрощает процесс поиска информации в документации.
Благодаря интеграции мощных LLM можно задавать вопросы по документации и различным текстам и получать точные ответы.

Модели на Hugging Face:
🟡 Docsgpt-7b-mistral — требует 1×A10G GPU
🟡 Docsgpt-14b — требует 2×A10 GPU
🟡 Docsgpt-40b-falcon — требует 8×A10G GPU

🖥 GitHub

#llm #gpt

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
⚡️ Lory — полностью дифференцируемая Mixture-of-Experts (MoE) для предварительного обучения авторегрессионной языковой модели

На днях исследователи из Принстона и MetaAI представили Lory — первое в своём роде решение, которое позволяет масштабировать MoE-архитектуры для предварительного обучения авторегрессионных языковых моделей.

В Lory реализованы 2 ключевые технологии:
(1) — стратегия маршрутизации причинных сегментов, которая обеспечивает высокую эффективность операций объединения экспертов при сохранении авторегрессивной природы языковых моделей

(2) — метод группировки данных на основе сходства, который стимулирует специализацию "экспертов" путем группировки похожих документов в обучающих выборках

Результаты экспериментов с Lory показывают значительный прирост производительности по сравнению с обычными MoE-моделями.

📎 Arxiv

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
🖥 Вышла новая, улучшенная версия GPT-4 Omni для. И что самое главное — она доступна всем БЕСПЛАТНО!

Это самая совершенная модель из всех, намного превосходящая своих предшественников, включая таинственный gpt2-chatbot.

Она появится уже сегодня в виде приложения для пк.


GPT-4 Omni будет понимать эмоции и тон голоса.

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
This media is not supported in your browser
VIEW IN TELEGRAM
🖥 Модель общается естественным и понятным языком, обрабатывает информацию в реальном времени и даже умеет шутить и понимать эмоции. Делает паузы, если вы спросите ее что-то.

Модель практически невозможно отличить от живого человека.

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
🖥 Gpt2-chatbot = Gpt-5 ?

Появился новый загадочный LLM под названием “gpt2-chatbot”, который невероятно хорошо справляется с широком спектром задач.

Пользователи reddit уверены, что создатели модели - OpenAI и таким образом они тестируют GPT-5 или GPT-4.5.

Модель выдает рабочий код высочайшего качества на всех популярных языках, решает олимпиады задачи по математике, физике, на недоступном ранее уровне и демонстрирует высокое качество рассуждений и логики.

GPT-4 тоже тестили подобным образом внутри Bing Chat, так что это вполне может быть новая модель OpenAI.

Вот как вы можете попробовать ее бесплатно и оценить модель сами:

- перейдите по ссылке: http://chat.lmsys.org

- перейдите во вкладку “Direct Chat”.

- введите свой промпт.

На видео сравниваем GPT-4 Turbo и Gpt2-chatbot. Отправляем запрос на создание игры на JS в одном HTML-документе.

Первое видео результат работы - GPT-4 Turbo, Второе - Gpt2-chatbot.

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
GPT4o уже разрывает все модели, вот ее некоторые крутые скрытые фишки новой версии, которые не были показаны на презентации.

1) GPT4o на 2 головы опередил всех в создании текста на изображениях, сгенерированных искусственным интеллектом. Великолепный результат.

2) Новая модель позволяет генерировать шрифты.
3) Поддерживает  3d-рендеринг.
4/ GPT4o может создавать звуковые эффекты, а не только речь.
5) Эффективная и стабильная работа в преобразовании изображений в зависимости от контекста.

А на этом видео, вы можете посмотреть как модель отвечает на русском языке, будущее здесь. 

Если интересуетесь темой ИИ и нейросетей, здесь я публикую разбор свежих моделей, статей и гайдов, кладешь полезной информации.

Chatgpturbobot - Мы добавим новую модель в наш бесплатный бот.
Бот также поддерживает визуальную модель gpt, вы можете отправить скриншот за задачей боту и он пришлет вам решение, крутая вещь;

Источник:
https://habr.com/ru/posts/814289/
...
LocalAI — открытая и бесплатная альтернатива предложений от OpenAI

LocalAI — это open-source альтернатива решений от OpenAI.
LocalAI выступает в качестве замены REST API, совместимого со спецификациями OpenAI API для локальных выводов.

Позволяет локально запускать LLM, генерировать изображения, аудио (и не только), клонировать голос; при этом не требует GPU.

Источник:
https://habr.com/ru/posts/814239/
...
13 мая OpenAI представила новую языковую модель GPT-4o, которая теперь ляжет в основу ChatGPT.

GPT-4o может воспринимать и генерировать звук, изображение и текст и будет доступна всем пользователям бесплатно.
Также OpenAI обновила интерфейс приложения ChatGPT, сделав его минималистичным.

Теперь пользователь общается с большим чёрным кругом, который изменяет свои формы и размеры в зависимости от происходящих событий.

Когда ИИ говорит, то круг меняется, визуально усиливая ощущение диалога и взаимодействия.

Возможности GPT-4o уже поражают, несколько способов использования нового ИИ-помощника:
может создавать картинки с запоминанием персонажа, например, нагенерить качественный комикс ИИ вообще не составит труда;
поможет в подготовке к собеседованию для устройства на работу — ИИ оценит ваш внешний вид и подтянёт по вопросам;
умеет придумать колыбельную под определённого ребёнка;
может стать репетитором по математике.
Причём GPT-4o не решает все за человека, а именно обучает его;
проводит рабочие созвоны в Zoom;
помогает с изучением других языков с помощью описания предметов;
переводит речь с двух разных языков в реальном времени;
умеет говорить нескучно, включая фразы с живым и острым сарказмом;
может быть полноценным поводырём для незрячих и подробно описывать окружающий их мир;
две GPT-4o способны общаться друг с другом, подружиться и даже петь вместе дуэтом.
https://habr.com/ru/posts/814215/
...
Теги: GPT-4o ChatGPT
Снижаем стоимость лида, обучая алгоритмы Яндекса на заявках и звонках 

Контекстная реклама — инструмент капризный и сложный.
Без лайфхаков не разберешься.

У нас скопилось много неочевидных решений, которые не прописаны в справке Яндекс Директа.

Решили поделиться своими наработками в этих постах.
https://habr.com/ru/posts/813141/
...
janvarev
Я пиарюсь

Кому нужно, свежая модель GPT-4o уже доступна из России по API через мой сервис, на котором я собираю разные текстовые нейросетевые модели.

Там же есть Claude 3 Opus, Google Gemini и вся прочая веселая классика.
https://habr.com/ru/posts/814101/
...
Вышла новая, улучшенная версия GPT-4 Omni для. И что самое главное — она доступна всем БЕСПЛАТНО!

Это самая совершенная модель из всех, намного превосходящая своих предшественников, включая таинственный gpt2-chatbot.

Она появится уже сегодня в виде приложения для пк. 

GPT-4 Omni будет понимать эмоции и тон голоса.
 Модель общается естественным и понятным языком, обрабатывает информацию в реальном времени и даже умеет шутить и понимать эмоции. Делает паузы, если вы спросите ее что-то. 

Видео заговора можно посмотреть здесь.
Модель практически невозможно отличить от живого человека. 


Модель: https://openai.com/index/hello-gpt-4o/
...
МТС выделила 6 млрд рублей на NUUM — аналог TikTok и YouTube
https://habr.com/ru/news/814153/

МТС запустили открытый бета–тест цифровой вселенной с шестью локациями и внутренней игровой валютой
https://habr.com/ru/news/814629/

Из CloudMTS в MWS

CloudMTS стал больше, чем просто облачным провайдером.
Представляем MTS Web Services (MWS) — сервисы и продукты Enterprise-уровня для ИИ-экспериментов и цифровой трансформации бизнеса.

MWS закрывает потребности клиентов в самых разных направлениях.
Мы предлагаем технологии, глубокую экспертизу, комплексную поддержку, надежную инфраструктуру, чтобы реализовать ИТ-проекты по запросам бизнеса.
Все сервисы CloudMTS также доступны в MWS.

Подробности — далее.
https://habr.com/ru/companies/mws/news/814533/
...