281K subscribers
3.95K photos
675 videos
17 files
4.54K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
🖥 Вышла новая, улучшенная версия GPT-4 Omni для. И что самое главное — она доступна всем БЕСПЛАТНО!

Это самая совершенная модель из всех, намного превосходящая своих предшественников, включая таинственный gpt2-chatbot.

Она появится уже сегодня в виде приложения для пк.


GPT-4 Omni будет понимать эмоции и тон голоса.

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥53👍108🌭1
This media is not supported in your browser
VIEW IN TELEGRAM
🖥 Модель общается естественным и понятным языком, обрабатывает информацию в реальном времени и даже умеет шутить и понимать эмоции. Делает паузы, если вы спросите ее что-то.

Модель практически невозможно отличить от живого человека.

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥65😨157👍7👏6
Media is too big
VIEW IN TELEGRAM
🔥 Грег Брокман, соучредитель OpenAI, опубликовал 5-минутное видео, в котором он общается с языковой моделью GPT-4 Omni и демонстрирует ее возможности компьютерного зрения.

А вот еще 33 видео с примерами работы ИИ - https://vimeo.com/openai.

А если интерсно, тут обращение самого Сэма Альтмана - https://blog.samaltman.com/gpt-4o

👉 Бесплатно пользоваться можно с браузера, сслыка - https://chatgpt.com/auth/login?next=%2F%3Fmodel%3Dgpt-4o

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
53🔥26👍16🤣1
⚡️ MatterSim — модель глубокого обучения для моделирования атомных структур; поддерживает все элементы, температуры и давления

MatterSim — Deep Learning, которая позволяет моделировать свойства атомных структур на высоком уровне и точно предсказывать свойства материалов во всей периодической таблице, при температурах от 0 до 5000 К и давления до 1000 ГПа.

MatterSim может быть тонко настроена для моделирования атомных структур на желаемом уровне теории.
Или же можно использовать модель для прямого прогнозирования свойств на основе заданной структуры.

📎 Arxiv

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥63👍188
🌟 LocalAI — свободная альтернатива предложений от OpenAI

LocalAI — это open-source альтернатива решений от OpenAI. LocalAI выступает в качестве замены REST API, совместимого со спецификациями OpenAI API для локальных выводов.

Позволяет локально запускать LLM, генерировать изображения, аудио (и не только), клонировать голос; при этом не требует GPU.

Поддерживается множество семейств LLM и архитектур, LocalAI работает с gguf, transformers, diffusers и не только.

Запуск LocalAI с помощью Docker:
docker run -p 8080:8080 --name local-ai -ti localai/localai:latest-aio-cpu

При наличии GPU Nvidia (аналогично для CUDA 12):
docker run -p 8080:8080 --gpus all --name local-ai -ti localai/localai:latest-aio-gpu-nvidia-cuda-11

🖥 GitHub
🟡 Страничка LocalAI

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍36🤔14🔥64
Приложение, в котором вы можете посмотреть прогресс открытых и проприетарных моделей LMS с течением времени

Это приложение отображает изменения показателей моделей, который оценивается чат-ботом LMSYS Arena, крутая штука, чтобы поиграться.

Показатель ELO (ось y) - это показатель относительной силы модели, основанный на ее показателях по сравнению с другими моделями на арене.

Дата публикации (по оси x) соответствует моменту, когда модель была впервые опубликована публично.

Линии тренда основаны на обычной регрессии методом наименьших квадратов (МНК) и корректируются в соответствии с критериями фильтрации.


https://huggingface.co/spaces/andrewrreed/closed-vs-open-arena-elo

@ai_machinelearning_big_data
👍232🔥2
🔥 Некоторые крутые скрытые фишки новой GPT4o


1) GPT4o на 2 головы опередил всех в создании текста на изображениях, сгенерированных искусственным интеллектом. Великолепный результат.

2) Новая модель позволяет генерировать шрифты.

3) Поддерживает 3d-рендеринг.

4/ GPT4o может создавать звуковые эффекты, а не только речь.

5) Эффективная и стабильная работа в преобразовании изображений в зависимости от контекста.

А на последнем видео, вы можете посмотреть как модель отвечает на русском языке.

Сегодня намечена Google I/O, где нам покажут обновленный Gemini, ждем достойного ответа.

@ai_machinelearning_big_data
👍58🔥177🥱2🤨2😐2😁1
⚡️ AT-EDM: Attention-Driven Training-Free Efficiency Enhancement of Diffusion Models

Компания Adobe нашла способ снизить вычислительные затраты на диффузионные модели данных без переобучения.

Они назвали метод AT-EDM, и это позволяет добиться сокращения FLOPs до 40% при сохранении почти такого же качества изображения, как и в исходной модели.

Почитать подробнее: https://atedm.github.io
Видео: https://www.youtube.com/watch?v=ZmOdN4F_8Ew
Статья: https://arxiv.org/abs/2405.05252

Код на подходе.

@ai_machinelearning_big_data
🔥17👍123
This media is not supported in your browser
VIEW IN TELEGRAM
💪 Разбираемся, у кого контекст длиннее!

У GEMINI обещают контекстное окно 2млн токенов. Это в 16 раз больше, чем у GPT-4o .

У GPT-4o 128k токенов, это две копии книги «Великого Гетсби», в Gemini 1.5 Pro можно загрузить всю «Войну и мир».

- Gemini теперь будет во ВСЕХ продуктах Google: Поисковике, gmail, photo, Workspace, NotebookGmail, Google Meet, модель может писать письма, делать выжимки из них, вести диалог, искать нужные для вас части письма, читает вложения и может отвечать по любым длинным документам, видео, изображениям во вложениях, управляется голосом.

- Еще Google представили Gemini 1.5 Flash оптимизированную модель с низкой задержкой.

-Новый Project Astra - это прототип от GoogleDeepMind, ИИ-ассистенты, с которыми можно общаться в реальном времени. ИИ работает прямо с вашего телефона и даже с умных очков! Project Astra может быть по-настоящему полезен в повседневной жизни.

Агенты могут взаимодействовать с окружающим миром, воспринимая информацию, запоминая то, что видит, обрабатывая эту информацию и понимая окружение и детали.

- Представлен Veo - прямой конкурент Sora для генерации видео.

Модель принимает текст и может генерировать видео с разрешением до 1080p продолжительностью более минуты.

- Представлен Imagen 3 - самая соверщенная модель Google для генерации изображений.

- Песочница с искусственным интеллектом для преобразования текста в музыку.

- Google наконец-то прилагают серьезные усилия для интеграции искусственного интеллекта в свой поисковик

@ai_machinelearning_big_data
👍62🔥97😁6🤔5🗿4