Data Secrets
78.8K subscribers
6.43K photos
669 videos
20 files
2.71K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Если сегодня Claude-3 может кого-то загипнотизировать, то через несколько лет ИИ станет в разы умнее гениев человечества?

В последнее время в сети часто мелькает график с картинки. Мнение сообщества снова разделилось.

Одни говорят: «как мы можем выйти за пределы человеческого разума, если тренируем модели только на данных от зеленой до оранжевой линии? Это невозможно».

Другие же отмечают, что LLM уже несколько раз показывали свою способность находить в обучающих данных паттерны, которых человек не видит, и делать на их основе продвинутые выводы. Эта способность и даст ИИ взлететь по экспоненте.

Что думаете?
❤️ - будет так, как на графике
🗿 - да не, не будет
🗿156119🤔24🌚3👍1🔥1
Обычный человек vs Data Scientist

Профдеформация вещь опасная, поэтому мы решили напомнить вам оригинальные значения DS-терминов.

Не забудь отправить друзьям, чтобы лучше тебя понимали.
👍65😁38🔥155💅4🤗1
“Так, Цук, как и планировали, заходим, подбрасываем 8В и уходим”


llama-3 8b >>> gpt4, mistral large, mistral 8x22b, claude3 haiku
👍40🔥244👏2🤩2😁1
Оценка стоимости обучения известных моделей из отчета Stanford 2024 AI Index Report

Зацените разрыв: обучить оriginal transformer в 2017 стоило $930, а потом началось…

GPT-3 - $4.3M
GPT-4 - $78.4M
Gemini Ultra - $191.4M

Кстати, новой Llama-3 здесь нет, ее обучение стоило Meta $100M. Да, больше чем GPT-4.
🤯68👍64🔥2👏1👀1
Data Secrets
Amazon закрывают магазины Just Walk Out (те самые берешь и уходишь) Дело в том, что технология не возымела спрос у крупных ретейлеров. Ну хотя «технология» – сказано громко. Еще год назад выяснилось, что ИИ там никакого нет, и записи с камер вручную обрабатывают…
Только закрыли одно, уже начинают продавать другое

Amazon'у все не дает покоя идея умных магазинов. Их технология Just Walk Out c тысячью работников из Индии вместо ИИ провалилась, зато теперь они придумали Dash Cart.

Это умная тележка, которая отслеживает товары и считает общую стоимость продуктов с помощью компьютерного зрения и датчиков. Экран тележки обновляет сумму в реальном времени.

Amazon хочет, чтобы Dash Cart стала сервисом и начинает продавать изобретение торговым сетям. Fresh и Whole Foods уже используют тележки, Price Chopper и Mckeever’s Market пока тестируют новинку.
🔥189👍5❤‍🔥1💯1
Мы тоже решили прокатиться на волне тренда с мемом про MKBHD.

Представьте: вы опубликовали статью, а на утро видите это на YouTube. Ваши действия?
😁56👍8🔥5🤩31
MT-bench и почему это важно

Последнее время при сравнении разных LLM все в основном доверяют Chat Arena, хотя оценивание LLM там происходит не по метрикам, а просто на основе слепого голосования людей. А что, по метрикам теперь уже не модно?

Да, не модно, но, оказывается, все-таки есть бенчмарк, который поможет оффлайн оценить результаты на арене. Это MT-bench, который эстимейтит способность модели вести связный и информативный диалог. Правда ведь очевидно, что в основном именно эта метрика влияет на лояльность людей при голосовании?

GPT-4 на MT-bench выбивает 9.32, а новая крошка Llama-3 8B - 8.25. Всего ~1 балл ниже!
👍248🔥7
This media is not supported in your browser
VIEW IN TELEGRAM
«Я думаю, опенсорсить LLM – это как опенсорсить ядерное оружие»

Вот такое внезапное заявление от небезызвестного Джеффри Хинтона. Он призывает правительство запретить модели с открытым исходным кодом.

При этом близкий друг Хинтона, Ян Лекун, напротив, выступает в поддержку опенсорс.
🤔63🤨20🗿16👍10🤯8🤪5🍌4🔥3🌚3🌭31
This media is not supported in your browser
VIEW IN TELEGRAM
И снова Google удивляет нас статьей. На этот раз они придумали ScreenAI для работы с UX продукта

Сеточка умеет все, что касается работы с интерфейсами и инфографикой. Может ответить на вопрос, настраивать навигацию, суммаризовать, аннотировать элементы и вот это все.

🟣Зачем они это делают? Сейчас ИИ-ассистенты вроде Siri работают с командами типа "позвони" только по четкому алгоритму, и не умеют справляться с ранее неизвестными интерфейсам. То есть, способность модели понимать UX и "пользоваться" сайтами и приложениями может стать ключевой вещью при внедрении ИИ в смартфоны.

🟣Как это работает? В два этапа - претрейнинг и файнтюнинг. На pt применяется self-supervised learning для генерации меток данных (внутри ViT), которые затем тюнятся на ft на данных, размеченных человеком.

Пока что это просто ресерч проект, и сеточка недоступна для пользования. Надеемся, она поможет компании сделать новый Google Pixel 9 еще ИИнтереснее.
Please open Telegram to view this post
VIEW IN TELEGRAM
34👍15🔥9😁1
Microsoft опубликовали Phi-3

Всего там три модели: mini (3.8B), small (7B) и medium (14B). Самая интересная из всех – mini. Эта крошка сравнима со старой версией GPT-3.5, Llama-3 8b и Mixtral 8x7b.

На бенчмарке MT-bench, который мы вчера обсуждали, моделька выбивает аж 8.38! При этом модель настолько мала, что ее можно запускать даже локально на телефоне. Тех.репорт про Phi-3 так и называется: A Highly Capable Language Model Locally on Your Phone.

Как говорят сами ученые: «The innovation lies entirely in our dataset for training». То есть, такого результата удалось добиться только за счет грамотной доработки и фильтрации данных, на которых училась предыдущая модель phi-2. 👏
Please open Telegram to view this post
VIEW IN TELEGRAM
👍50🔥15101👏1🤯1
Прямо сейчас где-то в офисе Meta, где все еще тренируется Llama-3 на 400b параметров:
😁126🔥234👍1
Любителям визуализаций: продолжаем серию красивых графиков, посвященных LLM

На этот раз у нас количество параметров. Оцените разницу между GPT3.5 и GPT4. На график скоро можно будет дорисовать:

Amazon Olympus 2 - обещают в августе 2024
Grok 2 - 2025
Llama 3 405B - все еще тренируется
Gemini 2 - ноябрь 2024
GPT-5 - soon…

График с длиной контекста, ценой и рейтингом на чат-бот арене

График со стоимостями обучения
👍29🔥75
Llama3 8b уже запускают (видео 1) и файнтюнят (видео 2 с использованием LoRA на MLX) на айфонах. Без интернета, на чистых мощностях телефона.

Скоро у них руки и до нового малыша phi-3 дойдут. Подробнее об этой модели мы рассказывали вчера.
🔥50🤯256👍43