Data Secrets

Если сегодня Claude-3 может кого-то загипнотизировать, то через несколько лет ИИ станет в разы умнее гениев человечества?

В последнее время в сети часто мелькает график с картинки. Мнение сообщества снова разделилось.

Одни говорят: «как мы можем выйти за пределы человеческого разума, если тренируем модели только на данных от зеленой до оранжевой линии? Это невозможно».

Другие же отмечают, что LLM уже несколько раз показывали свою способность находить в обучающих данных паттерны, которых человек не видит, и делать на их основе продвинутые выводы. Эта способность и даст ИИ взлететь по экспоненте.

Что думаете?
❤️ - будет так, как на графике
🗿 - да не, не будет

🗿156❤119🤔24🌚3👍1🔥1

7.45K views12:04

Data Secrets

Обычный человек vs Data Scientist

Профдеформация вещь опасная, поэтому мы решили напомнить вам оригинальные значения DS-терминов.

Не забудь отправить друзьям, чтобы лучше тебя понимали.

👍65😁38🔥15❤5💅4🤗1

7.7K views14:19

Data Secrets

“Так, Цук, как и планировали, заходим, подбрасываем 8В и уходим”

llama-3 8b >>> gpt4, mistral large, mistral 8x22b, claude3 haiku

👍40🔥24❤4👏2🤩2😁1

7.36K views17:10

Data Secrets

Оценка стоимости обучения известных моделей из отчета Stanford 2024 AI Index Report

Зацените разрыв: обучить оriginal transformer в 2017 стоило $930, а потом началось…

GPT-3 - $4.3M
GPT-4 - $78.4M
Gemini Ultra - $191.4M

Кстати, новой Llama-3 здесь нет, ее обучение стоило Meta $100M. Да, больше чем GPT-4.

🤯68👍6❤4🔥2👏1👀1

8.14K views06:12

Data Secrets

Amazon закрывают магазины Just Walk Out (те самые берешь и уходишь) Дело в том, что технология не возымела спрос у крупных ретейлеров. Ну хотя «технология» – сказано громко. Еще год назад выяснилось, что ИИ там никакого нет, и записи с камер вручную обрабатывают…

Только закрыли одно, уже начинают продавать другое

Amazon'у все не дает покоя идея умных магазинов. Их технология Just Walk Out c тысячью работников из Индии вместо ИИ провалилась, зато теперь они придумали Dash Cart.

Это умная тележка, которая отслеживает товары и считает общую стоимость продуктов с помощью компьютерного зрения и датчиков. Экран тележки обновляет сумму в реальном времени.

Amazon хочет, чтобы Dash Cart стала сервисом и начинает продавать изобретение торговым сетям. Fresh и Whole Foods уже используют тележки, Price Chopper и Mckeever’s Market пока тестируют новинку.

🔥18❤9👍5❤‍🔥1💯1

6.86K views09:04

Data Secrets

Мы тоже решили прокатиться на волне тренда с мемом про MKBHD.

Представьте: вы опубликовали статью, а на утро видите это на YouTube. Ваши действия?

😁56👍8🔥5🤩3❤1

6.81K views11:09

Data Secrets

MT-bench и почему это важно

Последнее время при сравнении разных LLM все в основном доверяют Chat Arena, хотя оценивание LLM там происходит не по метрикам, а просто на основе слепого голосования людей. А что, по метрикам теперь уже не модно?

Да, не модно, но, оказывается, все-таки есть бенчмарк, который поможет оффлайн оценить результаты на арене. Это MT-bench, который эстимейтит способность модели вести связный и информативный диалог. Правда ведь очевидно, что в основном именно эта метрика влияет на лояльность людей при голосовании?

GPT-4 на MT-bench выбивает 9.32, а новая крошка Llama-3 8B - 8.25. Всего ~1 балл ниже!

👍24❤8🔥7

7.12K views15:25

Data Secrets

0:28

This media is not supported in your browser

VIEW IN TELEGRAM

«Я думаю, опенсорсить LLM – это как опенсорсить ядерное оружие»

Вот такое внезапное заявление от небезызвестного Джеффри Хинтона. Он призывает правительство запретить модели с открытым исходным кодом.

При этом близкий друг Хинтона, Ян Лекун, напротив, выступает в поддержку опенсорс.

🤔63🤨20🗿16👍10🤯8🤪5🍌4🔥3🌚3🌭3✍1

7.64K views07:34

Data Secrets

This media is not supported in your browser

VIEW IN TELEGRAM

И снова Google удивляет нас статьей. На этот раз они придумали ScreenAI для работы с UX продукта

Сеточка умеет все, что касается работы с интерфейсами и инфографикой. Может ответить на вопрос, настраивать навигацию, суммаризовать, аннотировать элементы и вот это все.

🟣

Зачем они это делают? Сейчас ИИ-ассистенты вроде Siri работают с командами типа "позвони" только по четкому алгоритму, и не умеют справляться с ранее неизвестными интерфейсам. То есть, способность модели понимать UX и "пользоваться" сайтами и приложениями может стать ключевой вещью при внедрении ИИ в смартфоны.

🟣

Как это работает? В два этапа - претрейнинг и файнтюнинг. На pt применяется self-supervised learning для генерации меток данных (внутри ViT), которые затем тюнятся на ft на данных, размеченных человеком.

Пока что это просто ресерч проект, и сеточка недоступна для пользования. Надеемся, она поможет компании сделать новый Google Pixel 9 еще ИИнтереснее.

Please open Telegram to view this post

VIEW IN TELEGRAM

⚡34👍15🔥9😁1

7.44K views11:08

Data Secrets

Microsoft опубликовали Phi-3

Всего там три модели: mini (3.8B), small (7B) и medium (14B). Самая интересная из всех – mini. Эта крошка сравнима со старой версией GPT-3.5, Llama-3 8b и Mixtral 8x7b.

На бенчмарке MT-bench, который мы вчера обсуждали, моделька выбивает аж 8.38! При этом модель настолько мала, что ее можно запускать даже локально на телефоне. Тех.репорт про Phi-3 так и называется: A Highly Capable Language Model Locally on Your Phone.

Как говорят сами ученые: «The innovation lies entirely in our dataset for training». То есть, такого результата удалось добиться только за счет грамотной доработки и фильтрации данных, на которых училась предыдущая модель phi-2. 👏

Please open Telegram to view this post

VIEW IN TELEGRAM

👍50🔥15❤10⚡1👏1🤯1

7.55K views13:17

Data Secrets

Прямо сейчас где-то в офисе Meta, где все еще тренируется Llama-3 на 400b параметров:

😁126🔥23❤4👍1

7K views16:16

Data Secrets

Любителям визуализаций: продолжаем серию красивых графиков, посвященных LLM

На этот раз у нас количество параметров. Оцените разницу между GPT3.5 и GPT4. На график скоро можно будет дорисовать:

Amazon Olympus 2 - обещают в августе 2024
Grok 2 - 2025
Llama 3 405B - все еще тренируется
Gemini 2 - ноябрь 2024
GPT-5 - soon…

График с длиной контекста, ценой и рейтингом на чат-бот арене

График со стоимостями обучения

👍29🔥7❤5

7.01K views06:19

Data Secrets

0:24

This media is not supported in your browser

Llama3 8b уже запускают (видео 1) и файнтюнят (видео 2 с использованием LoRA на MLX) на айфонах. Без интернета, на чистых мощностях телефона.

Скоро у них руки и до нового малыша phi-3 дойдут. Подробнее об этой модели мы рассказывали вчера.

🔥50🤯25❤6👍4⚡3

7.27K views09:19

About

Blog

Apps

Platform