Data Secrets
78.8K subscribers
6.43K photos
669 videos
20 files
2.71K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
POV: к вам в команду пришел джун и пытается решить все задачи нейронками
😁199🥰15🤯9👍4🙈31
PyTorch в тренде: они представили альфа-релиз библиотеки для end-to-end настройки LLM

Новая либа с красивым названием torchtune включает инструменты для:

– скачивания и подготовки датасетов
– построения архитуктур с помощью разнообразных строительных блоков (как в torch)
– логирования
– квантизации моделей
– файнтюнинга и расстановки чекпоинтов
– оценки моделей на классических бенчмарках
– запуска локального инференса
– и многого другого.


Уже выложили код и туториалы, а еще, чтобы лучше осознать возможности библиотеки, можно почитать блогпост.
🔥54👍118😁2🥰1🕊1🏆1
This media is not supported in your browser
VIEW IN TELEGRAM
Вам так понравилось историческое видео с Яном Лекуном, что мы решили вкинуть еще одно

На нем пророк Стив Джобс говорит, что однажды компьютеры будут генерировать ответы, как люди. И тогда начнется новая эра.

Пока все жили в 80-х, он жил в 2023.
Please open Telegram to view this post
VIEW IN TELEGRAM
👏69👍10😁9🔥62
Сегодня День Рождения LISP!

С этого языка началось функциональное программирование и анализ данных. Его изобрели ученые из MIT ровно 64 года назад. Вот статья, в которой он впервые упоминается.

Сегодня LISP все еще активно используется. На нем работает система обработки данных Apache Storm, текстовый анализатор Grammarly, софт, который мониторит состояние самолетов, программа, управляющая лондонским метро и многое другое.

Кстати, язык разрабатывался специально для ИИ. В основе лежала эта идея:
Чтобы искусственный интеллект работал как настоящий, он должен быть устроен точно так же. А раз наш интеллект основан на мыслях, которые мы можем выразить словами, то нам нужно научить компьютер разбираться в словах, их смыслах и взаимосвязи между ними.


С др, короче
48🎉21🔥4👍2👏1🏆1
Google опять мерится не будем говорить чем миллиардами с Microsoft

Главу DeepMind спросили, как Google ответит на план Microsoft и OpenAI создать суперкомпьютер за $100млрд.

Демис Хаббис не ударил в грязь лицом и ответил, что Google потратит столько же на инвестиции в ИИ. «А может и больше!» – довольно добавил он.

Google такой:
I’m rich too, bitch 🤑
Please open Telegram to view this post
VIEW IN TELEGRAM
😁75🏆4👨‍💻3🗿3🤨1
Если ваш шопинг выглядит не так, не зовите меня
👍59😁355🗿4👏1
Сайты пытаются выпутаться из нейросетей

Российские СМИ начали запрещать «Яндексу» использовать свой контент для нейросетевых сервисов, которые пересказывают содержание веб-страниц, позволяя пользователям получать ответы без посещения сайтов.

Вот вам и Нейро
😁103👍13🤯7👏3
График, с помощью которого можно сравнить LLM сразу по трем категориям: длина контекста, цена и рейтинг на чат-бот арене.

Напоминаем, что менее, чем через 24 часа, ИИ-ряды также пополнит Llama-3.

Красивое
👍54🔥8🤯51😁1🏆1
This media is not supported in your browser
VIEW IN TELEGRAM
У Microsoft вышла VASA-1, которая очень реалистично оживляет фотографии

Становится все сложнее различать, что реально, а что нет: в VASA можно контролировать эмоции, направление взгляда и даже расстояние до камеры, а синхронизация губ просто поражает.

И кроме того, сила VASA в том, что она может поддерживать онлайн-генерацию видео 512х512 со скоростью до 40 кадров в секунду. До этого такой скорости мы еще не видели.

Под капотом, что интересно, не прямая генерация видеокадров, а генерация динамики лица и движения головы в латентном пространстве на основе звуковой дорожки (тут работает диффузионный трансформер). На это пространство затем навешивается декодер.

Декодер, кроме кодов из пространства, принимает также фичи лица, которые вытаскивает энкодер из фото, а на выходе из декодера мы уже получаем реалистичное видео.

Больше интересных примеров можно найти в блогпосте. Больше про архитектуру – в статье.
👍44🔥13😁116
Новый робот от Boston Dynamics конечно очень крут, но ощущение, как будто находишься в хорроре Звонок.

Сами создатели шутят: «зато вы точно знаете, что внутри нет человека и это не обман».

А еще оцените схожесть со SkyNet. Хорошая попытка приближения конца света, BD
39🔥13😁12👍6👏3🌭2🏆1🗿1
Breaking! Llama-3 уже здесь и рвет лидерборды!

Две модели - на 8B и 70В – уже ворвались, одна – на 400B – еще тренируется. Обе вышедшие модельки стали лучшими в своем весе.

Единственное, чем модели не могут похвастаться – контекст. У обеих он составляет всего 8k.

Приятным бонусом идет интервью с Цукербергом о Llama-3, вышедшее пару минут назад.

Блогпост | Попробовать новую ламу
👍34🔥117🥰1🏆1
⌨️
Please open Telegram to view this post
VIEW IN TELEGRAM
😁964🔥31👍1🏆1
Data Secrets
График наверху – это динамика частоты употребления слова «delve» (вникать) в статьях по медицине. Видите этот скачок в 2023? Вы скажете: ну и что? А то, что delve – это по каким-то причинам любимое слово ChatGPT. Бот использует его очень часто, и это стало…
Помните, пару недель назад мы показывали вам график резкого роста медицинских статей, в котором используется слово delve (вникать), любимое слово ChatGPT?

Так вот, это слово уже давно принято считать признаком, что текст сгенерирован. Но люди до сих пор недоумевают, почему именно delve? Что за тайна такая вокруг этого слова?

Кажется, мы разгадали, в чем тут дело.

Да, в США слово delve употребляется редко, но вот в Нигерии очень распространено: его, например, часто произносят учителя в начальной школе.

А в GPT есть RLHF, где качество ответов модели развернуто оценивается людьми. Над RLHF часто работают люди, чей труд дешевле, чем у среднего жителя США.

Понимаете, куда мы клоним? Для RLHF нанимают людей из Нигерии, для которых слово delve - классика, они описывают ответы модели, используя это слово («вникай глубже»), а затем их отзывы подгружаются обратно модель для дообучения. Вот она и запоминает это слово как «хорошее».

С вами была программа «Следствие вели» с DataSecrets
👍174😁648🤯8🔥7🥰52
Кстати, вот вам лучшая иллюстрация RLHF 👹
Please open Telegram to view this post
VIEW IN TELEGRAM
😨46🤪12👍9😁65
Тем временем Mistral активно ищет инвестиции

В декабре стартап уже привлек $415 млн. Тогда они оценивались в $2 млрд. Сейчас оценка компании – $5 млрд. К тому же, недавно Mistral стал получать доход.

Короче, несложная математика и здравый смысл подсказывает, что компания может привлечь сотни миллионов долларов. Среди инвесторов: Andreessen Horowitz, Microsoft (OpenAI ревнует, да) и др.
👍29🔥117👏1😁1
На днях вышла новая книга по Computer Vision от трех крутых авторов: Antonio Torralba, Bill Freeman и Phillip Isola

Авторы работали над книгой почти 10 лет. В ней собрано вообще все, от линейных фильтров и оптики до современных диффузионнок. Скорее всего, чтиво скоро будет признано сообществом как мастрид.

Самая приятная вещь в книге - авторские иллюстрации. Ну и вообще, на выходные самое то.
👍66🤯138🔥7
Опенсорс вперед ❤️
👍4722🥰11❤‍🔥7🔥4🌚1
Миниатюра: я пытаюсь файнтюнить новую Llama-3 на своем линово 2001 года
😁13211👍7🔥5🤯3
Визуализация эмбеддингов от TensorFlow

Пространство эмбеддингов с огромной размерностью представить себе очень сложно. Поэтому иногда, чтобы лучше понять задачу и/или наглядно оценить качество векторов, полезно посмотреть на эмбеддинги меньшей размерности. Крутейший залипательный инструмент для этого – Embedding Projector.

Что делаем: загружаем свои эмбеддинги/выбираем предобученные -> выбираем алгоритм сокращения размерности -> любуемся. На картинке сверху, например, можно увидеть кластер чисел снизу слева. Это означает, что эмбеддинги неплохо отражают семантическую близость слов.

Красивое...
46👍19🔥8