Love. Death. Transformers.

АИ алармисты не тупые, твердо и чётко, или оптимисты я неуверен.

Хотя твит интересный конечно

Ссылка

Fine. Deranged OpenAI Predictions

> 2 products
> GPT5 base model in API
> GPT5 + Q* Planner
> combination of the 2 with memory into a new Assistant product
> Q* uses a lot of compute at inference time
> so there will be various versions or settings of…

🤡20😁8🤩1

5.64K viewsedited 18:48

Love. Death. Transformers.

Forwarded from Esenia

Рады анонсировать очередной Tinkoff Lab RL Event — митап, на котором лаборанты исследовательской лаборатории Тинькофф делятся опытом и рассказывают о своих научных проектах.

Если вы учитесь на технической специальности и интересуетесь задачами искусственного интеллекта, а аббревиатуры ML, DL и RL для вас уже как родные — ребята из Тинькофф ждут вас 25 марта в 19:00 в московском офисе Тинькофф.

Все подробности и регистрация тут: https://o.tinkoff.ru/tlab_RL

👍22🤮17🤡3❤2🔥2

6.42K views22:11

Love. Death. Transformers.

Genstruct

Если вы когда то хотели сделать хороший инструкт сет вы упираетесь в одну простую проблему - нормальные датасеты лежат обычно в формате Plain Text:

Andrej Karpathy (born 23 October 1986[2]) is a Slovak-Canadian computer scientist who served as the director of artificial intelligence and Autopilot Vision at Tesla. He co-founded and formerly worked at OpenAI,[3][4][5] where he specialized in deep learning and computer vision.[6][7][1][8]

Education and early life
Karpathy was born in Bratislava, Czechoslovakia (now Slovakia)[9][10][11][12] and moved with his family to Toronto when he was 15.[13] He completed his Computer Science and Physics bachelor's degrees at University of Toronto in 2009[14] and his master's degree at University of British Columbia in 2011,[14] where he worked on physically-simulated figures (for example, a simulated runner or a simulated person in a crowd).

Karpathy received a PhD from Stanford University in 2016 under the supervision of Fei-Fei Li, focusing on the intersection of natural language processing and computer vision, and deep learning models suited for this task.[15][16]

И сунуть его as is в инструктивную модель нельзя - вытащить роли и прочее - не получиться. В FLAN like корпусах вытаскивали даты, имена и локации с помощью простых эвристик и на этом получалось довольно успешно учить модели.

Чуваки из Nous пошли дальше и сказали следущее: давайте у нас LLM будет переписывать существующие тексты в инструктивный формат, тем самым мы получаем очень качественную grounded синту, которую можно подсовывать в претрен!

model
paper

👍38🔥6❤1

6.86K views08:35

Love. Death. Transformers.

SOTA papers intro in 2024

🔥110😁20🤩8🤮2❤1👎1

6.22K views16:59

Love. Death. Transformers.

Релиз grok выглядит как релиз gpt2

8 rout Moe, 314 или 344в, 86b в инференсе, больше ничего не ясно

А, ещё код на джаксе

Чёт вспомнилось классическое:

Чудное время, забавный век
Тогда был не в моде обычный человек
Волосы длинные, на ранце значки
С таким внешним видом мы в школу шли

Верните мой 2019!
Я буду снова с небритой головой
По митингам бегать, с друзьями гулять
Пить гараж и танцевать

КОД

❤24👍3🔥2😁2😢2🤩1

5.53K views19:52

Love. Death. Transformers.

Forwarded from еба́ные идеи для резерча

Это не чат, это Ebа́nyChat. Еба́ноязычная Chа́tGPT от лаборатории еба́ного резерча

Здарова, хабровчане!
Хайп вокруг нейросетей, заалайненых при помощи Instructions и RLHF (известных в народе под единым брендом «хуйня из под коня из каждого утюга»), трудно не заметить. Именно поэтому мы решили тоже хайпануть запрыгнуть в этот поезд!

Общий подход для обучения подобных моделей примерно такой:
1. Заиметь хорошую LLM.
2. Сделать SFT.
3. Собрать фидбек.
4. Полирнуть все RLHF’ом.

В текущем релизе мы забили хуй на все эти пункты, как один из способов максимального прироста в качестве (а кто нас проверит, лол?).

Давайте посмотрим, что же находится внутри Ebа́nyChа́t’а.
⁃ Рандомная LM, которую нам принес стажер с хагинфейса (ваще похуй че там внутри, 13B параметров сделают go brrrr (больше модельки мы не умеем файнтьюнить))
⁃ Датасет для SFT (перевели альпаку-хуяку промтом; похуй, сгодится; еще собрали каких-то случайных датасетов с ХФ’а и захардкодили промпты; все же нормально будет, да? оверфитинг? ну мы меньше итераций обучения поставим)
⁃ Затем мы начали дрочить развесовку для этих датасетов на глазок (кидали кости на доску и записывали значения в качестве веса. Наш джун после этого сошел с ума, сказал что мы занимаемся какой-то дикой поеботой и устроился на работу в нормальное место)
⁃ Разочек обучили модель (а зачем че-то там тьюнить? (а вообще к нам пришли ребята с прода и сказали освобождать железо, т.к. мы опять занимаемся хуйней)) В какой-то момент она перестала генерировать <pad> <pad> <pad> — решили что близки к AGI и остановили обучение.

Сперва мы вообще хотели забить хуй на тестирование, но наш менеджер сказал что нужны какие-то цифры. В общем, позвали деврела, показали ему 3 парных семпла с chatgpt, спросили какие из них луче. Он везде сказал что чатжпт лучше. Получилось какое-то ебаное качество, но как-то плевать, напишем что 1 к 3 лучше. (деврела уволили, кстати).

Ни метрики, ни честный Human Evaluation мы показывать конечно же не будем. Кого это ебет? Тебя это ебет?

А, да, зарелизим претрейн. Мы его кстати назвали gpt-5. Почему? Просто.
Под катом у нас куча примеров, которые мы начерепикали, наслаждайтесь. Должно хватить на постов 10-20 где-то еще.

😁89🔥10🤡8👍5👎3👏3❤2🤔1

5.63K views20:45

Love. Death. Transformers.

Pr кейсы, мемы и схемы

Вы хотите хайпануть, но выкладывать хорошую технологию не хочется?

Выход есть - хуевый релиз!! Берём LLM, желательно на такое число параметров чтобы для прода она была бесполезной.
Кладём рядом с кодом: Megatron, Jax, flax, mojo - чем ебанутее кодовая база - тем лучше.

Оставляем 0 инструкций по тому как этим пользоваться.

Вы прекрасны!! СМИ хайпуют, блогеры хайпуют, реальной технологии на руках не у кого как не было, так и нет.

👏113😁36🤩4👍3🤡2❤1

7.03K views08:21

Love. Death. Transformers.

Не обгоняя модель в 4 раза меньше(?) Хз я не шарю. И тут ещё miqu не хватает

6.77K viewsedited 08:35

Love. Death. Transformers.

работодатель о котором он просит не беспокоиться vs ты

По сути:

Теперь у нас SoC, куча доп. железок рядом с основной, больше памяти, чипы стали х2 больше по площади

🤩31🔥9

6.3K viewsedited 20:35

Love. Death. Transformers.

Opus по бенчам хуже чем 4turbo намного лучше в реальной жизни.

Скрин от Илья А.

🔥95❤11👍4👏4

6.41K viewsedited 14:20

Love. Death. Transformers.

Красивая кривая? Мне тоже нравится, а ещё она нравится менеджерам инвесторам и прочим. Но она неверная, правильная кривая - та что я нарисовал красным.

а100 - 640tflops bf16
h100 - 1500tflops bf16
B100 - 3600tflops bf16

Не, фактически она верна, прирост в fp4 действительно есть, но есть нюанс - модели даже в fp8 никто не учит, максимум - инференс.

👍74😁29❤8

11K viewsedited 19:20

Love. Death. Transformers.

Its not a world model if its not hype enough - open sora

Китайская версия Sora начала учиться чуть больше месяца назад, и за всего то 200 а100 дней и 400к видео начала генерировать вполне неплохие 2s видео!

А, это не финальный чекпоинт и это всего 16×512×512

repo
blog про ускорение обучения

GitHub

GitHub - hpcaitech/Open-Sora: Open-Sora: Democratizing Efficient Video Production for All

Open-Sora: Democratizing Efficient Video Production for All - hpcaitech/Open-Sora

👍28🔥5❤1

11.5K viewsedited 10:46

Love. Death. Transformers.

👍4

6.28K views10:46

Love. Death. Transformers.

This media is not supported in your browser

VIEW IN TELEGRAM

🤔5

6.64K views10:46

Love. Death. Transformers.

This media is not supported in your browser

VIEW IN TELEGRAM

6.93K views10:46

Love. Death. Transformers.

❤41🤩7🔥3😢2🤮1

7.08K views14:23

Love. Death. Transformers.

twi @0fficialDinesh

😁24👍8🤮2🤡1

6.33K views15:21

Love. Death. Transformers.

Forwarded from serafim.eth

За последние 7 недель мы вместе с Каримом @karim_iskakov построили и запустили iOS приложение для автомонтажа коротких видео.

Как меня занесло в эту тему?
Карим является членом deYC, ко-фаундером Avatarify (13m+ users), работал в Samsung AI, имеет публикации про ИИ, и у него есть бот, который он с друзьями построил в 2021 году для автомонтажа видео.

С начала этого года бот стал вируситься и получил продакт-маркет фит (в следующем посте расскажу как мы это поняли)

На встрече в Москве Карим озвучил мысль, что он хотел бы когда-нибудь перенеси этот бот в мобильное приложение, ведь приложение может решать ту же проблему что и бот, но в 2 раза лучше.

Что услышал я?
Человек с невероятным опытом и готовым PMF ищет человека кто заэкзикьютит прилу. Примерно через 12 часов после встречи я написал Кариму, что нам срочно надо построить это приложение :)

Мы встретились, пожали руки, я стал CEO и руковожу продуктом и рекламой (но уже тоже начал разбираться в Swift и два моих PR уже в проде), а Карим CTO и предоставил алгоритм монтажа, аудиторию в 50к пользователей бота из России, а также лидит алгоритмическую часть монтажа и ресерча для AI эдитинга.

На следующий день после встречи мы разместили вакансию, через 2 дня наняли шикарного iOS разработчика ex core Prisma (Lensa), через 4 недели зарелизили бету.

И вот спустя 3 недели после беты можно сказать что первая продакшен-реди версия в бою :)

Встречайте Cutly - https://apps.apple.com/gb/app/reel-maker-short-video-cutly/id6477783184

App Store

CutLy - Reels & Stories Maker App - App Store

Download CutLy - Reels & Stories Maker by Daniil Dkhavan on the App Store. See screenshots, ratings and reviews, user tips and more games like CutLy - Reels &…

🔥27👍7❤2🤮2🤡2

5.62K views20:44

Love. Death. Transformers.

Forwarded from РИСЕРЧОШНАЯ

Превратите свой пет-проект из хобби в карьеру

Написал свой долгожданный пост на ХАБР, где рассказал как делать достойные пет-проекты, который помогут вам быстро развиваться!

Затронул очень много тем:
🛠 о том как быстро набирать навыки и стоп флажках в обучении
🏆 какие пет-проекты успешные и почему они станут вашим будущим стартапом
🚀 какие есть этапы в пет-проектах и почему вам нужны пользователи
💪 как не потерять мотивацию
🔍 и оформить это в резюме!

ЧИТАТЬ ПО ССЫЛКЕ

Отдать голос за канал
https://t.me/boost/persecond300k

#EDUCATION

👍17👎6🤮2🔥1

5.38K views08:13

Love. Death. Transformers.

Forwarded from Борис опять

OpenAI: actually closed
StabilityAI: actually unstable
AIBrain: no brains
DataRobot: no robots
Databricks: no bricks
DeepNorth: located in the US and Germany
H2O.ai: no water
Snowflake: no snow

😁163👍1🤡1

6.82K views12:11

About

Blog

Apps

Platform