Vol Building AGI

Археологічний артефакт — Джеремі Говард розповідає, що його загальна мовна лстмка ULMFiT (Universal Language Model Fine-tuning for Text Classification) була мотивацією будувати GPT-1. Під час адаптацііі на фінальну задачу замість лори тренували всю мережу з різними льорнінг рейтами на різні шари.

https://x.com/jeremyphoward/status/1906478657100755011

❤2

462 views00:39

Vol Building AGI

Що додати в ллмку? https://t.co/XKB4XxjREV

Openai

Open model feedback

We’re planning to release our first open language model since GPT‑2 in the coming months. We’re excited to collaborate with developers, researchers, and the broader community to gather inputs and make this model as useful as possible.

926 views22:23

Vol Building AGI

https://www.youtube.com/watch?v=6nJZopACRuQ

YouTube

Pre-Training GPT-4.5

Sam Altman sits down with Amin Tootoonchian, Alex Paino, and Daniel Selsam to discuss the journey to get to GPT-4.5.

589 views23:32

Vol Building AGI

Some very good MLP kernels https://github.com/triton-lang/triton/pull/6429

516 views02:47

Vol Building AGI

Яка архітектура краще? Та, що змінює експоненту ступеневого закону масштабування: https://x.com/_katieeverett/status/1926722325073801612

X (formerly Twitter)

Katie Everett (@_katieeverett) on X

There were so many great replies to this thread, let's do a Part 2!

For scaling laws between loss and compute, where loss = a * flops ^ b + c, which factors change primarily the constant (a) and which factors can actually change the exponent (b)?

https…

👍5

467 views17:35

Vol Building AGI

Куда кернели замінюються куда віртуальними машинами https://x.com/bfspector/status/1927435524416958871

X (formerly Twitter)

Benjamin F Spector (@bfspector) on X

(1/5) We’ve never enjoyed watching people chop Llamas into tiny pieces.

So, we’re excited to be releasing our Low-Latency-Llama Megakernel! We run the whole forward pass in single kernel.

Megakernels are faster & more humane. Here’s how to treat your Llamas…

🤯5

664 views02:10

Vol Building AGI

From Appendix E of Antonio Orvieto's paper on why Adam works better than SGD on transformers

👍3👏1

522 views01:55

Vol Building AGI

One of the first working algorithms for face detection was using a neural network representation, Rowley Baluja Kanade 1995, six years before the infamous Viola-Jones booster. They collected training data in two phases.

🔥3

466 views04:49

Vol Building AGI

Повідомлення від друзів:⚡️Java-мітап від Levi9: Java x AI — майбутнє твого коду

Як Java-інженеру вписатися в нову реальність, де AI змінює правила розробки?

Ми покажемо на живих прикладах, як інтегрувати AI у продакшн-код, розповімо про AI-агентів, інструменти та типові помилки.

Спікери:

Себастьян Дашнер — Java Champion, автор книги «Architecting Modern Java EE Applications», tech-евангеліст.
👉 AI Tools and Agents That Make You a More Efficient Developer (англійською, з live demo)

Поліна Сергієнко — Senior Java Engineer в Levi9, лідерка команди на проєкті.
👉 Як будувати AI-фічі в Java: кейс, інтеграція, граблі

Буде цікаво Java-розробникам, архітекторам, тімлідам і всім, хто хоче тримати руку пульсі розвитку AI.

🗓 25 червня, онлайн
🔗 Реєстрація вже відкрита: https://meetup.levi9.com.ua/java-event — до зустрічі!

meetup.levi9.com.ua

Java мітап від Levi9

Зустрічаємось онлайн спільнотою поговорити про Java технології, бо Java — is our thing! Участь в мітапі вільна. З нетерпінням чекаємо на зустріч!

540 views15:41

Vol Building AGI

Щоб не забувати, треба обертати

https://arxiv.org/abs/2506.19847

arXiv.org

Orthogonal Finetuning Made Scalable

Orthogonal finetuning (OFT) offers highly parameter-efficient adaptation while preventing catastrophic forgetting, but its high runtime and memory demands limit practical deployment. We identify...

🔥3

712 views08:34

Vol Building AGI

❤3

646 views20:19

Vol Building AGI

https://github.com/aw31/openai-imo-2025-proofs

GitHub

GitHub - aw31/openai-imo-2025-proofs

Contribute to aw31/openai-imo-2025-proofs development by creating an account on GitHub.

❤1

726 views20:31

Vol Building AGI

привіт, дуже пишаюся поділитися нашою останньою роботою: gpt-oss-120b та gpt-oss-20b. ми запускаємо модель зі слідами міркування. вона найкраща на математиці, научних питаннях. може запускати інструменти та говорити українською, бути вашим агентом, доктором та кодером. велика модель зроблена для відеокарти H100, а маленька зроблена для домашніх карт типу 3090. ми підготували для вас код для запуску моделей на нашому гітхабі. не можу дочекатися ваших файнтюнів.
github.com/openai/gpt-oss

GitHub

GitHub - openai/gpt-oss: gpt-oss-120b and gpt-oss-20b are two open-weight language models by OpenAI

gpt-oss-120b and gpt-oss-20b are two open-weight language models by OpenAI - openai/gpt-oss

❤25

7.46K views17:01

Vol Building AGI

https://www.youtube.com/live/0Uu_VJeVVfo

YouTube

Introducing GPT-5

Sam Altman, Greg Brockman, Sebastien Bubeck, Mark Chen, Yann Dubois, Brian Fioca, Adi Ganesh, Oliver Godement, Saachi Jain, Christina Kaplan, Christina Kim, Elaine Ya Le, Felipe Millon, Michelle Pokrass, Jakub Pachocki, Max Schwarzer, Rennie Song, Ruochen…

👍3👀2

507 views17:02

About

Blog

Apps

Platform