Vol Building AGI
580 subscribers
116 photos
9 videos
12 files
199 links
Past topics: speech synthesis, transformers, LSTM, recurrence
Download Telegram
Археологічний артефакт — Джеремі Говард розповідає, що його загальна мовна лстмка ULMFiT (Universal Language Model Fine-tuning for Text Classification) була мотивацією будувати GPT-1. Під час адаптацііі на фінальну задачу замість лори тренували всю мережу з різними льорнінг рейтами на різні шари.

https://x.com/jeremyphoward/status/1906478657100755011
2
From Appendix E of Antonio Orvieto's paper on why Adam works better than SGD on transformers
👍3👏1
One of the first working algorithms for face detection was using a neural network representation, Rowley Baluja Kanade 1995, six years before the infamous Viola-Jones booster. They collected training data in two phases.
🔥3
Повідомлення від друзів:⚡️Java-мітап від Levi9: Java x AI — майбутнє твого коду

Як Java-інженеру вписатися в нову реальність, де AI змінює правила розробки?

Ми покажемо на живих прикладах, як інтегрувати AI у продакшн-код, розповімо про AI-агентів, інструменти та типові помилки.

Спікери:

Себастьян Дашнер — Java Champion, автор книги «Architecting Modern Java EE Applications», tech-евангеліст.
👉 AI Tools and Agents That Make You a More Efficient Developer (англійською, з live demo)

Поліна Сергієнко — Senior Java Engineer в Levi9, лідерка команди на проєкті.
👉 Як будувати AI-фічі в Java: кейс, інтеграція, граблі

Буде цікаво Java-розробникам, архітекторам, тімлідам і всім, хто хоче тримати руку пульсі розвитку AI.

🗓 25 червня, онлайн
🔗 Реєстрація вже відкрита: https://meetup.levi9.com.ua/java-event — до зустрічі!
3
привіт, дуже пишаюся поділитися нашою останньою роботою: gpt-oss-120b та gpt-oss-20b. ми запускаємо модель зі слідами міркування. вона найкраща на математиці, научних питаннях. може запускати інструменти та говорити українською, бути вашим агентом, доктором та кодером. велика модель зроблена для відеокарти H100, а маленька зроблена для домашніх карт типу 3090. ми підготували для вас код для запуску моделей на нашому гітхабі. не можу дочекатися ваших файнтюнів.
github.com/openai/gpt-oss
25