Generative Anton
4.96K subscribers
774 photos
45 videos
6 files
808 links
Непубличный угловой интеллектуал. Широко известен в узких кругах.

https://repushko.com
Download Telegram
Стоит написать небольшой карьерный апдейт. Я больше не работаю в AWS Sagemaker (мы отвечали за всякие ML automation сервисы) и мы всей тимой ушли от operations и разработки, стали чуть более научной и теперь ковыряем автоматизацию разработки под зонтиком запущенного на прошлом reInvent'e Amazon Q.

Если вкратце, то ковыряем область автоматических агентов и весь путь от постановки задачи в рамках в рамках репозитория до PR'a, который эту задачу будет решать. Не можешь победить обесценивание инженеров -- возглавь.

Еще мы активно начинаем нанимать всяких Applied Scientist'ов, так что если вдруг что -- стучитесь за рефералкой.
Был обнаружен автобус-побратим
high poetic excellence
2024ый год, LLMs всех размеров бороздят просторы интернета.
Тем временем бизнес: ..they're looking to prove out one of their core use cases with using GenAI to migrate COBOL code to Java...
Моя ролевая модель — лифт в офисе: it works irregulary, causing no danger.
This media is not supported in your browser
VIEW IN TELEGRAM
Мальчик: “Моя ролевая модель — Джейсон Стэтхем и Илон Маск”
Мужчина: “Моя ролевая модель — Муми-папа”
Эпоха скама конечно великая. Известный в широких кругах rabbit r1 (это оранжевая штука, которую дизайнили Teenage Engineering), который был с очень здравыми идеями про Large Action Model и т.д., оказался на деле всего лишь несколькими скриптами для автоматизации четырех приложений: Spotify, Midjourney, Doordash и UberEats. Может конечно всё ещё изменится в будущем, но пока вот так.

Теперь хейтеры занимаются сливом их сорцов. Началось все в треде на HackerNews. В интересное время живём.
Хорошая статья от PhD студента из Standford AI Lab про то, как учить модели "забывать" знания, aka "unlearn" что-то и какие основные методы для этого существуют.

С продуктовой точки зрения сама область кажется интересной: модели обучать дорого (а будет еще дороже, т.к. они еще подрастут), иски (как от New York Times к OpenAI) будут литься как из рога изобилия (и это мы еще не знаем, сколько копирайта нарушили OpenAI, когда учили Sora) и только ленивый не пнёт какую-то очередную модель за diversity/токсичность и т.д. Учить заново -- дорого, вот и нужен дешевый способ "удалить" данные.
Я регулярно возвращаюсь с работы и каждый раз встречаю цаплю, которая стоит на моем пути. Каждый раз я задаю ей один и тот же вопрос: «А что ты тут делаешь?» Каждый раз она отвечает мне молчанием. Я спрашивал уже раз 150 и 150 раз она молчала. Смысл в том, что это всегда одна и та же цапля, и она всегда молчит с неизменной невозмутимостью. А я каждый раз с неизменной настойчивостью спрашиваю:

- Что ты тут делаешь?
- (молчание)

- Почему ты стоишь здесь?
- (молчание)

- Каждый день ты здесь стоишь, и каждый день молчишь. Почему?
- (молчание)

И ведь эта цапля, зараза, знает меня в лицо, знает, что я спрошу, и знает, что она не ответит. Но ни разу ни одна из сторон не показала, что знает сценарий. Бывает, что цапля сидит на дереве, когда я прохожу мимо, тогда я подсматриваю за ней издалека. Она равнодушно смотрит вокруг, затем я спрашиваю:

- Что ты тут делаешь?
- (молчание)

Иногда она просто стоит, когда вокруг никого нет, и только я прохожу мимо. Конечно, она знает, что будет дальше, но не подаёт виду и спокойно продолжает стоять.

- Почему ты всегда здесь стоишь?
- (молчание)

Это очень суровое, по-настоящему упрямое противостояние, исход которого не ясен. Очевидно, что каждая сторона рассчитывает на победу. Впрочем, я уже согласен на ничью.
This media is not supported in your browser
VIEW IN TELEGRAM
Generative Anton
А мы тут зарелизились
ну, наша SOTA.

Вообще надо бы рассказать про всякие бенчмарки как-нибудь.
Волшебная история про то, как в 90ые годы в Германии все сообщения Air Traffic Control передавались через headless Emacs, а роутер сообщений был написан на Emacs-Lisp.

In Germany, a Herr Doktor is always right (they have forgiven Moses by now for not having space on the stone tablets, but it really is the 11th Commandment). This one worked at Symbolics before so knew one programming language: Lisp. He wanted to code the message router in Lisp because of the “complex” (meh) requirements, but there was no Lisp (or no Lisp in budget) for HP/UX so he was stuck. I told him about Emacs, gave him my tape with the ports, and maybe that was a mistake 😉

A week later - I helped out finishing the 4GL UI in the meantime and completed the messaging protocol - he called me in, quite happy.
He showed me the code - page after page of Emacs Lisp, with exactly zero comments “because Lisp is self-documenting”. I got scared, it was an air traffic control system after all, but I was no Herr Doktor so I whipped up the DCE native code for Emacs, made a hack to have it start headless in message router server mode, and we got messages to flow. I did a code hand-over, and drove back home a couple of days later. The “self-documenting” code, as far as I know, landed in production so at least for a while, all ATC message routing in Germany was done through Emacs.
How it looks like: Иду на конференцию про Developer Experience, чтобы послушать, с какими проблемами сталкиваются разработчики и подумать, как мы можем улучшить их опыт.

How it is: Иду послушать доклад Джона Ромеро (создатель DOOM, Quake и Wolfenstein 3D) и если получится поиграть с ним в DOOM.
Сходил в гости к Самату (@ctodaily) и открыл новый сезон его подкаста рассказом про свою древнегреческую эпопею. Кажется, что получилось хорошо!

Вероятно, попозже будет большой пост с анонсом на разных платформах, но уже есть на Spotify и Youtube.

Какие celebrity-выплаты мне теперь полагаются?