Из летней школы по финтеху (где половина лекций была не по финтеху) узнала для себя много нового, в том числе то, что у nvidia помимо дорогих карточек есть еще куча предобученных моделей для около-нлп
Например, вот эта мегалиба, где лежат модели для automatic speech recognition, NLP и text-to-speech synthesis. В том числе там есть asr для русского (на основе quartznet), о существовании которой я не знала вообще. Короче, может быть довольно полезно для диалоговых систем, жалко, что предобученных tts там не особо 🙁 Еще надеюсь, что поскорее подгонят презентацию по tensorRT, потому что у себя на сайте nvidia толком не описывают, что там творится
https://github.com/NVIDIA/NeMo
Например, вот эта мегалиба, где лежат модели для automatic speech recognition, NLP и text-to-speech synthesis. В том числе там есть asr для русского (на основе quartznet), о существовании которой я не знала вообще. Короче, может быть довольно полезно для диалоговых систем, жалко, что предобученных tts там не особо 🙁 Еще надеюсь, что поскорее подгонят презентацию по tensorRT, потому что у себя на сайте nvidia толком не описывают, что там творится
https://github.com/NVIDIA/NeMo
GitHub
GitHub - NVIDIA/NeMo: A scalable generative AI framework built for researchers and developers working on Large Language Models…
A scalable generative AI framework built for researchers and developers working on Large Language Models, Multimodal, and Speech AI (Automatic Speech Recognition and Text-to-Speech) - NVIDIA/NeMo
Все наверное слышали про Copilot, который Гитхаб запустил вместе с OpenAI – это сервис, который призван лишить всех программистов работы дописывать введенные пользователем строки кода или даже генерить целые функции по контексту (то есть по тому, что вы уже написали в этом скрипте, по комментариям к коду, по названиям переменных и классов и т.д.). Звучит очень впечатляюще, и мне стало интересно, что за модель лежит в основе этого всего.
Сама модель назвается Codex, и в лучших традициях OpenAI нет не только опенсорсного проекта, но и статьи с описанием деталей тоже нет. Но есть статья, посвященная первым версиям Codex'а, которые потом легли в основу Copilot.
Так вот если ее почитать, то окажется, что Codex это просто зафайнтюненная GPT-3. This is literally it. Ну то есть было очевидно, что это какая-то языковая модель, но тут чуваки не меняли архитектуру вообще, и правда просто скормили GPT-3 кучу опенсорсного кода 🤡
В начале статьи авторы делают довольно красивый клейм: 'On HumanEval, a new evaluation set we release to measure functional correctness for synthesizing programs from docstrings, our model solves 28.8% of the problems, while GPT-3 solves 0% and GPT-J solves 11.4%'. Потом авторы делают еще более интересный заход, и говорят, что раз люди тоже не с первого раза пишут работающий код, мы тоже дадим модельке посемплить 100 решений и из них выберем лучшее, тогда она 70.2% решит наших задачек.
Короче это все как-то сильно underwhelming, потому что тюнить модели относительно легко, и в этой статье даже не было никаких эвристик, как заставить архитектуру лучше приспособиться к задаче написания кода, особенно с учетом того, что она может и в код, и в естественный язык, так как умеет писать комментарии и описания функций
Сама модель назвается Codex, и в лучших традициях OpenAI нет не только опенсорсного проекта, но и статьи с описанием деталей тоже нет. Но есть статья, посвященная первым версиям Codex'а, которые потом легли в основу Copilot.
Так вот если ее почитать, то окажется, что Codex это просто зафайнтюненная GPT-3. This is literally it. Ну то есть было очевидно, что это какая-то языковая модель, но тут чуваки не меняли архитектуру вообще, и правда просто скормили GPT-3 кучу опенсорсного кода 🤡
В начале статьи авторы делают довольно красивый клейм: 'On HumanEval, a new evaluation set we release to measure functional correctness for synthesizing programs from docstrings, our model solves 28.8% of the problems, while GPT-3 solves 0% and GPT-J solves 11.4%'. Потом авторы делают еще более интересный заход, и говорят, что раз люди тоже не с первого раза пишут работающий код, мы тоже дадим модельке посемплить 100 решений и из них выберем лучшее, тогда она 70.2% решит наших задачек.
Короче это все как-то сильно underwhelming, потому что тюнить модели относительно легко, и в этой статье даже не было никаких эвристик, как заставить архитектуру лучше приспособиться к задаче написания кода, особенно с учетом того, что она может и в код, и в естественный язык, так как умеет писать комментарии и описания функций
GitHub
GitHub Copilot
AI that builds with you
Ну и еще некоторые кеки из статьи. В конце авторы отмечают, что поскольку это языковая модель, она выдаст токены с наибольшей вероятностью с условием данного контекста, исходя из того, что она выучила из обучающих данных. Поэтому если вы пишете говнокод, Copilot также будет предлагать вам говнокод и стилизоваться под ваш стиль программирования, даже если он способен был сгенерить 'правильный' и работающий вариант 🤡
Еще авторы пишут, что 'codex can generate code with structure that reflects stereotypes about gender, race, emotion, class, the structure of names, and other characteristics' и в целом извиняются, что нейроночка может нагенерить вам расистские комментарии в коде( Мне почему-то кажется, что это не главная проблема модели, но левая повесточка в STEM такая вот
Еще авторы пишут, что 'codex can generate code with structure that reflects stereotypes about gender, race, emotion, class, the structure of names, and other characteristics' и в целом извиняются, что нейроночка может нагенерить вам расистские комментарии в коде( Мне почему-то кажется, что это не главная проблема модели, но левая повесточка в STEM такая вот
Давайте добивайте его ✌️🤡✌️https://tprg.ru/znUB
Tproger
Neural Pushkin генерирует текст на русскому в стиле Пушкина при помощи нейросетей. Теперь проект доступен для всех
Генератор текста «Нейропушкин» запустили в открытый доступ. Вы начинаете текст, а нейронные сети их заканчивают — в стиле русской классической литературы.
Генератор оскорблений из работ Мартина Лютера, у меня выпало:
I beg everyone who can to flee from you as from the devil himself.
https://ergofabulous.org/luther/
I beg everyone who can to flee from you as from the devil himself.
https://ergofabulous.org/luther/
Forwarded from настенька и графики
Вы когда-нибудь видели, как сделан сайт группы "Аквариум"?? Я прямо залипла, просто кайф! Сначала как будто находишься в аквариуме))
https://www.aquarium.ru/ru
https://www.aquarium.ru/ru
www.aquarium.ru
Сайт «Аквариума»
Бесконечное погружение в творчество
Отрецензировал статью чувак из NYU, вокруг ресерча которого я в принципе строила весь свой дизайн 😎 perhaps the biggest flex in my whole academic career
Оффтопное видео, но мне субъективно было очень интересно
Я сама была вегетарианкой 5 лет (скорее всего, вернусь к этому постепенно), и все 5 лет мной в основном руководила не жалость к животным, а статистика, доказывающая, что скотоводство это самое худшее, что может быть для экологии. Например, данные о том, что на производство мяса уходит огромное количество воды, что если бы площадь, которую занимают поля для выпаса, засеяли зерновыми, то мы бы решили проблему мирового голода, или что коровы отрыгивают метан и тем самым ответственны за парниковый эффект.
В этом видео собственно происходит debunk всей этой статы:
1. На производство мяса реально уходит огромное количество воды (6000 литров на килограмм свинины), но 94% – это дождевая вода, которую животные пьют, плюс вода, полученная из пищи (эта вода потом возвращается в окружающую среду, так сказать, естественным путем). В то же время, 70% запасов пресной воды в мире уходит на орошение. В видео есть интересные кейсы о том, что во время засух в Калифорнии люди испытывают проблемы с доступом к воде, потому что вся эта вода уходит на орошение миндаля. И то же самое можно сказать про плантации авокадо в Чили.
2. То, что животные едят растительную пищу, которой можно было бы накормить людей, – это миф. 84% корма животных не пригодно для употребления людьми. Более того, на корм животным пускают вторсырье от производства человеческой еды, которое бы иначе пришлось просто выкидывать. Поэтому неверно говорить, что на производство килограмма говядины уходит 25 килограммов зерна – если убрать из этого то, что люди не могут есть, получится 2.5 кг человеческой еды на килограмм мяса.
3. Нельзя просто засеять все поля для выпаса и накормить всех людей в мире. На 2/3 сельхохозяйственных земель просто нельзя ничего выращивать из-за параметров почвы или ланшафта. Зато на них зачастую растет трава, коорую могут есть коровы. Если просто взять и засеять все пшеницей, еды в мире станет меньше, а не больше.
4. 14.5% выбросов углекислого газа в мире действительно приходится на скотоводство. Но прикол в том, что коровы производят метан, который они получают из углерода из травы, который трава производит из углекислого газа в воздухе, потом коровы возвращают этот метан в атомосферу, со временем он снова разлагается на углекислый газ и воду, трава поглощает углекислый газ из воздуха and so on. Это совсем не то же самое, что происходит при произодстве и сжигании топлива. Еще одно исследование устанавливает, что еще до прихода европейцев на территорию Северной Америки, дикие животные (типа бизонов) производили 86% того метана, который сейчас в США производят коровы. Поэтому – вау – нужно что-то делать с потреблением нефти и газа, а не с производством мяса.
5. Гораздо большая проблема это food waste. 82% этих отходов – это как раз растительная пища, а не продукты животноводства. Поэтому сокращение потребления мяса и молока потенциально может только раздуть эту проблему.
https://youtu.be/sGG-A80Tl5g
Я сама была вегетарианкой 5 лет (скорее всего, вернусь к этому постепенно), и все 5 лет мной в основном руководила не жалость к животным, а статистика, доказывающая, что скотоводство это самое худшее, что может быть для экологии. Например, данные о том, что на производство мяса уходит огромное количество воды, что если бы площадь, которую занимают поля для выпаса, засеяли зерновыми, то мы бы решили проблему мирового голода, или что коровы отрыгивают метан и тем самым ответственны за парниковый эффект.
В этом видео собственно происходит debunk всей этой статы:
1. На производство мяса реально уходит огромное количество воды (6000 литров на килограмм свинины), но 94% – это дождевая вода, которую животные пьют, плюс вода, полученная из пищи (эта вода потом возвращается в окружающую среду, так сказать, естественным путем). В то же время, 70% запасов пресной воды в мире уходит на орошение. В видео есть интересные кейсы о том, что во время засух в Калифорнии люди испытывают проблемы с доступом к воде, потому что вся эта вода уходит на орошение миндаля. И то же самое можно сказать про плантации авокадо в Чили.
2. То, что животные едят растительную пищу, которой можно было бы накормить людей, – это миф. 84% корма животных не пригодно для употребления людьми. Более того, на корм животным пускают вторсырье от производства человеческой еды, которое бы иначе пришлось просто выкидывать. Поэтому неверно говорить, что на производство килограмма говядины уходит 25 килограммов зерна – если убрать из этого то, что люди не могут есть, получится 2.5 кг человеческой еды на килограмм мяса.
3. Нельзя просто засеять все поля для выпаса и накормить всех людей в мире. На 2/3 сельхохозяйственных земель просто нельзя ничего выращивать из-за параметров почвы или ланшафта. Зато на них зачастую растет трава, коорую могут есть коровы. Если просто взять и засеять все пшеницей, еды в мире станет меньше, а не больше.
4. 14.5% выбросов углекислого газа в мире действительно приходится на скотоводство. Но прикол в том, что коровы производят метан, который они получают из углерода из травы, который трава производит из углекислого газа в воздухе, потом коровы возвращают этот метан в атомосферу, со временем он снова разлагается на углекислый газ и воду, трава поглощает углекислый газ из воздуха and so on. Это совсем не то же самое, что происходит при произодстве и сжигании топлива. Еще одно исследование устанавливает, что еще до прихода европейцев на территорию Северной Америки, дикие животные (типа бизонов) производили 86% того метана, который сейчас в США производят коровы. Поэтому – вау – нужно что-то делать с потреблением нефти и газа, а не с производством мяса.
5. Гораздо большая проблема это food waste. 82% этих отходов – это как раз растительная пища, а не продукты животноводства. Поэтому сокращение потребления мяса и молока потенциально может только раздуть эту проблему.
https://youtu.be/sGG-A80Tl5g
YouTube
Eating less Meat won't save the Planet. Here's Why
Big thanks to Dr. Frank Mitloehner for chatting with me. You can find him on twitter under @GHGGuru
▼Newsletter signup: https://josepheverettwil.substack.com/
▲Patreon: www.patreon/com/WILearned
▲Twitter: https://twitter.com/jeverettlearned
▲IG: www…
▼Newsletter signup: https://josepheverettwil.substack.com/
▲Patreon: www.patreon/com/WILearned
▲Twitter: https://twitter.com/jeverettlearned
▲IG: www…
ДА я буду постить мемы про xsolla весь день и чево вы мне сделаете
Кстати довольно хороший комментарий HR'а по ситуации с xsolla, в частности о том, что у них сейчас лего переманят всех топовых разрабов 🤡 что характерно, в комментах на vc уже куча компаний предлагает желающим написать в тг
Facebook
Log in or sign up to view
See posts, photos and more on Facebook.