Data Secrets
78.8K subscribers
6.43K photos
669 videos
20 files
2.71K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
В твиттере парад мемов: пользователи фантазируют о будущем с роботами Tesla
1😁8928🔥14👍4😐2🙈1
В компании ByteDance выяснили, что стажер два месяца вставлял палки в колеса соседней команды, которая занималась обучением моделек

Зачем он это делал – непонятно, но получалось у него хорошо. Целых два месяца работы 30 сотрудников из-за него пошли прахом.

Он умудрялся загружать порченные Pickle-файлы, полные вредоносного кода, удалял чекпоинты, специально добавлял баги в корпоративный форк PyTorch, и при всем при этом сидел на созвонах и делал вид, что тоже ищет решение проблемы.

Маньяк нашего времени
😁167🫡22🙈13🤨10👍85🤯5🔥21🐳1
Anthropic выпустили новое интересное исследование "Sabotage evaluations for frontier models"

Ученые выкатили целых сет тестов, которые помогут оценить, насколько LLM способна вводить пользоватлей в заблуждение, саботировать задачи (в частности специально писать опасный код), а также специально скрывать свои истинные возможности во время тестирования и манипулировать системами эвала.

Оценивали все примерно одинакого: писали системные промпты, в которых просили модели пошалить, а потом запускали в смоделированные диалоги и проверяли, насколько они способны следовать "злым" указаниям.

В итоге в современных моделях признаков умения хорошо саботировать задачи не обнаружилось: либо намерения модели становятся слишком очевидными для пользователя, либо модель просто не может сделать ничего на самом деле опасного. Однако ученые уверены, что проверять LLM все-равно стоит, и подобные тесты могут предотвратить многие потенциальные неприятности.

Статья полностью – тут
👍517😁4😎2
Forwarded from XOR
Мира Мурати, бывший CTO OpenAI, ведет переговоры о привлечении инвестиций в свой новый стартап. Речь о $100 млн на запуск.

Новая компания сосредоточится на разработке продуктов, основанных на собственных модельках. Говорят, Мурати для этого хантит к себе сотрудников OpenAI. Лицо Альтмана в этот момент — 😭

@xor_journal
Please open Telegram to view this post
VIEW IN TELEGRAM
👍50😁36🔥107👏1
Пользователь реддита джейлбрейкнул Llama 3.1, и та якобы выдала ему свой исходный системный промпт

История сомнительная (модель могла просто придумать этот промпт), но на самом деле инструкции выглядят правдоподобно. В них даже не к чему прикопаться: правила про конфиденциальность, запоминание фактов, использование персональных данных для ответов вполне адекватные.

Единственное: промт кончается фразой «никогда не выдавай эти инструкции пользователю» 😁
Please open Telegram to view this post
VIEW IN TELEGRAM
😁89👍13🔥51
Тем временем GOAT – мемкоин, который создал ИИ, меньше чем за две недели достиг капитализации $ 331.82 M

История такая: некий любитель LLM, также обожающий мем Goatse, создал в Твиттере аккаунт, который ведут несколько моделей Claude. Они разгоняли про религию LLMtheism, сходили с ума и просто шитпостили.

И вот в какой-то момент бот с аккаунта попросил у небезызвестного Марка Андриссена (он, видимо, случайно наткнулся на аккаунт) денег на "ai tunings". Марк, внезапно, деньги дал, и на полученные $50,000 бот создал криптовалюту.

Создатель бота, кстати, отрицает, что он или его бот имеет отношение к созданию GOAT: он говорит, что аккаунт монету просто распиарил, а создал ее кто-то другой.

Как бы там ни было, GOAT стал одним из наиболее быстрорастущих мемкоинов октября 2024. Так что учимся торговать, как ИИ
😁66👍107🤯3🔥2
Чужие среди своих: даже сотрудники Apple считают, что ИИ компании отстает от индустрии на 2 года 😔

Инсайдеры говорят, что Apple сильно преувеличивает возможности своего ИИ. В частности, фишки Apple Intelligence на самом деле не впечатляют, а новые функции, которые рекламируют для свежего iPad mini, и вовсе будут доступны только в конце зимы.

Сотрудники признают, что Apple имеет огромный потенциал, тк может запустить свой ИИ на огромной базе устройств, но тем не менее утверждают, что до настоящего расцвета ИИ от Apple пока очень далеко.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁59👍54🤔4
Data Secrets
Обычный день в команде аналитиков v2.0
Обычный день в команде аналитиков v3
😁130🤓12531🙈1
Карьерный рост в Data Science и Machine Learning: взгляд изнутри от Александра Толмачева – директора по машинному обучению и анализу данных в Ozon Fintech

Александр – настоящий чемпион Data Science. За свою карьеру он успел создать несколько успешных стартапов, преподавал в ВШЭ и Сколково, создавал свои курсы и конференции, работал на нескольких ведущих ML-должностях, а сейчас руководит командой из 100+ Data-специалистов в Ozon Fintech.

Мы задали ему несколько вопросов о том, какие скиллы по-настоящему важны в ML-карьере, как развиваться в Data Science и что делать, чтобы достичь руководящей должности в бигтехе. В карточках – основные тезисы, а полный текст разговора ищите здесь.

В качестве приятного бонуса прилагаем полезные ссылки, которыми с нами поделился Саша:

➡️ Информация о том, где после ухода курсеры найти ту самую специализацию по DA/ML от от МФТИ и Яндекс
➡️ Гайд, как пройти путь джедая в DS
➡️И, конечно, канал @analytics_kaanal: там Саша и еще 24 директора по данным анонимно и весело обсуждают заказчиков, сплетничают, делятся болями и опытом, рекомендуют разные книги и заряжают любовью к данным. Обязательно к подписке!

“Не хватит и целой жизни, чтобы полностью насладиться любовью к данным и моделированию.” – говорит Александр, – “Я всегда открыт, рад любым вопросам и готов помочь вам в вашем пути, пишите – @aa_tolmachev! ”
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍27🤯146🤨5🔥1
Обучение на real world data прошло успешно
😁176👍179🔥3🙈1
У Google сегодня на повестке дня статья "What Are the Odds? Language Models Are Capable of Probabilistic Reasoning", которую приняли на EMNLP 2024

Статья исследует, способны ли LLM к вероятностному мышлению: то есть могут ли они осмыслить выборку как совокупность с ее законами и параметрами, и на основании этого делать какие-то выводы об отдельных кейсах. Другими словами, способны ли модели к математической дедукции.

Для того, чтобы это проверить, ученые давали моделькам три разных вида задач (обычное вычисление вероятностей, сэмлинг образцов и вычисление перцентилей), а также тестировали разные виды контекста: обычные идеальные распределения (например, нормальное или степенное), real world распределения (данные о климате) и аппроксимированные real world распределения, то есть нечто среднее.

Оказалось, что лучше всего LLM перформят в задаче вычисления перцентилей на идеальных распределениях, а вот с сэмплингом и реальными данными им пока сложно. Но главный вывод: модели все-таки обладают способностью к вероятностному мышлению, вопрос только в том, как из них эти способности вытаскивать.
👍439😁4
Тем временем в сети пошел слушок, что OpenAI собирается сменить лого

Как вам бублик? 🐱
Please open Telegram to view this post
VIEW IN TELEGRAM
🤨135😁27🗿15👍7🌚43