Data Secrets
78.8K subscribers
6.43K photos
669 videos
20 files
2.71K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Data Secrets
Ты должен был бороться со злом, а не примкнуть к нему! Пользователи Интернетов после вчерашней новости о сотрудничестве Stack Overflow с OpenAI начали припоминать, что раньше политика форума в отношении AI была другой. В частности, в 2022 году они полностью…
Кстати, недавно вышло интересное исследование на тему того, постарел ли Stack Overflow в эру ChatGPT.

В итоге 52% ответов ChatGPT из 517 вопросов со Stack Overflow о программировании оказались неверны. 77% ответов более многословны, чем человеческие ответы, а 78% ответов страдают от различной степени несоответствия человеческим ответам.
9923🤓8👍3🔥1
А вы знали, что у Mistral не так давно появился собственный cookbook?

Там лежат ноутбуки с интересными кейсами использования моделей Mistral от самой команды и контрибьюторов. Особенно полезно под ресерч и учебу, но для бытового использования кое-что тоже подойдет. Листинг самого интересного:

⚪️ RAG from scratch с использованием Mistral AI API
⚪️ Извлечение эмбеддингов и их использование для классификации и кластеризации
⚪️ text-to-sql с файнтюнингом и RAG
⚪️ RAG из статей на ArXiv (вот это точно очень полезно для жизни)
⚪️ Pandas на естественном языке

Кстати, прямо сейчас у Mistral проходит хакатон в Париже. Все-таки у опенсорса есть свои крутые преимущества.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍39🔥10733
print(“accuracy = 0.99”)
🔥132😁481611👍65🤗2👾2🤯1🏆1
This media is not supported in your browser
VIEW IN TELEGRAM
Когда нет денег на GPU, на помощь приходит Minecraft. Гений всего за 2 недели написал систему распознавания цифр, которую игрок пытается нарисовать.

YOLO тихо курит в сторонке.
201🔥34🤯206👍51
XOR
Там небезызвестный в ИИ кругах Ян Лекун выдал базу. Да-да, это тот самый перец, фото которого красовалось на башне Бурдж-Халифа со ставкой от властей ОАЭ на привлечение специалиста к себе. Так вот база: Язык имеет низкую пропускную способность: менее 12…
Сознателен ли искусственный интеллект?

Когда-то не так давно Ян Лекун высказывался о том, что AI никак не сможет стать AGI без обучения на прикосновениях и визуалах. Мы писали об этом тут. Так вот, эти рассуждения подверглись критике, некоторые в сообществе даже приводят аргументы в пользу того, что сознание - это вообще выдумка (см. карточку №4).

Давайте вместе разложим по полочкам: что такое AGI, может ли ИИ быть сознательным, и почему нет.

Источник: статья проректора Стэнфордского университета Джона Этчеменди
45🔥10👍7😐5🤨33👏1🌭1💯1🎃1
Илон Маск VS Ян Лекун

После прожарки OpenAI Лекун не остановился, и решил оторваться еще и на xAI.

Под постом, где Маск зовет специалистов на работу, он написал, что тот отвратительный босс, который генерирует бредовые теории заговора, ставит нереалистичные сроки и давит на сотрудников.

После этого Маск поставил под сомнение деятельность Лекуна, назвав ее наукой в кавычках. Он заявил, что 80 статей, которые ученый написал за два года – это «ничего», и Яну нужно «стараться лучше».

Как думаете, бой в клетке, как с Цукербергом, будет?
10075😁3821👌1
Data Secrets
🚀Вышла YOLOv.10 Юхууу, юбилей! И, в отличие от Форсажа, YOLO все-таки становится чуть лучше с каждым разом. Сейчас исследователи поработали над оптимизацией, и новая версия содержит на 25% меньше параметров и сокращает задержку на 46%, при этом выбивает…
This media is not supported in your browser
VIEW IN TELEGRAM
Кажется, противопоставив YOLO Форсажу, мы немного поторопились. Оказалось, что новая, десятая, версия детектора все-таки остает от предыдущих.

Смотрим на видео:
– зеленые объекты: те, которые нашла и YOLOv8, и YOLOv10
– красные: только YOLOv8
– синие: только YOLOv10

Видно, что с небольшими и удаленными от камеры объектами у новой версии неприятности. Ждем v10.1
60🤔11🔥73👍3🙈2🕊1
Друзья, в эфире снова KANтент!

Слились старая и новая школы: KAN обучили на titanic.csv. Прунинг и визуализации на месте. Лосс, кстати, тоже получился очень приличный.

Пошаговый гайд
Ноутбук на Kaggle
👍49🔥166🌚2
Теперь официально: OpenAI начала обучение своей следующей модели

Информация об этом появилась в новости о создании внутреннего комитета по безопасности ИИ на сайте OpenAI. Комитет будет давать рекомендации совету директоров касательно безопасной разработки AGI. Один из членов комитета - сам Альтман.

Тем временем Суцкевер и Лейке, которым пол года до увольнения не выделяли ресурсы на исследования про alignment: 🗿
Please open Telegram to view this post
VIEW IN TELEGRAM
5524🗿12👍1
В Твиттере популярность набирает тред от создателей «Хемингуэй поспорил, что сможет написать самый короткий рассказ, способный растрогать любого».

Суть: нужно написать очень грустную историю из трех слов. Конечно, ML-щики в стороне не остались. Наш фаворит 👆

Продолжаем в комментариях
Please open Telegram to view this post
VIEW IN TELEGRAM
😁872014🔥7👍3😐31
Data Secrets
Илон Маск VS Ян Лекун После прожарки OpenAI Лекун не остановился, и решил оторваться еще и на xAI. Под постом, где Маск зовет специалистов на работу, он написал, что тот отвратительный босс, который генерирует бредовые теории заговора, ставит нереалистичные…
Кстати, Маск не просто так зазывает на работу: xAI привлек инвестиции в размере $6 млрд.

Они поступят от Sequoia Capital, Valor Equity Partners и… лично принца Саудовской Аравии. При этом всего пол года назад Маск вообще отрицал, что ищет инвесторов.

Как думаете, на что уйдут 💰? Ну да, на чипы конечно. По оценкам журналистов, для обучения новой версии Grok понадобится около 100 тыс. NVIDIA H100.

Интересно, кто сейчас доволен больше, Маск или Дженсен Хуанг?
😁3620🔥3👍2
Ян Лейке, который уволился из OpenAI вместе с Суцкевером, ушел в Anthropic

Там он будет заниматься исследованием генерализации, масштабируемости и, конечно, alignment’ом.

Создатели Claude известны своей любовью к такому роду ресерчам. У них регулярно выходят статьи и собрана большая команда. Не удивительно, что они легко приманили Яна.

Надеемся, что скоро мы увидим больше интересных папирок 😏
Please open Telegram to view this post
VIEW IN TELEGRAM
7221🔥10👍5😎2
Да, я слышал про big data. Интересно, какой протеин эта data пьет?
😁80👨‍💻10🔥8
Трансформеры МОГУТ справляться с математикой, если подобрать правильные эмбеддинги

Есть известная проблема: хотя LLM хорошо справляются с естественным языком, они все еще могут уверенно утверждать, что 2+2 = 5. Проблему пытаются решать файн-тюнингом, прикручиваем питона и тд (см. наш недавний разбор).

А на днях вышла статья, в которой ученые утверждают, что на самом деле нужно просто внимательно поработать с эмбеддингами чисел. В работе доказано, что проблема трансформеров в том, что они не способны отслеживать "положение" числа относительно нуля. "Так давайте же просто добавим информацию о такой позиции прямо в эмбеддинг" – предложили исследователи.

И это заработало! Всего один день обучения на единственной GPU, и удалось достичь SOTA перформанса: 99% accuracy в задачах сложения 100-значных чисел. При этом интересно, что обучалась модель ТОЛЬКО на 20-значных.

Читать статью
🔥151👍1910🗿64💅1