Data Secrets

Ты должен был бороться со злом, а не примкнуть к нему! Пользователи Интернетов после вчерашней новости о сотрудничестве Stack Overflow с OpenAI начали припоминать, что раньше политика форума в отношении AI была другой. В частности, в 2022 году они полностью…

Кстати, недавно вышло интересное исследование на тему того, постарел ли Stack Overflow в эру ChatGPT.

В итоге 52% ответов ChatGPT из 517 вопросов со Stack Overflow о программировании оказались неверны. 77% ответов более многословны, чем человеческие ответы, а 78% ответов страдают от различной степени несоответствия человеческим ответам.

9923🤓8👍3🔥1

8.52K views05:58

Data Secrets

А вы знали, что у Mistral не так давно появился собственный cookbook?

Там лежат ноутбуки с интересными кейсами использования моделей Mistral от самой команды и контрибьюторов. Особенно полезно под ресерч и учебу, но для бытового использования кое-что тоже подойдет. Листинг самого интересного:

⚪️

RAG from scratch с использованием Mistral AI API

⚪️

Извлечение эмбеддингов и их использование для классификации и кластеризации

⚪️

text-to-sql с файнтюнингом и RAG

⚪️

RAG из статей на ArXiv (вот это точно очень полезно для жизни)

⚪️

Pandas на естественном языке

Кстати, прямо сейчас у Mistral проходит хакатон в Париже. Все-таки у опенсорса есть свои крутые преимущества.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍39🔥10❤733

10.4K views09:05

Data Secrets

print(“accuracy = 0.99”)

🔥132😁481611👍6❤5🤗2👾2🤯1🏆1

9.43K views11:00

Data Secrets

0:42

This media is not supported in your browser

VIEW IN TELEGRAM

Когда нет денег на GPU, на помощь приходит Minecraft. Гений всего за 2 недели написал систему распознавания цифр, которую игрок пытается нарисовать.

YOLO тихо курит в сторонке.

201🔥34🤯206👍5❤1

10.3K viewsedited 13:28

Data Secrets

XOR

Там небезызвестный в ИИ кругах Ян Лекун выдал базу. Да-да, это тот самый перец, фото которого красовалось на башне Бурдж-Халифа со ставкой от властей ОАЭ на привлечение специалиста к себе. Так вот база: Язык имеет низкую пропускную способность: менее 12…

Сознателен ли искусственный интеллект?

Когда-то не так давно Ян Лекун высказывался о том, что AI никак не сможет стать AGI без обучения на прикосновениях и визуалах. Мы писали об этом тут. Так вот, эти рассуждения подверглись критике, некоторые в сообществе даже приводят аргументы в пользу того, что сознание - это вообще выдумка (см. карточку №4).

Давайте вместе разложим по полочкам: что такое AGI, может ли ИИ быть сознательным, и почему нет.

Источник: статья проректора Стэнфордского университета Джона Этчеменди

❤45🔥10👍7😐5🤨33👏1🌭1💯1🎃1

8.6K views16:17

Data Secrets

Илон Маск VS Ян Лекун

После прожарки OpenAI Лекун не остановился, и решил оторваться еще и на xAI.

Под постом, где Маск зовет специалистов на работу, он написал, что тот отвратительный босс, который генерирует бредовые теории заговора, ставит нереалистичные сроки и давит на сотрудников.

После этого Маск поставил под сомнение деятельность Лекуна, назвав ее наукой в кавычках. Он заявил, что 80 статей, которые ученый написал за два года – это «ничего», и Яну нужно «стараться лучше».

Как думаете, бой в клетке, как с Цукербергом, будет?

10075😁38❤2☃1👌1

8.76K views06:47

Data Secrets

🚀Вышла YOLOv.10 Юхууу, юбилей! И, в отличие от Форсажа, YOLO все-таки становится чуть лучше с каждым разом. Сейчас исследователи поработали над оптимизацией, и новая версия содержит на 25% меньше параметров и сокращает задержку на 46%, при этом выбивает…

This media is not supported in your browser

VIEW IN TELEGRAM

Кажется, противопоставив YOLO Форсажу, мы немного поторопились. Оказалось, что новая, десятая, версия детектора все-таки остает от предыдущих.

Смотрим на видео:
– зеленые объекты: те, которые нашла и YOLOv8, и YOLOv10
– красные: только YOLOv8
– синие: только YOLOv10

Видно, что с небольшими и удаленными от камеры объектами у новой версии неприятности. Ждем v10.1

60🤔11🔥7❤3👍3🙈2🕊1

8.96K viewsedited 08:54

Data Secrets

Друзья, в эфире снова KANтент!

Слились старая и новая школы: KAN обучили на titanic.csv. Прунинг и визуализации на месте. Лосс, кстати, тоже получился очень приличный.

Пошаговый гайд
Ноутбук на Kaggle

👍49🔥16❤6🌚2

8.92K views11:38

Data Secrets

Теперь официально: OpenAI начала обучение своей следующей модели

Информация об этом появилась в новости о создании внутреннего комитета по безопасности ИИ на сайте OpenAI. Комитет будет давать рекомендации совету директоров касательно безопасной разработки AGI. Один из членов комитета - сам Альтман.

Тем временем Суцкевер и Лейке, которым пол года до увольнения не выделяли ресурсы на исследования про alignment: 🗿

Please open Telegram to view this post

VIEW IN TELEGRAM

5524🗿12👍1

8.53K views13:50

Data Secrets

В Твиттере популярность набирает тред от создателей «Хемингуэй поспорил, что сможет написать самый короткий рассказ, способный растрогать любого».

Суть: нужно написать очень грустную историю из трех слов. Конечно, ML-щики в стороне не остались. Наш фаворит 👆

Продолжаем в комментариях

Please open Telegram to view this post

VIEW IN TELEGRAM

😁872014🔥7👍3😐3❤1

8.41K views15:46

Data Secrets

Илон Маск VS Ян Лекун После прожарки OpenAI Лекун не остановился, и решил оторваться еще и на xAI. Под постом, где Маск зовет специалистов на работу, он написал, что тот отвратительный босс, который генерирует бредовые теории заговора, ставит нереалистичные…

datasecrets.ru

Илон Маск привлёк 6 млрд долларов для развития xAI | Data Secrets

Деньги планируют потратить на запуск собственного дата-центра

Кстати, Маск не просто так зазывает на работу: xAI привлек инвестиции в размере $6 млрд.

Они поступят от Sequoia Capital, Valor Equity Partners и… лично принца Саудовской Аравии. При этом всего пол года назад Маск вообще отрицал, что ищет инвесторов.

Как думаете, на что уйдут 💰? Ну да, на чипы конечно. По оценкам журналистов, для обучения новой версии Grok понадобится около 100 тыс. NVIDIA H100.

Интересно, кто сейчас доволен больше, Маск или Дженсен Хуанг?

😁3620🔥3👍2

8.93K views18:27

Data Secrets

Ян Лейке, который уволился из OpenAI вместе с Суцкевером, ушел в Anthropic

Там он будет заниматься исследованием генерализации, масштабируемости и, конечно, alignment’ом.

Создатели Claude известны своей любовью к такому роду ресерчам. У них регулярно выходят статьи и собрана большая команда. Не удивительно, что они легко приманили Яна.

Надеемся, что скоро мы увидим больше интересных папирок 😏

Please open Telegram to view this post

VIEW IN TELEGRAM

72❤21🔥10👍5😎2

8.72K views06:26

Data Secrets

Да, я слышал про big data. Интересно, какой протеин эта data пьет?

😁80👨‍💻10🔥8

8.84K views09:34

Data Secrets

Трансформеры МОГУТ справляться с математикой, если подобрать правильные эмбеддинги

Есть известная проблема: хотя LLM хорошо справляются с естественным языком, они все еще могут уверенно утверждать, что 2+2 = 5. Проблему пытаются решать файн-тюнингом, прикручиваем питона и тд (см. наш недавний разбор).

А на днях вышла статья, в которой ученые утверждают, что на самом деле нужно просто внимательно поработать с эмбеддингами чисел. В работе доказано, что проблема трансформеров в том, что они не способны отслеживать "положение" числа относительно нуля. "Так давайте же просто добавим информацию о такой позиции прямо в эмбеддинг" – предложили исследователи.

И это заработало! Всего один день обучения на единственной GPU, и удалось достичь SOTA перформанса: 99% accuracy в задачах сложения 100-значных чисел. При этом интересно, что обучалась модель ТОЛЬКО на 20-значных.

Читать статью

🔥151👍1910🗿6❤4💅1

9.7K views11:36

Data Secrets

Google в своем репертуаре. То у них генератор картинок делает ванильное мороженое шоколадным, а английский монархов азиатами, то свежий ИИ-поисковик предлагает самоубийство в качестве лекарства от депрессии. Анонсированный на Google I/O поисковик с фичей…

И снова breaking!

Исследователи из Google выпустили новую книгу: «Как конкурировать с OpenAI без тестирования и другие способы опозориться»

😁10633🤪13👍3💅1

8.49K views13:32

About

Blog

Apps

Platform