Data Secrets
78.8K subscribers
6.42K photos
667 videos
20 files
2.71K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Это интересно (и полезно): интерактивная карта навыков для ML-разработчиков

Исследователи из Яндекса проанализировали запросы по машинному обучению на StackOverflow и их теги и собрали все в большую карту навыков.

На карте чем больше размер навыка – тем он популярнее среди разработчиков. Расстояние между навыками соответствует сходству контекста (для расчета использовались векторы встречаемости и TF-IDF).

При наведении на навык можно увидеть 10 его ближайших соседей + дополнительную информацию о нем: описание, динамику интереса с 2010 года, а также список навыков-альтернатив.

В конце статьи также есть список самых актуальных навыков — интерес к которым в 2023 году вырос особенно сильно по сравнению с 2022-м.

Осторожно, присутствует высокая вероятность залипнуть
👍50🔥1210😨1
Data Secrets
То, что все пропустили На днях мы писали о новом исследовании от Apple про развертывание LLM на устройствах с ограниченной памятью. Как оказалось, это не единственная их работа за последнее время. Компания также выпустила статью, в которой предлагает HUGS…
И еще одна мультимодальная опенсорс модель от Apple – MGIE. Разработанная (снова) совместно с Калифорнийским университетом, она предназначена для редактирования изображений по описанию на естественном языке.

В модели объединено распознавание образов и команд и диффузионка до генерации. Таким образом, модель может, например, добавить что-то на фото, что-нибудь удалить или подкорректировать. Ждем в iPhone 16.

Код и веса | Статья | Hugging Face
👍20🔥54
Media is too big
VIEW IN TELEGRAM
Google переименовали Bard в Gemini (создатели считают, что это название лучше передает вайб продукта) и выкатили Gemini Advanced. Это платная подписка для доступа к самой мощной из мультимодальных моделей Gemini – Gemini Ultra.

Стоит $20 и позволяет не только работать с моделью на максималках, но еще и интегрировать ее в другие продукты Google экосистемы.

Можно позволить ассистенту просматривать свою почту, календарь, документы и встречи, а он сможет, например, собирать саммари по письмам или документам, да еще и учитывать весь ваш контент в следующих генерациях. К подписке также идет ништяк в виде 2TB на диске.
👍277🔥5🤯1
Извините, что опоздал: просто застрял в локальном минимуме
101😁82👍7🔥7👌2
Выходные – время отсыпаться. Главное, чтобы не мучали кошмары. Хотя после нашей подборки страшилок на ночь ничего нельзя обещать 👻
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32👻16😁123👍2
Немного интересной статистики:

🟢С мая прошлого года спрос на ИИ в России увеличился почти в четыре раза

🟢Основная масса трафика приходится на Москву, Санкт-Петербург и Краснодар

🟢Самые популярные у россиян нейросети – Midjourney и ChatGPT

🟢Мужчин, использующих ИИ, на 24% больше, чем женщин

🟢Больше всего ИИ пользуются люди от 35 до 40. Зумеры пока отстают...
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥25👍7😁72
На данный момент инвестиции в OpenAI суммарно перевалили за $11,3 млрд. Как они это сделали?

Вот их питч-дек: очень краткая презентация, создающаяся, чтобы за 2-3 минуты привлечь внимание инвесторов. Поучимся же у профессионалов:
👍25🔥542😐2
😻 Пользователи ChatGPT генерируют 100 миллиардов слов в день.

Кажется, мы вот-вот проверим теорему о бесконечных обезьянах.
©️Сэм Альтман
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥59😁309
Data Secrets
Как сделать так, чтобы нейросеть не переобучалась Переобучение – это одно из главных проклятий большинства ML-алгоритмов, в том числе нейросетей. Вещь неприятная, конечно, но в большинстве случаев фиксится достаточно просто. Надо только знать специальные…
Как сделать так, чтобы нейросеть не переобучалась: 2 часть

Как и обещали, показываем вам еще три фокуса, которые вылечат вашу модель от переобучения. Уже пробовали что-то из перечисленного?
🔥38👍11👌63😁1