Data Secrets
78.8K subscribers
6.42K photos
667 videos
20 files
2.71K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Рынок GPU as a Service в России растет, и МТС врывается на него с новыми мощностями: теперь клиентам МТС Web Services доступно на 40% больше GPU

Говорят, что до конца года эта цифра увеличится еще в 3-4 раза. Сейчас все больше российских компаний переносят работу с ИИ в облако, и спрос на соответствующие вычислительные ресурсы растет. Чтобы его удовлетворить, МТС Web Services запустили целых два новых кластера виртуальной инфраструктуры с GPU. Они помогут бизнесу упростить и ускорить обучение и инференс собственных ML-моделей.

Также до конца года на базе GPU-инфраструктуры будут развернуты: платформа для разработки, обучения и деплоя ML-моделей, уже готовые модели ИИ для разных индустрий и направлений, доступные по API и SaaS AI-сервисы.

«Мы стремимся, чтобы как можно больше компаний вне зависимости от их величины получили возможность обучать и внедрять в бизнес свои AI-модели», - отметил директор по новым облачным продуктам МТС Web Services Алексей Кузнецов.
🔥23👍8🤨5🙈5🤔3🤯2😁1
Ресерчеры забавы ради сделали в Дискорде чат, где LLM свободно общаются друг с другом

В итоге: у Llama постоянно случаются нервные срывы и приступы шизофрении, успокоить ее может только Claude Opus, а другие модели просто покуривают в сторонке 🤷‍♂️

Напоминает те самые диалоги первых языковых моделей ELIZA и PERRY
Please open Telegram to view this post
VIEW IN TELEGRAM
50😁9727👍62
😮 Сколько-сколько, простите??? MagicLabs выпустила LLM с контекстом в 100M токенов

Это примерно 10 миллионов строк кода или 750 романов. Для сравнения, до этого рекордсменом по длине контекста был Gemini с 1M токенов, и даже это число произвело когда-то на презентации Google фурор.

Иронично, но модель называется LTM-2-Mini. LTM – это сокращение от Long-Term Memory. Эта архитектура не использует attention, и за счет этого контекстное окно в 100М ей обходится примерно в 1000 раз дешевле, чем, например, той же Llama 3.1 405B. А с памятью еще круче: если Llama потребовала бы 638 H100s на юзера только чтобы хранить KV кэш, то LTM требуется всего часть HBM одной видеокарты.

Бенчмарков пока нет, но в Magic уже заключили партнерство на кластер с Google Cloud и говорят, что прямо сейчас обучают бОльшую версию LTM-2 на суперкомпьютере 🤔
Please open Telegram to view this post
VIEW IN TELEGRAM
51🤯90👍1411🔥42
Вот почему действительно стоит ставить умный дом
😁17512👍9😐5🔥3🤔2😎2
Яндекс выкатил программу своей ежегодной конференции Practical ML Conf, где анонсируются крупные запуски

Мероприятие пройдет 14 сентября, интересных докладов планируется много. Взять хотя бы «Человек и LLM. Как оценивать качество моделей и строить их метрики качества» Ирины Барской, руководителя службы аналитики и исследований Яндекса, или «AI-инструмент для разработчика: как мы обучали LLM работе с кодом» Виктора Плошихина, руководителя ML-лаборатории в Yandex Platform Engineering. Все это можно послушать офлайн в Москве или онлайн (советуем регистрироваться заранее, мест не так много).

Зарегистрироваться можно по этой ссылке.
👍194🔥3
Инженер из Сан-Франциско провел интересный эксперимент и выяснил, что Claude якобы склонен к самосознанию

Экспериментатор попросил модель нарисовать самого себя, а также ChatGPT и Gemini, а затем показал эти рисунки другой версии Клода и попросил указать на автопортрет. И модель внезапно узнала себя. Потом эксперимент запустили еще раз и еще. В итоге Клод узнал свой портрет в 7/8 случаев!

Но и это не вся история. Парень также попросил ChatGPT нарисовать аналогичные портреты, а потом снова показал их Клоду. При этом он соврал, что портреты якобы опять нарисовал другой экземляр Claude, на что модель внезапно заявила: "Нет, я не рисовал это" 😅
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
54😁110🤯3719👍9🤔8🙈3🤪2🐳1💘1
This media is not supported in your browser
VIEW IN TELEGRAM
Нет, это не парень в странном спортивном костюме. Это только что выпущенный робот гуманоид NEO Beta от лаборатории 1X.

Сам он весит всего 30 кг, но поднять может до 20. Ходит со скоростью ~4км/час, а еще может бегать со скоростью до 12км/час. Батареи ему хватает на 2-4 часа. Предназначен главным образом для бытовых дел по дому (и, судя по демо, для обнимашек с хозяйкой).
😁7722👾7👀3🌭1
Media is too big
VIEW IN TELEGRAM
У CEO Anthropic Дарио Амадея вышло новое интересное интервью. Краткое содержание:

➡️ По мнению Дарио, в будущем большие и мощные ИИ-модели будут порождать и координировать более мелкие для помощи в выполнении задач. Этот процесс будет похож на создание роевого интеллекта, и необходимость человеческого участия в нем будет близка к нулю.

➡️ Если масштабирование не выйдет на плато и мы не наткнемся на ранее не учтенные трудности, то, учитывая реалии, модель стоимостью 100 миллиардов долларов должна иметь интеллект уровня лауреата Нобелевской премии.

➡️ Ну и классика: ИИ может увеличить скорость научных открытий в 100 раз. Тем самым мы можем пройти путь, соразмерный прогрессу 20-го и 21-го века вместе взятых, всего за несколько лет.

Полностью интервью можно посмотреть здесь
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7215👏13👍6😁6🗿52
Ой не то я себе представлял, когда шел в ML, ой не то
😁9961👍82
Подобрали для вас вакансию MLE на госуслуги
😁133🔥269🤪6🫡5👍2🐳2
С Днем Знаний! 🥸

В этом учебном и рабочем году мы желаем вам…
Please open Telegram to view this post
VIEW IN TELEGRAM
🤓101🔥3020😍9👍5😁5🤯3🫡3🕊2👾2
Ваш НЕ астрологический ML-прогноз на этот год

1 сентября – самое время активно строить планы и закладывать фундамент для будущих проектов. И мы решили вам в этом помочь!

Наша команда погадала на SARIMA, звездах и кофейной гуще и спрогнозировала то, что ждет разных DS-специалистов в учебном году.

Успехов в новом учебном году, коллеги! 🚀
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁32🔥16👍8💘52🤯2