Data Secrets
57.6K subscribers
5.2K photos
466 videos
19 files
1.92K links
Первый журнал о Data Science | Machine Learning | Big Data | Deep Learning | Neural Networks

По вопросам сотрудничества: @veron_28

https://telega.in/c/data_secrets

Реестр РКН: clck.ru/3FY3GN
Download Telegram
Забавные комиксы на тему Data Science от Allison Marie Horst

Да-да, художница взяла и оформила обучающие материалы в короткие веселые истории в картинках. Есть комиксы про:

– K-means
– Автокорреляцию
– Линейную регрессию
– Git
– Язык R
– и еще много чего другого

Осторожно, вы рискуете надолго залипнуть…
Forwarded from XOR
Рыночная стоимость NVIDIA превысила 2 триллиона долларов
Помните тот скандал с Reddit, когда компания приняла решение о платном доступе к данным?

Так вот: не без сложностей в виде крупнейшей в истории интернета забастовки пользователей, но, кажется, корпорация добилась своего. Google теперь будет платить примерно $60 млн в год за то, что Reddit предоставит свой контент для обучения моделей искусственного интеллекта. Кроме того, такая сделка повысит потенциальную оценку стоимости компании.

Пока представители Google и Reddit отказались комментировать возможные условия сделки.
Неделя новая, боль старая
Лид лаборатории Tinkoff Research Сергей Колесников выпустил статью, в которой поразмышлял на тему того, как SORA изменит индустрию и мир. Внутри много интересных инсайтов. Мы вынесли основное в карточки.
Ой-ой... от Google мы такого не ожидали!

Выяснилось, что у недавно выпущенной Gemma-7В на самом деле не 7В параметров, а 8.5В.

Казалось бы, ну "немного" обcчитались, с кем не бывает. Но с другой стороны, размер модели очень важен для сравнения LLM между собой. Так, до этого Gemma выгодно сравнивали с Mixtral-7B и Llama-7B, но теперь понятно, что это было некорректно.

Отсюда вопрос: а действительно ли обсчитались случайно?
Forwarded from Skolkovo LIVE
🤔 Кейс: как в несколько раз увеличить эффективность и качество работы компании с помощью нейросетей

Участник «Сколково» «Тексел» уже применяет ИИ в восьми ключевых аспектах — найм сотрудников, менеджмент, продажи, техподдержка, исследования, разработка, маркетинг, юридическая работа.

Эффективность использования нейросетей в компании заключается не просто в автоматизации процессов, а в полном переосмыслении и перестроении подхода к работе, рассказывает Максим Федюков, гендиректор «Тексел».

💬 «Нейросети не заменяют людей, а дополняют и усиливают наши возможности. Это новый тип собеседника, который помогает нам видеть вещи по-новому и решать задачи более эффективно. Нейросети помогают нам в достижении целей, приумножая ценность человеческого вклада».

Например, в области продаж нейросети помогают обрабатывать сложные запросы и вести переговоры. Время ожидания ответа клиентами сократилось в 18 раз, при этом сами ответы идут не по шаблонам, а на основе собранной базы знаний, и всегда четко соответствуют вопросам.

👉 Подробнее о том, как еще наш резидент применяет ИИ, рассказываем по ссылке.

👋  Skolkovo LIVE — инновации тут
Please open Telegram to view this post
VIEW IN TELEGRAM
Сэм, только не обижайся. Microsoft начали инвестировать в Mistral.

Напоминаем, что это французский ИИ-стартап, который в декабре выпустил опенсурс LLM, натворившую шума. Стоимость партнерства оценивается примерно в 2.1 миллиарда долларов, сделка будет включать в себя приобретение Microsoft’ом небольшой доли в компании.

Кстати, как раз вчера Mistral анонсировала новую LLM Mistral Large, которая уже не будет открытой, зато более плотно конкурирует с ChatGPT.

Посмотрим, получится ли у Microsoft во второй раз поймать золотую рыбку. Впрочем, 2.1 миллиарда – это всего 0.03% от 7 триллионов, которые Альтман сейчас собирает на производство чипов.
Давайте уважать промпт-инженеров 😁
Please open Telegram to view this post
VIEW IN TELEGRAM
Сейчас будет полезная полезность

В интернете существует замечательный сайт NeetCode. Он идеален для подготовки к собеседованиям и в целом для развития. Здесь ссылки на задачи редиректят вас на функционал LeetCode, НО все отсортировано по темам и в правильном порядке изучения. Создатель составлял подборки на основе опыта интервью в FAANG.

К чему мы это все? Недавно там появилась вкладка Machine Learning! Это задачи на реализацию занимательных алгоритмов с нуля. Подойдет для всех уровней подготовки: задачи отсортированы по Easy, Mediums и Hard. Автоматическая проверка и подсказки в комплекте.

Ну где такое еще увидишь? Однозначно, рекомендуем.
Яндекс Переводчик стал мировым лидером по качеству перевода с английского на русский по итогам международного независимого бенчмарка DiBiMT. Это эталонный тест для машинного перевода.

Следующие в рейтинге – DeepL и Google Translate. Поздравляем коллег!
This media is not supported in your browser
VIEW IN TELEGRAM
Вышла YOLOv9!

▪️Теперь это SOTA для обнаружения объектов в реальном времени, работает локально в браузере без сервера.

▪️Совместима с Transformers.js.

▪️Новая архитектура Generalized Efficient Layer Aggregation Network с полноценными свертками. Благодаря подходу Programmable Gradient Information меньше информации теряется при прямом проходе.

Папира | Код | Демо | Hugging Face
Помните, мы рассказывали про Netflix Prize? Это легендарный конкурс по рексис, который длился много лет. Победители разработали решение, которое увеличило точность рекомендаций на 10 процентов и получили 1 млн долларов.

Однако Netflix так и не воспользовались этой технологией. Но почему? Да потому что решение оказалось слишком сложным и тяжелым, чтобы внедрить его в продакш.

Эта история – демонтрация того, почему исследователи в современном мире борются не только за accuracy и performance. Есть еще несколько важных "инженерных" метрик, по которым сравнивают модели. Советуем не забывать про них, если хотите, чтобы ваши решения приносили реальную пользу.