Как Netflix Prize изменил рекомендательные системы навсегда
Лестер Макки был старшим специалистом по информатике в Принстоне, когда его друг ворвался в его комнату в общежитии с этими словами. На дворе был 2006 год. Хотите знать, что было дальше? Поехали!
"НАМ НУЖНО ВЫИГРАТЬ МИЛЛИОН ДОЛЛАРОВ"
Лестер Макки был старшим специалистом по информатике в Принстоне, когда его друг ворвался в его комнату в общежитии с этими словами. На дворе был 2006 год. Хотите знать, что было дальше? Поехали!
👍44🔥14❤5👏1🤯1
В Технопарке Сколково сегодня начался международный форум «Открытые инновации». На пленарной сессии «Технологии — ключ к суверенитету» обсудили как настроить эффективное взаимодействие государства и разработчиков для ускоренного преобразования результатов исследований в работающие бизнесы.
В рамках сессии о будущем технологий искусственного интеллекта и его встраивании в бизнес рассказал первый зампред правления Сбера Александр Ведяхин.
В рамках сессии о будущем технологий искусственного интеллекта и его встраивании в бизнес рассказал первый зампред правления Сбера Александр Ведяхин.
🗿25👍10🔥3🤯3❤2🤨2😁1🎉1🐳1
Тайминг – огонь
Угадайте, что произошло вчера сразу после рефреша Arena, про который мы писали? Правильно, появилось сразу две обновленные модели🤨
– Новая версия GPT-4-Turbo. По метрикам наблюдается сильный прирост в математических задачах, в том числе олимпиадного уровня. Кроме того, модель дообучили до декабря 2023. Для разработчиков открыли API GPT-4V.
– Mixtral-8x22B. Конфиги смотрите сверху. Если кратко: 262 GB, 8 экспертов, контекст в 65536 токенов.
Если раньше лидерборды обновлялись раз в пару месяцев, то сейчас счет в гонке идет на дни, а то и на часы. Ждем, что будет дальше.
Угадайте, что произошло вчера сразу после рефреша Arena, про который мы писали? Правильно, появилось сразу две обновленные модели
– Новая версия GPT-4-Turbo. По метрикам наблюдается сильный прирост в математических задачах, в том числе олимпиадного уровня. Кроме того, модель дообучили до декабря 2023. Для разработчиков открыли API GPT-4V.
– Mixtral-8x22B. Конфиги смотрите сверху. Если кратко: 262 GB, 8 экспертов, контекст в 65536 токенов.
Если раньше лидерборды обновлялись раз в пару месяцев, то сейчас счет в гонке идет на дни, а то и на часы. Ждем, что будет дальше.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤35🔥16👍7🥰1👏1
Кстати, с интро к своей новой модели Mistral вообще не парились. Без привет и до свидания просто твитнули ссылку на торрент с весами.
Такое вот доброе утро от французских коллег🥖
Такое вот доброе утро от французских коллег
Please open Telegram to view this post
VIEW IN TELEGRAM
😁83👍7❤6⚡1🥰1👏1
Вау, первая в России мультимодальная модель! Да еще и в опенсорс!
OmniFusion 1.1., помимо привычного LLM-диалога, может отвечать на вопросы по картинкам. Например, туда можно сгрузить написанные от руки задачи, попросить проанализировать карту, или получить рецепт по фото продуктов.
В основе – Mistral, но можно легко положить в ядро любую другую LLM. Модель – SoTA на ряде бенчмарков (среди моделей схожего размера) и, более того, она хорошо справляется со сложными задачами и понимает русский.
Разработчики открыли модель как для некоммерческой, так и для коммерческой деятельности. Кстати, статья про OmniFusion сегодня на первом месте в списке daily papers на Hugging Face.
Огромный респект коллегам из AIRI🔥
Статья | GitHub | Пост на Хабр
OmniFusion 1.1., помимо привычного LLM-диалога, может отвечать на вопросы по картинкам. Например, туда можно сгрузить написанные от руки задачи, попросить проанализировать карту, или получить рецепт по фото продуктов.
В основе – Mistral, но можно легко положить в ядро любую другую LLM. Модель – SoTA на ряде бенчмарков (среди моделей схожего размера) и, более того, она хорошо справляется со сложными задачами и понимает русский.
Разработчики открыли модель как для некоммерческой, так и для коммерческой деятельности. Кстати, статья про OmniFusion сегодня на первом месте в списке daily papers на Hugging Face.
Огромный респект коллегам из AIRI
Статья | GitHub | Пост на Хабр
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👏66🔥25👍16❤5🤯4👌1
А что это мы все про OpenAI и Mistral? Google вот тоже старается:
⚙️ Вчера вышло крутое обновление Gemini 1.5 Pro — у нейросети появилась новая модальность в виде аудио.
Может в speech2text, суммаризацию, определение сантимента, ну и QA. Можно сгрузить до 11 часов аудио.
⚙️ В опенсорс выпущены веса для модели CodeGemma — сеточки на основе Gemma, но затюненой под всевозможные задачи по программированию. Модели небольшие, можно запускать локально (2Б и 7Б). Вот статья.
Может в speech2text, суммаризацию, определение сантимента, ну и QA. Можно сгрузить до 11 часов аудио.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21🔥6❤5🤯3🌚1
Центр экосистемы ИИ сегодня – Париж. Может показаться, что это случилось как-то в одночасье после прихода Mistral. Но ничего не происходит просто так. Следите за руками:
– Все началось в 2013. Тогда во Франции возникла Ecole 42 – открытая школа компьютерных наук, основанная на концепции p2p обучения. Сам концепт такого дополнительного образования был тогда не очень развит, но из школы выходили сильные спецы, чем она и привлекла внимание.
– В 2015 наш любимый француз Ян Лекун основал FAIR Paris (Facebook AI Research). После этого много талантливых ученых начали съезжаться во Францию со всей Европы.
– Кстати, сам Ян Лекун признан одним из трех "изобретателей" глубокого обучения, каким мы его знаем.
– В 2018 GoogleDeepMind открыли большую лабораторию в Париже. После этого стало очевидно, что если вы собираете большую международную ИИ-команду, то Францию во всех смыслах нельзя обойти стороной.
– В 2016 впервые была проведена VivaTech. Тогда она собрала около 2400 стартапов и 2000 инвесторов. По сей день мероприятие остается одним из крупнейших стартап-ивентов в мире, туда ежегодно съезжаются тысячи талантов.
– Также в 2016 во Франции был основан HuggingFace, а про него вы и так все знаете.
– Кстати, именно HF стал одним из первых стартапов, присоединившихся к французскому стартап-сообществу Station F (сейчас крупнейшему в мире, см.картинку), основанному в 2017, конечно же во Франции.
– Итак, к 2019 году AI в Париже уже был во всей красе. А во время пандемии главный "конкурент" – кремниевая долина – сильно потеряла в своем влиянии, и Париж стал еще более заметен.
– В 2021 году выстрелил HF, в 2023 – Mistral. И кроме того, PhotoRoom, Mithril Security, Giscard, ChainLid, Zama – это все французские стартапы.
В 2023 мы имеем то, что имеем. Как видите, это не результат удачи 2-3 стартапов, а путь длиною в десятилетие.
– Все началось в 2013. Тогда во Франции возникла Ecole 42 – открытая школа компьютерных наук, основанная на концепции p2p обучения. Сам концепт такого дополнительного образования был тогда не очень развит, но из школы выходили сильные спецы, чем она и привлекла внимание.
– В 2015 наш любимый француз Ян Лекун основал FAIR Paris (Facebook AI Research). После этого много талантливых ученых начали съезжаться во Францию со всей Европы.
– Кстати, сам Ян Лекун признан одним из трех "изобретателей" глубокого обучения, каким мы его знаем.
– В 2018 GoogleDeepMind открыли большую лабораторию в Париже. После этого стало очевидно, что если вы собираете большую международную ИИ-команду, то Францию во всех смыслах нельзя обойти стороной.
– В 2016 впервые была проведена VivaTech. Тогда она собрала около 2400 стартапов и 2000 инвесторов. По сей день мероприятие остается одним из крупнейших стартап-ивентов в мире, туда ежегодно съезжаются тысячи талантов.
– Также в 2016 во Франции был основан HuggingFace, а про него вы и так все знаете.
– Кстати, именно HF стал одним из первых стартапов, присоединившихся к французскому стартап-сообществу Station F (сейчас крупнейшему в мире, см.картинку), основанному в 2017, конечно же во Франции.
– Итак, к 2019 году AI в Париже уже был во всей красе. А во время пандемии главный "конкурент" – кремниевая долина – сильно потеряла в своем влиянии, и Париж стал еще более заметен.
– В 2021 году выстрелил HF, в 2023 – Mistral. И кроме того, PhotoRoom, Mithril Security, Giscard, ChainLid, Zama – это все французские стартапы.
В 2023 мы имеем то, что имеем. Как видите, это не результат удачи 2-3 стартапов, а путь длиною в десятилетие.
🔥88👍17🤯14❤6👾6🤨1
Meta показали свой новый чип MTIA (Meta Training and Inference Accelerator)
Говорят, он гораздо производительней первой версии, которая вышла год назад. На этом чипе Meta, как сказано в статье, уже может крутить свои рексисы, а это дорогого стоит.
На сайте можно интерактивно поиграть 3D модельками и схемами и почитать подробности.
Зачем покупать у Nvidia, когда можно сделать самим?
Говорят, он гораздо производительней первой версии, которая вышла год назад. На этом чипе Meta, как сказано в статье, уже может крутить свои рексисы, а это дорогого стоит.
На сайте можно интерактивно поиграть 3D модельками и схемами и почитать подробности.
Зачем покупать у Nvidia, когда можно сделать самим?
👍22❤7🤯6🔥3
Неоднозначные новости: на NeurIPS 2024 будет принимать работы старшеклассников.
Мнения сообщества разделились:
– Одни говорят, что это правильный шаг и даст школьникам возможность выделиться и поступить в хороший вуз. К тому же, статья не предполагает быть глубоко-технической, это должно быть исследование про влияние AI на общество.
– Другие настаивают, что написание детьми настоящих научных статей не только бессмысленно, но и нечестно по отношению к самим школьникам: одни, пользуясь знаниями родителей и учителей, могут несправедливо получить преимущество. Тем самым, крысиные бега при поступлении только усилятся, как и пустая шумиха вокруг AI.
А вы что думаете?
❤️ - здорово
🗿- не здорово
Мнения сообщества разделились:
– Одни говорят, что это правильный шаг и даст школьникам возможность выделиться и поступить в хороший вуз. К тому же, статья не предполагает быть глубоко-технической, это должно быть исследование про влияние AI на общество.
– Другие настаивают, что написание детьми настоящих научных статей не только бессмысленно, но и нечестно по отношению к самим школьникам: одни, пользуясь знаниями родителей и учителей, могут несправедливо получить преимущество. Тем самым, крысиные бега при поступлении только усилятся, как и пустая шумиха вокруг AI.
А вы что думаете?
❤️ - здорово
🗿- не здорово
🗿298❤57👍2
Data Secrets
Пу-пу-пуууу, больше не первые, получается
Ну и что вы думаете? OpenAI снова первые в лидерборде со своим новым обновленным GPT-4. Недолго радовались Anthropic.
Создается небольшое ощущение дразнилок со стороны сами знаете кого, хотя возможно корпорации просто уж очень важен факт первенства
Создается небольшое ощущение дразнилок со стороны сами знаете кого, хотя возможно корпорации просто уж очень важен факт первенства
🔥44❤7👍4😁4
Meta наступает на грабли всех генераторов изображений: на этот раз сетка не может себе представить пару, в которой люди разных рас.
Это заметили в сети: репортер The Verge кучу раз пытался сгенерировать такую пару, но генератор так и не поддался.
Это, кстати, именно тот генератор, который компания пытается развернуть в Instagram. Кроме него, они также внедряют туда поиск на основе ИИ.
Это заметили в сети: репортер The Verge кучу раз пытался сгенерировать такую пару, но генератор так и не поддался.
Это, кстати, именно тот генератор, который компания пытается развернуть в Instagram. Кроме него, они также внедряют туда поиск на основе ИИ.
😁51🌚6🤓6👍3🕊3🔥2
Где взять данные? Этим вопросом хотя бы однажды задавался каждый из нас. Итак, подборка дата-ресурсов от редакции:
1. Kaggle. Не нуждается в представлении. Тысячи бесплатных датасетов.
2. Awesome Data Github репозиторий. Список открытых наборов данных с прямыми ссылками на скачивание. Есть данные с видео, картинками, аудио, и вообще со всем.
3. Open ML. 20k+ датасетов. Есть библиотеки для Python и R.
4. Open Data Registry от AWS. Тут есть некоторые датасеты, которых больше нигде не найти.
5. Papers with Code. Краш подборки. Почти 10k датасетов, которые использовались в реальных исследованиях.
6. Dagshub. Непопулярно, но иногда полезно. Датасеты удобно поделены по областям применения (NLP, CV, пр.)
7. Hugging Face. Также не нуждается в представлении. На данный момент там 80k+ датасетов.
Пользуйтесь и пилите свои мега-проекты!
1. Kaggle. Не нуждается в представлении. Тысячи бесплатных датасетов.
2. Awesome Data Github репозиторий. Список открытых наборов данных с прямыми ссылками на скачивание. Есть данные с видео, картинками, аудио, и вообще со всем.
3. Open ML. 20k+ датасетов. Есть библиотеки для Python и R.
4. Open Data Registry от AWS. Тут есть некоторые датасеты, которых больше нигде не найти.
5. Papers with Code. Краш подборки. Почти 10k датасетов, которые использовались в реальных исследованиях.
6. Dagshub. Непопулярно, но иногда полезно. Датасеты удобно поделены по областям применения (NLP, CV, пр.)
7. Hugging Face. Также не нуждается в представлении. На данный момент там 80k+ датасетов.
Пользуйтесь и пилите свои мега-проекты!
👍54🔥15❤9👏1🍾1
Пока Яндекс музыка развлекается с цветовым сопровождением приложения, подстраивающимся под трек, в Spotify запускают AI плейлисты
Приложение будет подбирать композиции в плейлист по текстовому запросу. В промпте можно указать жанр и ситуацию, под которую нужна музыка. Пока тестируют в бета-версии.
Осталось ко всему этому еще прикрутить LoudlyAI, которая генерит ИИ-музыку, и будет красота
Приложение будет подбирать композиции в плейлист по текстовому запросу. В промпте можно указать жанр и ситуацию, под которую нужна музыка. Пока тестируют в бета-версии.
Осталось ко всему этому еще прикрутить LoudlyAI, которая генерит ИИ-музыку, и будет красота
👍35🔥11😁9❤2👌1🤗1