Один ИИ хорошо, а много ещё лучше. Туториал по AutoGen
Вы наверняка слышали про Autogen от microsoft. Но если вкратце AutoGen — это фреймворк для создания многоагентных диалоговых систем на основе больших языковых моделей (LLM).
Этот обзор предоставит немного больше информации об этой удивительной платформе. В видео показано, как легко настроить среду с несколькими агентами в Google Colab.
#туториал #autogen
Вы наверняка слышали про Autogen от microsoft. Но если вкратце AutoGen — это фреймворк для создания многоагентных диалоговых систем на основе больших языковых моделей (LLM).
Этот обзор предоставит немного больше информации об этой удивительной платформе. В видео показано, как легко настроить среду с несколькими агентами в Google Colab.
#туториал #autogen
Новый ИИ от Google: как RealFill расширяет границы фото не меняя пространства
В своём новом исследовании Google представил модель RealFill. Она восстанавливает недостающие части фото, используя существующие данные, а не просто генерируя правдоподобную информацию, как это делает Adobe Firefly.
Для работы нужно лишь несколько дополнительных снимков той же сцены. После чего RealFill воссоздаст утраченные фрагменты максимально близко к реальности.
Посмотреть:
https://youtu.be/bD_HyxHMHPo?si=jSEeAjaLXOvDX4le
Почитать:
https://arxiv.org/pdf/2309.16668.pdf
#статья #realfill
В своём новом исследовании Google представил модель RealFill. Она восстанавливает недостающие части фото, используя существующие данные, а не просто генерируя правдоподобную информацию, как это делает Adobe Firefly.
Для работы нужно лишь несколько дополнительных снимков той же сцены. После чего RealFill воссоздаст утраченные фрагменты максимально близко к реальности.
Посмотреть:
https://youtu.be/bD_HyxHMHPo?si=jSEeAjaLXOvDX4le
Почитать:
https://arxiv.org/pdf/2309.16668.pdf
#статья #realfill
This media is not supported in your browser
VIEW IN TELEGRAM
Пикачу уже не тот
Ютубер «demonflyingfox» сделал пародию на Покемонов в стиле боевика 90-х. Для этого он использовал возможности нейросети D–ID.
Ютубер «demonflyingfox» сделал пародию на Покемонов в стиле боевика 90-х. Для этого он использовал возможности нейросети D–ID.
Forwarded from Типичный программист
Автор курсов по Python и Pandas получил вечный бан за рекламу торговли экзотическими животными — решение вынес бот
Ревен М. Лернер создает курсы по Python, выпускает книги с задачами по Python и Pandas. Python и Pandas действительно легко спутать в английском языке с видами редких животных. Хотя названия технологий основаны не на схожести с животными: Python — отсылка к британской комик-группе «Монти Пайтон», а Pandas — сокращение от «Python data analysis».
Лернер попытался разместить рекламу курсов Python и Pandas. Но система сочла её рекламой продажи экзотических животных и заблокировала аккаунт рекламодателя.
Аккаунт не помогло вернуть даже вмешательство человека. Решение о бане вынес бот, но обжаловать его можно было в течение 180 дней. Лернер не знал о бане и просто не успел обжаловать решение. Он экспериментировал с рекламой пару лет назад и просто забыл про свой кабинет.
Если тоже рекламируете курсы про IT на английском, держите несколько идей для рекламных объявлений: «LaTeX для новичков», «убить Python», «получить доступ к Cocaine».
#кек #ии #python
Ревен М. Лернер создает курсы по Python, выпускает книги с задачами по Python и Pandas. Python и Pandas действительно легко спутать в английском языке с видами редких животных. Хотя названия технологий основаны не на схожести с животными: Python — отсылка к британской комик-группе «Монти Пайтон», а Pandas — сокращение от «Python data analysis».
Лернер попытался разместить рекламу курсов Python и Pandas. Но система сочла её рекламой продажи экзотических животных и заблокировала аккаунт рекламодателя.
Аккаунт не помогло вернуть даже вмешательство человека. Решение о бане вынес бот, но обжаловать его можно было в течение 180 дней. Лернер не знал о бане и просто не успел обжаловать решение. Он экспериментировал с рекламой пару лет назад и просто забыл про свой кабинет.
Если тоже рекламируете курсы про IT на английском, держите несколько идей для рекламных объявлений: «LaTeX для новичков», «убить Python», «получить доступ к Cocaine».
#кек #ии #python
Скайнет ближе, чем мы думаем: LLM формируют представление о пространстве и времени
Исследователи из Массачусетского технологического института проанализировали пространственные и временные представления в больших языковых моделях семейства Llama-2.
Они обнаружили, что модели формируют линейные представления пространства и времени на разных масштабах. Эти представления устойчивы к изменениям в формулировках запросов и едины для разных типов сущностей.
Помимо этого учёные выложили в открытый доступ код и данные, использованные в работе, чтобы любой желающий мог убедиться в этом лично.
#статья
Исследователи из Массачусетского технологического института проанализировали пространственные и временные представления в больших языковых моделях семейства Llama-2.
Они обнаружили, что модели формируют линейные представления пространства и времени на разных масштабах. Эти представления устойчивы к изменениям в формулировках запросов и едины для разных типов сущностей.
Помимо этого учёные выложили в открытый доступ код и данные, использованные в работе, чтобы любой желающий мог убедиться в этом лично.
#статья
Kornia: компьютерное зрение на новом уровне
Kornia — это мощная библиотека компьютерного зрения на Python, которая позволяет легко экспериментировать с обработкой изображений, а по своему функционалу в некотором превосходит даже OpenCV.
Основные преимущества перед аналогами:
— работа на GPU;
— дифференцируемость;
— интеграция с PyTorch;
— обрабатка изображения батчами.
В этой статье рассматриваются практические примеры загрузки изображений, применения различных фильтров и преобразований с использованием Kornia.
Репозиторий: https://github.com/kornia/kornia
#статья #kornia #cv
Kornia — это мощная библиотека компьютерного зрения на Python, которая позволяет легко экспериментировать с обработкой изображений, а по своему функционалу в некотором превосходит даже OpenCV.
Основные преимущества перед аналогами:
— работа на GPU;
— дифференцируемость;
— интеграция с PyTorch;
— обрабатка изображения батчами.
В этой статье рассматриваются практические примеры загрузки изображений, применения различных фильтров и преобразований с использованием Kornia.
Репозиторий: https://github.com/kornia/kornia
#статья #kornia #cv
Декомпозиция — ключ к логическому мышлению ИИ
Наши любимые индусы предложили интересный подход для языковых моделей — DaSLaM. Он повышает способности больших языковых моделей к сложному логическому рассуждению.
Суть подхода в том, что небольшая предобученная модель (всего 13 млрд параметров) используется для декомпозиции сложных задач на простые подзадачи. Эти подзадачи уже легко решаются при помощи мощной языковой модели (175 млрд параметров).
Эксперименты продемонстрировали, что метод позволяет достичь конкурентных результатов по сравнению с гораздо более крупными моделями вроде GPT-4.
При этом подход DaSLaM универсален и не зависит от возможностей конкретной большой модели.
Репозиторий GitHub: https://github.com/LCS2-IIITD/DaSLaM
#статья #llm
Наши любимые индусы предложили интересный подход для языковых моделей — DaSLaM. Он повышает способности больших языковых моделей к сложному логическому рассуждению.
Суть подхода в том, что небольшая предобученная модель (всего 13 млрд параметров) используется для декомпозиции сложных задач на простые подзадачи. Эти подзадачи уже легко решаются при помощи мощной языковой модели (175 млрд параметров).
Эксперименты продемонстрировали, что метод позволяет достичь конкурентных результатов по сравнению с гораздо более крупными моделями вроде GPT-4.
При этом подход DaSLaM универсален и не зависит от возможностей конкретной большой модели.
Репозиторий GitHub: https://github.com/LCS2-IIITD/DaSLaM
#статья #llm
ML для ленивых: ИИ ушёл на самообучение
Можно ли учить искусственный интеллект без утомительной разметки данных? Ответ — да. В машинном обучении существуют методы, позволяющие модели самостоятельно работать с неразмеченными данными и находить в них закономерности.
При обучении с учителем мы показываем модели: это стул, а это — стол или шкаф. То есть датасет размеченный, информация о данных известна, мы точно знаем, какой результат хотим от них получить.
При обучении без учителя мы просто запускаем модель в большую комнату, и она сама разбирается с объектами: классифицирует, ищет аномалии и ассоциации. Однако такой метод применим не во всех случаях. В статье вы узнаете, в каких именно.
#статья #ml
Можно ли учить искусственный интеллект без утомительной разметки данных? Ответ — да. В машинном обучении существуют методы, позволяющие модели самостоятельно работать с неразмеченными данными и находить в них закономерности.
При обучении с учителем мы показываем модели: это стул, а это — стол или шкаф. То есть датасет размеченный, информация о данных известна, мы точно знаем, какой результат хотим от них получить.
При обучении без учителя мы просто запускаем модель в большую комнату, и она сама разбирается с объектами: классифицирует, ищет аномалии и ассоциации. Однако такой метод применим не во всех случаях. В статье вы узнаете, в каких именно.
#статья #ml
Простой и универсальный шаблон для задач машинного обучения
В видео показан универсальный шаблон предобработки данных в Scikit-Learn, применимый для широкого круга задач ML.
Шаблон состоит из двух этапов: на первом происходит предобработка признаков, на втором обучается модель, а именно логистическая регрессия.
Автор справедливо отмечает ограничения подхода. Тем не менее, при грамотной адаптации он может стать хорошей стартовой точкой.
#туториал #scikit_learn #ml
В видео показан универсальный шаблон предобработки данных в Scikit-Learn, применимый для широкого круга задач ML.
Шаблон состоит из двух этапов: на первом происходит предобработка признаков, на втором обучается модель, а именно логистическая регрессия.
Автор справедливо отмечает ограничения подхода. Тем не менее, при грамотной адаптации он может стать хорошей стартовой точкой.
#туториал #scikit_learn #ml
NorthPole: сапфир в мире процессоров для ИИ
Корпорация IBM выпустила революционный процессор NorthPole для ИИ-задач. Разработка чипа заняла 8 лет. Он имеет 22 млрд транзисторов и 256 ядер.
Уникальная архитектура предусматривает выделенную память для каждого ядра, что даёт колоссальный прирост скорости передачи данных. В ходе тестирования он продемонстрировал энергоэффективность в 25 раз выше, чем у графического чипа NVIDIA V100 Tensor Core.
NorthPole нацелен на обработку изображений, прежде всего цифрового машинного зрения. Речь идёт об автопилотировании, роботах-диагностах и т. п.
#новости #cv
Корпорация IBM выпустила революционный процессор NorthPole для ИИ-задач. Разработка чипа заняла 8 лет. Он имеет 22 млрд транзисторов и 256 ядер.
Уникальная архитектура предусматривает выделенную память для каждого ядра, что даёт колоссальный прирост скорости передачи данных. В ходе тестирования он продемонстрировал энергоэффективность в 25 раз выше, чем у графического чипа NVIDIA V100 Tensor Core.
NorthPole нацелен на обработку изображений, прежде всего цифрового машинного зрения. Речь идёт об автопилотировании, роботах-диагностах и т. п.
#новости #cv
This media is not supported in your browser
VIEW IN TELEGRAM
Видео результатов исследования недавнего проекта Google DeepMind под названием «Футбольные навыки для двуногого робота с помощью глубокого обучения с подкреплением».
Репозиторий сего чуда.
#deepmind #reinforcement_learning
Репозиторий сего чуда.
#deepmind #reinforcement_learning
9 полезных инструментов для аннотирования изображений в 2023 году
Аннотирование изображений по-прежнему остаётся важным этапом при создании проектов компьютерного зрения.
В этой статье рассматриваются 9 популярных инструментов: Encord Annotate, Scale, CVAT, Labelbox, Playment, Appen, Dataloop, V7 Labs и Hive.
Каждый инструмент оценивается по ключевым критериям: функциональности, поддерживаемым типам данных, интеграции с ML, безопасности, управлению проектами и т.д.
#статья #cv
Аннотирование изображений по-прежнему остаётся важным этапом при создании проектов компьютерного зрения.
В этой статье рассматриваются 9 популярных инструментов: Encord Annotate, Scale, CVAT, Labelbox, Playment, Appen, Dataloop, V7 Labs и Hive.
Каждый инструмент оценивается по ключевым критериям: функциональности, поддерживаемым типам данных, интеграции с ML, безопасности, управлению проектами и т.д.
#статья #cv
This media is not supported in your browser
VIEW IN TELEGRAM
Компания OpenAI выпустила обновлённую версию модели Whisper large для распознавания и перевода речи
Модель обучена на 5 млн часов аудиоданных, что позволило значительно улучшить качество распознавания многих языков.
Уровень ошибок также снизился, в этом обзоре можно увидеть, что для всех языков наблюдается снижение ошибок на 10-20% по сравнению с предыдущей версией.
#openai #whisper
Модель обучена на 5 млн часов аудиоданных, что позволило значительно улучшить качество распознавания многих языков.
Уровень ошибок также снизился, в этом обзоре можно увидеть, что для всех языков наблюдается снижение ошибок на 10-20% по сравнению с предыдущей версией.
#openai #whisper
Tree of Thoughts: революционный подход в использовании больших языковых моделей
Языковые модели активно используются для решения разнообразных задач. Но зачастую они выдают достаточно линейные выводы. Это неэффективно в задачах, требующих сложного стратегического планирования.
Чтобы решить эту проблему, исследователи из DeepMind разработали подход Tree of Thoughts. Он позволяет моделям рассматривать разные варианты решения, оценивать последствия каждого шага и выбирать оптимальную стратегию.
Эксперименты продемонстрировали значительные успехи в задачах с элементами планирования и поиска. Например, в логической игре «24» модель GPT-4 с новым подходом решила 74% задач вместо прежних 4%.
Репозиторий: https://github.com/princeton-nlp/tree-of-thought-llm
#статья #llm
Языковые модели активно используются для решения разнообразных задач. Но зачастую они выдают достаточно линейные выводы. Это неэффективно в задачах, требующих сложного стратегического планирования.
Чтобы решить эту проблему, исследователи из DeepMind разработали подход Tree of Thoughts. Он позволяет моделям рассматривать разные варианты решения, оценивать последствия каждого шага и выбирать оптимальную стратегию.
Эксперименты продемонстрировали значительные успехи в задачах с элементами планирования и поиска. Например, в логической игре «24» модель GPT-4 с новым подходом решила 74% задач вместо прежних 4%.
Репозиторий: https://github.com/princeton-nlp/tree-of-thought-llm
#статья #llm
Эндрю Ын: возможности в области искусственного интеллекта
Эндрю — один из ведущих экспертов в области искусственного интеллекта, основатель проектов DeepLearningAI, Landing AI и Coursera. В этом видео представлен перевод недавней презентации, где он подробно рассказывает о своём ви́дении технологий ИИ в ближайшем будущем и их влиянии на нашу жизнь.
Ключевые темы выступления:
— Влияние больших языковых моделей на разработку ПО.
— Создание стартапов в сфере ИИ — советы эксперта.
— Значение ИИ в решении этических вопросов.
— Перспективы расширения обучения с учителем и возможности для бизнеса.
#видео #ml
Эндрю — один из ведущих экспертов в области искусственного интеллекта, основатель проектов DeepLearningAI, Landing AI и Coursera. В этом видео представлен перевод недавней презентации, где он подробно рассказывает о своём ви́дении технологий ИИ в ближайшем будущем и их влиянии на нашу жизнь.
Ключевые темы выступления:
— Влияние больших языковых моделей на разработку ПО.
— Создание стартапов в сфере ИИ — советы эксперта.
— Значение ИИ в решении этических вопросов.
— Перспективы расширения обучения с учителем и возможности для бизнеса.
#видео #ml
Компания Del Complex анонсировала создание плавучего дата-центра на корабле с 10 000 процессоров Nvidia
Платформа будет в открытом море вне юрисдикции стран. Цель — разработка ИИ без ограничений.
Представители компании заявляют, что каждый корабль получит статус независимого государства. А на борту будут жить сотрудники и охрана.
Как вы считаете, получится ли у Del Complex создать плавучую страну для разработчиков ИИ? Или это просто рекламный ход?
#новости #bluesea
Платформа будет в открытом море вне юрисдикции стран. Цель — разработка ИИ без ограничений.
Представители компании заявляют, что каждый корабль получит статус независимого государства. А на борту будут жить сотрудники и охрана.
Как вы считаете, получится ли у Del Complex создать плавучую страну для разработчиков ИИ? Или это просто рекламный ход?
#новости #bluesea
This media is not supported in your browser
VIEW IN TELEGRAM
3D Gaussian Splatting — новый метод визуализации трёхмерных сцен на основе анализа фотографий с разных ракурсов. Пространство моделируется как агрегация гауссовых функций с оптимизированными параметрами.
По результатам тестирования, Gaussian Splatting превосходит аналогичные методы, обеспечивая высококачественный рендеринг при разрешении 1080p в реальном времени. Он достигает уровня визуализации, сопоставимого с лучшими подходами, такими как Mip-NeRF, при этом требуя гораздо меньше времени обучения (всего несколько минут вместо часов).
Репозиторий GitHub.
#статья #cv
По результатам тестирования, Gaussian Splatting превосходит аналогичные методы, обеспечивая высококачественный рендеринг при разрешении 1080p в реальном времени. Он достигает уровня визуализации, сопоставимого с лучшими подходами, такими как Mip-NeRF, при этом требуя гораздо меньше времени обучения (всего несколько минут вместо часов).
Репозиторий GitHub.
#статья #cv
10 лет исследований НЛП, объяснённых в 50 концепциях
Это видео — настоящая сокровищница знаний для всех, кто интересуется нейронными сетями и обработкой естественного языка.
В доступной форме рассказываются ключевые концепции NLP: от базовых идей типа токенизации и векторных представлений слов до революционных архитектур вроде RNN, Seq2Seq, Transformer и таких моделей, как BERT, GPT, XLNet.
Помимо этого, вы узнаете о проблемах, с которыми сталкивался автор и как современные модели их преодолевают.
#видео #nlp
Это видео — настоящая сокровищница знаний для всех, кто интересуется нейронными сетями и обработкой естественного языка.
В доступной форме рассказываются ключевые концепции NLP: от базовых идей типа токенизации и векторных представлений слов до революционных архитектур вроде RNN, Seq2Seq, Transformer и таких моделей, как BERT, GPT, XLNet.
Помимо этого, вы узнаете о проблемах, с которыми сталкивался автор и как современные модели их преодолевают.
#видео #nlp
YouTube
10 years of NLP history explained in 50 concepts | From Word2Vec, RNNs to GPT
From RNNs to Transformers to GPT-4, the leap in intelligence in Deep Learning research for Language Modelling and NLP has been a steady and educational growth. In this video, I explain 50 concepts that cover the basics of NLP like Tokenization and Word Embeddings…
UNINEXT: инспектор гаджет в мире компьютерного зрения
Разделение изображения на отдельные группы одна из наиболее важных и сложных проблем компьютерного зрения. UNINEXT решает это, объединяя 10 задач распознавания объектов в одну модель.
Она гибко воспринимает разные объекты, используя подсказки — названия, описания и аннотации. Это позволяет обучать модель на огромных данных и извлекать универсальные признаки объектов.
UNINEXT показала отличные результаты в 20 сложных тестах. А ещё заняла 2 место на конференции по компьютерному зрению CVPR 2023 в категории «Проблемы отслеживания и сегментации нескольких объектов».
Читать: https://arxiv.org/pdf/2303.06674.pdf
Репозиторий: https://github.com/MasterBin-IIAU/UNINEXT
#статья #cv
Разделение изображения на отдельные группы одна из наиболее важных и сложных проблем компьютерного зрения. UNINEXT решает это, объединяя 10 задач распознавания объектов в одну модель.
Она гибко воспринимает разные объекты, используя подсказки — названия, описания и аннотации. Это позволяет обучать модель на огромных данных и извлекать универсальные признаки объектов.
UNINEXT показала отличные результаты в 20 сложных тестах. А ещё заняла 2 место на конференции по компьютерному зрению CVPR 2023 в категории «Проблемы отслеживания и сегментации нескольких объектов».
Читать: https://arxiv.org/pdf/2303.06674.pdf
Репозиторий: https://github.com/MasterBin-IIAU/UNINEXT
#статья #cv
Forwarded from Zen of Python
LazyPredict: ультралаконичный синтаксис ML-моделей
Инструмент позволяет запускать 30 (!) видов моделей беспрецедентно коротким способом:
Репозиторий на GitHub
А знаете ли вы инструменты, упрощающие подготовку данных? Поделитесь в комментариях.
#библиотека
Инструмент позволяет запускать 30 (!) видов моделей беспрецедентно коротким способом:
from lazypredict.Supervised import LazyClassifier
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
data = load_breast_cancer()
X = data.data
y= data.target
X_train, X_test, y_train, y_test = train_test_split(X, y,test_size=.5,random_state =42)
clf = AdaBoostClassifier(verbose=0,ignore_warnings=True, custom_metric=None)
models,predictions = clf.fit(X_train, X_test, y_train, y_test)
models
Репозиторий на GitHub
А знаете ли вы инструменты, упрощающие подготовку данных? Поделитесь в комментариях.
#библиотека