Neurohive - Нейронные сети, AI, ML, DL
4.65K subscribers
257 photos
49 videos
1.42K links
Нейросети - свежие новости. State-of-the-art модели и методы, AI, Deep learning, Big data, Machine learning, NLP, Computer vision
Website: neurohive.io/ru/
По вопросам сотрудничества: @cyrud
Download Telegram
Хотите учиться у экспертов в области IT? Школа анализа данных Яндекса принимает заявки до 12 мая, успейте зарегистрироваться.

ШАД для вас, если вы:

· интересуетесь Machine Learning
· имеете хорошую математическую подготовку
· уверенно владеете каким-либо языком программирования

Программа длится два года, обучение бесплатное. Можно выбрать одно из направлений: Data
Science, инфраструктура больших данных, разработка машинного обучения или анализ
данных и ИИ в прикладных науках.

Больше об учёбе в ШАД и возможностях для выпускников расскажем на днях открытых
дверей. Узнать даты и зарегистрироваться можно по ссылке.
Microsoft представила платформу VASA-1, преобразующую изображение человека и аудиозапись с речью в видео с синхронизированными движениями губ и головы. Алгоритм работает в реальном времени со скоростью 40 кадров в секунду.

Cгенерированные видео передают полный спектр эмоций, а также особенности различных выражений лица и естественные движения головы.

#StateoftheArt
Яндекс обновил YandexART и рассказал в статье на Хабре, чем новая версия 1.3 отличается от предыдущей. Главное изменение в том, что нейросеть перешла на технологию латентной диффузии. Кроме того, датасет, на котором обучалась модель, был увеличен в 2,5 раза, и теперь нейросеть еще лучше понимает запросы пользователей.

YandexART 1.3 уже доступна в Шедевруме, там же появилась возможность создавать изображения в разных форматах, таких как 16:9, 4:3 или 3:4.

#StateoftheArt
Платформа автоматизации тестирования Mabl объявила о запуске AI-сервиса для тестирования мобильных приложений. C ее помощью разработчики могут за несколько минут создавать тесты для iOS- и Android-приложений, покрывающие все основные типы проверок.

Сервис многократно ускоряет ручное тестирование, создание автотестов и выявление пробелов в тестовом покрытии, а также дает возможность решения большинства задач тестирования для специалистов с малым опытом работы.

#AppliedDS
Python Tutorials for Digital Humanities рассказал, как можно распознавать широкую номенклатуру именованных сущностей (NER) без обучающей выборки с помощью библиотеки gliner-spacy. На видео пошагово рассказывается, как работать с репозиторием gliner-spacy, как интегрировать его в NLP-среду SpaCy, как получить первые результаты. Перевод подготовила Бюро переводов и школа переводчиков «Альянс ПРО».

Для удобства к ролику прилагается код на Python в блокноте Google Colab.

#Development
Google DeepMind разработала Gecko – бенчмарк, обеспечивающий более точное и надежное тестирование и сравнение text-to-image моделей, чем существующие подходы.

Gecko включает тексты 2000 запросов, которые проверяют широкий спектр навыков модели и уровней их сложности. Каждый запрос проверяет конкретные вспомогательные навыки, чтобы точно определить слабые места, ограничивающие соответствие сгенерированных моделью изображений запросам.

#Datasets
NVIDIA и Alphabet прогрессируют в разработке нового поколения роботов

На конференции Automate компания Alphabet X Intrinsic презентовала Isaac Manipulator - коллекцию базисных моделей и библиотек для создания масштабируемых пайплайнов для роборук-манипуляторов. Модели, основанные на архитектуре трансформера, позволяют роботам воспринимать информацию и принимать решения автономно, демонстрировать понимание окружающей среды, сравнимое с человеческим.

Разработчики Intrinsic тестируют манипуляторы совместно с производителем промышленных станков Trumpf Machine Tools. Планируется использование двух рук в работе гибких автоматизированных систем.

В рамках сотрудничества с NVIDIA Intrinsic хотят добавиться от роботов большей ловкости в движениях и улучшить мультимодальные свойства, за счет использования GPU Nvidia и готовых библиотек.

#AppliedDS
NVIDIA продемонстрировала, что большие языковые модели могут ускорить обучение роботов. Роботы с четырьмя конечностями, обученные с помощью модели DrEureka, превосходят стандартные системы обучения на 34% по скорости движения робота в реальных условиях и на 20% — по пройденному им расстоянию.

DrEureka требует только высокоуровневого описания задачи и быстрее и эффективнее, чем разработанные человеком функции вознаграждения, переносит изученные стратегии из моделируемой среды в реальный мир.

#AppliedDS
Media is too big
VIEW IN TELEGRAM
OpenAI анонсировала новую модель - GPT-4 Omni, которая смогла удивить.

GPT-4o в 2 раза быстрее, вдвое дешевле и имеет в 5 раз более высокие ограничения скорости по сравнению с GPT-4 Turbo. В ближайшие недели планируется запустить поддержку новых аудио- и видеовозможностей GPT-4o для группы доверенных партнеров по API.

— Функции платных подписчиков станут доступны для всех бесплатно;

— Полноценный голосовой ассистент - отвечает человечным голосом, способен менять его по командам: шептать и даже петь;

— Задержка у ассистента минимальная, что открывает возможность синхронного перевода;

На видео Грег Брокман 5 минут разговаривает с новой GPT4o.

Вот еще 33 видео-примера использования GPT-4o: https://vimeo.com/openai

#AIApps #Stateoftheart
Google DeepMind представила генеративную модель Veo, создающую видео длительностью более 60 секунд в разрешении Full HD. Помимо текстовых запросов, модель может принимать на вход изображения и видеоролики.

Модель работает в трех режимах: text2video, image2video и video2video. В режиме video2video Veo может вносить правки в снятые в любом стиле видео с помощью текстовых запросов.

#StateoftheArt
This media is not supported in your browser
VIEW IN TELEGRAM
🟥 Microsoft представила Copilot+, который будет доступен только на новых ПК, выходящих под брендом Copilot+ уже этим летом.

Устройство будет иметь маркировку Copilot+, если будет ооснащено нейронным процессором (NPU) с производительностью не менее 45 TOPS.

Наиболее заметное новшество в Windows 11 — функция Recall, которая ранее была известна под кодовым названием AI Explorer. Она работает в фоновом режиме и запоминает всё, что вы видели или делали на своём компьютере. Пользователь сможет найти необходимую информацию, сделав запрос на естественном языке.

Появится интерфейс временной шкалы, он позволяет посмотреть все снимки по запросу, которые были сделаны Windows.

Подробнее про все характеристики и функции тут

#AppliedDS
Please open Telegram to view this post
VIEW IN TELEGRAM
Ученые из Чикагского университета продемонстрировали, что большие языковые модели могут проводить анализ финансовой отчетности компаний с точностью, превосходящей точность профессиональных аналитиков. Выводы исследования могут иметь последствия для развития отрасли финансового анализа и консалтинга.

Дообученная модель OpenAI GPT-4 достигла точности 60% в прогнозировании корпоративных доходов против средней точности 55% у финансовых аналитиков.

#AppliedDS
📱Apple и OpenAI достигли соглашения о внедрении функциональности ChatGPT в IOS 18 и другие операционные системы в 2024 году.

Подробности не раскрываются. Apple хочет внедрить искусственный интеллект на своих платформах, но сосредоточилась на сохранении конфиденциальности данных на устройстве, разрабатывая локальные модели. Сделка с OpenAI может означать, что ChatGPT заменит Siri

Подробнее тут

#AppliedDS
Please open Telegram to view this post
VIEW IN TELEGRAM
Codestral — открытая модель для генерации кода от команды Mistral c 22 миллиардами параметров и контекстом 32к. Она преводсходит Llama Code 70B на большинстве популярных бенчмарков.

Codestral обучена на более чем 80 языках программирования, таких как Python, C, C++, JavaScript и Bash. Она способна анализировать, генерировать, автозаполнять и модифицировать код, создавать приложения, тестировать ПО на наличие багов.

Доступ к Codestral осуществляется через Le Chat, бесплатный разговорный интерфейс. Модель предоставляется по открытой лицензии для исследований и тестирования (некоммерческое использование).

#Stateoftheart
Стартап ElevenLabs представил Sound Effects – платформу для генерации аудиосэмплов различного типа на основе текстового описания. Сервис позволяет создателям видео, игр и другого контента сократить время на самостоятельную запись звуковых эффектов и сэкономить на покупке лицензий.

Примеры семплов, которые может генерировать Sound Effects – гроза, дверной звонок, звон монет, крик обезьян и звук останавливающегося поезда.

#AppliedDS
Media is too big
VIEW IN TELEGRAM
Wegic - это сервис, основанный на GPT-4o, который выполняет функции дизайнера и разработчика сайта, получая команды на естественном языке.

Вы можете указать, какие блоки, сервисы, тексты и цвета должны быть на сайте, и сервис внесет изменения «на лету».

После этого подключаем свой домен и пользуемся сайтом.

Потестировать сервис можно уже сейчас.

#AppliedDS
Qwen2 - новый state-of-the-art среди открытых языковых моделей. Qwen2 превосходит Llama3 на большинстве бенчмарков!

Китайские исследователи выложили в открытый доступ набор предобученных и донастроенных (instruction-tuned) языковых моделей Qwen2: Qwen2-0.5B, Qwen2-1.5B, Qwen2-7B, Qwen2-57B-A14B и Qwen2-72B.

Qwen2 понимает 29 языков. В задачах написания кода и решения математических задач, Llama3 осталась позади на всех тестах.

Длина контекста: от 32к до 128к (у моделей Qwen2-7B-Instruct and Qwen2-72B-Instruct).

#Stateoftheart