Новый инструмент для реконструкции сцен из мультфильмов и аниме.
Toon 3D может восстанавливать ракурсы камеры и плотную геометрию помещений.
Такие методы, как COLMAP, не могут реконструировать негеометрические изображения, нарисованные от руки, но Toon 3D справляется с этой задачей. Вы только посмотрите на примеры выше!
▪Github: https://github.com/ethanweber/toon3d
▪Paper: https://arxiv.org/abs/2405.10320
Dem
▪Proj: https://toon3d.studio
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20👍6❤4🤔2🥰1
OpenAI расширила возможности анализа данных в ChatGPT с использованием Google Drive и OneDrive.
Теперь файлы в чат-бот можно будет загружать напрямую из Google Drive и Microsoft OneDrive.
ChatGPT получит доступ к сервисам Google, таким как таблицы, документы, презентации и платформам Microsoft, таким как Excel, Word и PowerPoint.
Кроме того, в чат-бот внедрят расширяемое представление для таблиц и диаграмм. Когда пользователи добавляют набор данных, ChatGPT создаст интерактивную таблицу, которую можно развернуть в полноэкранном режиме. Наконец, можно будет кликать на определённые области таблицы, чтобы задать дополнительные вопросы или выбрать подсказки.
Например, пользователи смогут попросить ChatGPT объединить несколько электронных таблиц, содержащих ежемесячные расходы, и создать сводную с классификацией по типам расходов. Чат-бот также предлагает настраиваемые и интерактивные диаграммы, включая гистограммы, линии, круговые и точечные диаграммы. Все их можно будет загружать для использования в презентациях или документах.
Улучшения будут доступны пользователям ChatGPT Plus, Team и Enterprise в ближайшие недели.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍37❤10🔥9👏2
Media is too big
VIEW IN TELEGRAM
CAT3D позволяет создавать что угодно в 3D с помощью диффузионных моделей.
Достижения в области 3D-реконструкции позволили осуществить высококачественную 3D-съемку, однако для создания 3D-сцены пользователю приходилось собирать от сотен до тысяч изображений.
Теперь процесс 3D-реконструкции сильно упрощается.
CAT3D использует под капотом воссоздание реального мира с помощью многоракурсной диффузионной модели.
CAT3D может создавать целые 3D-сцены всего за одну минуту и превосходит существующие методы создания 3D-сцен.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍37❤7🔥5🥰3😎2👏1
🧠 Awesome AGI Survey
Как Далеко Мы Находимся От AGI?
AGI (artificial general intelligence) – это область теоретических исследований искусственного интеллекта, которая стремится создать программное обеспечение с интеллектом, подобным человеческому, и способностью к самообучению.
AGI, отличается способностью выполнять разнообразные задачи в реальном мире с эффективностью, сравнимой с человеческим интеллектом, отражает важнейшую веху в развитии искусственного интеллекта.
Здесь представлен большой структурированный список обязательных к прочтению статей по AGI, на которые стоит обратить внимание.
▪Github
@ai_machinelearning_big_data
Как Далеко Мы Находимся От AGI?
AGI (artificial general intelligence) – это область теоретических исследований искусственного интеллекта, которая стремится создать программное обеспечение с интеллектом, подобным человеческому, и способностью к самообучению.
AGI, отличается способностью выполнять разнообразные задачи в реальном мире с эффективностью, сравнимой с человеческим интеллектом, отражает важнейшую веху в развитии искусственного интеллекта.
Здесь представлен большой структурированный список обязательных к прочтению статей по AGI, на которые стоит обратить внимание.
▪Github
@ai_machinelearning_big_data
👍33🔥6❤4🤨2🤣1
This media is not supported in your browser
VIEW IN TELEGRAM
Moondream WebGPU — это VLM (Vision-Language Model) с 1.86 миллиардами параметров.
После загрузки модель (1.8 ГБ) будет кэширована и повторно использована при повторном посещении страницы.
Все выполняется непосредственно в браузере с помощью Transformers.js и ONNX Runtime Web, то есть ваши разговоры не отправляются на сервер.
🤗 Hugging Face
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍37🔥5❤1🗿1
—
pip install goldenverba
Verba — это полностью настраиваемый AI-помощник для запросов и взаимодействия с вашими данными, как локальными, так и развернутыми в облаке.
Отвечает на вопросы, связанные с вашими документами, получает информацию из существующих баз знаний. Verba сочетает в себе современные технологии RAG и контекстно-зависимую базу данных Weaviate. Выбирайте между различными фреймворками RAG, типами данных, методами разбивки и поиска и поставщиками LLM в зависимости от конкретного случая использования.
Позволяет использовать разные LLM: как от HuggingFace и Ollama, так и от OpenAI, Cohere и Google.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍45🥰6❤2🤔2🍾1
This media is not supported in your browser
VIEW IN TELEGRAM
Позволяет использовать локальные (llama3, gemma, mistral) или облачные (Groq/Llama3, OpenAI/gpt4-o) LLM.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31🔥8❤2😍2❤🔥1🥰1
В этой свежей статье Arxiv представляется PHUDGE — тонко настроенная модель Phi3, которая достигла результатов SOTA в 4 задачах: Feedback Test, Feedback OOD, MT Human, Preference Test, превзойдя все существующие модели по задержке и пропускной способности.
PHUDGE демонстрирует очень сильную корреляцию не только с GPT4, но и с человеческими аннотаторами на непросмотренных данных, а также в задачах абсолютного и относительного оценивания.
В этой статье Arxiv не только рассмотривается вопрос использования небольших LM для экономичных систем производственного уровня, но и показывается, что причинно-следственное моделирование не только медленно по своей природе, но иногда может препятствовать обучаемости моделей и должно быть заменено на более простые задачи, когда это возможно, чтобы сделать систему в целом быстрее и лучше.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14😁9❤3🔥1
⚡️ Layer-Condensed KV Cache
Многослойный кэш-память KV для эффективного инференса больших языковых моделей.
Обеспечивает в 26 раз более высокую пропускную способность (throughput) по сравнению со стандартными трансформерами и помогает увеличить производительность больших языковых моделей.
▪repo: https://github.com/whyNLP/LCKV
▪abs: https://arxiv.org/abs/2405.10637
@ai_machinelearning_big_data
Многослойный кэш-память KV для эффективного инференса больших языковых моделей.
Обеспечивает в 26 раз более высокую пропускную способность (throughput) по сравнению со стандартными трансформерами и помогает увеличить производительность больших языковых моделей.
pip install xformers --index-url https://download.pytorch.org/whl/cu121
pip install -r requirements.txt
▪repo: https://github.com/whyNLP/LCKV
▪abs: https://arxiv.org/abs/2405.10637
@ai_machinelearning_big_data
👍22❤4🔥2
🦙 Llama3-from-scratch
Очень подробный гайд по созданию LLaMa-3 с нуля!
Крутой репозиторий, в котором реализована llama 3 с нуля - умножение матриц с помощью multiple heads, позиционное кодирование (способ кодирования позиции слова внутри эмбеддинга), реализация механизма внимания и все остальное, здесь тщательно описано и объяснено.
Отличный репо для обучения, 3 к звезд за сутки⭐️.
▪Github
@ai_machinelearning_big_data
Очень подробный гайд по созданию LLaMa-3 с нуля!
Крутой репозиторий, в котором реализована llama 3 с нуля - умножение матриц с помощью multiple heads, позиционное кодирование (способ кодирования позиции слова внутри эмбеддинга), реализация механизма внимания и все остальное, здесь тщательно описано и объяснено.
Отличный репо для обучения, 3 к звезд за сутки⭐️.
▪Github
@ai_machinelearning_big_data
🔥43👍12❤3
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 GaussianObject: Just Taking Four Images to Get A High-Quality 3D Object with Gaussian Splatting
Только что был выпущен код для генерации 3D объектов с помощью Гауссовских сплатов.
Новый фреймворк обеспечивает высокое качество генераций и рендеринга всего по четырем входными изображениями.
▪Github: https://github.com/GaussianObject/GaussianObject
▪Colab: https://colab.research.google.com/drive/1WIZgM--tJ3aq25t9g238JAuAoXrQYVMs?usp=sharing#scrollTo=TlrxF62GNePB
▪Project: https://gaussianobject.github.io
@ai_machinelearning_big_data
Только что был выпущен код для генерации 3D объектов с помощью Гауссовских сплатов.
Новый фреймворк обеспечивает высокое качество генераций и рендеринга всего по четырем входными изображениями.
git clone https://github.com/GaussianObject/GaussianObject.git --recursive
▪Github: https://github.com/GaussianObject/GaussianObject
▪Colab: https://colab.research.google.com/drive/1WIZgM--tJ3aq25t9g238JAuAoXrQYVMs?usp=sharing#scrollTo=TlrxF62GNePB
▪Project: https://gaussianobject.github.io
@ai_machinelearning_big_data
🔥22👍13❤2