274K subscribers
3.94K photos
674 videos
17 files
4.53K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
🔈 Urhythmic: Rhythm Modeling for Voice Conversion

Unsupervised Rhythm Modeling for Voice Conversion.

Проект для изменения исходного голоса на другие, позволяющая моделировать ритм речи.

🖥 Github: https://github.com/bshall/urhythmic

🖥 Documentation: https://colab.research.google.com/github/bshall/urhythmic/blob/main/urhythmic_demo.ipynb

📕 Paper: https://arxiv.org/abs/2307.06040v1

🚀 Dataset: https://paperswithcode.com/dataset/vctk

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍113🔥3
Fine-tuning Stable Diffusion Models on Intel CPUs

This post will show you how to fine-tune a Stable Diffusion model on an Intel Sapphire Rapids CPU cluster.

В этом посте показано, как провести тонкую настройку модели Stable Diffusion на кластере процессоров Intel Sapphire Rapids. Настройка с помощью
текстовой инверсии - техники, которая требует лишь небольшого количества изображений-примеров.

https://huggingface.co/blog/stable-diffusion-finetuning-intel

📌 Post: https://huggingface.co/blog/stable-diffusion-finetuning-intel

⭐️ Diffusers documentation: https://huggingface.co/docs/diffusers

📌 Optimum Intel documentation: https://huggingface.co/docs/optimum/main/en/intel/inference

🖥 Intel IPEX on GitHub: https://github.com/intel/intel-extension-for-pytorch

ai_machinelearning_big_data
👍16🥴31🔥1😁1
🔥 Artificial Intelligence for Science (AIRS)

AIRS - это коллекция инструментов с открытым исходным кодом, датасетов ии для науки и работы с квантовыми системами.

OpenQM: AI for Quantum Mechanics
OpenDFT: AI for Density Functional Theory
OpenMol: AI for Small Molecules
OpenProt: AI for Protein Science
OpenMat: AI for Materials Science
OpenMI: AI for Molecular Interactions
OpenPDE: AI for Partial Differential Equations

🖥 Github: https://github.com/divelab/AIRS

📕 Paper: https://arxiv.org/abs/2307.08423

⭐️ Website: https://www.air4.science/

📌 Dataset: https://paperswithcode.com/dataset/atom3d

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22🔥74
Как бороться с утечкой данных в машинном обучении

Команда VK Cloud перевела статью о том, как информация из тестового датасета ошибочно попадает в обучающий, какие у этого могут быть последствия.

В статье описываются примеры реальных датасетов со способами предотвращения утечки данных: проверки вручную, пайплайнами, перекрёстным контролем и др.


🔗 Хабр: https://habr.com/ru/companies/vk/articles/746360/

ai_machinelearning_big_data
2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
💬 Text2Cinemagraph: Synthesizing Artistic Cinemagraphs from Text

Полностью автоматизированный метод Text2Cinemagraph для создания синемаграфов из текстового описания с учетом различных художественных стилей.

🖥 Github: https://github.com/text2cinemagraph/text2cinemagraph

🖥 Colab: https://colab.research.google.com/github/camenduru/AnimateDiff-colab/blob/main/AnimateDiff_colab.ipynb

📕 Paper: https://arxiv.org/pdf/2307.03190.pdf

🚀 Project: https://text2cinemagraph.github.io/website/

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👍64
🔥 Llama 2: Open Foundation and Fine-Tuned Chat Models

Llama 2 collection of pretrained and fine-tuned large language models (LLMs).

Новая Llama 2 в открытом доступе. Доступны предварительно обученные и настроенные модели с параметрами от 7B до 70B.

Llama 2 превосходит модели с открытым исходным кодом в большинстве протестированных бенчмарков и, судя по оценке полезности и безопасности, может стать достойной заменой моделям с закрытым исходным кодом.


🖥 Github: https://github.com/facebookresearch/llama

⭐️ Demo: https://huggingface.co/blog/llama2

🤗Hugging face: https://huggingface.co/meta-llama/Llama-2-70b

📕 Paper: https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥25👍104
This media is not supported in your browser
VIEW IN TELEGRAM
📌 InstructZero: Efficient Instruction Optimization for Black-Box Large Language Models

The first framework to conduct instruction optimization for black-box LLM like ChatGPT, where Black-box API LLM can only provide textual output.

Модель отбора, автоматически определяющая и удаляющая низкокачественные данные с помощью LLM.

🖥 Github: https://github.com/lichang-chen/instructzero

⭐️ Project: https://lichang-chen.github.io/InstructZero/

📕 Paper: https://arxiv.org/abs/2307.08701v1

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥206👍3
🆓 Free Courses and Guides for Learning Generative AI

Бесплатные курсы и руководства по изучению генеративного ИИ

1. Building AI Products with OpenAIБесплатный курс от CoRise и OpenAI.

2. Подробное руководство по Prompt Engineering by DAIR.AI

3. LLM Bootcamp - Серия бесплатных лекций от The full Stack по созданию и развертыванию приложений LLM.

4. Что такое модели трансформеров и как они работают: Учебное пособие от Cohere AI.

5. Бесплатный курс от Activeloop на LangChain & Vector Databases in Production.

6. Pinecone learning centerМножество полезных гайдов.

7. Build AI Apps with ChatGPT, Dall-E and GPT-4бесплатный курс по Scrimba.

8. Gartner Experts Answer the Top Generative AI Questions for Your Enterpriseотчет компании Gartner.

9. GPT best practices: Руководство ****OpenAI, в котором рассказывается о стратегии и тактике получения лучших результатов от GPT.

10. OpenAI cookbook by OpenAIПримеры и руководства по использованию API OpenAI.

11. Prompt injection explained,

12. Generative AI short courses by DeepLearning.AIПять коротких курсов по генеративному ИИ, включая LangChain для разработки LLM-приложений, "Как работают диффузионные модели" и др.

13. Generative AI learning path by Google Cloud - серия из 10 курсов по продуктам и технологиям генеративного ИИ: от основ больших языковых моделей до создания и развертывания генеративного ИИ в Google Cloud.

ai_machinelearning_big_data
👍1812🔥6
🐋 FreeWilly, Large And Mighty Instruction Fine-Tuned Models
.
FreeWilly1 and FreeWilly2 set a new standard in the field of open access Large Language Models.

В freeWilly1 используется оригинальная базовая модель LLaMA 65B, которая была обучена на новом синтетически сгенерированном наборе данных с использованием технологии
Supervised Fine-Tune (SFT) в стандартном формате Alpaca.

FreeWilly2 использует базовую модель LLaMA 2 70B и достигает качества, сравнимого с GPT-3.5.

⭐️ Post: https://stability.ai/blog/freewilly-large-instruction-fine-tuned-models

📌 FreeWilly1: https://huggingface.co/stabilityai/FreeWilly1-Delta-SafeTensor

📌 FreeWilly2: https://huggingface.co/stabilityai/FreeWilly1-Delta-SafeTensor

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🔥41
↗️ L-Eval: Instituting Standardized Evaluation for Long Context Language Models

Data and code for L-Eval, a comprehensive long context language models evaluation benchmark.

Данные и код для L-Eval, комплексноого эталона оценки языковых моделей с длинным контекстом.

L-Eval, содержащий 411 длинных документов и более 2000 пар "вопрос-ответ", аннотированных и проверенных авторами вручную, охватывает такие области, как право, финансы, школьные лекции, длинные разговоры, новости, длинные романы.

🖥 Github: https://github.com/bshall/urhythmic

🧑‍💻Model: https://huggingface.co/datasets/L4NLP/LEval

📕 Paper: https://arxiv.org/abs/2307.11088

🚀 Dataset: https://paperswithcode.com/dataset/quality

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥1🥰1😁1
⭐️ CNOS: A Strong Baseline for CAD-based Novel Object Segmentation

Three-stage approach to segment unseen objects in RGB images using their CAD models.

CNOS - это простой, но эффективный трехэтапный подход к сегментации объектов.

🖥 Github: https://github.com/nv-nguyen/cnos

📕 Paper: http://arxiv.org/abs/2307.11067

🚀 Dataset: https://bop.felk.cvut.cz/datasets/

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍143🔥3
🗣 DialogStudio: Towards Richest and Most Diverse Unified Dataset Collection and Instruction-Aware Models for Conversational AI.

Studio: самая большая и разнообразная коллекция диалоговых датасетов, объединенных в единый формат.

🖥 Github: https://github.com/salesforce/DialogStudio

📕 Paper: https://arxiv.org/abs/2307.10172v2

🔥 Dataset: https://paperswithcode.com/dataset/dialogstudio

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥114👍3
Edge Guided GANs with Multi-Scale Contrastive Learning for Semantic Image Synthesis

ECGAN новая система для решения сложной задачи семантического синтеза изображений.

🖥 Github: https://github.com/ha0tang/ecgan

📕 Paper: https://arxiv.org/abs/2307.12084v1

🔥 Dataset: https://paperswithcode.com/dataset/cityscapes

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍73
ANNOUNCING SDXL 1.0

The Stability AI team is proud to release as an open model SDXL 1.0, the next iteration in the evolution of text-to-image generation models.

Stability AI объявили о выпуске Stable Diffusion 1.0 XL, новой версии популярной модели для генерации изображений. SDXL 1.0 представляет собой базовую модель с 3,5B параметров и пайплайн с ансамблем моделей из 6,6B параметров.

💫 Announcement: https://stability.ai/blog/stable-diffusion-sdxl-1-announcement

🖥 Github: https://github.com/Stability-AI/generative-models

⭐️ Clip: https://clipdrop.co/stable-diffusion

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥32