Что произойдет, если мы заставим языковые модели предсказывать несколько токенов, а не только на следующий? В этой статье мы показано, что прогнозирование с использованием нескольких токенов повышает эффективность обучения языковых моделей.
Статья: https://arxiv.org/abs/2404.19737
@machinelearning_ru
Статья: https://arxiv.org/abs/2404.19737
@machinelearning_ru
👍12🔥3❤2
🔥 GPT-4o: революция в общении с компьютерами
На канале OpenAI на YouTube появились демонстрации работы новой версии чат-бота. В режиме реального времени GPT-4o можно задавать вопросы об окружающем мире, играть в «Камень-ножницы-бумага», получать комплименты для своей собаки или считать до 10 в разных темпах.
GPT-4o уже доступен разработчикам через API. Обычные пользователи получат доступ к нейросети «в ближайшие недели». И да, GPT-4o будет доступен бесплатно, хотя и с некоторыми ограничениями на количество запросов.
Общение с компьютером никогда не было таким естественным. Больше примеров взаимодействия можно найти по ссылке.
@machinelearning_ru
На канале OpenAI на YouTube появились демонстрации работы новой версии чат-бота. В режиме реального времени GPT-4o можно задавать вопросы об окружающем мире, играть в «Камень-ножницы-бумага», получать комплименты для своей собаки или считать до 10 в разных темпах.
GPT-4o уже доступен разработчикам через API. Обычные пользователи получат доступ к нейросети «в ближайшие недели». И да, GPT-4o будет доступен бесплатно, хотя и с некоторыми ограничениями на количество запросов.
Общение с компьютером никогда не было таким естественным. Больше примеров взаимодействия можно найти по ссылке.
@machinelearning_ru
🔥9👍3❤2
#PySpark позволяет вам параметризовать запросы, что значительно упрощает тестирование #SQL запросов .
В этом примере переменные df и amount параметризуются для проверки соответствия между actual_df и
@machinelearning_ru
В этом примере переменные df и amount параметризуются для проверки соответствия между actual_df и
expected_df.@machinelearning_ru
👍12❤2🔥1
Выпущена Sqlcode 8b на базе Llama-3!
Вероятно, это лучшая на данный момент модель размером <10B для преобразования текста в SQL.
Работает лучше, чем gpt-4-turbo и claude opus для генерации SQL запросов.
▪Github: https://github.com/defog-ai/sql-eval
▪Weights: https://huggingface.co/defog/llama-3-sqlcoder-8b/
▪Demo (optimized for postgres): https://defog.ai/sqlcoder-demo/
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8
⚡️ Подробные примеры реализации алгоритмов машинного обучения
С этой подборкой вы сможете самостоятельно написать код с нуля для следующих алгоритмов:
▪нс (многослойный перцептрон, CNN, RNN, LSTM),
▪случайный лес,
▪линейная и логистическая регрессии,
▪метод опорных векторов (SVM) с ядрами (Linear, Poly, RBF),
▪метод k-средних,
▪модель гауссовой смеси,
▪k-ближайших соседей,
▪наивный байес,
▪градиентный бустинг
▪xgboost
📌 GitHub
@machinelearning_ru
С этой подборкой вы сможете самостоятельно написать код с нуля для следующих алгоритмов:
▪нс (многослойный перцептрон, CNN, RNN, LSTM),
▪случайный лес,
▪линейная и логистическая регрессии,
▪метод опорных векторов (SVM) с ядрами (Linear, Poly, RBF),
▪метод k-средних,
▪модель гауссовой смеси,
▪k-ближайших соседей,
▪наивный байес,
▪градиентный бустинг
▪xgboost
📌 GitHub
@machinelearning_ru
👍9🔥6❤2
Держите подробный гайд по созданию Llama 3 только средствами Python и библиотеки NumPy.
В качестве источников вдохновения и примеров использовались такие реализации:
— llama2.c
— llama.np
— modeling_llama.py — с Hugging Face
"""
I have a dream. He dream of a big, beautiful garden full of flower and tree. He dream of playing with hi friend and eating yummy snack.
One day, he wa walking in the garden when he saw
Token count: 50, elapsed: 1.53s, 33 tokens/s
"""
📌GitHub
📌Подробное описание реализации
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤2🔥2🤯2
Это 1 урок нашего из нашего Бесплатного курса.
Поддержите наше видео ЛАЙКОМ и комментом, больше продвинутых уроков на подходе!
https://www.youtube.com/watch?v=W7ZCXcxQxV8
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14❤3🔥1
abs: https://arxiv.org/abs/2405.12971
страница проекта: https://microsoft.github.io/BiomedParse/
Microsoft Research представили BiomedParse - базовую биомедицинскую модель для анализа изображений, которая позволяет выполнять сегментацию, обнаружение и распознавание 82 типов объектов в 9 режимах обработки изображений.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤4
50,000,000 Point Bouncy Jelly Simulation!
https://www.youtube.com/watch?v=w_7fHVcHqkY
@machinelearning_ru
https://www.youtube.com/watch?v=w_7fHVcHqkY
@machinelearning_ru
YouTube
Crazy 50,000,000 Point Bouncy Jelly Experiment!
❤️ Check out Weights & Biases and sign up for a free demo here: https://wandb.me/papers
📝 The paper "Vertex Block Descent" is available here:
https://ankachan.github.io/Projects/VertexBlockDescent/index.html
Notes from the authors:
“The range you mentioned…
📝 The paper "Vertex Block Descent" is available here:
https://ankachan.github.io/Projects/VertexBlockDescent/index.html
Notes from the authors:
“The range you mentioned…
❤5👍1🔥1
🎉 DeepSeek-VL, VIM с открытым исходным кодом, сегодня в тренде на GitHub! 🌐
🖼️ DeepSeek-VL расширяет границы мультимодальных моделей!
🔬 Модель может обрабатывать диаграммы, веб-страницы, формулы, научную литературу, изображения природы и многое другое.
Models are on Hub🤗: https://huggingface.co/deepseek-ai
🚀On Spaces: https://huggingface.co/spaces/deepseek-ai/DeepSeek-VL-7B
🧪Build Locally: https://github.com/deepseek-ai/DeepSeek-VL?tab=readme-ov-file#gradio-demo
@machinelearning_ru
🖼️ DeepSeek-VL расширяет границы мультимодальных моделей!
🔬 Модель может обрабатывать диаграммы, веб-страницы, формулы, научную литературу, изображения природы и многое другое.
Models are on Hub🤗: https://huggingface.co/deepseek-ai
🚀On Spaces: https://huggingface.co/spaces/deepseek-ai/DeepSeek-VL-7B
🧪Build Locally: https://github.com/deepseek-ai/DeepSeek-VL?tab=readme-ov-file#gradio-demo
@machinelearning_ru
👍5❤1
Forwarded from Machinelearning
🔥🔥🔥 YOLOv10: Real-Time End-to-End Object Detection
⚡️ Вышла новая версия детектора объектов YOLOv10
Добавлена новая функция сквозного обнаружения объектов в реальном времени. Код выпущен под лицензией GNU GPL v3.0
По сравнению с YOLOv9-C, YOLOv10-B имеет на 46% меньшую задержку и использует на 25% меньше параметров при той же производительности.
▪Paper: arxiv.org/pdf/2405.14458
▪Github: https://github.com/THU-MIG/yolov10/
▪Demo :https://huggingface.co/spaces/kadirnar/Yolov10
▪Colab: https://colab.research.google.com/github/roboflow-ai/notebooks/blob/main/notebooks/train-yolov10-object-detection-on-custom-dataset.ipynb#scrollTo=SaKTSzSWnG7s
@ai_machinelearning_big_data
⚡️ Вышла новая версия детектора объектов YOLOv10
Добавлена новая функция сквозного обнаружения объектов в реальном времени. Код выпущен под лицензией GNU GPL v3.0
По сравнению с YOLOv9-C, YOLOv10-B имеет на 46% меньшую задержку и использует на 25% меньше параметров при той же производительности.
▪Paper: arxiv.org/pdf/2405.14458
▪Github: https://github.com/THU-MIG/yolov10/
▪Demo :https://huggingface.co/spaces/kadirnar/Yolov10
▪Colab: https://colab.research.google.com/github/roboflow-ai/notebooks/blob/main/notebooks/train-yolov10-object-detection-on-custom-dataset.ipynb#scrollTo=SaKTSzSWnG7s
@ai_machinelearning_big_data
👍12❤3
https://www.youtube.com/watch?v=bsbW8UoA0zA
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🔥2👍1🤔1