SOTA✛ – Telegram

SOTA✛

323 subscribers

28 photos

2 videos

43 links

Artificial Intelligence at the service of designers.
Next-generation graphic design tool.

instagram.com/sotaplus
twitter.com/sota_plus

sotaplus.com
info@sotaplus.com

Download Telegram

About

Blog

Apps

Platform

323 subscribers

Расстояние Махаланобиса

В статистике существует обобщение евклидова расстояния для векторов случайных величин. Называется это обобщение расстоянием Махаланобиса. Задается следующей формулой:
d(x, y) = √ t(x − y) S⁻¹ (x − y)
x, y — вектора-столбцы случайных величин, взятые из одного распределения;
t() — оператор транспонирования;
S — ковариационная матрица.

Как видно, расстояние учитывает ковариацию компонент векторов и является инвариантным к масштабу. Если все компоненты всех векторов из распределения умножить на K, расстояние d(x, y) не изменится.

Расстояние Махаланобиса имеет широчайшее применение в задачах классификации, регрессии и кластерном анализе.

Рассмотрим пример.
Каждый человек описывается двумя характеристиками: рост и вес. Нужно оценить величину различия для пар случайных людей. То есть для любых двух людей сказать, насколько они различаются.

Обычное евклидово расстояние для такой задачи плохо подходит так как: 1) характеристики коррелируют между собой; 2) характеристики разнородны, измеряются в разных величинах. Использование расстояния Махаланобиса решает обе проблемы.

Есть один нюанс, о котором нельзя забывать — расстояние Махаланобиса было введено для случая многомерного нормального распределения случайных величин. Именно в этом случае оно дает оптимальные результаты. Применение расстояния к векторам, распределенным не гауссово, может привести к совершенно некорректным оценкам.

#dainamicskills

851 viewsedited 20:47

Winners of ACL 2019 Best Paper Awards

= THE BEST DEMO PAPER =

OpenKiwi: An Open Source Framework for Quality Estimation.
Fabio Kepler, Jonay Trenous, Marcos Treviso, Miguel Vera and André F. T. Martins

= OUTSTANDING PAPERS =

Emotion-Cause Pair Extraction: A New Task to Emotion Analysis in Texts.
Rui Xia and Zixiang Ding

A Simple Theoretical Model of Importance for Summarization.
Maxime Peyrard

Transferable Multi-Domain State Generator for Task-Oriented Dialogue Systems.
Chien-Sheng Wu, Andrea Madotto, Ehsan Hosseini-Asl, Caiming Xiong, Richard Socher and Pascale Fung

We need to talk about standard splits.
Kyle Gorman and Steven Bedrick

Zero-shot Word Sense Disambiguation using Sense Definition Embeddings.
Sawan Kumar, Sharmistha Jat, Karan Saxena and Partha Talukdar

= THE BEST SHORT PAPER =

Do you know that Florence is packed with visitors? Evaluating state-of-the-art models of speaker commitment.
Nanjiang Jiang and Marie-Catherine de Marneffe

= THE BEST LONG PAPER =

Bridging the Gap between Training and Inference for Neural Machine Translation.
Wen Zhang, Yang Feng, Fandong Meng, Di You and Qun Liu

#dainamicnews

1.1K views17:03

Advances in Conversational AI

Способность к ведению диалога — важнейшее свойство интеллектуальных агентов будущего. На сегодняшний день ни один чат-бот не в состоянии вести «качественную» беседу на произвольную тему. Тест Тьюринга остаётся непройденным. Тем интереснее наблюдать за прогрессом в этой области...

https://ai.facebook.com/blog/advances-in-conversational-ai/

Advances in Conversational AI

Facebook AI has made scientific progress in improving nuanced conversational skills, including consistency, specificity, and empathy.

1.21K views19:44

Video Understanding Using Temporal Cycle-Consistency Learning

Довольно оригинальный подход к решению задачи распознавания действий на видео. Для обучения используются циклические последовательности фреймов.

https://ai.googleblog.com/2019/08/video-understanding-using-temporal.html?m=1

Video Understanding Using Temporal Cycle-Consistency Learning

1.35K views20:09

Откуда берется MSE?

При решении задач регрессии чаще всего «по умолчанию» используют mean squared error (MSE). То есть в качестве меры близости идеального вектора y и предсказанного y’ используют величину:
MSE = ∑ (yⱼ − y’ⱼ)² / n
Чем эта величина меньше, тем лучше.

Никогда не задумывались почему именно квадраты? Почему не модули и не четвертая степень?

Чаще всего выбор MSE объясняют простой геометрической интерпретацией. Два вектора представляются в виде точек в n-мерном евклидовом пространстве и измеряется расстояние между ними. Не смотря на красивую интерпретацию, никакого статистического смысла у такого объяснения нет.

Все дело в модели. При решении регрессионных задач обычно используется модель с нормальным аддитивным шумом:
y = f(x, θ) + ε
x — вектор независимых переменных;
y — зависимая переменная;
θ — вектор параметров модели;
ε — случайная величина с нормальным распределением 𝒩(ε | 0, σ).

Перепишем в терминах вероятностей:
p(y | x, θ) = 𝒩(y | f(x, θ), σ)

После того, как модель задана, делается предположение о независимости появления каждого из наблюдений и применяется метод максимального правдоподобия (Maximum likelihood estimation, MLE). Находятся такие параметры модели θ, при которых появление наблюдений наиболее вероятно.

Так вот, для заданной выше модели, максимизация правдоподобия эквивалентна минимизации среднеквадратической ошибки. Проверить не сложно, попробуйте расписать MLE и прологарифмировать.

Вывод: MSE — следствие применения MLE и регрессионной модели с аддитивным гауссовским шумом. Никакие геометрические интерпретации здесь ни при чем.

#dainamicskills

1.71K viewsedited 20:57

Designing agent incentives to avoid reward tampering

AI-системы создаются такими, чтобы они хорошо решали свои задачи. Понятие «хорошо» определяется некоторой функцией. Что, если AI-система, в процессе обучения, найдёт лазейку и сумеет переписать эту функцию?

https://medium.com/@deepmindsafetyresearch/designing-agent-incentives-to-avoid-reward-tampering-4380c1bb6cd

Designing agent incentives to avoid reward tampering

By Tom Everitt and Ramana Kumar

1.38K views19:21

On-Device, Real-Time Hand Tracking with MediaPipe

Распознавание жестов от Google.

https://ai.googleblog.com/2019/08/on-device-real-time-hand-tracking-with.html?m=1

blog.research.google

On-Device, Real-Time Hand Tracking with MediaPipe

1.4K views18:18

Таблица построения ядер

Использование ядер — оригинальный и эффективный трюк в машинном обучении. Идея проста: если в исходном признаковом пространстве прецеденты линейно неразделимы, можно попробовать повысить размерность пространства так, чтобы в новом пространстве прецеденты стали линейно разделимы. Осуществляются такие преобразования с помощью ядер: скалярное произведение в исходном пространстве ⟨x, x’⟩ заменяется ядром k(x, x’).

Существует набор стандартных способов построения ядер. Функция k(x, x’) будет ядром во всех нижеперечисленных случаях.

k(x, x’) =

= c ⋅ k₁(x, x’)
= f(x) ⋅ k₁(x, x’) ⋅ f(x’)
= q(k₁(x, x’))
= exp(k₁(x, x’))
= k₁(x, x’) + k₂(x, x’)
= k₁(x, x’) ⋅ k₂(x, x’)
= k₃(ϕ(x), ϕ(x’))
= t(x) ⋅ A ⋅ x’
= kₐ(xₐ, xₐ’) + kₑ(xₑ, xₑ’)
= kₐ(xₐ, xₐ’) ⋅ kₑ(xₑ, xₑ’)

Здесь:
k₁(x, x’) и k₂(x, x’) — ядра;
kₐ(xₐ, xₐ’) и kₑ(xₑ, xₑ’) — ядра;
x = (xₐ, xₑ);
c — положительная константа;
f(⋅) — произвольная функция;
q(⋅) — полином с неотрицательными коэффициентами;
ϕ(x) — функция, отображающая x в ℝⁿ;
k₃(⋅, ⋅) — ядро в ℝⁿ;
A — симметричная положительно полуопределенная матрица.

#dainamicskills

1.32K views20:34

A Topology Layer for Machine Learning

Топологические свойства распределений прецедентов редко используются в машинном обучении. Причина — сложность применения градиентных методов. TopologyLayer призван решить эту проблему.

http://ai.stanford.edu/blog/topologylayer/

A Topology Layer for Machine Learning

Topology is a combinatorial property that is tricky to utilize in gradient based methods, but it is also a useful and underexploited feature of data. We present an easy-to-use TopologyLayer that allows for backpropagation through a loss based on Persistent…

1.31K viewsedited 20:44

Модель vs данные

Всего за несколько лет мир машинного обучения изменился.

Ещё пять лет назад конкуренция выигрывалась моделями и алгоритмами. Побеждал тот, у кого ML-модель и алгоритм обучения были удачнее.

Сегодня модели и алгоритмы у Google, Amazon и у стартапа из трёх человек примерно одинаковые. Практически любая state-of-the-art архитектура доступна абсолютно всем. Теперь конкуренция выигрывается качественными датасетами и грамотно построенной инфраструктурой для их сбора, обновления и перетренировки моделей.

#dainamicskills

1.43K viewsedited 20:59

Нелинейный SVM и ядерный трюк

Существует замечательное обобщение SVM для случая нелинейной разделимости классов — SVM с ядрами. Идея состоит в том, чтобы при помощи некоторого нелинейного преобразования так повысить размерность пространства признаков, чтобы в новом пространстве классы стали линейно разделимы.

Интересная особенность — само нелинейное повышение размерности пространства не обязательно осуществлять в явном виде. Не нужно пересчитывать новые координаты (признаки) объектов. Нелинейное преобразование осуществляется неявно при помощи так называемого ядерного трюка — в алгоритме SVM все скалярные произведения ⟨x, x’⟩ просто заменяются функцией выбранного ядра k(x, x’). Именно благодаря этой особенности нелинейный SVM становится вычислительно эффективным.

Можно пойти еще дальше и применить ядерный трюк к объектам вообще без признаков. Нелинейному (и линейному тоже) SVM признаки в явном виде не нужны, нужна лишь функция ядра, обладающая свойствами (удовлетворяющая аксиомам) скалярного произведения.

#dainamicskills

1.31K viewsedited 20:19

Мы с друзьями запускаем новый стартап. Цель — научить AI творить. Новостями и AI-работами будем делиться здесь: instagram.com/sotaplus. Подписывайтесь.

1.33K views07:23

Первый продакшн SOTA+.

https://instagram.com/p/CFH-Tllle24

Graphic generated by @sotaplus for art-installation "Горький опыт" from @anvilrosenkreuz, @ivan_seriy, @aleksandrignatushko, @kurtstudiodesign. Shown at the @russiancreativityweek. #sotaplus #sotaprocessing

1.28K views10:14

https://instagram.com/p/CFe4H-VpJSt

Glyph generation process by ML. #sotaplus #sotaprocessing #glyph #machinelearning

1.16K views16:31

https://instagram.com/p/CFzNxyIpZiK

∞ One crucial thing about graphics created by SOTA+ is an infinite creative canvas ∞ #sotaplus #sotaprocessing #machinelearning #ai #ml #graphicdesign

998 views14:41

instagram.com/p/CGAd4m5J5vN

What is Sota+? It's an AI-based platform for graphic designers. It's not one more tool; it's a new way to design. We are convinced that artificial intelligence technologies will empower designers and creatives and give them unlimited self-expression opportunities.…

897 views09:56

https://instagram.com/p/CGFgCoYJC4d

We’re building algorithms to exhibit behaviours that might be deemed as skillful, appreciative and imaginative. #sotaplus #sotaplusprocessing #ml #ai #algorithms #graphicdesign #sotaprocessing

1.07K views10:05

https://instagram.com/p/CGU6jSYpj0B

Like a type designer, our algorithms learn how to draw each glyph step by step. ML based glyph morphing process. #sotaplus #sotaprocessing #ml #font #glyph #ai #graphicdesign #typedesign #design

1.14K views14:42

SOTA+ can generate glyphs consisting of line segments and cubic Bézier curves.

https://instagram.com/p/CHsqUEtJbgw

938 views20:17