# ЗП монтажера видео
Зайдем на хедхантер и найдем вакансии с монтированием видео. Есть разные названий для подходящих вакансий: режиссер монтажа, видеомонтажер, монтажер-оператор. И ещё запрос на вакансии содержащие "Adobe Premier". Получаем четыре запроса для поиска. Для всех запросов после первой страницы начинаются нерелевантные запросы. Так что будем использовать первые страницы каждого запроса.
Руками переписывать и усреднять 1000+ зарплат слишком муторно, напишем несложный Javascript код, который выберет на каждой странице все строки с зарплатами:
Зайдем на хедхантер и найдем вакансии с монтированием видео. Есть разные названий для подходящих вакансий: режиссер монтажа, видеомонтажер, монтажер-оператор. И ещё запрос на вакансии содержащие "Adobe Premier". Получаем четыре запроса для поиска. Для всех запросов после первой страницы начинаются нерелевантные запросы. Так что будем использовать первые страницы каждого запроса.
Руками переписывать и усреднять 1000+ зарплат слишком муторно, напишем несложный Javascript код, который выберет на каждой странице все строки с зарплатами:
document.querySelectorAll(['[data-qa="vacancy-serp__vacancy-compensation"]']);Надо вытащить из этих строк цифры. Эта функция вернет середину интервала или просто число если указана конкретная цифра.
function salaryFromString(txt) {
const parts = txt.split("–");
let val;
if (parts.length == 2){
const left = parts[0].replace(/\D/g,'');
const right = parts[1].replace(/\D/g,'');
val = (parseInt(left) + parseInt(right))/2;
} else {
const val_str = parts[0].replace(/\D/g,'');
val = parseInt(val_str)
}
return val
}
Осталось только применить это ко всем зарплатам на странице и посчитать среднюю зарплату на странице:function salaryFromDOM(elem) { return salaryFromString(elem.textContent) }
const avg = (array) => array.reduce((a, b) => a + b) / array.length;
avg(Array.from(salaries).map(salaryFromDOM))
Далее руками запускаем этот код на каждой странице результатов поиска и выписываем результаты:Видео-монтажер: 59882 рубОценка средней зарплаты в монтаже видео: 62,108 руб. При 39 часах рабочей недели (скидываем час с учетом праздников в течение года), средняя почасовая ставка: 398.12 руб.
Режиссер монтажа: 62675 руб
Монтажер: 60079 руб
Adobe Premier: 65797 руб
Борис опять pinned «# Фермизация объема рынка монтажа видео Недавно мне пришла в голову идея проекта. Он бы упростил и ускорил монтаж видео. Проект уменьшил бы время на отсмотр видео на "косяки". Главный вопрос: стоит ли браться за идею? Для ответа понадобится несколько других…»
# Сколько часов тратит монтажер на отсмотр видео?
Сколько вообще монтажер тратит на монтаж? Анекдоты и кулстори указывают такие цифры по общей загрузке: 2-3 часа на одну минуту видео.
Примем за оценку, что производство одной минуты видео занимает два часа. С учетом того, что работать все 40 часов рабочей недели невозможно, за неделю можно сделать 10-20 минут видео. Тогда за год производится 15 * 4 * 12 = 720 минут или 12 часов видео. Отсмотреть все эти минуты нужно как минимум один раз, но можно предположить, что как минимум два раза. Получаем 1440 минут или 24 часа в год на отсмотр. Вероятнее всего цифра намного больше: за отсмотром следует переделывание и повторный отсмотр. Но я не знаю, как улучшить оценку, подскажите.
# На сколько мы можем уменьшить потребность в отсмотре видео?
Этот параметр мы не знаем и узнать не может. Но мы можем варьировать его, чтобы рассмотреть при какой эффективности идея становится рентабельной. Предположим, что можем сократить время на отсмотр на 20%. Таким образом мы экономим монтажеру 4.8 часов работы в год на чистом отсмотре. По средней ставке в видеомонтаже это 4.8 * 398.12 = 1911 руб. Если пользование сервисом будет стоить монтажеру меньше этой суммы, то оно будет ему экономически выгодно, так как он будет в плюсе.
# Сколько мы можем заработать?
Если нам заплатит каждый монтажер, то в год заработок составит: 38,957 * 1911 = 74,446,827 руб.
Что-то совсем немного получилось. Я бы не ожидал, что можно занять больше 5% рынка, а это меньше 4 миллионов в год. Даже если вдруг монтажеры будут готовы заплатить в три раза больше, принципиально ничего не изменится. Я делаю вывод: рынок очень маленький. Идею нужно переформулировать или целиться в другой рынок.
Сколько вообще монтажер тратит на монтаж? Анекдоты и кулстори указывают такие цифры по общей загрузке: 2-3 часа на одну минуту видео.
Примем за оценку, что производство одной минуты видео занимает два часа. С учетом того, что работать все 40 часов рабочей недели невозможно, за неделю можно сделать 10-20 минут видео. Тогда за год производится 15 * 4 * 12 = 720 минут или 12 часов видео. Отсмотреть все эти минуты нужно как минимум один раз, но можно предположить, что как минимум два раза. Получаем 1440 минут или 24 часа в год на отсмотр. Вероятнее всего цифра намного больше: за отсмотром следует переделывание и повторный отсмотр. Но я не знаю, как улучшить оценку, подскажите.
# На сколько мы можем уменьшить потребность в отсмотре видео?
Этот параметр мы не знаем и узнать не может. Но мы можем варьировать его, чтобы рассмотреть при какой эффективности идея становится рентабельной. Предположим, что можем сократить время на отсмотр на 20%. Таким образом мы экономим монтажеру 4.8 часов работы в год на чистом отсмотре. По средней ставке в видеомонтаже это 4.8 * 398.12 = 1911 руб. Если пользование сервисом будет стоить монтажеру меньше этой суммы, то оно будет ему экономически выгодно, так как он будет в плюсе.
# Сколько мы можем заработать?
Если нам заплатит каждый монтажер, то в год заработок составит: 38,957 * 1911 = 74,446,827 руб.
Что-то совсем немного получилось. Я бы не ожидал, что можно занять больше 5% рынка, а это меньше 4 миллионов в год. Даже если вдруг монтажеры будут готовы заплатить в три раза больше, принципиально ничего не изменится. Я делаю вывод: рынок очень маленький. Идею нужно переформулировать или целиться в другой рынок.
Forwarded from data.csv (Алексей Смагин)
Всё ещё самый действенный способ понять что всё опять пошло по новой
Перевел хабро-туториал про прогнозирование ковида и выложил на медиум, клянчу лайки (ссылка без пейвола):
https://b-tseytlin.medium.com/how-to-actually-forecast-covid-19-778cce27b9d6?source=friends_link&sk=ee3b5c2fad9858806a002ad6702d921f
Из неприятных известий: на медиуме можно зарабатывать деньги на публикациях, однако для этого нужен аккаунт Stripe, который не работает в России.
https://b-tseytlin.medium.com/how-to-actually-forecast-covid-19-778cce27b9d6?source=friends_link&sk=ee3b5c2fad9858806a002ad6702d921f
Из неприятных известий: на медиуме можно зарабатывать деньги на публикациях, однако для этого нужен аккаунт Stripe, который не работает в России.
Medium
Actually forecasting COVID-19
A thorough tutorial on forecasting COVID-19, with code in Python
Все больше кажется, что 90% мыслей в неразвлекательном инфополе это пересказанные абстракты научных статей
В тему недавнего поста про бенчмарки: создатели CLIP замерили, что модель может обучиться для победы на бенчмарке, однако не стать лучше на самом деле
https://openai.com/blog/clip/
https://openai.com/blog/clip/
# Video as timeseries, video as picture
С вами рубрика "велосипеды от Бориса" и сегодня мы будем изобрать мою следующую научную статью.
Нет времени объяснять, давайте обрабатывать видео с помощью неиронок.
Возьмем такое видео с ютуба:
https://www.youtube.com/watch?v=mcEZ2cV6WIg
Видео это последовательность кадров. Возьмем кадры с частотой 5 FPS и засунем в конволюционную неиронную сеть MobileNetV3, у которой убран классификатор. Неиронная сеть предобучена на ImageNet, то есть её научили различать 1000 различных классов на картинке: породы собак, самолеты, все такое прочее.
Что выдает нейронная сеть для каждой картинки? Она выдает вектор из 1280 чисел, где каждое число это какая-то информация, нужная для классификации. Какие-то числа могут обозначать "котистость" изображения, другие "куда смотрит объект на фото" или, например, "есть ли на картинке террористы". Мы не знаем, что именно значат эти числа, можем только догадываться. Но мы точно знаем, что эта информация очень полезна, емко описывает картинку и по ней можно очень многое сказать. По сути неиронная сеть берет изображение размерности [очень много X дофига] и сжимает до маленького вектора, отфильтровав ненужное и оставив только полезную информацию. Подобно как мы описывая фильм сжиаем полтора часа контента до фразы "ну очередной фильм со Стетхемом" почти без потери полезной информации. В дальнейшем будем называть выдаваемый нейронной сетью вектор просто "фичи" (features).
Революционная идея: а давайте вытащим фичи из всех кадров видео, а потом составим их вместе. Было N векторов фичей по 1280, станет матрица [Nx1280]. Тогда первая строка этой матрицы будет, например, зависимостью котистости (первой фичи) от времени. Иначе говоря, получаем представление видео в виде 1280-мерного временного ряда неведомых нейронных смыслов.
С вами рубрика "велосипеды от Бориса" и сегодня мы будем изобрать мою следующую научную статью.
Нет времени объяснять, давайте обрабатывать видео с помощью неиронок.
Возьмем такое видео с ютуба:
https://www.youtube.com/watch?v=mcEZ2cV6WIg
Видео это последовательность кадров. Возьмем кадры с частотой 5 FPS и засунем в конволюционную неиронную сеть MobileNetV3, у которой убран классификатор. Неиронная сеть предобучена на ImageNet, то есть её научили различать 1000 различных классов на картинке: породы собак, самолеты, все такое прочее.
Что выдает нейронная сеть для каждой картинки? Она выдает вектор из 1280 чисел, где каждое число это какая-то информация, нужная для классификации. Какие-то числа могут обозначать "котистость" изображения, другие "куда смотрит объект на фото" или, например, "есть ли на картинке террористы". Мы не знаем, что именно значат эти числа, можем только догадываться. Но мы точно знаем, что эта информация очень полезна, емко описывает картинку и по ней можно очень многое сказать. По сути неиронная сеть берет изображение размерности [очень много X дофига] и сжимает до маленького вектора, отфильтровав ненужное и оставив только полезную информацию. Подобно как мы описывая фильм сжиаем полтора часа контента до фразы "ну очередной фильм со Стетхемом" почти без потери полезной информации. В дальнейшем будем называть выдаваемый нейронной сетью вектор просто "фичи" (features).
Революционная идея: а давайте вытащим фичи из всех кадров видео, а потом составим их вместе. Было N векторов фичей по 1280, станет матрица [Nx1280]. Тогда первая строка этой матрицы будет, например, зависимостью котистости (первой фичи) от времени. Иначе говоря, получаем представление видео в виде 1280-мерного временного ряда неведомых нейронных смыслов.
Я попробовал делать что-то с этим представлением, например искать по нему ключевые фреймы. Если взять точки изменения этого временного ряда, а так же точки между точками изменения, получается неплохой набор фреймов для короткого саммари видео. Этакое сжатие видео в 10 фреймов. Оно конечно не учитывает смысловое наполнение, то есть не делает саммари содержащее самую важную часть видео (чем занимается раздел Video Summarization в DL), а просто делает примерно по фрейму на сцену.
Кроме этого я ничего с таким представлением не придумал, поэтому перешел ко второй идее.
Кроме этого я ничего с таким представлением не придумал, поэтому перешел ко второй идее.