Авто изменение громкости у синтеза речи, требует понимание процесса.
1) мы автоматически выравниваем свою громкости по внутреннему голосу
2) мы оцениваем внешнюю интенсивность (шумы, голоса и т.д.) для регулировки голоса
3) существует 2е эмоциональные реакции быстрая и медленная. Первая вызвана пептидными гормонами, а вторая стероидными. С голосом они связаны через два типа мышц.
4) расчет уровня громкости и саморегулировки, оказалась сложной задачей. Но удалось правильно сделать расчетную модель и решить.
Сама регулировка происходит через гормоны и регулирование скорости потока выдоха.
В расчетах есть, что улучшить. Но данная работа и так тянет на диссертацию. Поэтому улучшать расчеты буду только, если не хватит точности.
В целом тесты показали, что расчеты дают верный результат громкости с биологической точки зрения.
Буду встраивать. Без этого, громкость меняет скачками на коротких и длинных фразах.
Источники материалов на которые опирался приложу в комментариях.
1) мы автоматически выравниваем свою громкости по внутреннему голосу
2) мы оцениваем внешнюю интенсивность (шумы, голоса и т.д.) для регулировки голоса
3) существует 2е эмоциональные реакции быстрая и медленная. Первая вызвана пептидными гормонами, а вторая стероидными. С голосом они связаны через два типа мышц.
4) расчет уровня громкости и саморегулировки, оказалась сложной задачей. Но удалось правильно сделать расчетную модель и решить.
Сама регулировка происходит через гормоны и регулирование скорости потока выдоха.
В расчетах есть, что улучшить. Но данная работа и так тянет на диссертацию. Поэтому улучшать расчеты буду только, если не хватит точности.
В целом тесты показали, что расчеты дают верный результат громкости с биологической точки зрения.
Буду встраивать. Без этого, громкость меняет скачками на коротких и длинных фразах.
Источники материалов на которые опирался приложу в комментариях.
Добавление громкости речи в модель легкие-сердце, объяснило скорость воздуха при выдохе. И я решил заменить абстрактное значение "сила эмоции" на гормоны и метаболизм.
Замените глюкозу на заряд батареи устройства, энергию на питание, метаболизм потребление. Гормоны на сообщения.
Это дало:
- не от O2, а от CO2 зависит скорость речи и дыхания
- время вдоха, зависит от обмена газов O2/CO2
- объём вдоха от нескольких параметров
- громкость речи от объёма и гормонов, а те на сердце
- группа эмоций от артериального давления
В целом всё процессы взаимосвязаны и влияют друг на друга. Но это позволяет посчитать их.
Я стараюсь отойти от модели эмоций к обобщённой системе. Эмоции это как цвета, вроде есть но длина волны лучше описывает цвет. И либо надо при синтезе уметь смешивать эмоции выдавая сразу несколько, либо формировать их на более низком уровне.
Данная модель не только помогает синтезировать эмоции речи, но и позволяет строить расчёт биологии. Чего нет ни в одном исследовании.
Замените глюкозу на заряд батареи устройства, энергию на питание, метаболизм потребление. Гормоны на сообщения.
Это дало:
- не от O2, а от CO2 зависит скорость речи и дыхания
- время вдоха, зависит от обмена газов O2/CO2
- объём вдоха от нескольких параметров
- громкость речи от объёма и гормонов, а те на сердце
- группа эмоций от артериального давления
В целом всё процессы взаимосвязаны и влияют друг на друга. Но это позволяет посчитать их.
Я стараюсь отойти от модели эмоций к обобщённой системе. Эмоции это как цвета, вроде есть но длина волны лучше описывает цвет. И либо надо при синтезе уметь смешивать эмоции выдавая сразу несколько, либо формировать их на более низком уровне.
Данная модель не только помогает синтезировать эмоции речи, но и позволяет строить расчёт биологии. Чего нет ни в одном исследовании.
🔥6
Тесты напыления оптики показали, что вышел мусор.
При чем зеркало с внешней стороны есть, а с внутренней нет.
Договорились попробовать напылить хром вместо серебра.
Второе, есть подозрение что протирание оптики перед напылением могло негативно отразится.
Третье, дело в смоле.
Я склоняюсь большее к третьему варианту. Хотя не исключаю второй. Дело в том, что одна из ненапыленных оптик даже без напыления даёт сфокусированную точку.
На третьем фото как раз там где нет напыления, но луч сфокусирован в точку. Фото не удачная, на третьем фото точка.
Как итог на втором фото размытое пятно с напылением.
На третьем без напыления, другой образец.
Но у них разные смолы, не было отрывок оптики.
Дальнейшие шаги
1) попробовать напылить хром
2) предварительно ничего не делать с оптикой перед напылением
3) закрыть всё стороны кроме одной на случай если что то попало
4) изменить смолу.
При чем зеркало с внешней стороны есть, а с внутренней нет.
Договорились попробовать напылить хром вместо серебра.
Второе, есть подозрение что протирание оптики перед напылением могло негативно отразится.
Третье, дело в смоле.
Я склоняюсь большее к третьему варианту. Хотя не исключаю второй. Дело в том, что одна из ненапыленных оптик даже без напыления даёт сфокусированную точку.
На третьем фото как раз там где нет напыления, но луч сфокусирован в точку. Фото не удачная, на третьем фото точка.
Как итог на втором фото размытое пятно с напылением.
На третьем без напыления, другой образец.
Но у них разные смолы, не было отрывок оптики.
Дальнейшие шаги
1) попробовать напылить хром
2) предварительно ничего не делать с оптикой перед напылением
3) закрыть всё стороны кроме одной на случай если что то попало
4) изменить смолу.
👍2🔥1
Работы по голографическому HOE принтеру продолжаются.
Меня периодически спрашивают по голографическим волноводам. Это проект в долгую, с проб и ошибок с R&D в среднем 2 года.
Проект сам по себе дорогой. С учётом финансовых трудностей сложнее ещё в несколько раз.
Повезло что оптику я закупал несколько лет под лабораторию. Сейчас она пошла под стендовую сборку.
Нормальный SLM стоит несколько миллионов руб, сейчас же используется более дешёвый аналог чтобы откалибровать всё и сделать нормальный софт.
Сейчас жду стержни нужной длины и втулки для держания снизу.
Попав качестве шасси gcode шасси от лазерного гравёра с шагом 0,01 мм.
После получения, надо будет перепечатать конструкцию на фотополимерном принтере (тестовая из хлипкой смолы и сломалась и что ещё хуже - гнётся).
Затем прикрепить всё к гранитной плите, так как свою оптическую плитку пришлось продать. После этого откалибровать и отладить расчёты софта.
Думаю это займёт 2-4 месяца.
Качество будет плохое, но задача добиться первых результатов.
Меня периодически спрашивают по голографическим волноводам. Это проект в долгую, с проб и ошибок с R&D в среднем 2 года.
Проект сам по себе дорогой. С учётом финансовых трудностей сложнее ещё в несколько раз.
Повезло что оптику я закупал несколько лет под лабораторию. Сейчас она пошла под стендовую сборку.
Нормальный SLM стоит несколько миллионов руб, сейчас же используется более дешёвый аналог чтобы откалибровать всё и сделать нормальный софт.
Сейчас жду стержни нужной длины и втулки для держания снизу.
Попав качестве шасси gcode шасси от лазерного гравёра с шагом 0,01 мм.
После получения, надо будет перепечатать конструкцию на фотополимерном принтере (тестовая из хлипкой смолы и сломалась и что ещё хуже - гнётся).
Затем прикрепить всё к гранитной плите, так как свою оптическую плитку пришлось продать. После этого откалибровать и отладить расчёты софта.
Думаю это займёт 2-4 месяца.
Качество будет плохое, но задача добиться первых результатов.
На прошлой неделе закончил расчёты вдоха. Сложное исследование с реальным R&D.
Надо ещё улучшить расчёты диффузии газов и учесть сердце.
Новая модель:
- учитывает метаболизм в качестве энергии работы
- артериальное давление, решает парасимпатическая или симпатическая система. Влияет на выбор эмоций
- гормоны, вместо силы эмоций
Это скачек в понимании процессов и паттернов эмоций речи.
Выше описаны расчёты вдоха. Они позволяют рассчитать часть паузы в речи.
В основном влияют O2/CO2, гормоны влияют через сопротивление (диаметр бронх и тд).
O2 отвечает за скорость речи.
CO2 за объём вдоха/выдоха.
Эти параметры нужны для расчёта выдоха.
Это даёт:
- моделирование поведения процессов для их изучения
- обобщение знаний для лучшего понимание процессов
- естественное создание паттернов эмоций.
- несколько эмоций одновременно, через смешивание их паттернов
- точный синтез речи
На слайдах показаны 3и шага развития расчётов
1) скорость постоянная
2) скорость изменяется
3) учитывается сопротивление воздуху
Надо ещё улучшить расчёты диффузии газов и учесть сердце.
Новая модель:
- учитывает метаболизм в качестве энергии работы
- артериальное давление, решает парасимпатическая или симпатическая система. Влияет на выбор эмоций
- гормоны, вместо силы эмоций
Это скачек в понимании процессов и паттернов эмоций речи.
Выше описаны расчёты вдоха. Они позволяют рассчитать часть паузы в речи.
В основном влияют O2/CO2, гормоны влияют через сопротивление (диаметр бронх и тд).
O2 отвечает за скорость речи.
CO2 за объём вдоха/выдоха.
Эти параметры нужны для расчёта выдоха.
Это даёт:
- моделирование поведения процессов для их изучения
- обобщение знаний для лучшего понимание процессов
- естественное создание паттернов эмоций.
- несколько эмоций одновременно, через смешивание их паттернов
- точный синтез речи
На слайдах показаны 3и шага развития расчётов
1) скорость постоянная
2) скорость изменяется
3) учитывается сопротивление воздуху
Попытался заменить смолу у принтера на Harz lab ABS при печати корпуса очков. Из того что нашёл, обещало ближе всего в к abs.
1) время печати некоторых деталей выросло с 8 часов до 25 часов.
2) качество хуже, хотя брал настройки с сайта (смола российская). Это касается деталей, тонких стенок, и вообще деталей. У сложных деталей сплошной брак.
3) стоит в 2,5 раза дороже стандартной.
На первом фото, что напечатал Harz за неделю. Остальное углов в мусор.
На втором фото, то что печатал смолой и лил полиуретан.
На третьем фото, механизм, на отладку которого ушёл год. Это подъёмник дисплея. Проблема в тяге + на границах (застревает и тяги её хватало) и других мелочах.
На четвёртом фото просто как крепится дисплей
Так же я пересчитал затраты на производство сейчас в новых реалиях. Не вижу смысла выпускать очки в продажу пользователям. Раньше цена должна была быть 30-35 тыс руб. Сейчас это себестоимость, и чтобы отбивать надо цену хотя бы 60-70 тыс руб. Это только при закупке школами/вузами через субсидии
1) время печати некоторых деталей выросло с 8 часов до 25 часов.
2) качество хуже, хотя брал настройки с сайта (смола российская). Это касается деталей, тонких стенок, и вообще деталей. У сложных деталей сплошной брак.
3) стоит в 2,5 раза дороже стандартной.
На первом фото, что напечатал Harz за неделю. Остальное углов в мусор.
На втором фото, то что печатал смолой и лил полиуретан.
На третьем фото, механизм, на отладку которого ушёл год. Это подъёмник дисплея. Проблема в тяге + на границах (застревает и тяги её хватало) и других мелочах.
На четвёртом фото просто как крепится дисплей
Так же я пересчитал затраты на производство сейчас в новых реалиях. Не вижу смысла выпускать очки в продажу пользователям. Раньше цена должна была быть 30-35 тыс руб. Сейчас это себестоимость, и чтобы отбивать надо цену хотя бы 60-70 тыс руб. Это только при закупке школами/вузами через субсидии