duangsuse::Echo

导入功能完全可以用，我觉得应该可以在里面用质量比较好的葛炮，不知道是 DeepVocal 还是 UTAU+moresampler 还是 tn_fnds (基于WORLD的 resampler) 质量更好，但维尼熊的音源，很不行呢……

23 viewsduangsuse, 15:30

duangsuse::Echo

https://github.com/open-speech/speech-aligner #signal #cs #phonetic #vocaloid

GitHub - open-speech/speech-aligner: speech-aligner，是一个从“人声语音”及其“语言文本”，产生音素级别时间对齐标注的工具。speech-aligner, is a tool that generate…

speech-aligner，是一个从“人声语音”及其“语言文本”，产生音素级别时间对齐标注的工具。speech-aligner, is a tool that generate phoneme-level alignment between human speech and its transcription - GitHub - open-speech/speech-aligner: s...

23 viewsduangsuse, 15:31

duangsuse::Echo

https://github.com/icsharpcode/ILSpy #dotnet #re 知名项目了

GitHub

GitHub - icsharpcode/ILSpy: .NET Decompiler with support for PDB generation, ReadyToRun, Metadata (&more) - cross-platform!

.NET Decompiler with support for PDB generation, ReadyToRun, Metadata (&more) - cross-platform! - icsharpcode/ILSpy

22 viewsduangsuse, 15:55

duangsuse::Echo

UTSU 应该是打算做比较完全的 UTAU 替换 🤔 看起来还不错，现在基本上是个原型很多功能没有、钢琴卷轴也不完善

26 viewsduangsuse, 16:02

duangsuse::Echo

https://github.com/hyperzlib/Sinsy-Remix
这是一个支持中文作为音标记号的 Sinsy，它依赖 HTS (HMM-based speech synthesis engine)

git clone https://github.com/hyperzlib/Sinsy-Remix.git
cd Sinsy-Remix
aclocal; autoreconf

http://hts-engine.sourceforge.net/
可以到这里下载源代码(hts_engine) 编译和示例的音源

aclocal; ./configure
make
sudo make install

最后回到 Sinsy-Remix
./configure --includedir /usr/local; make

/usr/bin/ld: /home/DuangSUSE/Projects/Sinsy-Remix/lib/hts_engine_API/HtsEngine.cpp:209: undefined reference to `HTS_Engine_generate_sample_wave'
http://hts.sp.nitech.ac.jp/?Download 去这里下载编译…… 不对，那里只有音源训练相关

grep -r HTS_Engine_generate_sample_wave

最后才发现因为 HTS engine 体积小，所以直接被加进来了 😂

pushd hts_engine_API
aclocal; autoreconf
make
sudo make install
popd

在 sinsy-r 里
sudo make install 就可以了！

GitHub

GitHub - hyperzlib/Sinsy-Remix: The HMM-Based Singing Voice Syntheis System Remix "Sinsy-r"

The HMM-Based Singing Voice Syntheis System Remix "Sinsy-r" - GitHub - hyperzlib/Sinsy-Remix: The HMM-Based Singing Voice Syntheis System Remix "Sinsy-r"

25 viewsduangsuse, 01:43

duangsuse::Echo

https://github.com/hyperzlib/Sinsy-Remix 这是一个支持中文作为音标记号的 Sinsy，它依赖 HTS (HMM-based speech synthesis engine) git clone https://github.com/hyperzlib/Sinsy-Remix.git cd Sinsy-Remix aclocal; autoreconf http://hts-engine.sourceforge.net/ 可以到这里下载源代码(hts_engine)…

整个的代码： #sysadmin #linux

git clone https://github.com/hyperzlib/Sinsy-Remix.git
pushd Sinsy-Remix
pushd hts_engine_API
aclocal; autoreconf
sudo make install
popd
aclocal; autoreconf
sudo make install
popd

27 viewsduangsuse, edited 01:44

duangsuse::Echo

http://flite-hts-engine.sp.nitech.ac.jp/

28 viewsduangsuse, 01:45

duangsuse::Echo

sinsy -w c -m 文档/hts_voice/cmu_us_arctic_slt.htsvoice -o 音乐/xi.wav 文档/MuseScore3/乐谱/野习_pin.xml
草，结果非常失败，根本唱不出来更不支持中文字典

27 viewsduangsuse, 02:12

duangsuse::Echo

野习_pinyin.s5p

52.4 KB

28 viewsduangsuse, 02:19

duangsuse::Echo

用 Utsu 调 UTAU 音源，深黄蓝这个样子看起来合成可以接受

32 viewsduangsuse, 03:17

duangsuse::Echo

#cs #signal #phonetic https://www.bilibili.com/read/cv1007842/

Bilibili

UTAU日记- Moresampler

不同于采样器需要多重采样，UTAU可以将单个采样进行拉伸、变调、变形等处理从而达到比较理想的声音效果。Resampler（重采样器），俗称“引擎”，是UTAU的核心之一。不同的引擎以及其相应的

28 viewsduangsuse, 04:04

duangsuse::Echo

https://github.com/autokey/autokey#installation #GitHub #Python #tools #linux 桌面自动化脚本……

GitHub

GitHub - autokey/autokey: AutoKey, a desktop automation utility for Linux and X11.

AutoKey, a desktop automation utility for Linux and X11. - autokey/autokey

27 viewsduangsuse, 05:43

duangsuse::Echo

Collecting PyQt5-sip<13,>=12.7 (from PyQt5)
  Downloading https://pypi.tuna.tsinghua.edu.cn/packages/af/ea/b0e4e5d3364780c0500325afb7b1bdc024f6b3fc637447f11a333b49329e/PyQt5_sip-12.7.2-cp37-cp37m-manylinux1_x86_64.whl (253kB)
     |████████████████████████████████| 256kB 2.1MB/s 
Building wheels for collected packages: PyQt5
  Building wheel for PyQt5 (PEP 517) ... done
  Stored in directory: /home/DuangSUSE/.cache/pip/wheels/b3/1f/34/259708ede3893c6b16abc9ac9d414598784cf2e25d03bbb373
Successfully built PyQt5
Installing collected packages: PyQt5-sip, PyQt5

安装这个轮子花了我几乎半个小时……

23 viewsduangsuse, 07:00

duangsuse::Echo

https://github.com/autokey/autokey#installation #GitHub #Python #tools #linux 桌面自动化脚本……

from time import sleep
mouse.click_absolute(40, 130, 1) # Open Character Settings
sleep(0.1) # Wait for the dialog
keyboard.send_keys("<tab><tab><up><enter>") # last voice
mouse.click_absolute(40, 130, 1)
keyboard.send_keys("<tab><tab><down><enter>") # back

这个轮子又花了我半个小时…… 但可以一键 reload UTAU 里的 voice 了，方便。

22 viewsduangsuse, 08:00

duangsuse::Echo

from time import sleep
mouse.click_absolute(40, 130, 1) # Open Character Settings
sleep(1) # Wait for the dialog
keyboard.send_keys("<tab><tab><up><enter>") # last voice
sleep(0.5)
mouse.click_absolute(40, 130, 1)
keyboard.send_keys("<tab><tab><down><enter>") # back

这个是加长等待防脚本瓦特的。顺便说一句，如果 gtk 的 key recorder 不能用，只需在终端打开，然后错的哪一行，把 RecordDialog 里对应的调用代码注释掉即可。

22 viewsduangsuse, 08:03

duangsuse::Echo

用 Utsu 调 UTAU 音源，深黄蓝这个样子看起来合成可以接受

发现其实最关键的不是蓝-右部分的时长，而是文语对齐 — 把音素和波形对齐。 UTAU 的重复线（这里为蓝色）比较自由，拒绝“痰音”的关键不仅在于分析猜测音素起止，而且在于优先猜得越短越好。 (图音 /zu/ )

21 viewsduangsuse, edited 13:05

duangsuse::Echo

发现其实最关键的不是蓝-右部分的时长，而是文语对齐 — 把音素和波形对齐。 UTAU 的重复线（这里为蓝色）比较自由，拒绝“痰音”的关键不仅在于分析猜测音素起止，而且在于优先猜得越短越好。 (图音 /zu/ )

平时遇到的形式基本都会是 offset - cutoff 里面，顺序
深蓝(overlap)
黄(pre-utterance)
蓝(consonant)

偶尔会有深蓝-offset-黄-蓝-cutoff 的情况 #vocaloid #UTAU

一般音源合成使用无非两种情况：拉长和切短
如果要拉长的话，蓝-右(或者左-蓝) 部分很重要
如果要缩短的话，我不清楚 🤔

音源质量很重要，如果音源 oto.ini 定义的不好 moresampler 也不能发挥作用，可是如果音源的波形自己也质量差，那改 oto.ini 也没用了，必须重新找波形。

21 viewsduangsuse, edited 13:08

duangsuse::Echo

还有这种的 🤔 (ua n)

19 viewsduangsuse, 13:21

duangsuse::Echo

Sinsy 歌手香玲歌唱祖国 🤔 – 野习 (香玲)

香玲根本不能用！ sinsy 到现在包装的都很烂，而且居然连 wo 都认不出来…… 音太高了也会直接略过，MusicXML 输入局限性太大了，sinsy 也到处说太长不能唱什么的…… 而且本地编译了一个带英文 voice 也根本不能用，连官方示例都没法合成，而且安装还默认没带纯英文的字典……

21 viewsduangsuse, 14:39

duangsuse::Echo

UTAU 的节奏也是个问题…… 莫名其妙根本对不上，都是 125bpm，但一个长一个短

21 viewsduangsuse, 14:41

duangsuse::Echo