duangsuse::Echo

不用 smooth 处理的版本虽然要多做很多次 OCR 速度更慢，但提取的时间线也更精确

68 viewsduangsuse, 08:49

duangsuse::Echo

效果比较好，生成命令：

./extract_subtitles.py -crop '(617,955)(685,32)' --crop-debug -filter-code '~cvInGrayRange(it, 0xbf,0xff)' --draw-plot --use-sharp --chunk-size 1000  SomethingNew.mp4
./timeline_ops.py merge frames/timeline_SomethingNew.mp4.txt 0.25|./timeline_ops.py to-lrc 29.97 srt> mux.srt

27 viewsduangsuse, edited 09:05

duangsuse::Echo

从这个小细节都可以看出 --use-sharp 多进行了多少次 OCR

40 viewsduangsuse, 09:07

duangsuse::Echo

而用 smooth 则会少进行很多次 OCR，但这样时间轴就不准确了

25 viewsduangsuse, 09:12

duangsuse::Echo

有意思的小细节：

def postprocessDifferences(self, a: array) -> array: return smooth(a, self.window_size, self.window)
def findPeaks(self, a: array) -> array: return np.asarray(signal.argrelextrema(a, np.greater))[0] #< argrelextrema(_) always (x,)

^利用 scipy.signal 的新关键帧算法，修复了原来盲目对 argrelextrema 用 numpy.subtract 操作的做法

processChunk = lambda it: self.ocrWithLocalMaxima(it, reducer)
diff_array_parts = map(processChunk, chunked(self.chunk_size, frames))
def concatResults(a, b) -> Tuple[array, array]:
    a0, a1 = a
    b0, b1 = b
    ab0 = concatenate(array([a0, b0]))
    ab1 = concatenate(array([a1, b1+len(a0)]))
    return (ab0, ab1)
(diff_array, indices) = reduce(concatResults, diff_array_parts)

^把帧差 array 和检测出的关键帧 index array 拼合起来的 reduce function
b1+len(a0) 正好可以把 b1[0] 映射到 a0.lastIndex+1

24 viewsduangsuse, edited 09:18

duangsuse::Echo

This media is not supported in your browser

VIEW IN TELEGRAM

24 viewsduangsuse, 09:21

duangsuse::Echo

好不容易做成现在这个玩具，我得好好拿来玩几天才可以

70 viewsduangsuse, 09:21

duangsuse::Echo

https://www.youtube.com/watch?v=bH5nSGYGnzU

YouTube

【闇音レンリ】星の在り処【SynthV】

どうも、Kyoと申します！

もう一回SynthVのライブラリーテストをできて嬉しいです！
しかもずっと使いたかった闇音レンリ！！！ついにチャンスが訪れました！

今回のレンリは完全版ではなかったが（呼吸音、エッジ声と鼻濁音記号はまだ加えていなかった、エッジは正式版機能としてエンジン側が実装されます）
SynthVの高い編集能力に助けられて、レンリに新しい生命力を与えたと思う。
レンリのファンたちもうけいれてくれたら嬉しいです！
よろしくお願いいたします！

twitter：@Kyo_Append…

27 viewsduangsuse, 09:21

duangsuse::Echo

新玩具真好玩

25 viewsduangsuse, 12:26

duangsuse::Echo

This media is not supported in your browser

VIEW IN TELEGRAM

25 viewsduangsuse, 12:30

duangsuse::Echo

其实我觉得这个『多crop』功能，还是可以给加上
也不需要什么数据结构，TreeSet 的 binary search 是为了优化空间复杂度做的，我也可以直接弄 Frame.no 预填充啊
gui_crop_select.py 已经把这个 multi crop 的功能给做了，我也可以顺水推舟下去嘛

73 viewsduangsuse, edited 12:30

duangsuse::Echo

mux.srt

2.8 KB

……视频我直接给删了，因为它帧率不正确，而且还没声音

32 viewsduangsuse, 12:40

duangsuse::Echo

1:34

This media is not supported in your browser

VIEW IN TELEGRAM

🤔这个是带字幕的，但 Telegram Desktop 好像不能看字幕

28 viewsduangsuse, 13:02

duangsuse::Echo

30 viewsduangsuse, 13:02

duangsuse::Echo

🤔开启了 --use-sharp 后真的把时轴打得非常好

./extract_subtitles.py --crop-debug -crop '(1106,905)(680,62)' -filter-code '~cvInGrayRange(it, 0x00, 0xaa)' -lang chi_sim --draw-plot --use-sharp --chunk-size 1200 HxN.mkv

./timeline_ops.py merge frames/timeline_HxN.mkv.txt 0.25 |./timeline_ops.py to-lrc 60 srt >mux.srt

78 viewsduangsuse, 14:25

duangsuse::Echo

new.txt 是第一次提取结果手动做了十分钟左右的修改后弄出来的，它的准确度几乎令我惊讶

77 viewsduangsuse, 14:26

duangsuse::Echo

timeline_HxN.mkv.txt

13.8 KB

33 viewsduangsuse, 14:27

duangsuse::Echo

new.txt

1.7 KB