duangsuse::Echo

[Video Path] SomethingNew.mp4
[Crop] [[313, 951], [1343, 45]]
[Threshold] None
[Subtitle Language] chi_sim
[Frame Directory] frames
[Filter Window Size] 13
Extracting key frames...
[Video Props] (2837, 29, 1920, 1080)
100% |#############################################################################|
smooth [...x386], 13 hanning
q120 How can something be so nice?      面      本
177 How can sgomething be snicey

3
192 Yet so shocking, yet so mice，|

3
220 Yet so shocking, yet so mice，|
241 Yet so shocking, yet so iiice，|
261 [ee二和:和-TAR      om
269 [ee二和iT:和-TAR      5owm
284 [ee二和[让:和-IT      om
299 [wei二和:和 -TAN      Dowm
306 [ee二和:和-IT      5owm
320 How can something bel sg new?
338 YetSoknown but yet,SsSomnew?
361 YetSoknown but yetSomnew?

32 viewsduangsuse, 08:54

duangsuse::Echo

./extract_subtitles.py -crop '(313,951)(1343,45)' --crop-debug SomethingNew.mp4 [Video Path] SomethingNew.mp4 [Crop] [[313, 951], [1343, 45]] [Threshold] None [Subtitle Language] chi_sim [Frame Directory] frames [Filter Window Size] 13 Extracting…

This media is not supported in your browser

VIEW IN TELEGRAM

32 viewsduangsuse, 09:05

duangsuse::Echo

🤔 Sticker

说实在话，其实原作者的算法也没有什么问题，不仅在于……关键还是在于没有 windowing，数据一下子都处理完，不能按照固定的大小一部分一部分处理

32 viewsduangsuse, 09:06

duangsuse::Echo

不知道可不可以解决问题

30 viewsduangsuse, 09:12

duangsuse::Echo

#Python #code 真可怜，无用的代码被丢掉了…… 看来纪念下吧

printedCall_fmt = lambda op, args: f"{getFuncName(op)} {' '.join(map(str, args))}"
printedCall_on_result = lambda r: print("" if r == None else f" -> {r}")
def printedCall(op, fmt = printedCall_fmt, on_result = printedCall_on_result):
  def _invoke(*args, **kwargs):
    print(fmt(op, args), end="")
    res = op(*args, **kwargs)
    on_result(res)
    return res
  return _invoke

def getFuncName(func): return findall("^<.*function (\S+)", repr(func))[0]

33 viewsduangsuse, edited 09:13

duangsuse::Echo

说实在话，其实原作者的算法也没有什么问题，不仅在于……关键还是在于没有 windowing，数据一下子都处理完，不能按照固定的大小一部分一部分处理

🤔 原文件采用先保存在 list 里的方法，我利用 generator，换成数据流模式，然后倒着来…… 是不是就不用把所有 UMat 都保持下来了？

32 viewsduangsuse, 09:16

duangsuse::Echo

有点困难…… 不过应该可以弄个数据窗口，找找资料先

61 viewsduangsuse, edited 09:18

duangsuse::Echo

先来分析一下：原项目的 solveFrameDifferences 会得出 frames 和 frame_diffs，其二等价 map(lambda it: it.value, frames) ，没啥意义

后期 ocrWithLocalMaximal() 主要是按从 frame_diffs 计算出的东西，去 filter frame 并且实际 OCR
所以只要在这个函数里分块处理数据（关键是 Frame.no 属性有顺序），就可以了

31 viewsduangsuse, 09:29

duangsuse::Echo

from window_slider import Slider                                            
s = Slider(3, 0)                                                              
s.fit(np.array(range(0, 100000)))

<window_slider.slider.Slider at 0x7fd25afc8e10>

s.slide()

array([0, 1, 2])
🤔

31 viewsduangsuse, 09:38

About

Blog

Apps

Platform