shaka-player字幕解析本地移植

957天前 · 分享 · 1391次阅读

项目地址 -> https://github.com/xhlove/dash-subtitle-extractor


前言

目前shaka-packager并不支持dash mp4内嵌字幕转回文本字幕

之前从shaka-player翻译了部分代码,实现了dash mp4内嵌vtt的解析,不过不太完善

于是决定直接从shaka-player里面把解析部分单独拿出来

步骤

首先下载shaka-player的源代码,github直接下载zip就可以了

然后将lib文件夹解压,重命名为shaka

通过简单阅读源代码,可以发现代码中大量使用goog.providegoog.require

我们需要知道的是该项目使用了google-closure-library这个库

以及使用google-closure-compiler进行编译,即将整个项目编译为单个js文件

接下来新建一个parsertest.js文件,在这个文件里面,我们通过类似的写法调用解析的方法即可

这部分可以参考mp4_vtt_parser_unit.js

更多官方案例(PS 大多数时候看官方的测试用例可以学到很多东西)

这里简化了下,最终代码如下

goog.module('parser');

require("google-closure-library");
goog.require("shaka.text.Mp4VttParser");
const fs = require("fs");

try {
    const vttInitSegment = new Uint8Array(fs.readFileSync("test/assets/vtt-init.mp4"));
    const vttSegment = new Uint8Array(fs.readFileSync("test/assets/vtt-segment.mp4"));
    console.log("文件加载完成");
    const parser = new shaka.text.Mp4VttParser();
    console.log("Mp4VttParser初始化析完成");
    parser.parseInit(vttInitSegment);
    console.log("vttInitSegment解析完成");
    const time = {periodStart: 0, segmentStart: 0, segmentEnd: 0};
    const result = parser.parseMedia(vttSegment, time);
    console.log("vttSegment解析完成");
    for (let i = 0; i < result.length; i++){
        console.log(result[i]);
    }
} catch (err) {
    console.trace(err);
}

这里读取了本地文件,将shaka-player用的测试文件复制过来即可

这里直接弄好了,路径是test/assets/vtt-init.mp4test/assets/vtt-segment.mp4

现在代码是没办法直接运行的,因为node不认识goog.xxx

所以要使用google-closure-compiler将全部js编译成一个js

第一步执行npm install命令

第二步将shaka/debug/log.js里面的window.console && window.console.log.bind改为true

因为node没有window

第三步在shaka/util/xml_utils.jsclass之前,也就是shaka.util.XmlUtils = class前面加一句

  • var { Node, DOMParser } = require('xmldom');

第四步在node_modules/xmldom/lib/dom-parser.js末尾导出的地方加一句

  • exports.Node = require('./dom').Node;

然后执行下面的命令编译为一个单独的js

有兴趣可以参考closure-library官方文档,看看hello world的整体过程

  • https://google.github.io/closure-library/develop/get-started

命令如下

npx google-closure-compiler --js parsertest.js --js shaka/**/*.js --js=node_modules/xmldom/**/*.js --js=node_modules/google-closure-library/**/*.js --js=!**/goog/asserts/asserts.js --dependency_mode=PRUNE --entry_point=goog:parser --js_output_file=parsertest_compiled.js

具体可以通过npx google-closure-compiler --help查看详细说明

简单解释一下

  • --js 后面接要一起编译的js文件

    • 可以是单个文件
    • 可以是xx/*.js或者xx/**/*.js这样的通配符表示
    • 最前面加一个!表示排除
  • --dependency_mode 表示编译的模式

    • PRUNE 表示根据--entry_point设定的文件,然后只导入需要的依赖,这很重要,不然会把很多用不到的也编译了,然后出现很多找不到window的报错(被坑了很久)
  • --entry_point 入口点,姑且理解为主程序入口吧
  • --js_output_file 最终输出文件

注意命令中的=不是必须的

现在可以执行node parsertest_compiled.js命令测试了

解析正常~

👍 0

none

最后修改于957天前

评论

取消回复
贴吧 狗头 原神 小黄脸
收起

贴吧

狗头

原神

小黄脸

  1. jgsw 918天前

    这个对b站国内版权番剧以及动画疯之类的内嵌字幕有效不?

    1. 未末 892天前

      不太清楚他们具体是怎么样的,请自行测试

目录

avatar

未末

迷失

126

文章数

275

评论数

7

分类