影视黑科技——免费自动同步字幕(唱词)流程
1)硬件准备
1-1)电脑1台,最好是低噪音的主机或笔记本。
1-2a)比较专业的抗环境干扰音频电信号连接方案
耳机一分二转换头1个 监听耳机耳塞或外放音箱1套(给人辅助监听的,质量无所谓)
耳机输出接到麦克风或线路输入的信号线1根(有的电脑只有带高灵敏度供电的麦克风接口,可能需要增加电阻电容元件衰减信号和隔断直流。)
监听和音频线接一分二转换头接耳机输出即可
1-2b)比较傻瓜但可能受环境噪音影响的电声耦合方案
稍好的耳麦或电脑单独麦克风1套
笔记本自带机内扬声器或者外接扬声器1套(能比较好还原语音即可)
把麦克风插头插入电脑麦克风输入 麦克风头子尽量靠近外放扬声器
2)软件准备
2-1)电脑跑WINDOWS系统,一般推荐最新的WIN10 64位
2-2)自己熟悉的音视频编辑软件,最好有采样降噪、频率均衡、动态压缩等音频处理能力
2-3)讯飞输入法最新电脑版
2-4)WPS,MS-OFFICE等文字处理软件
2-5)ARCTIME 免费开源字幕软件
3)操作流程
3-1)剪辑好需要做字幕的语言素材(剪辑到什么程度看需要,可以是成片版,也可以是粗编版,不过一般最好是成片版)
3-2)对语音素材进行 降噪,均衡,动态压缩等处理,通常这是一般节目听众的要求,也是提高语音识别率的要求
3-3)正确设置讯飞语音输入法,例如麦克风音量自动优化,选择语种,长文连续输入还是聊天输入,断句间隙时间,标点等,推荐在线云计算提高识别率,离线也行
3-4)打开一个文字处理软件,设置为文字输入状态
3-5)然后用编辑软件播放要做唱词的语音轨(配乐,音效轨等暂时关闭,前面可以提前一点播放给下面的操作留点时间)
3-6)激活讯飞语音输入和文字处理软件的文字输入 语音就自动转换为文字了 推荐断句用逗号隔开
3-7)转换完毕后,用文字处理软件的全部替换功能,把逗号替换成换行
3-8)再次播放音频,人工校对
3-9)把校对好的文稿粘贴到 ARCTIME的字幕稿编辑区
3-10)用媒体制作软件把语音轨内容输出带视频 ARCTIME能导入的 MP4文件(虽然音频即可,但个人认为带视频的校对起来感觉比较好)
3-11)利用ARCTIME的自动字幕时间轴功能制作字幕文件,如果自动有问题,这个软件的人工操作也非常高效
3-12)ARCTIME输出 SRT ASS等通用字幕文件
3-13)这个字幕文件可以用各种工具转换成所需要的格式,或者利用MEGUI等有加载字幕文件的编码软件输出带唱词的交付格式。
3-14)后续审片如果发现字幕BUG,在3-11到3-13都比较好修改
4)补充
4-1)讯飞公司有语音文件转文字的收费服务,但我前面的方法是合法免费的
4-2)个人认为目前人工智能的处理速度正好和语音播放的速度匹配,所以语言文件直接转文字也不见得会快多少,意义不是很大,我们主要是解放了人工听写字幕的苦逼工作。
4-3)目前的机器识别的水平,如果素材好,识别率确实可以达到90%以上,但人工校对等工作还是需要的。
1-1)电脑1台,最好是低噪音的主机或笔记本。
1-2a)比较专业的抗环境干扰音频电信号连接方案
耳机一分二转换头1个 监听耳机耳塞或外放音箱1套(给人辅助监听的,质量无所谓)
耳机输出接到麦克风或线路输入的信号线1根(有的电脑只有带高灵敏度供电的麦克风接口,可能需要增加电阻电容元件衰减信号和隔断直流。)
监听和音频线接一分二转换头接耳机输出即可
1-2b)比较傻瓜但可能受环境噪音影响的电声耦合方案
稍好的耳麦或电脑单独麦克风1套
笔记本自带机内扬声器或者外接扬声器1套(能比较好还原语音即可)
把麦克风插头插入电脑麦克风输入 麦克风头子尽量靠近外放扬声器
2)软件准备
2-1)电脑跑WINDOWS系统,一般推荐最新的WIN10 64位
2-2)自己熟悉的音视频编辑软件,最好有采样降噪、频率均衡、动态压缩等音频处理能力
2-3)讯飞输入法最新电脑版
2-4)WPS,MS-OFFICE等文字处理软件
2-5)ARCTIME 免费开源字幕软件
3)操作流程
3-1)剪辑好需要做字幕的语言素材(剪辑到什么程度看需要,可以是成片版,也可以是粗编版,不过一般最好是成片版)
3-2)对语音素材进行 降噪,均衡,动态压缩等处理,通常这是一般节目听众的要求,也是提高语音识别率的要求
3-3)正确设置讯飞语音输入法,例如麦克风音量自动优化,选择语种,长文连续输入还是聊天输入,断句间隙时间,标点等,推荐在线云计算提高识别率,离线也行
3-4)打开一个文字处理软件,设置为文字输入状态
3-5)然后用编辑软件播放要做唱词的语音轨(配乐,音效轨等暂时关闭,前面可以提前一点播放给下面的操作留点时间)
3-6)激活讯飞语音输入和文字处理软件的文字输入 语音就自动转换为文字了 推荐断句用逗号隔开
3-7)转换完毕后,用文字处理软件的全部替换功能,把逗号替换成换行
3-8)再次播放音频,人工校对
3-9)把校对好的文稿粘贴到 ARCTIME的字幕稿编辑区
3-10)用媒体制作软件把语音轨内容输出带视频 ARCTIME能导入的 MP4文件(虽然音频即可,但个人认为带视频的校对起来感觉比较好)
3-11)利用ARCTIME的自动字幕时间轴功能制作字幕文件,如果自动有问题,这个软件的人工操作也非常高效
3-12)ARCTIME输出 SRT ASS等通用字幕文件
3-13)这个字幕文件可以用各种工具转换成所需要的格式,或者利用MEGUI等有加载字幕文件的编码软件输出带唱词的交付格式。
3-14)后续审片如果发现字幕BUG,在3-11到3-13都比较好修改
4)补充
4-1)讯飞公司有语音文件转文字的收费服务,但我前面的方法是合法免费的
4-2)个人认为目前人工智能的处理速度正好和语音播放的速度匹配,所以语言文件直接转文字也不见得会快多少,意义不是很大,我们主要是解放了人工听写字幕的苦逼工作。
4-3)目前的机器识别的水平,如果素材好,识别率确实可以达到90%以上,但人工校对等工作还是需要的。
本文为作者 左艺共创 分享,半岛电子官方下载地址
鼓励从业者分享原创内容,半岛电子官方下载地址
不会对原创文章作任何编辑!如作者有特别标注,请按作者说明转载,如无说明,则转载此文章须经得作者同意,并请附上出处(半岛电子官方下载地址
)及本页链接。原文链接 //m.nflsystem.com/stream/79700
左艺共创
点击了解更多
CREATIVE COMMONS FOR COMMUNISM
开源 互助 共享