FunClip是什么
FunClip的主要功能
自动化语音识别:利用阿里巴巴通义实验室的FunASR Paraformer系列模型,对视频进行语音识别,将语音转换成文字。
热词定制化:通过集成的SeACo-Paraformer模型,用户可以指定一些实体词、人名等作为热词,以提升特定词汇的识别准确率。
说话人识别:集成CAM++说话人识别模型,允许用户根据自动识别的说话人ID裁剪出特定说话人的视频段落。
视频裁剪:用户可以选择识别结果中的文本片段或指定说话人,通过点击裁剪按钮获取对应视频片段。
Gradio交互界面:通过Gradio实现的交互界面,简化了视频剪辑的操作流程,用户可以在服务端搭建服务并通过浏览器进行剪辑。
多段剪辑支持:FunClip支持用户对视频进行多段剪辑,提供了灵活的编辑能力。
自动生成字幕:剪辑后的视频可以自动生成全视频和目标段落的SRT字幕文件,方便用户添加或编辑字幕。
命令行调用:除了图形界面,FunClip还支持通过命令行进行视频识别和裁剪,提供了更灵活的使用方式。
FunClip的官网入口:
官方GitHub源码地址:GitHub - alibaba-damo-academy/FunClip: A video clipping tool based on FunASR open-source models and Gradio || 一款基于FunASR高准确率开源语音识别模型的智能视频剪辑工具
ModelScope魔搭社区在线Demo:魔搭社区
如何使用FunClip
准确识别,自由复制所需段落,或者设置说话人标识,一键裁剪、添加字幕
Step1: 上传视频或音频文件(或使用下方的用例体验),点击 识别 按钮
Step2: 复制识别结果中所需的文字至右上方,或者右设置说话人标识,设置偏移与字幕配置(可选)
Step3: 点击 裁剪 按钮或 裁剪并添加字幕 按钮获得结果
注:裁剪并添加字幕 功能需要手动安装imageMagick,ImageMagick下载地址 百度网盘 请输入提取码,
下载后,默认路径安装就可以了,就是一直点下一步。
本地一键整合包下载地址:释放双手!阿里达摩开源的AI全自动剪辑神器-FunClip 本地一键整合包 - AI软件 - AI换脸软件、AI数字人、AI绘画、AI语音克隆 - DeepFaceLab软件下载、DeepFaceLab教程;AI直播换脸软件 - DeepFaceLive下载、DeepFaceLive教程 - DeepFaceLab资源站FunClip是什么FunClip是阿里达摩院推出的一款完全开源、本地部署的自动化视频剪辑工具,通过调用阿里巴巴通义实验室的FunASR Paraformer系列模型实现视频的自动化语音 ... 释放双手!阿里达摩开源的AI全自动剪辑神器-FunClip 本地一键整合包 ,AI换脸软件、AI数字人、AI绘画、AI语音克隆 - DeepFaceLab软件下载、DeepFaceLab教程;AI直播换脸软件 - DeepFaceLive下载、DeepFaceLive教程https://deepface.cc/thread-173-1-1.html