Wishlist 0 ¥0.00

用AI工具轻松翻译视频字幕:从费劲到高效的转变

大家好,我是互联技术。今天我想和大家聊聊一个我们可能都遇到过的烦恼——好不容易找到一个外语视频,却发现没有字幕支持。这该怎么办呢?相信很多人和我有一样的经历,尤其是像我这样英语成绩从未及格的人,面对全外语的内容时,简直是头疼不已。

最近几天,OpenAI 开启了一场为期 12 天的发布会。作为一名自媒体从业者,我需要尽快搞清楚里面的内容,然后制作一期视频。可面对全是英语的讲解,我感到无从下手。好在人类的厉害之处在于懂得利用工具解决问题。今天,我就给大家分享一个超级实用的工具,彻底解决了我的翻译难题。

从“机械翻译”到“智能优化”的探索

最初,我尝试使用视频平台自带的字幕工具。这个功能确实能用,但问题在于,除非是作者自己上传的字幕,否则基本都是谷歌机器翻译的结果。翻译出来的内容虽然勉强能看,却完全无法准确传达上下文的意思,词不达意、机械生硬,根本达不到我想要的效果。

于是,我想到另一个办法:把视频下载下来,丢进剪映,用它的翻译功能试试看。相比平台自带工具,剪映的翻译确实好了一些,但对于专业术语的识别依然不准确,而且翻译出来的句子还是不够自然,读起来不够通俗易懂。这让我意识到,常规工具虽然能应急,但离高效创作还差得远。

发现神器:Video Captioner

直到昨天,我偶然发现了一款工具——Video Captioner,简直让我眼前一亮。它利用 LLM(大语言模型)技术,不仅能翻译视频字幕,还能优化内容,让翻译结果更加贴近自然语言。这款工具的开发者竟然还只是个大三学生,真是让人惊叹!

Video Captioner 的技术原理并不复杂。它通过 AI 技术,将视频中的语音转录成文字,再进行智能翻译和优化。我们之前可能只用 LLM 聊天,没想到它还能帮我们搞定字幕翻译。这又是 AI 提升效率的一个绝佳场景。

如何使用 Video Captioner?

接下来,我带大家看看这款工具的具体用法。为了方便大家体验,我会把相关链接放在说明栏里。如果你访问不便,我还把工具上传到了网盘,供大家直接下载使用。

第一步:下载与安装
  1. 打开 Video Captioner 的 GitHub 仓库。
  2. 在页面中找到下载标签,向下滚动,选择适合你系统的版本(我用的是 Windows 64 位)。
  3. 下载完成后,双击安装包,点击“更多信息”并选择“仍要运行”。
  4. 选择安装语言(比如简体中文),点击“确定”。
  5. 指定安装路径(我改成了 D 盘),勾选“创建桌面快捷方式”,然后一路点击“下一步”和“安装”直到完成。

安装完成后,桌面上会出现一个非常小巧的软件图标。双击打开后,界面简洁明了,非常容易上手。

第二步:设置字幕样式

初次使用时,我们可以先调整一下字幕样式:

  1. 点击“字幕样式”,进入设置页面。
  2. 默认字体可能是“微软雅黑”,但它有版权限制。建议切换到免费字体,比如“思源黑体”或“阿里巴巴普惠体”。如果电脑里没有这些字体,可以在网上搜索下载。
  3. 设置主字幕字号(我选了 24),间距保持默认值 2,字幕颜色改成白色,边框大小调到 1.8。
  4. 副字幕(双语对照)字号设为 22,间距调整为 0.2。
  5. 点击“确认”,即可实时预览效果。
第三步:翻译视频

设置好样式后,就可以开始翻译了。以 OpenAI 的发布会视频为例:

  1. 复制视频链接(比如从 OpenAI 的官方频道获取)。
  2. 回到 Video Captioner,将链接粘贴到主界面,点击“播放”按钮。
  3. 软件会自动下载视频(速度取决于你的网络,可能需要科学上网)。
  4. 下载完成后,它会进入“字幕优化与翻译”阶段。这个过程可能需要几分钟到十几分钟,取决于视频长度。期间,你可以去喝杯茶或干点别的,不用傻等。
  5. 翻译完成后,软件会自动合成字幕与视频,并生成三个文件:原视频、翻译后的视频和单独的字幕文件(支持双语时间轴)。

生成的字幕文件可以直接导入剪辑软件,比如剪映或 PR,进行进一步调整。如果对默认样式不满意,你完全可以自定义。

第四步:高级设置(可选)

Video Captioner 支持多种接口和模型:

  • 在线模式:默认提供“B 接口”和“J 接口”,基于 LLM 优化,免费且效果不错。
  • 本地模式:使用 Whisper 模型,需要下载模型文件(从小到大可选,推荐 3.9GB 的版本,效果更好)。
  • API 模式:如果你有 OpenAI 或 Claude 的 API Key,可以填入设置中(比如选择 gpt-4o),翻译精度会更高。

比如,我想用 OpenAI 的 gpt-4o 模型翻译:

  1. 在设置中找到“LLM 配置”,输入 API Key 和标准访问地址。
  2. 选择模型为“gpt-4o”,测试连接成功后切换接口为“API”。
  3. 再次输入视频链接,点击播放,翻译结果会更准确。

灵活应用:满足不同需求

Video Captioner 的强大之处在于它的灵活性。你可以选择完整流程(语音转录 → 优化翻译 → 视频合成),也可以单独使用某一步:

  • 只需字幕文件?点击“语音转录”,下载后优化翻译即可。
  • 有本地视频?拖入文件,配合字幕合成,照样搞定。

总结:学习与创作的得力助手

通过这款工具,我不仅解决了外语视频无字幕的难题,还大大提高了工作效率。无论你是想学外语,还是需要快速消化外文内容,Video Captioner 都能帮你轻松搞定。更别提它出自一个大三学生之手,实在是令人佩服。

本期内容就到这里。如果你觉得有用,请给个赞;想看更多干货,不妨关注我。我们下期再见,拜拜!

用 AI 创作音乐与 MV:Suno 的奇妙旅程

嗨,大家好!今天我们要聊聊 Suno,这是一个利用 AI 人工智能创作音乐的工具。只要打开 Suno 的首页,你就可以开始一场音乐创作的冒险。我们先到右上角点击“Make a song”(作一首歌),然后到左侧点击“Create”(建立),用 Google 或微软邮箱注册一个免费账号。免费用户每天能获得 50 点点数,每首歌消耗 5 点,相当于每天可以创作 10 首曲子。

在 Suno 上作曲非常简单。你只需在左上角输入音乐的主题和曲风,比如我想做一首中文流行歌,描述一个人在脸书上看到前任有了新恋情,心中百味杂陈。输入提示词后,底下有个“Instrumental”(器乐)选项,启用它会让歌曲变成纯音乐演奏,没有人声。按下“Create”按钮,AI 就会开始生成音乐。Suno 一次生成两首歌,每首长度为 2 分钟。生成后,你可以点击播放聆听,先听个片段就好,再试试另一首。

Suno 会根据提示词自动决定歌曲语言。比如,我用 ChatGPT 把提示词改成英文,曲风调整为“乡村蓝调”,然后贴回 Suno,点击“建立”,就能听到不同风格的曲子。在界面右侧有个“Remix”(混音)按钮,点击后可以修改歌词或调整曲风,比如将风格改为“Hard Rock”(硬式摇滚),比较不同版本的差异。我还试了其他曲风,一起听听看吧。

在 Remix 时,Suno 会切换到“Custom Mode”(自定义模式)界面。歌词栏除了原本歌词外,还有用方括号标注的“Meta Tags”(元标签),用来描述歌词结构和风格。常见标签包括“Verse”(主歌),负责故事讲述和气氛塑造,通常有 4 到 8 行;“Chorus”(副歌),最具感染力,旋律重复加深印象;“Pre-Chorus”(前副歌),衔接主歌和副歌,让过渡自然;“Bridge”(桥段),引入新旋律作为转折点;“Break”(间奏),突出乐器独奏;以及“Intro”(前奏)和“Outro”(尾奏),作为歌曲的开场和收尾。

了解这些标签后,你可以按结构填写歌词,或让 ChatGPT 代写。不过,ChatGPT 的初稿可能不完美,需要反复调整,才能打造出既有创意又符合初衷的作品。我把歌词贴到 Notion 或其他记事软件,最后检查一遍:每行歌词后去掉标点,段落间加空白行,帮助 AI 识别结构。还可以添加“[Intro] 前奏”等标签,甚至补充说明音乐表现方式,但 Suno 团队提醒,标签效果有随机性,受曲风、歌词和标签共同影响。此外,还有“圆括号”的“Ad-Libs”(即兴演出),用于和声或随兴声音,常放在歌词末尾。

由于 Suno 单次生成限时两分钟,长歌需分段制作。我先拷贝前半段歌词,在“自定义模式”贴上,指定“Music Style”(音乐风格),若不知风格,可用 Sonoteller 分析 YouTube 歌曲,参考其结果输入曲风、人声或乐器描述。取名后按“建立”,生成前两分钟。后半段从功能菜单选“从这首歌继续”,贴上剩余歌词,默认接续第一段结尾,也可自定义秒数。若仍未完成,可重复此步骤生成/transaction第三段,最后用“取得整首歌”合并完整歌曲,生成分享链接或下载。

接下来,我们为歌曲制作简单 MV。我将部分歌词交给 ChatGPT,生成图片提示词,翻译成英文后用微软 Designer 或免费工具如 Adobe Firefly、Ideogram 等生成图片,Midjourney 也是不错的选择。素材准备好后,打开 CapCut,将音乐和图片拉到时间轴,调整图片时长与歌曲一致。CapCut 内置特效如“落叶”,可调整透明度和速度,但方向不符时,我从网上找素材,叠加后用“变暗”或“叠加”模式去白底,复制覆盖全片。为避免落叶遮挡人物,在 Photopea 去背图片,叠加到时间轴,确保视觉自然。

为增强沉浸感,我用 Runway 的“Motion Brush”给树叶加飘曳效果,生成四秒动画后加入 CapCut,用遮罩隐藏多余部分,复制循环至 MV 结束。想加音乐可视化特效,可用 TuneForm 上传 MP3,选频谱颜色,渲染后下载,导入 CapCut 去绿底,调整位置并静音,避免声音冲突。

最后为 MV 加字幕。CapCut 的语音识别对歌词不准,只能手动输入,每句唱完暂停,调整时长,逐句添加。字幕位置若与频谱重叠,可移到上方,换字体如“文艺繁体”,加样式或进入动画提升吸引力。背景用“炫彩闪光”模拟玻璃幕墙反光,完成后导出影片,链接放说明栏供查看。

今天就聊到这里,下回再见,拜拜!


文章中提到的网站链接:

  1. Suno: https://suno.ai/
  2. ChatGPT: https://chat.openai.com/
  3. Notion: https://www.notion.so/
  4. Sonoteller: https://sonoteller.ai/
  5. YouTube: https://www.youtube.com/
  6. Microsoft Designer: https://designer.microsoft.com/
  7. Adobe Firefly: https://firefly.adobe.com/
  8. Ideogram: https://ideogram.ai/
  9. Stylar: https://stylar.ai/
  10. Leonardo AI: https://leonardo.ai/
  11. Midjourney: https://www.midjourney.com/
  12. CapCut: https://www.capcut.com/
  13. Photopea: https://www.photopea.com/
  14. Runway: https://runwayml.com/
  15. TuneForm: https://tuneform.com/

用Suno和AI工具打造属于你的音乐与MV:从创作到剪辑全攻略

嗨,大家好!今天我们来聊聊Suno,这是一个利用AI人工智能创作音乐的工具。当你打开Suno的首页后,可以先到右上角点击“Make a song”(作一首歌),然后在左侧点击“Create”(建立),接着用自己的Google或微软邮箱注册一个免费账号。免费用户每天可以获得50点数,而创作一首歌需要5点,也就是说每天可以创作10首曲子。

在Suno上作曲非常简单。你只需在左上角输入音乐的主题和曲风。例如,我想做一首中文流行歌,描述一个人在脸书上看到前任有了新恋情,心中百味杂陈。输入好提示词后,下面有一个“Instrumental”(器乐)的选项。如果启用这个功能,歌曲就会变成纯音乐演奏,没有人声。最后按下“Create”按钮,AI就会开始生成音乐。Suno一次会生成两首歌,每首歌长度为2分钟。音乐生成完毕后,你可以点击播放来聆听歌曲。

我们先听一段试试。好,再听听另一首。Suno会根据我们输入的提示词自动决定歌曲的语言。比如,我用ChatGPT把提示词改成英文,曲风改为“乡村蓝调”,然后把翻译好的文字贴回Suno,再点击“建立”。我们来听听这次生成的曲子是什么感觉。

在界面右侧有一个“Remix”(混音)按钮,点击后可以修改原曲中的音乐元素,比如调整歌词或曲风。这次我把音乐风格改成了“Hard Rock”(硬式摇滚),我们来比较一下摇滚版本听起来如何。我还尝试了一些其他曲风的版本,大家一起来听听。

在混音时,Suno会自动切换到“Custom Mode”(自定义模式)界面。在歌词栏中,除了原本的歌词外,还会出现一些用方括号标注的文字,这些被称为“Meta Tags”(描述标签/元标签),主要用来描述歌词结构和乐曲风格。常见的Meta标签包括:

  • Verse(主歌):负责故事讲述和气氛塑造,歌词通常有4到8行。
  • Chorus(副歌):歌曲最具感染力的部分,通常有重复旋律来加深听众印象。
  • Pre-Chorus(前副歌):旋律与主歌不同,用来衔接主歌和副歌,使过渡更自然。
  • Bridge(桥段):歌曲的转折点,通常引入新歌词和旋律,增加变化与层次。
  • Break(间奏):通常无人声,让其他乐器如吉他或萨克斯风成为焦点。
  • Intro(前奏)和Outro(尾奏):作为歌曲的开头和结尾。

了解这些标签后,你可以按照这个结构填写歌词,或者请ChatGPT帮忙创作。当然,ChatGPT写的歌词可能无法一次完全符合需求,可以基于初稿反复调整,打造一首既有创意又符合初衷的作品。我会把完成的歌词先贴到Notion或其他记事软件,然后做最后检查。歌词每行后不要有标点符号,段落间需加空白行,帮助AI识别结构。如果有不含歌词的Meta标签,比如“[Intro] 前奏”,可以补充说明音乐表现方式。不过Suno团队强调,Meta标签效果有随机性,受曲风、歌词和标签共同影响。

除了方括号的Meta标签,Suno还有“圆括号”的“Ad-Libs”(即兴演出)标记,括号内的文字可作为和声支持或随兴声音,通常放在歌词结尾。

由于Suno一次只能生成2分钟音乐,这首歌我们分两次生成。我先复制前半段歌词,回到Suno启用“自定义模式”,粘贴歌词。下面有个“Music Style”栏位,可以指定音乐类型和曲风。如果不清楚音乐类型,可以在YouTube找首喜欢的歌,把链接贴到Sonoteller网站分析风格,再输入到Suno,还能指定人声或乐器。最后给歌曲命名,按“建立”,生成前2分钟。

至于后半段,打开前半段右侧菜单,选择“从这首歌继续”,把剩余歌词粘贴回去,默认接续第一段结尾,也可自定义秒数,再按“Continue”。如果第二段仍未完成,可以重复此步骤,保留未唱部分生成第三段。最后比较不同版本结尾,从菜单选“取得整首歌”,Suno会合并片段成完整歌曲,可分享链接或下载。

接下来,我们花点时间为这首歌做个简单MV。我先复制部分歌词到ChatGPT,让它根据歌词设计生成图片的提示词,再翻译成英文,贴到生成图片的AI工具,如微软Designer,生成图片。其他免费工具如Adobe Firefly、Ideogram、Stylar、Leonardo AI也可以用,付费的Midjourney也是不错选择。

准备好音乐和图片后,打开CapCut剪辑软件,把素材拖到时间轴,将图片时长调整与歌曲一致。CapCut有许多特效,比如“自然”类别中的“落叶”效果,可调整透明度和速度。默认落叶方向是从左上到右下,我想改成右上到左下,但特效无角度参数,于是我在网上找适合的落叶素材,拖到时间轴叠加在图片上。素材有白色背景,可将混合模式改为“变暗”或“叠加”过滤掉。按住Alt或Option键复制素材,覆盖整个MV。

落叶在最上层,有时会遮住人物和桌子,感觉出戏。解决方法是在落叶上叠加去背的人物。我用Photopea网站,导入背景图,用“魔术棒工具”选主体,再用“矩形选取工具”加选室内物体,反转选取后删除背景,输出PNG图。把去背人物拖到CapCut,调整时长与MV一致,播放时叶子就不会跑到室内。

为让图片更生动,我用Runway网站为树叶添加随风飘曳效果。上传图片,用“Motion Brush”涂抹树叶区域,调整“不规则移动”强度,生成4秒动画,下载后加入CapCut。用“遮罩转场”加矩形遮罩,调整大小和羽化,遮住多余部分。因动画时长不足,我复制一份设为逆向播放,平滑过渡,再复制至覆盖整个MV。

想加音乐可视化特效,可用TuneForm网站,上传Suno的MP3,选择频谱颜色,背景色在CapCut移除无影响,输入歌名渲染动画,下载后导入CapCut。用“抠图”面板移除绿色背景,再用遮罩隐藏Logo和标题,放大频谱移到MV底部,调低音量避免冲突。

最后为MV加字幕。CapCut的语音转文字对歌词识别不佳,只能手动输入,逐句调整时长和位置。为避免与频谱重叠,我把字幕移到窗台上方,换成“文艺繁体”字体,加样式和进入动画,增加互动性。再用“炫彩闪光”效果模拟高楼反光,渲染后导出MV,链接放说明栏。

今天就聊到这里,下回见,拜拜!

探索 Akeeba Engage:功能、审核与多语言支持解析

互联技术: Akeeba Engage 的特点是什么?

人工智能: Akeeba Engage 是由 Akeeba Ltd 开发的一款用于 Joomla! 核心内容(文章)的评论扩展,以下是其主要特点:

  1. 免费且专注于 Joomla 核心内容
    Akeeba Engage 是一款免费的评论解决方案,专为 Joomla 的核心文章设计,不支持第三方内容组件,确保高性能和专注性。
  2. 支持丰富的 HTML 编辑
    用户可以使用 Joomla 配置的所见即所得(WYSIWYG)编辑器提交评论,支持完整的 HTML 格式,无需手动输入原始代码,提供直观的用户体验。
  3. 快速且可扩展
    该扩展针对速度进行了优化,手动调整以减少数据库查询的数量和时间,能够轻松支持数十万条评论。
  4. 安全性高
    • 评论提交时会通过 Joomla 内置文本过滤器或广泛使用的 HTML Purifier 库进行清理,确保安全性。
    • 显示时会对评论中的链接进行后处理,防止 SEO 问题。
    • 支持 Joomla 的 CAPTCHA 系统,可防止垃圾评论,还可选集成第三方 Akismet 服务。
  5. 灵活的权限和配置
    • 使用 Joomla 的核心权限系统,允许管理员设置谁可以评论、编辑或管理评论。
    • 支持按类别或文章启用/关闭评论,还可设置评论自动关闭时间。
    • 支持访客和登录用户评论,访客信息可在同一浏览器会话中记住。
  6. 可定制性强
    • 支持标准的 Joomla 模板和 CSS 覆盖,用户可轻松调整外观。
    • 提供 SCSS 源文件,便于深度自定义。
  7. 嵌套评论和分页
    • 支持多级嵌套评论(默认最多 6 级),便于讨论的层次展示。
    • 可自定义每页评论数量,默认使用 Joomla 的分页设置。
  8. 头像和用户体验
    • 集成 Gravatar 服务,显示评论者的头像,提升互动感。
    • 前端和后端界面支持屏幕阅读器和键盘导航,具有良好的可访问性。
  9. 通知和集成
    • 可向评论管理员和文章作者发送电子邮件通知,回复评论时也可通知用户。
    • 与 Joomla 的隐私功能、用户操作日志以及 Akeeba DataCompliance 集成,支持 GDPR 合规性。
  10. Joomla 版本支持
    • Akeeba Engage 3 支持 Joomla 4 和 5,是当前活跃维护的版本。
    • Akeeba Engage 2 支持 Joomla 3(仅安全维护)和 Joomla 4 的迁移。

这些特点使 Akeeba Engage 成为一个功能强大、易用且安全的 Joomla 评论解决方案,特别适合希望为网站文章添加互动功能的站长。


互联技术: 有审核留言的功能吗?

人工智能: 是的,Akeeba Engage 具备审核留言的功能。这一功能通过其灵活的权限管理和配置选项实现,具体如下:

  1. 评论审核选项
    • 在 Akeeba Engage 的设置中,管理员可以启用评论审核功能,要求所有新提交的评论在发布前必须经过手动批准。
    • 这对于防止垃圾评论或不当内容非常有用,尤其是在允许访客评论的情况下。
  2. Joomla 权限系统支持
    • Akeeba Engage 利用 Joomla 的核心权限系统,管理员可以指定哪些用户组(例如管理员或特定角色)有权审核和管理评论。
    • 例如,可以设置只有“超级用户”或“编辑者”才能批准或拒绝评论。
  3. 后台管理界面
    • 在 Joomla 后台,Akeeba Engage 提供了一个评论管理界面,管理员可以查看所有提交的评论,包括未审核的评论。
    • 从这里,管理员可以批准、编辑、删除或标记评论,确保内容符合网站标准。
  4. 通知功能
    • 当有新评论待审核时,系统可以向指定的评论管理员发送电子邮件通知,便于及时处理。
  5. 结合反垃圾措施
    • 除了手动审核,Akeeba Engage 还支持 CAPTCHA 和 Akismet 服务,可以在评论提交时自动过滤垃圾内容,减少审核负担。

通过这些功能,Akeeba Engage 提供了强大的留言审核能力,既能保证评论质量,又能灵活适应不同网站的需求。如果你需要更具体的配置步骤,可以告诉我,我会进一步说明!


互联技术: 支持多语言吗?

人工智能: 是的,Akeeba Engage 支持多语言功能,这得益于它与 Joomla! 平台的深度集成以及自身的国际化设计。以下是其多语言支持的具体特点:

  1. Joomla 原生多语言支持
    • Akeeba Engage 作为一个 Joomla 扩展,充分利用了 Joomla 内置的多语言系统。如果你的 Joomla 网站启用了多语言功能(通过语言包和内容关联),Akeeba Engage 会自动适配当前语言环境。
    • 例如,评论界面的提示文字、按钮和通知会根据网站的前端语言自动切换。
  2. 界面翻译
    • Akeeba Engage 的前端和后端界面都支持翻译。官方提供了英语作为默认语言,同时社区或用户可以通过 Joomla 的语言覆盖功能添加其他语言的翻译。
    • 如果需要特定语言的支持(例如中文),你可以通过创建或安装相应的语言包来实现本地化。
  3. 评论内容的多语言
    • 用户提交的评论内容本身没有语言限制,用户可以用任何语言撰写评论。Akeeba Engage 的所见即所得(WYSIWYG)编辑器支持多语言输入,具体取决于 Joomla 配置的编辑器(如 TinyMCE 或 JCE)。
    • 评论显示时会保留用户输入的原始语言,不强制转换。
  4. 多语言网站的管理
    • 在多语言 Joomla 网站中,Akeeba Engage 可以按文章类别或语言分别管理评论。例如,你可以为不同语言的文章设置不同的评论策略(开启/关闭评论、审核要求等)。
    • 评论会与对应的文章关联,确保多语言内容和评论的一致性。
  5. 语言文件自定义
    • 如果官方未提供你所需的语言包,你可以通过 Joomla 的语言管理功能手动编辑或添加 Akeeba Engage 的语言文件(通常位于 language 文件夹中),以实现完全自定义的多语言支持。

当前状态

截至我的知识更新,Akeeba Engage 的官方文档和发布页面没有明确列出所有预装语言包,但作为一个开源项目,社区可能会贡献额外的翻译。你可以在 Akeeba Ltd 的官方论坛或 GitHub 上查看是否有中文或其他语言的支持,或者自己动手翻译。

如果你需要确认特定语言(如中文)是否已有现成支持,可以告诉我,我可以帮你搜索最新的社区资源或指导你如何添加语言包!


About Us

Since 1996, our company has been focusing on domain name registration, web hosting, server hosting, website construction, e-commerce and other Internet services, and constantly practicing the concept of "providing enterprise-level solutions and providing personalized service support". As a Dell Authorized Solution Provider, we also provide hardware product solutions associated with the company's services.
 

Contact Us

Address: No. 2, Jingwu Road, Zhengzhou City, Henan Province

Phone: 0086-371-63520088 

QQ:76257322

Website: 800188.com

E-mail: This email address is being protected from spambots. You need JavaScript enabled to view it.