得益于macOS上提供的MacWhisper形式的应用程序,转录可能会变得更加容易。Otter和Transcribe等转录服务使您能够将音频文件转换为文本,以便您可以将其添加到项目或采访中以供回读。
它由JordiBruin开发,可免费下载,但也有Pro版本,售价13美元/11英镑,可实现更快的转录。您可以将MP3、MP4、WAV或M4A文件放入应用程序中,通过使用OpenAI,您会看到一个显示整个转录的窗口,如果应用程序拼写错误,您可以编辑其中的部分内容。
Bruin最近推出了版本2,该版本将应用程序的大小从4GB减少到8MB,并允许您直接从Apple的语音备忘录应用程序拖放文件。例如,如果您在iPhone上使用它来录制采访,那么不久之后您就可以轻松地在Mac上获得转录。
我做播客已经很多年了,为了确保一切正确,尝试转录剧集总是很耗时。然而,这对我来说一直很重要,因为它可以帮助有听力障碍的人。
考虑到这一点,我在最近一集的iMoreShow中使用了MacWhisper2.0,看看它能否很好地转录我和凯伦、斯蒂芬在一个小时内谈论的内容。我还花了一些时间与Bruin讨论如何将人工智能用作正义的力量,就像MacWhisper所做的那样。
2月19日播出的这一集时长62分钟,但MacWhisper只用了10分钟就转录完毕。我能够编辑某些部分,用“iMore”替换“IMoar”,而我的名字有一个额外的“r”,很容易修复,然后我可以将其导出为字幕文件或文档。
从大范围来看,这令人印象深刻,与我在2020年手动转录播客和采访的方式相去甚远。我能够向下滚动到42分钟标记,找到我们对俄罗斯方块预告片的印象例如,在本周早些时候首次亮相,这样我就可以直接转到我们正在讨论的另一个主题,而无需清理时间线来漫无目的地找到它。
在接受Bruin采访时,他希望像MacWhisper这样的应用程序能够展示人工智能如何用于公益事业。“我认为大多数人都没有意识到Whisper之类的东西也基于类似的技术,可以让GPT等东西发挥作用,”Bruin解释道。“虽然Whisper和大型语言模型有所不同,但它们都建立在过去几年人工智能进步的基础上。对我来说,Whisper确实表明所有这些进步都可以以我们从未考虑过的多种方式使用。”
然而,可访问性可能是这里的大赢家。例如,人工智能可以让有视觉或听力障碍的人帮助他们欣赏YouTube上的播客和视频。我们询问Bruin是否也希望MacWhisper等其他应用程序能够利用人工智能来满足此类需求。“我希望人工智能能让开发者更容易地想出创新的方法来解决无障碍挑战。视频和音频内容的转录是一个非常明显的改进,但我也很期待看到人工智能如何实现复杂的计算机交互对于运动技能有限的人来说更简单,”Bruin解释道。
例如,人工智能可以达到这样的程度:它可以生成一个人,为任何视频提供手语,或者它可以与盲文浮雕机配合使用,将文本、播客和视频转换为为用户创建触觉点。
“拥有一个接受过人类可以轻松完成的特定动作训练的人工智能,然后将其转化为复杂的(一组)交互,这将对很多人产生巨大的影响,”布鲁因继续说道。“我的主要收获是,随着这些复杂的技术变得越来越容易被更多的开发人员和用户使用,我们可以与最需要的人一起想出更多的解决方案。”
Bruin还有其他利用人工智能的应用程序,例如TextAssistant,它可以让您使用该技术来处理某些提示和请求。从语言翻译和简单的解释,到将代码转换为其他语言等等。
然而,MacWhisper似乎可以以其他应用程序和人工智能服务无法做到的方式为用户带来好处,而Bruin还没有做到这一点。“虽然我的主要关注点是在接下来的几周内添加一些小的生活质量改进和功能。MacWhisper3.0可能会重点关注说话者检测和改进的可定制性更强的导出选项,”Bruin透露。“我想稍后发布一款iOS应用程序,但我必须考虑人们在这种情况下如何使用它。我刚刚向该应用程序添加了一个路线图,用户可以在其中对他们最喜欢的功能进行投票,这样应该可以帮助我缩小接下来要添加的内容的范围!”
虽然MacWhisper相对较新,但它提供了很多机会-不仅是可访问性,而且还为学生创建报告或想要观看带字幕的内容时提供了机会。人工智能有很大的潜力成为每个人的工具,而像Bruin这样的开发者似乎才刚刚开始。