您当前的位置:首页 > 指南 > 正文

在其他改进中iOS11为Siri提供了更多的智能和新的声音

导读: 苹果公司周三发表了三篇新文章,详细介绍了用于创建Siri的新合成声音的深度学习技术。这些文章还涵盖了其他机器学习主题,该主题将在本周晚...

苹果公司周三发表了三篇新文章,详细介绍了用于创建Siri的新合成声音的深度学习技术。这些文章还涵盖了其他机器学习主题,该主题将在本周晚些时候在瑞典斯德哥尔摩举行的Interspeech 2017会议上分享。现在可以从Siri团队获得以下新文章:

Siri语音的深度学习-详细说明如何将设备上的深度混合密度网络用于混合单元选择综合

反向文本规范化 -从标签角度出发

改善神经网络声学模型 -如果您了解我的意思,则可以利用跨带宽和跨语言初始化

如果您在掌握技术知识或什至无法理解最新文章中所用语言的高度技术性方面遇到困难,那么您并不孤单。

我毫无疑问深入研究Apple为开发人员提供的复杂文档和其他专业文档,但是我在阅读这些详细的解释器时感到非常愚蠢。

在其他改进中,iOS 11为Siri提供了更多的智能和新的声音。

苹果公司的私人助理不再使用配音演员录制的短语和单词 来构造句子及其回应。取而代之的是,iOS 11(和其他平台)上的Siri采用了以编程方式创建的男女声音。这是一种非常困难的语音合成技术,但它允许一些非常酷的创作可能性。

例如,新的Siri语音利用设备上的机器学习和人工智能功能,可以在实时讲话的同时调整语调,音调,重点和速度,同时考虑到对话的上下文。Apple的文章“ Siri语音深度学习”详细介绍了iOS 11 Siri语音改进背后的各种深度学习技术。

根据开头一段:

Siri是使用语音合成进行交流的私人助理。从iOS 10开始,并在iOS 11中继续提供新功能,我们将Siri声音基于深度学习。产生的声音更自然,更流畅,并使Siri的个性闪耀。

新的文章发表在几周前建立的Apple Machine Learning Journal官方博客上,涵盖了该公司在机器学习,人工智能和相关研究领域的努力。

苹果公司批评该公司无法雇用人工智能和机器学习方面的最聪明的人,因为它不允许他们发表自己的作品,因此在博客上继续前进。

就职后,题为“提高合成影像的现实主义”,发表在七月。深入的文章概述了一种新方法,该方法可在不保留注释信息的情况下使用未标记的真实数据来改善来自模拟器的合成图像的真实性。


声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,谢谢。

上一篇: 4个金字读什么字? 四个金字读什么字

下一篇: 妖狐x仆ss漫画结局是什么 妖狐x仆ss图片



推荐阅读