直击WAIC2019现场:连接,进化与人工智能的新“头牌”

时间:2019-09-12 来源: 国内新闻

“如果结果不够好,那一定不是最后一个。”

写作|裴一多

制造商

“你好,我是七天的伟大圣人孙悟空!”孙悟空的声音响彻上海世博中心的展馆。

别误会我的意思。这不是孙悟空的声音。这个声音类似于孙悟空的声音。它来自标准湾技术的交互式语音合成产品,这是一个智能语音企业 - “你说我学习”。在场地现场,除了孙悟空特有的合成声音,你还可以看到六个动画IP图像,包括台湾女声小梅和中国孩子冉然,滑动到相应的人物并点击它们来说出你想要的单词,角色将用个性化的声音表达单词。的场景来自8月29日在上海世博会馆举行的WAIC 2019世界人工智能大会。

如今,随着人工智能产业的快速发展,语音已经开始作为场景连接器发挥新的作用,并通过支持产品成为人工智能服务的最新供应商,这是一个不争的事实。可以理解,在最接近未来的行业中,“良好的声音是一种好的生意”已成为共识。

在赛马圈之间,赛道上出现了一张新的“顶级牌”。

一,智能语音产业的新“把握”

智能言语的东风来了。

来自语音产业联盟白皮书的一组数据证明,近年来人工智能产业的平均增长率约为43%。 AI工业的市场规模在2018年达到200亿元。预计到2019年底,整个AI产业将达到近300亿元。

在这组上升曲线的背后,智能语音的发展更加有趣。作为当今工业化相对成熟,产业规模较大的人工智能轨道的一部分,2011年整个市场规模仅为6.3亿。到2017年,整个智能语音市场已超过100亿,整个行业的发展几乎指数增长。

市场雄心勃勃,实际具体。虽然今天语音识别领域的人们展示了你的攻击情境,但在今天的东风智能语音中,一种稍微不可识别的趋势是语音合成正在成为一种新的布局点。

“许多从事语音识别的大牛正在转变为语音合成。例如,在一些公司,它之前并没有太多关注合成,但从去年开始,焦点逐渐转向综合。”一位业内人士告诉业内人士。

时代的潮流总是伴随着个人的行为,事实确实如此。在国外,谷歌的Lyerbird推出了一个系统,“只需一分钟的声音样本即可模拟任何人的声音”。去年,微软在其公共云平台上推出了Voice Voice,一种语音合成定制服务产品。在国内,贝克尔科技推出了一个拥有370多种声音库的“声音超市”,为客户提供了一套完整的语音合成解决方案。 Xunfei推出了“Xunfei Remaining Sound”,只需要10段声音收集。可以完成个人语音的复制。

就目前的情况而言,语音合成技术系统比语音识别和语义理解等智能语音交互技术更加独立。外部世界也认为有机会独自存在而不必完全堆叠。

不难看出人工智能行业正在走向深水。

随着人工智能轨道上出现更多个性化产品,对声音的要求不再相同,而是追求个性和丰满度,以便通过更好地连接现场来改善基于产品本身的服务。这也意味着语音定制已经成为一种新的必需品。

二,“反汇编”语音合成卡

事实上,语音合成比聚光灯下的语音识别和语义理解更“低调”。

低调的背后是其比其他两种技术更严格的标准。 “声音是日常交流的重要载体。我希望每个人都能在各种场景中享受良好的声音体验,让声音非常苛刻,而且要求非常高,“标准技术联合创始人兼首席技术官李秀林说。

他是语音合成行业的资深人士。他从头开始见证了过去几年语音合成技术的发展。 “如何使声音更温度,更灵性地与产品结合是一个必须拥有的命题。”

从时间轴的角度来看,回顾性语音合成技术必须回到20世纪90年代,当时科技大学新闻是最重要的参与者。早期语音合成技术的应用非常有限,主要用于汽车导航,银行电话号码,医院电话号码和电台广播系统。可以理解,当时的合成技术还处于起步阶段。

有两种合成技术,第一种称为拼接方法。在语音中记录语音的所有语料库,然后根据需要选择语音单元,并拼接成特定的话语。这种方法需要大量的录音。第二种类型称为参数方法。基于通过参数模型的有限语料库数据训练,合成新片段。参数方法的优点是它需要较少的记录数量,并且几千个句子可以产生合成效果。

“无论客户使用哪种合成技术,他们都离不开专业的语音数据服务,”数据技术团队负责人表示。可以理解,在语音合成的轨道上,语音数据是所有服务的“石头”,并且仅基于此可以演绎语音合成“更高层建筑”。

但这并不是全部。 “尽管所有人都认识到语音合成的重要性,但仍然很少有可以实现的产品。”一位多年来一直关注人工智能轨道的人告诉我们。

确实如此。与技术研究相比,从实验室到商业阶段的飞跃是真正考虑公司是否能够适应这一趋势的最佳标准。

在AIOT和物联网不断发展的时代,人们需要的是一种视觉声音,它将有助于不断推出新设备并创造更具活力和温度的智能硬件。

从另一个角度看,对于语音合成技术,数据,场景,产品,服务,四位一体,相互促进,相互成就,不可或缺。语音连接场景,场景建设服务。

在这条已成为公众主流的秀场上,有人出发了,有人正在观看。

三,标准技术的“重业务”

达到语音合成技术需要多少步骤?不可衡量。

这是Becker Technology给出的答案。发音选择,语料库设计,语音收集,数据处理,语音深度处理.但是,您可以想到的关于声音合成的所有链接在产品着陆中一直是司空见惯的。

据了解,Becker Technology拥有一套专业的业务流程,主要包括语料库设计,语音收集和数据处理。作为定制的数据服务提供商,由于流程的复杂性,每个步骤的质量控制是最终结果的命脉。

“人工智能不仅仅处理简单的注释,而且还能综合后期综合,通过技术手段提高准确性,最终接近真实人的声音状态,”标准语音团队的负责人说。

贝克尔科技有点松了一口气。首先,贝克尔科技拥有专业的标签团队和大量的自有数据,为语音合成提供丰富而持续的“原材料”。据了解,Becker Technology目前拥有超过3000小时的自有合成数据库;二是建立了完整的业务链,包括需求分析,项目设计,严格的授权数据采集,专业的数据处理和处理,严格的校对和语音标注,统一整齐的结构处理,以及TTS评估系统。

这也意味着Becker Technology不仅可以提供语音合成标准化服务,还可以提供多场景个性化语音定制解决方案。

数据障碍由专业技术模型补充,最终成为标准技术 - 声音超市的明星产品。该模型是Becker Technology提供的370多个声音库的集合。它还包括多种声音,类型,星星,动漫IP和高品质扬声器。根据线程和调用的数量,可以自由选择声音。等待模式付款。据了解,截至目前,语音数据超市的规模已超过10万小时。在此基础上,Becker Technology还为有需要的大型企业提供定制服务。

此外,除了定制的标准化技术模型和大容量语音库外,声音超市还提供服务。基于此,它是Becker Technology的TTS评估系统。对于它的角色,您可以将其理解为“检查员” - 即,使用该系统来确保调整和改进客户的后续产品。

不难看出贝克尔科技在这方面的作用不仅是“给渔民”,还有“钓鱼人”。

截至目前,该标准已与百度,阿里,腾讯,微软,京东,迪迪,Byte Beat,网易,360,三星等国内外企业客户建立合作,300多个服务项目,涵盖汽车,教育,客户服务,零售,阅读,智能硬件等领域。

此外,贝克尔科技还免费向公众开放中文合成语音数据库(万句话),主动承担行业“水电煤”的作用,并通过建设赋予AI行业权力。基础设施,如行业数据库,加速产品。登陆不同的场景。可以理解的是,在当前的AI大火中,贝克汉姆技术公司已经真正将自己定位为构建行业基石的“底层建设者”。

对于它来说,这是一个“沉重”的业务和一个“缓慢”的业务。走得快,你必须稳定。

第四,技术驱动的背后

时代在变。

“贝贝科技认为语音合成正在进入一个新的阶段。”李秀林说,“功能时代已经过去,语音合成功能并不少见。现在最重要的需求是让用户更具选择性。需要满足个人需求。“

毫无疑问,人工智能,互联网和5G的结合将加速万物互联的到来。对于行业而言,各方紧密合作,需要更强大和迭代的基本服务。对企业而言,要找到自己的立场,树立自己的障碍,为产业发展提供基础支撑,建立自身实力的竞争优势。

在当前人工智能的跨越和发展中,进化将是唯一的生存机会。

但是,我们应该更加关注这样一个事实,即新兴产品和改变时代节奏的新趋势背后,宝贝科技等技术领域有许多精干的人才。

从海量数据收集到技术模型构建,从前端产品设计到后端操作和维护服务,每个平滑链接背后都有成千上万的调试和计算。每一个新的经验和新的需求都是相互支持的。从0到1的算法和研究。

如果你不忘记挖井,你最终会得到一份礼物。俗话说,“如果没有最好的结果,那一定要到最后。”它应该是。

http://www.sugys.com/bdsO.html

频道热点
新闻排行
  1. 06:04:05ChinaFitHealth肝硬化和肝纤维化是一回事吗?可以逆转吗?将介绍如何对待这篇文章。{!-PGC_COLUMN

    06:04:05ChinaFitHealth肝硬化和肝纤维化是一回事吗?可以逆转吗?将介绍如何对待这篇文章。{!-PGC_COLUMN...

  2. 落魄时卖保险,40岁复出跑龙套,成吴奇隆至交好友1112PatEntertainment1在娱乐界,演员的职业生涯已成为一种不变的规律。有些人非常幸运,他们会飙升,有些人只有在不幸运的情况下

    落魄时卖保险,40岁复出跑龙套,成吴奇隆至交好友1112PatEntertainment1在娱乐界,演员的职业生涯已成为一种不变的规律。有些人非常幸运,他们会飙升,有些人只有在不幸运的情况下...

  3. 伊朗着名导演RezaMirkarimi接受采访国际在线报道(中央广播电视台记者雷向平,李惠中):近年来,伊朗具有?

    伊朗着名导演RezaMirkarimi接受采访国际在线报道(中央广播电视台记者雷向平,李惠中):近年来,伊朗具有?...

  4.   18:35:10大体育纵横派  据《太阳报》报道,曼联官推近日晒出了球队训练的照片,马奎尔与一众红魔后卫

      18:35:10大体育纵横派  据《太阳报》报道,曼联官推近日晒出了球队训练的照片,马奎尔与一众红魔后卫...

  5. “如果结果不够好,那一定不是最后一个。”写作|裴一多制造商“你好,我是七天的伟大圣人孙悟空!”孙悟空?

    “如果结果不够好,那一定不是最后一个。”写作|裴一多制造商“你好,我是七天的伟大圣人孙悟空!”孙悟空?...

  6.   原创买车网2天前我要分享  近日,买车网从东风悦达起亚官方获悉,旗下紧凑型轿车全新一代起亚K3将推?

      原创买车网2天前我要分享  近日,买车网从东风悦达起亚官方获悉,旗下紧凑型轿车全新一代起亚K3将推?...

  7. ?“21世纪经济报道”摩根士丹利资本国际的第二次扩张为市场增加了1600亿元外资,主要资金积极乐观北京时间8月8日凌晨,摩根士丹利资本国际公布了8月份季度评估的最终决定:作为8月20日季度指数评估的一

    ?“21世纪经济报道”摩根士丹利资本国际的第二次扩张为市场增加了1600亿元外资,主要资金积极乐观北京时间8月8日凌晨,摩根士丹利资本国际公布了8月份季度评估的最终决定:作为8月20日季度指数评估的一...

  8. 文章圖片

    文章圖片...

  9. 昨天成都全搜索新闻网我要分享虫虫创意成都全搜新闻网(记者姚文君但唐文)8月7日报道5G手机效应?交通费价

    昨天成都全搜索新闻网我要分享虫虫创意成都全搜新闻网(记者姚文君但唐文)8月7日报道5G手机效应?交通费价...

  10. 7月23日,荣耀在西安正式发布“超能旗舰”荣耀9X系立柱手机,这是“锐科技”战略指导下的跨越式创新。此次?

    7月23日,荣耀在西安正式发布“超能旗舰”荣耀9X系立柱手机,这是“锐科技”战略指导下的跨越式创新。此次?...

友情链接