本篇文章1343字,读完约3分钟

图片来源:照片网

6月28日,由上海新上海工商联合会主办的第二届长三角民营企业发展大会在上海召开。HKUST讯飞(002230)有限公司(以下简称HKUST讯飞)轮值主席胡宇出席会议并讲话。会见中,胡雨接受了《国家商报》记者的采访。

每经专访科大讯飞轮值总裁胡郁:5G对于影音和图像交互有机遇

人工智能已经不远了,它的相关应用已经不知不觉地渗透到了人们的生活中。例如,在长江三角洲民营企业发展大会上,发言者的发言将被实时转换成文字,并显示在大会主舞台的屏幕上。这是IFlytek制作的会议字幕,IFlytek提供的智能语音转录系统。然而,尽管准确率相当高,也存在一些专业词汇错误。

每经专访科大讯飞轮值总裁胡郁:5G对于影音和图像交互有机遇

对此,HKUST飞轮价值总裁胡宇在接受《国家商报》记者采访时表示,将从方言识别、中英文混合阅读、专业词汇、降噪等方面进行优化,以降低出错率。

降低错误率还有许多困难要克服。智能语音识别是人工智能的重要组成部分。从软件开发人员的角度来看,如何进一步降低语音识别的错误率?

在回答《国家商报》记者的提问时,胡瑜表示,仍然有几个难题需要克服,需要研究人员来解决这些问题。一个是口音问题。很多人的普通话可能不太准确,还有一些方言混杂,发音不清。第二,现场环境是否足够安静。由于场景环境中存在一些噪声,需要一些降噪方法来不断提高智能语音识别系统的性能。第三,中英文之间有一些混合阅读的情况。当汉语和英语混合在一起时,它们现在处理得不太好,尽管它们比以前好得多。最后一个是一些专业词汇。有些词只有在特定的情况下才能知道它们的意思。有很多同音字,也可能有一些同音字。

每经专访科大讯飞轮值总裁胡郁:5G对于影音和图像交互有机遇

胡雨提到技术必须不断优化。例如,他说,与两三年前相比,将语音转换成文本并与大屏幕字幕同步的语音转录系统的准确性有了很大提高。现在,这个屏幕上字幕的准确率超过95%。如果是几年前,可能只有90%左右。

每经专访科大讯飞轮值总裁胡郁:5G对于影音和图像交互有机遇

除了在语音识别领域的智能应用,胡宇还提到,iFlytek已经扩展和覆盖了教育、医疗、政法、智慧城市等多个方面和场景。语音识别只是语音技术中的一个小问题。现在IFlytek不仅在做语音技术,还在做人工智能的认知智能等许多方面。

每经专访科大讯飞轮值总裁胡郁:5G对于影音和图像交互有机遇

人机交互将能够通过语音即时实现5g。在谈到如何在5g框架下构建新一代的人机交互语音技术时,胡宇说,5g时代有很多发展机遇。

胡宇提到5g的响应速度会非常快,响应时间延迟现在已经达到毫秒级。这是一个很好的机会,在未来的声音和图像之间的互动。此外,5g将带来内容的爆炸式增长,如高清视频和游戏,这也将增加人工智能在其中应用的机会。例如,内容处理、内容自动编辑或向内容添加一些语音注释将会有新的发展机会。

每经专访科大讯飞轮值总裁胡郁:5G对于影音和图像交互有机遇

至于物联网的理念,从家庭中的简单应用来看,胡雨表示,未来物联网将在家庭中的许多设备和产品与人之间的互动中发挥新的作用。家用电器、玩具、机器人(300024、诊断单元)可以相互连接,我们也可以与它们建立联系,即人和事物。人与物之间的联系最初是通过一些按钮、控制面板和其他操作来实现的,但在未来可能会越来越多地通过声音来实现,就像人与人之间的交流一样。胡雨认为,这种联系将会越来越普遍和广泛。

每经专访科大讯飞轮值总裁胡郁:5G对于影音和图像交互有机遇

胡宇表示,iFlytek本身被定位为人工智能领域的技术创新公司。这需要一系列的品牌、市场和产品。要进入每个人的生活,需要时间来逐步建立更多的公众对iFlytek的认识。

每经专访科大讯飞轮值总裁胡郁:5G对于影音和图像交互有机遇

封面图片来源:照片网

标题:每经专访科大讯飞轮值总裁胡郁:5G对于影音和图像交互有机遇

地址:http://www.erdsswj.cn/oedsxw/5054.html