科技企业积极布局,共同推动产业链成熟
语音AI产业链主要分为上游的基础技术层、中游的基础应用层和下游的方案产品集成层。上、中游主要参与者是擅长基础技术研发的科研院所、技术与资金实力比较雄厚的传统巨头厂商(如亚马逊、谷歌、百度等),包括英伟达、英特尔等芯片厂商。
下游主要参与者包括智能语音助手软件服务商和嵌入智能语音系统的硬件服务商等,国内如云知声、思必驰等研发实力较强的创业公司也通过与实力较强的企业合作参与其中。
Google:底层技术积累深厚,持续发力布局全产业链
公司于年正式成立AI部门,目前包括Google搜索、GoogleNow、Gmail等余个团队使用机器学习技术,并往其开源Android手机系统中注入大量机器学习功能(如用卷积神经网络开发Android手机语音识别系统)。目前产品和服务主要依靠AI技术驱动,如使用深度学习技术改善搜索引擎、识别Android手机指令、鉴别其Google+社交网络的图像等。
掀起AI并购狂潮,持续发力语音AI领域。“内生+外延”双轮驱动成为科技龙头企业布局AI的一般战略。谷歌在成立专门的AI研究团队以维持自身在先天基础技术和产品集成优势的同时,也积极并购或参股AI初创公司,以期搭建完整的AI生态链。
公司年9月收购的Speaktoit是专注于语音交互功能和自然语言学习,为有语音识别功能的应用app提供云端应用接口编程。年1月收购的LimesAudio在音频信号处理方面经验丰富,技术可用于减少因物理空间条件不足所导致的音效不佳问题。底层语音AI技术不断积累,用户使用场景进行重点覆盖。在语音AI布局方面,谷歌的布局分成三个方面。第一是做好底层技术积累,研发先进的深度学习算法,增强语音识别能力,对于信息处理和用户服务产生更好反馈;第二是覆盖用户生活使用场景,抓取到更多信息;第三是将技术转化为商业应用,以GoogleHome作为家居系统入口,着力打造智能家居生态产业链。
开源第二代深度学习系统,设计专用集成芯片。年11月,谷歌宣布开源第二代深度学习系统TensorFlow。TensorFlow可模仿人类大脑工作的方式并识别出模式,在数据输入和输出方面都有较好的精度和速度,被广泛应用于语音识别、图像识别等领域。
年5月,谷歌发布专为TensorFlow设计的专用集成芯片,命名为张量处理单元TPU(TensorProcessingUnit),大幅度提升深度学习系统运行效率。年2月15日第一届TensorFlow开发者峰会上,TensorFlow1.0版本正式推出,加强了PythonAPI的稳定性,使得加入新特征变得更加容易,更适合商业化使用。
推出智能音箱GoogleHome,标志谷歌语音AI商业应用落地。年5月召开的GoogleI/O开发者大会上,谷歌推出语音智能助手GoogleAssistant与智能音箱GoogleHome,利用虚拟助理融合智能家居,加速推进智能生态建设。之后能与GoogleHome兼容的家庭智能设备继续增多。
年1月25日,Google宣布与Belkin的Wemo系列智能插头和照明开关和Honeywell智能恒温器展开合作。GoogleHome用户只需打开App,就可以在控制菜单中将这些设备连接到智能音箱上。更进一步的是谷歌在MWC展会上宣布,Android6.0以上版本获取GoogleAssistant无需系统更新,谷歌会通过Play服务为符合运行条件的设备自动添加GoogleAssistant服务。
Wavenet语音合成方法开创全新思路。年9月,谷歌发布由零开始创造整个音频波形输出的语音合成方法Wavenet,通过利用真实的人类声音剪辑和相应语言、语音特征来训练其卷积神经网络,让其能够辨别语音和语音模式,输出音频更接近人声。
Apple:以Siri为入口,拓展智能设备应用
苹果对于自身在人工智能领域的定位是设备智能技术研发商和产品提供商,即将人工智能技术纳入到硬件,利用如Siri语音以及iOS10中的图片自动识别分类机制,拓展语音、图像识别方面的应用。Siri于年和iPhone4S同时推出,客户体验经历了一个逐步攀升的过程。
经过较长的语音技术探索,在年苹果开发者大会上,iOS10搭载的Siri开放新功能API和SDK,支持Siri控制第三方应用,如使用Siri叫滴滴专车、为QQ好友发送消息等。相较谷歌助手仅支持5种语言,亚马逊语音助手Alexa仅支持英语和德语,Siri支持语言的种类高达24种,可以更好地本地化、融入用户生活。今年3月,苹果表示iOS10.3版本中语音助手Siri将支持上海话,这是继粤语和台湾国语之后的另一种中文方言上线。
Amazon:以Alexa+Echo为核心,构建智能生态系统
市场优势明显,智能音箱Echo抢占先机。亚马逊作为全球大规模跨国电商,拥有海量C端市场用户。年后,公司借助AWS在云市场的领先地位为AI产业发展积累基础数据量。年11月,亚马逊智能音箱Echo与个性化语音助手Alexa诞生,并在随后的两年时间内得到消费者的高度认可。尽管Amazon推出Echo时,它只是一个内置几个语音命令的智能扬声器,但随着用户习惯培养以及近两年语音技术的不断精进,已经发展成为一个丰富的智能生态系统。
加强Alexa第三方合作,步入相关智能设备领域。目前搭载Alexa的硬件品类已经超过种。产品品类从电器、手机到机器人、汽车信息娱乐系统等多个领域,品牌涵盖了LG、华为、GE、福特、大众、联想、优必选等。年1月,Amazon与华为达成合作,在面向美国发售的Mate9上搭载语音助手Alexa,同时与摩托罗拉合作开发MotoMods。MotoMods是与MotoZ手机配合使用的可拆卸模块,可为手机增加音箱、投影仪等功能。年2月,高通宣布旗下公司将帮助高通蓝牙音频系统芯片SoC实现内置Alexa唤醒支持,Amazon顺利进入智能耳机领域。
Microsoft:“小冰”、“小娜”与合作方切入多个领域
年5月,微软首次发布人工智能伴侣虚拟机器人“微软小冰”,经过两年的技
术改进与调试,第四代微软小冰于年8月5日发布。
年12月9日,微软(亚洲)互联网工程院宣布与腾讯达成合作,小冰进入腾讯QQ,让手机QQ聊天功能“厘米秀”拥有智能沟通的能力,与QQ平台上获得首批AI体验资格的用户进行智能互动。3月14日,合作又进一步深入,小冰可被用户邀请至QQ群聊。小冰拥有实时情感决策对话引擎,可以与群用户进行实时对话,支持语音和图像多感官交流。除聊天功能外,QQ群聊小冰还开放了测天气、猜成语、占星术、对诗等群游戏和群管理技能。
百度:整合打造AIG,度秘应用空间广阔
百度作为BAT中最早进军人工智能的互联网公司,已将AI作为未来最重要的核心战略,先后成立深度学习研究院(InstituteofDeepLearning,IDL)、硅谷人工智能实验室、百度北美研究中心、AI技术平台体系(AIG)等。
年,百度已经开始进行智能语音技术研发,并于同年10月推出语音搜索服务。年末,在百度任职的吴恩达团队发明了“DeepSpeech”语音识别系统,可以在嘈杂环境下实现将近81%的辨识准确率。该系统采用深度学习算法取代了原有模型,在递归神经网络或者模拟神经元阵列中进行训练,让语音识别系统更加简单。年11月,百度推出DeepSpeech2.0深度语言识别技术,用于提高在嘈杂环境下语音识别的准确率。年,百度公布深层卷积神经网络技术DeepCNN算法模型,此模型有望成为DeepSpeech3.0核心组成部分,并率先应用到百度语音搜索中。
科大讯飞:全面布局智能语音产业链
科大讯飞作为国内智能语音产业领导者,实行全产业链发展战略,从上游的语音硬件芯片、麦克风阵列,到中游基础应用层的语音合成、语音识别和语音拓展等技术,再到下游的服务方案和产品均有完整布局。
科大讯飞麦克风阵列主要有二麦、四麦、六麦三类,主要应用场景有机器人、智能家居、智能硬件等,功能聚焦于智能硬件远场拾音的实现。
音识别:针对人与人之间自由交谈、会议演讲等场景,语音实时转写通用正确率很高,能够在实际应用场景中达到实用门槛的中文语音转写。年9月,科大讯飞参加由Google承办的第四届CHiMEChallenge国际多通道语音分离和识别大赛获取全部三项赛事第一名,说明其语音识别以及麦克风阵列处理技术处于国际顶尖水平。
Nuance:语音识别传统巨头,车载与医疗语音前景看好
Nuance是专注语音识别底层技术巨头之一。年,Nuance从底层语音技术输出商转型为企业解决方案服务商,成立四大业务部门,包括医疗业务部、企业业务部、移动设备业务部和图像业务部。凭借多年在银行、医疗、汽车等行业的服务经验,Nuance开始布局语音AI领域,试图率先建立行业壁垒。
推出物联网开发平台NuanceMix,提供智能物联网家居体验。年末,Nuance推出专门针对移动和消费电子产品的开发平台NuanceMix。NuanceMix可以帮助设备制造商和开发人员快速创建自定义语音和自然语言处理接口,加速包括智能家居、游戏、机器人等行业在内的发展。同时,NuanceMix可以作为中间件对智能手机和物联网产品实施控制,并直接与设备本身交互。年1月,在国际消费电子展上,Nuance通过融合NuanceMix平台的GreenwaveSystemsAXONPlatform、家居安全系统集成、ROOBOJellyOS等实现了对话型智能家居系统。现场有将物联网的连接范围延伸到互联汽车中的演示。
腾讯:借腾讯云布局语音AI,专注ASR和NLP
年8月,腾讯设立TICS(智能计算和搜索)实验室,专注搜索、自然语言处理、数据挖掘和人工智能等方面。年11月,成立WHAT实验室,即
转载请注明:http://www.0431gb208.com/sjszyzl/5544.html