句子大全

句子大全 > 句子大全

雷军公布小爱同学月活设备超3000万 被撩最多的话竟是马冬梅和“我吃火锅你吃火锅底

句子大全 2011-10-06 07:42:56
相关推荐

有意思的是,就在昨天小米公司内部举办的庆祝会上,雷军继宣布小米AI服务——小爱同学月活跃设备超过3000万,半年增速超过5倍,达成小米AI业务新的里程碑后,还晒出了用户和小爱同学聊得最多10句话。

“你会干什么”排名第一,“几点啦”、“声音小一点”、“讲个笑话”、“小猪佩奇”、“打开电视”、“打开微信”、“这首歌叫什么名字”、“打电话给妈妈”、“播放凯叔讲故事”纷纷上榜。

而在撩得最多的10句话中,“马冬梅”位居榜首。随后依次是:“我吃火锅你吃火锅底料”、“雷军有多少钱”、“你会唱一个人饮酒醉吗”、“动物园里有什么”、“怎么样才能追到吴亦凡”、“启动无敌模式”、“不想上班怎么办”、“睡不着怎么办”、“我帅吗”。

“小爱同学”是谁?

小爱同学是小米旗下的人工智能助手,内置在小米手机、小米AI音箱、小米小爱音箱mini等设备中,用户可以通过小爱同学语音操控小米生态链中的多款产品。除此以外,小爱同学还具备播放音乐、查天气、翻译、闲聊等日常应用;手机里的小爱同学还可以打电话、信息搜索、打开App、导航、语音设置日程提醒等专属应用;第三方开发者也可以通过小爱开放平台开发各种应用场景下的语音技能和语音服务;同时,该平台还能让开发者接入智能硬件设备。

截至到今年7月底,小爱同学每月唤醒超过10亿次,累计唤醒超过50亿次。

毫无疑问,小米公司在物联网和人工智能领域交出了一张漂亮的成绩单。

实际上,在小爱同学推出之前,很多科技公司都推出过相似的应用,比如苹果公司在2011年推出了iPhone4s上就加入了Siri语音;微软小冰也早在2014年推出;亚马逊、谷歌等都推出了语音服务。

不过,大多数语音交互的应用场景都集中在手机或者电商上。小爱同学则不同,它依托小米强大的IoT平台,不仅仅只应用于手机、音箱产品,还支持众多智能硬件,可以实现的功能非常多。

目前,小爱同学支持的设备覆盖手机、电视、盒子、音箱、儿童手表、儿童故事机、翻译机、车载后视镜、智能手表等小米和小米生态链数百款产品。通过小爱同学,用户可获取各种内容和服务。同时,小爱同学已能与空气净化器、扫地机器人、电饭煲、台灯、空调等1亿台IoT智能设备联动。

语音交互引来众多参与者

小爱同学之所以能够如此成功,背后离不开人工智能与物联网的迅猛发展。

正是有了人工智能的加持,才让小爱同学听懂你的话并迅速作出反馈的场景得以实现;也正是有了物联网的发展,才让用户能够通过智能音箱控制物联网平台上的智能硬件设备,进行场景联动与响应。

然而,这一切的背后,都离不开人机交互的变革。试想几年前,我们的手机屏幕还单纯的只是一块显示屏,无法实现触摸功能。更早的时期,人类甚至只能选择单一的按钮进行设备操作。

为什么这块屏幕没有反应?

苹果以鼠标与图形用户界面的商业化取得了较大的成功,并以触摸屏智能设备引领了移动互联网时代的人机交互方式。

在人机交互史上,从最初的程序员通过穿孔卡和键盘来使用计算机,到图形用户界面再到VR/AR的体感交互等等,历史上每一次交互模式的革新,都将会给行业带来一次新的洗牌。

据Canalys的分析师报告,全球智能音箱市场在2018年第二季度增长了187%。苹果,谷歌,小米,亚马逊和其他公司的总出货量为1680万台,高于第一季度的900万台。

智能音箱作为语音交互技术呈现的有效载体,早在多年前开始风靡。

在2014年,亚马逊就率先推出Echo智能音箱,拉开了搭载语音交互的智能音箱的战场的帷幕; Google 在16年年底推出Google home,迅速成为美国智能音箱二号霸主,随之在在17年10月推出低价音箱Google home mini和高端音箱Google home max; Apple在17年6月推出了高价HomePod,原计划17年底发售,但最终跳票,在18年2月开始发售。 微软也在2017年5月份开发者大会上,迫不及待地与曼哈顿联合推出 Invoke 智能音箱,而它的「内核」是微软的智能个人助理 Cortana。

在四大巨头之外,传统的家庭音箱领导者Sonos,也在2017年,推出了智能音箱Sonos one,首先搭载Alexa,据说搭载Google Assistant的版本会在18年上市。

与此同时,国内众多互联网厂商、手机厂商、电商以及创新企业都纷纷加入战局,推出自己品牌的智能音箱设备。其中包括腾讯、阿里、百度、联想、苏宁、京东、小米、喜马拉雅、出门问问等。

八大语音交互技术提供商

智能音箱的火爆只是表面现象,背后是人机交互模式的变革。具备解放双手、快速反馈等特点语音交互模式正在成为下一波交互模式的变革风口。那么,目前都有哪些语音交互技术值得关注,它们背后又有哪些故事?

苹果

Siri在语音交互界可谓大名鼎鼎,算是世界上语音识别的执牛耳者。然而,Siri并不是苹果自己研发的技术。

Siri成立于2007年,2010年被苹果以2亿美金收购,2011年苹果将该技术融入到iPhone 4S中并发布了Siri语音助理。Siri Inc.这家公司成立于2007年,原本核心技术是CALO人工智能项目。当然Siri刚开始发布的时候语音识别的体验还很差,众多果粉也是四处吐槽。

因此2013年苹果又收购了语音识别公司Novauris Technologies。Novauris是一种可识别整个短语的语音识别技术,这种技术并非简单识别单个词句,而是试图利用超过2.45亿个短语的识别辅助理解上下文,当然这是很有难度的一件事情。不管怎样,这次收购也让苹果进一步完善了Siri的功能。

但是这还是不够,苹果又在2015年收购了英国语音技术初创公司VocalIQ。VocalIQ开发的人工智能软件,能够帮助计算机与用户进行更为自然的对话。VocalIQ使用机器学习(machine learning)开发虚拟助手,将语音处理和机器学习技术整合到可穿戴设备、家庭联网设备当中的同时,这家公司还特别关注车载应用的开发。因此,Siri 进军市场也就有迹可循。

谷歌

与苹果相比,谷歌的动作稍微缓慢了一些。2011年谷歌才出手收购语音通信公司SayNow和语音合成公司Phonetic Arts。

SayNow可以把语音通信、点对点对话、以及群组通话和Facebook、Twitter、MySpace、Android和 iPhone等等应用等整合在一起;而Phonetic Arts可以把录制的语音对话转化成语音库,然后把这些声音结合到一起,从而生成听上去非常逼真的人声对话。

当然,这才只是开始,实际上语音技术远没那么简单,因此2013年谷歌以超过3000万美元收购了新闻阅读应用开发商Wavii。Wavii擅长“自然语言处理”技术,可以通过扫描互联网发现新闻,并直接给出一句话摘要及链接。

但是谷歌忙活了这么久,似乎还没真正介入语音识别行业,因此谷歌还收购了SR Tech Group 的多项语音识别相关的专利,这些技术和专利谷歌也很快应用到市场,比如YouTube已提供标题自动语音转录支持,Google Glass使用了语音控制技术,Android也整合了语音识别技术等等,Google Now更是拥有了完整的语音识别引擎。

亚马逊

Amazon是一家最有可能把语音识别落地到消费市场的巨头。

Amazon的语音技术起步于2011年收购语音识别公司Yap,Yap成立于2006年,主要提供语音转换文本的服务。

2012年Amazon又收购了语音技术公司Evi,继续加强语音识别在商品搜索方面的应用,不得不提的是,Evi这家公司也曾经应用过Nuance的语音识别技术。

2013年,Amazon继续收购语音技术公司Ivona Software,Ivona是一家波兰公司,主要做文本语音转换,其技术已被应用在Kindle Fire的文本至语音转换功能、语音命令和Explore by Touch应用之中,其最近推出的智能音箱Echo也是利用了这项技术。

微软

Cortana微软在机器学习和人工智能领域方面的尝试。Cortana可以记录用户的行为和使用习惯,利用云计算、搜索引擎和“非结构化数据”分析,读取和学习包括手机中的文本文件、电子邮件、图片、视频等数据,来理解用户的语义和语境,从而实现人机交互。

而微软小冰是微软亚洲研究院2014年发布的人工智能机器人,微软小冰除了智能对话之外,还兼具群提醒、百科、天气、星座、笑话、交通指南、餐饮点评等实用技能。

科大讯飞

科大讯飞是目前国内最有影响力的语音技术公司,成立于1999年底,依靠中科大的语音处理技术以及国家的大力扶持,很快就走上了正轨。

在2008年的时候就已经挂牌上市,目前市值接近500亿,根据2014年语音产业联盟的数据调查显示,科大讯飞占据了超过60%的市场份额,绝对是语音技术的龙头企业。

一提到科大讯飞,可能大家想到的都是语音识别很牛,但其实它最大的收益来源是教育,特别是在2013年左右,收购了很多家语音评测公司,包括启明科技等,对教育市场形成了垄断,经过一系列的收购后,目前所有省份的口语评测用的都是科大讯飞的引擎,由于其占据了考试的制高点,所有的学校及家长都愿意为其买单。这种局面很难打破,所以其霸主的地位也很难撼动。

目前,凭借领先的语音合成、语音识别、语音唤醒、人脸识别、麦克风阵列等10多项核心能力,科大讯飞布局了教育行业、智能车载、智慧城市、医疗和移动互联等行业。

百度

百度语音其实很早就被确立为战略方向,2010年与中科院声学所合作研发语音识别技术,但是市场发展相对缓慢。

因此直到2014年,百度请来了人工智能领域的泰斗级大师吴恩达,正式组建了语音团队,专门研究语音相关技术,由于有百度强大的资金支持,到目前为止收获颇丰,其技术实力已经可以和拥有十多年技术与经验积累的科大讯飞相提并论。

思必驰

在2009年左右,DNN被用于语音识别领域,语音识别率得到大幅提升,识别率突破90%,达到商用标准,这极大的推动了语音识别领域的发展,这几年内又先后成立许多语音识别相关的创业公司。

其中思必驰成立于2007年,创始人大部分来源于剑桥团队,其技术有一定的国外基础,当时公司主要侧重于语音评测,也就是教育,但经过多年的发展,虽然占有了一些市场,但在科大讯飞把持着考试制高点的情况下,也很难得到突破。

于是在2014年的时候,思必驰痛下决心将负责教育行业的部门剥离,以9000万卖给了网龙,自己则把精力收缩专注智能硬件和移动互联网,专注智能终端领域,智能车载、智能家居、智能玩具/机器人、智能穿戴、智能手机等打造自然语言交互产品方案,目前已接入上亿智能终端 。

出门问问

出门问问也是成立于2012年,其CEO曾经在谷歌工作,在拿到红杉资本和真格基金的天使投资之后,从谷歌辞职创办了上海羽扇智信息科技有限公司,并立志打造下一代移动语音搜索产品——“出门问问”。

其拥有自主研发的语音识别、语义分析、垂直搜索、基于视觉的ADAS和机器人SLAM等核心技术。自成立以来,出门问问致力于以人工智能为中心,通过软硬结合产品落地到生活场景,来打造下一代的人机交互方式。

2015年更是拿到了Google的C轮融资,融资额累计已经7500万美元。出门问问主要瞄准可穿戴市场,更是推出了其代表性的软硬结合产品包括智能手表Ticwatch、车载智能后视镜问问魔镜Ticmirror、以及高级驾驶辅助系统问问魔眼Ticeye。

为什么语音交互是未来?

除了上文提到的企业,其中三星、IBM、Facebook、搜狗、阿里、腾讯等都在研究语音识别,分羹语音交互市场。

从众多布局者不难看出,语音交互正在成为又一主流的人机交互方式。而业界之所以作出这种预判,钛媒体平台发布的一篇文章指出,其理由更多是从交互进化的角度来看的,体现在三个方面:

一是语音交互是比文字交互更为自然和普适的一种交互模式。从人的能力习得来看,语音可以说是人类与生俱来的一种能力,而文字则是后天习得的一种能力。所以从学习成本的角度来看,可以说语音交互天然适合人类。并且从当前现实来看,也能发现在全球范围内依旧有许多不会书写文字的人。那么假设语音交互能够普及,在理想状态下,将会出现的场景是:人人都可以用语音命令操控智能设备,实现智能体验,而这将会带动智能设备新一轮的爆发潮。

二是语音交互相对于文字交互模式而言,能够做到更少的感官占用,将人的多项感官(诸如视觉、双手)从文字交互中解放出来,使得我们能够实现一心多用和在特定情况下精力集中,诸如在处于驾驶状态时,我们就可以通过语音助手来查看智能手机上的信息,从而避免视觉查看而导致的注意力不集中。

三是基于智能语音交互不需要对APP、浏览器进行点击操作,而是直接通过语音操作的特质,使其能够凌驾于浏览器、APP等其他应用入口之上,成为一个新的超级入口,而这个入口,将会变革许多产业,诸如信息搜索、分发。

苹果以多点触控将此前实体按键交互基本送进了历史尘埃。在物联网和人工智能迅速发展的今天,语音交互又将革了谁的命?

语音交互被各大科技巨头看作是交互模式革新的突破口,智能音箱和语音助手的布局只是巨头们争抢语音交互风口的一种手段。从物联网整体视角出发,可以说,未来不存在任何一个孤立的、独自运行的场景,单纯图形用户交互模式开始显现“疲态”。而语音交互在现阶段仍存在诸多弊端,例如隐私性不够、识别精度不足、智能化程度较低等等。

因此,各大厂商布局语音交互正是在培养用户习惯,并在技术不断完善的过程中,提升综合实力,寻求用户场景,做新一代交互模式的引领者。

【参考资料】

Range博客园《人机交互30年》

人人都是产品经理人《语音交互功能详析》

电子发烧友《人机交互的发展趋势及进程》

爱范网《实体按键消亡的背后,是一段人机交互的发展史》

钛媒体《巨头花费精力做语音交互,其终极目标还在于智能家居物联网》

雷军公布小爱同学月活设备超3000万 被撩最多的话竟是马冬梅和“我吃火锅你吃火锅底料”!

阅读剩余内容
网友评论
相关内容
拓展阅读
最近更新