智能语音抢滩中国:用声音控制一切?
2012-07-28 08:48:11 来源:Chinaz 评论:0 点击:
相比于苹果公司的先声夺人,本土公司在中国智能语音市场可谓“近水楼台先得月”。
苹果公司智能语音工具推出汉语服务之前,以科大讯飞为首的本土公司大刀阔斧抢占市场份额,语音产业链雏形初现。但是他们无一不是“摸着石头过河”,盈利模式尚不清晰。
“我饿了。”
“饿了就赶紧吃东西啊。”
“不知道吃什么好。”
“这个嘛,那我就推荐你吃一两块黑巧克力,它能迅速缓解饥饿感呢。”
“我不爱吃巧克力。”
“此题甚好,我却不会,待我加紧学习了再来答你。”
这是在手机上安装一款名为“讯飞语点”的国产智能语音应用软件后进行的一段“人机对话”。你发出声音指令后,它便可以帮你发短信和微博,定闹钟、查询天气航班、推荐附近好吃的餐馆,甚至可以讲故事、陪你聊天。
苹果公司iPhone4S手机最大或说唯一的亮点,便是Siri这一智能语音工具。它让机器仿佛拥有了思考能力。调戏Siri也一度成为网络上的热门游戏。
但是过去两年Siri并未给中国用户带来直观的使用体验,因为它一直以来只接受英语对话,且不能查询中国大陆的各种服务信息,直到2012年6月苹果公司才宣布将推出汉语服务。这便给了一批中国本土公司绝佳的成长空间。在国内,讯飞语点、虫洞语音助手、小i机器人、小唐龙、快说语音助手、Ciriis语音助理、智能360、恋爱机器人柳柳等一批类Siri产品纷纷面世,欲跑在苹果公司之前分得一杯羹。
2012年7月,讯飞语点因进入苹果在线应用商店(AppleStore)不顺畅而成为业界关注的焦点。看似简单的“进店”问题,打开了中国智能语音市场暗战的“潘多拉魔盒”。
尴尬的盈利模式
讯飞语点的开发者科大讯飞公司日前向外界大倒“苦水”:2012年6月20日,其向苹果公司正式提交了讯飞语点iPhone版申请,15天后,苹果给出了明确的“Rejected”(拒绝)回应,理由是缺少具体应用的演示视频。科大讯飞对媒体表示了他们的担忧:将于2012年秋季推出中文Siri的苹果公司,似乎对类Siri产品的审核设置了障碍。
苹果公司官方没有回应这种猜测,也未回复南方周末记者的采访请求。不过据多位开发者称,在调整了审核规则后,苹果商店的审核期限普遍有所延长,从原来的7天增加到两周左右。2012年7月9日上午,科大讯飞再次提交审核申请,目前正等待苹果的回复。
虽未有定论,但这款本土智能语音产品,在争论中以“中国版Siri”之名迅速为公众所知。“有一次开会碰到刘永好(新希望集团董事长),他看了我的名片后第一句话就说,讯飞口讯(另一款语音产品)是不是你们做的?”科大讯飞副总裁徐景明说。
科大讯飞创立于1999年,9年后在深圳创业板上市,招股书称其占据国内智能语音市场六成以上的份额。2010年它开始布局移动互联网,并发布了智能语音云,简单来说就是一个融合了各种语音技术的开放端口,免费提供给开发者使用。讯飞语点只是科大讯飞使用了第二代开发平台的核心技术开发的一个示范产品。
而语音云平台的推出,使一条语音产业链逐步形成。根据科大讯飞向南方周末记者提供的数据,目前,免费使用其平台的开发者达到四千余家。“虫洞语音助理”的开发者们就是讯飞开放端口的使用者。虫洞的机器语言甚至提供了四川话、粤语、东北话、湖南话、陕西话等方言版本。
“除了相互开放端口,我们还有一些深度合作。”虫洞软件创始人王向一对南方周末记者说,但其拒绝透露具体内容。
开放端口不仅培育了产业链上的草根创业者,一些早已成熟的互联网产品,则把智能语音技术当作一个必备“插件”,融合到已有产品中。
“我们在整合二十余种主流的应用,比如人人网、去哪儿网、大众点评网、知乎、瓦力等,互相开放端口供对方使用。”徐景明说。
融入这条产业链的,并不局限在移动设备。
2012年春节刚过,长虹就在其新品战略上发布了多款语音智能电视产品,这些最高售价近7000元的不同款式的智能电视,可以根据语音命令换台、调整音量,长虹给它起了个山寨名字“Ciri”;2011年11月,三洋推出了全语音系列的微波炉产品,售价同样接近7000元,按下语音键,发出命令“帮我烤个牛排”,微波炉便开始运转。这些厂商均是讯飞的合作伙伴。
虽然看起来很酷,但科大讯飞的盈利模式也有许多尴尬。众彩电厂商和科大讯飞均是“一锤子买卖”,即一次性购买语音软件或芯片,前者推出的所有应用皆为免费,只是智能产品本身的售价有一定幅度的提高。
而对于开放的语音云平台,开发者们也有一种担心。“科大讯飞将来如果收取高额的使用费,对我们这种创业公司来说会是不小的压力。”王向一说。
巨无霸公司来争食
一些本土的巨无霸公司也正加入到智能语音市场上来。“我们和投资人聊,被问得最多的就是,如果百度腾讯做了这款产品,你们怎么办?”王向一说。
百度语音项目技术负责人在接受南方周末记者采访时称,百度刚成立了多媒体部,组建了几十人的语音团队,目前的产品有语音搜索、语音输入法等。腾讯亦然,其QQ输入法和搜索已嵌入语音功能。
不过与科大讯飞不同,这些大型互联网公司没有专业的智能语音技术专利,他们采取的是技术开发者合作的发展模式。在国内,提供核心智能语音技术的研究机构数量并不多,基本分成三类,一类是依托于中国科技大学的科大讯飞,一类是依托于中科院的中科信利等,此外便是北大清华的一些研究机构。百度和腾讯选择的合作者是讯飞的竞争对手——中科信利。合作方式是由中科信利提供核心技术,再由百度、腾讯在此技术上包装成产品。
在科大讯飞2011年报中,“能否吸引和培养高水平的人才队伍”被列为公司今后发展的主要风险,讯飞为此正制定具有竞争力的薪酬体系和股权激励机制。
竞争者并非只有本土企业。
早在1999年讯飞成立时,IBM、微软、摩托罗拉、英特尔等就已经在中国成立了专门的语音研究基地,2004年才开始涉足语音领域的谷歌,在2009年11月发布了中文语音搜索服务。本轮智能语音热潮,成为国外企业再次抢滩中国市场的绝佳时机。
对科大讯飞等技术提供商而言,更大的威胁可能来自那个站在Siri身后的技术提供商——Nuance。Nuance成立于1992年,Siri的出现让其从幕后走向台前。
在全球语音技术市场,Nuance占据了2/3的市场份额,并为三星、诺基亚、摩托罗拉、HTC、福特等公司提供语音技术。2009年2月,其在上海建立了语音技术开发中心。
值得关注的是,Nuance于2011年11月推出针对中国市场的移动开发者项目(NMDP),这给了虫洞等草根开发者更多的选择空间。目前,Nuance已与一些国内企业达成合作,例如四维图新计划于新版地图上就将采用Nuance的语音技术。
不过,拥有技术和人才优势的Nuance,进入中国市场后也面临诸多“不适应症”。2011年其刚推出语音识别搜索软件——声龙搜索(DragonSearch)时,合作伙伴为谷歌、Youtube和Twitter,而这些产品因为众所周知的原因在中国根本无法使用。
Nuance大中华区总经理郑裕庆日前在接受南方周末记者采访时称,为解决用户体验问题,优酷网、淘宝网、新浪爱问、大众点评网等中国公司也已成为其合作伙伴,但南方周末记者的试用结果并不理想。
浪潮和泡沫
众多竞争者的加入,让智能语音应用日益普及。而这实际上仅是一个开始。
科大讯飞2011年的营收是5.6亿元人民币,依此推算,目前中文智能语音市场的盘子在10个亿左右。
“这个盘子并不大。”中科信利语音识别实验室主任颜永红对南方周末记者说,“每隔五到十年,智能语音产业就会迎来一波热潮,但事后都没能有突破性进展。”而由Siri带动的此轮“面向移动终端”的智能语音是又一轮浪潮,盈利能力还有待观察。“整体而言,现在的泡沫有些严重,在核心技术还有待提高的背景下,语音产业短期内大规模提高营收并不现实。”
对以智能语音为主的新创企业,颜永红同样不乐观,“语音技术的进步,需要漫长的时间周期,百度和腾讯有主要的收入来源,资金和技术的投入对他们不是太大的问题,但创业企业承担不起。”
事实上,尽管科大讯飞不断投入大量人力财力开发面向移动终端的产品,但目前这一块的投入尚未给其带来任何盈利,商业模式也还有待清晰。
目前科大讯飞的收入支撑,全部依赖企业和机构客户,2012年7月9日,科大讯飞刚刚和公安部合作成立“智能语音技术公安部重点实验室”,研发面向重点人员声纹库建设所需的各项核心技术。2012年一季度科大讯飞营收为1.3亿元,净利润将近2000万元,分别同比增长51%和36%,财报显示其同时将教育类产品(智能语音教具等)作为发展重点,这也是科大讯飞为寻找新利润增长点“软硬(软件+硬件)兼施”的信号。
对于整个智能语音产业而言,真正面向大众,才能获得革命性的发展,而这面临着技术和习惯的双重挑战。
“最难的还是使用习惯的建立。”王向一说,“调侃一下Siri可以,但大量依靠语音来完成工作,恐怕心里还是不放心,目前的技术也不能完全做到。”
人们纷纷猜测,苹果公司即将在秋天揭开真面目的Siri汉语语音服务,会带来中文智能语音市场的又一次集体兴奋吗?
苹果公司智能语音工具推出汉语服务之前,以科大讯飞为首的本土公司大刀阔斧抢占市场份额,语音产业链雏形初现。但是他们无一不是“摸着石头过河”,盈利模式尚不清晰。
“我饿了。”
“饿了就赶紧吃东西啊。”
“不知道吃什么好。”
“这个嘛,那我就推荐你吃一两块黑巧克力,它能迅速缓解饥饿感呢。”
“我不爱吃巧克力。”
“此题甚好,我却不会,待我加紧学习了再来答你。”
这是在手机上安装一款名为“讯飞语点”的国产智能语音应用软件后进行的一段“人机对话”。你发出声音指令后,它便可以帮你发短信和微博,定闹钟、查询天气航班、推荐附近好吃的餐馆,甚至可以讲故事、陪你聊天。
苹果公司iPhone4S手机最大或说唯一的亮点,便是Siri这一智能语音工具。它让机器仿佛拥有了思考能力。调戏Siri也一度成为网络上的热门游戏。
但是过去两年Siri并未给中国用户带来直观的使用体验,因为它一直以来只接受英语对话,且不能查询中国大陆的各种服务信息,直到2012年6月苹果公司才宣布将推出汉语服务。这便给了一批中国本土公司绝佳的成长空间。在国内,讯飞语点、虫洞语音助手、小i机器人、小唐龙、快说语音助手、Ciriis语音助理、智能360、恋爱机器人柳柳等一批类Siri产品纷纷面世,欲跑在苹果公司之前分得一杯羹。
2012年7月,讯飞语点因进入苹果在线应用商店(AppleStore)不顺畅而成为业界关注的焦点。看似简单的“进店”问题,打开了中国智能语音市场暗战的“潘多拉魔盒”。
尴尬的盈利模式
讯飞语点的开发者科大讯飞公司日前向外界大倒“苦水”:2012年6月20日,其向苹果公司正式提交了讯飞语点iPhone版申请,15天后,苹果给出了明确的“Rejected”(拒绝)回应,理由是缺少具体应用的演示视频。科大讯飞对媒体表示了他们的担忧:将于2012年秋季推出中文Siri的苹果公司,似乎对类Siri产品的审核设置了障碍。
苹果公司官方没有回应这种猜测,也未回复南方周末记者的采访请求。不过据多位开发者称,在调整了审核规则后,苹果商店的审核期限普遍有所延长,从原来的7天增加到两周左右。2012年7月9日上午,科大讯飞再次提交审核申请,目前正等待苹果的回复。
虽未有定论,但这款本土智能语音产品,在争论中以“中国版Siri”之名迅速为公众所知。“有一次开会碰到刘永好(新希望集团董事长),他看了我的名片后第一句话就说,讯飞口讯(另一款语音产品)是不是你们做的?”科大讯飞副总裁徐景明说。
科大讯飞创立于1999年,9年后在深圳创业板上市,招股书称其占据国内智能语音市场六成以上的份额。2010年它开始布局移动互联网,并发布了智能语音云,简单来说就是一个融合了各种语音技术的开放端口,免费提供给开发者使用。讯飞语点只是科大讯飞使用了第二代开发平台的核心技术开发的一个示范产品。
而语音云平台的推出,使一条语音产业链逐步形成。根据科大讯飞向南方周末记者提供的数据,目前,免费使用其平台的开发者达到四千余家。“虫洞语音助理”的开发者们就是讯飞开放端口的使用者。虫洞的机器语言甚至提供了四川话、粤语、东北话、湖南话、陕西话等方言版本。
“除了相互开放端口,我们还有一些深度合作。”虫洞软件创始人王向一对南方周末记者说,但其拒绝透露具体内容。
开放端口不仅培育了产业链上的草根创业者,一些早已成熟的互联网产品,则把智能语音技术当作一个必备“插件”,融合到已有产品中。
“我们在整合二十余种主流的应用,比如人人网、去哪儿网、大众点评网、知乎、瓦力等,互相开放端口供对方使用。”徐景明说。
融入这条产业链的,并不局限在移动设备。
2012年春节刚过,长虹就在其新品战略上发布了多款语音智能电视产品,这些最高售价近7000元的不同款式的智能电视,可以根据语音命令换台、调整音量,长虹给它起了个山寨名字“Ciri”;2011年11月,三洋推出了全语音系列的微波炉产品,售价同样接近7000元,按下语音键,发出命令“帮我烤个牛排”,微波炉便开始运转。这些厂商均是讯飞的合作伙伴。
虽然看起来很酷,但科大讯飞的盈利模式也有许多尴尬。众彩电厂商和科大讯飞均是“一锤子买卖”,即一次性购买语音软件或芯片,前者推出的所有应用皆为免费,只是智能产品本身的售价有一定幅度的提高。
而对于开放的语音云平台,开发者们也有一种担心。“科大讯飞将来如果收取高额的使用费,对我们这种创业公司来说会是不小的压力。”王向一说。
巨无霸公司来争食
一些本土的巨无霸公司也正加入到智能语音市场上来。“我们和投资人聊,被问得最多的就是,如果百度腾讯做了这款产品,你们怎么办?”王向一说。
百度语音项目技术负责人在接受南方周末记者采访时称,百度刚成立了多媒体部,组建了几十人的语音团队,目前的产品有语音搜索、语音输入法等。腾讯亦然,其QQ输入法和搜索已嵌入语音功能。
不过与科大讯飞不同,这些大型互联网公司没有专业的智能语音技术专利,他们采取的是技术开发者合作的发展模式。在国内,提供核心智能语音技术的研究机构数量并不多,基本分成三类,一类是依托于中国科技大学的科大讯飞,一类是依托于中科院的中科信利等,此外便是北大清华的一些研究机构。百度和腾讯选择的合作者是讯飞的竞争对手——中科信利。合作方式是由中科信利提供核心技术,再由百度、腾讯在此技术上包装成产品。
在科大讯飞2011年报中,“能否吸引和培养高水平的人才队伍”被列为公司今后发展的主要风险,讯飞为此正制定具有竞争力的薪酬体系和股权激励机制。
竞争者并非只有本土企业。
早在1999年讯飞成立时,IBM、微软、摩托罗拉、英特尔等就已经在中国成立了专门的语音研究基地,2004年才开始涉足语音领域的谷歌,在2009年11月发布了中文语音搜索服务。本轮智能语音热潮,成为国外企业再次抢滩中国市场的绝佳时机。
对科大讯飞等技术提供商而言,更大的威胁可能来自那个站在Siri身后的技术提供商——Nuance。Nuance成立于1992年,Siri的出现让其从幕后走向台前。
在全球语音技术市场,Nuance占据了2/3的市场份额,并为三星、诺基亚、摩托罗拉、HTC、福特等公司提供语音技术。2009年2月,其在上海建立了语音技术开发中心。
值得关注的是,Nuance于2011年11月推出针对中国市场的移动开发者项目(NMDP),这给了虫洞等草根开发者更多的选择空间。目前,Nuance已与一些国内企业达成合作,例如四维图新计划于新版地图上就将采用Nuance的语音技术。
不过,拥有技术和人才优势的Nuance,进入中国市场后也面临诸多“不适应症”。2011年其刚推出语音识别搜索软件——声龙搜索(DragonSearch)时,合作伙伴为谷歌、Youtube和Twitter,而这些产品因为众所周知的原因在中国根本无法使用。
Nuance大中华区总经理郑裕庆日前在接受南方周末记者采访时称,为解决用户体验问题,优酷网、淘宝网、新浪爱问、大众点评网等中国公司也已成为其合作伙伴,但南方周末记者的试用结果并不理想。
浪潮和泡沫
众多竞争者的加入,让智能语音应用日益普及。而这实际上仅是一个开始。
科大讯飞2011年的营收是5.6亿元人民币,依此推算,目前中文智能语音市场的盘子在10个亿左右。
“这个盘子并不大。”中科信利语音识别实验室主任颜永红对南方周末记者说,“每隔五到十年,智能语音产业就会迎来一波热潮,但事后都没能有突破性进展。”而由Siri带动的此轮“面向移动终端”的智能语音是又一轮浪潮,盈利能力还有待观察。“整体而言,现在的泡沫有些严重,在核心技术还有待提高的背景下,语音产业短期内大规模提高营收并不现实。”
对以智能语音为主的新创企业,颜永红同样不乐观,“语音技术的进步,需要漫长的时间周期,百度和腾讯有主要的收入来源,资金和技术的投入对他们不是太大的问题,但创业企业承担不起。”
事实上,尽管科大讯飞不断投入大量人力财力开发面向移动终端的产品,但目前这一块的投入尚未给其带来任何盈利,商业模式也还有待清晰。
目前科大讯飞的收入支撑,全部依赖企业和机构客户,2012年7月9日,科大讯飞刚刚和公安部合作成立“智能语音技术公安部重点实验室”,研发面向重点人员声纹库建设所需的各项核心技术。2012年一季度科大讯飞营收为1.3亿元,净利润将近2000万元,分别同比增长51%和36%,财报显示其同时将教育类产品(智能语音教具等)作为发展重点,这也是科大讯飞为寻找新利润增长点“软硬(软件+硬件)兼施”的信号。
对于整个智能语音产业而言,真正面向大众,才能获得革命性的发展,而这面临着技术和习惯的双重挑战。
“最难的还是使用习惯的建立。”王向一说,“调侃一下Siri可以,但大量依靠语音来完成工作,恐怕心里还是不放心,目前的技术也不能完全做到。”
人们纷纷猜测,苹果公司即将在秋天揭开真面目的Siri汉语语音服务,会带来中文智能语音市场的又一次集体兴奋吗?
分享到:
收藏