搜索

下凡的人工智能,除了语音交互还有更多

发表于 2024-12-21 16:17:25 来源:上海市机械制造工艺研究所有限公司
  导读:人工智能不再是下凡空中楼阁,而是工智更多以接地气的方式逐渐改变我们的用户习惯和生活方式。

  人工智能为我们构建了一个新世界,语音或许这个观点的交互出处已经无从考证,但站在新世界的下凡起点,全球许多国家都对AI充满了憧憬与渴望,工智更多尤其是语音“深度学习”获得突破之后,创业者和投资者的交互情绪愈发高涨。

  然而外界对人工智能的下凡讨论一直未能走出“雷声大,雨点小”的工智更多境地,专家们高谈人工智能的语音顶层设计,巨头们谋划了一个又一个科幻般的交互场景,创业者们也在积极蹭热点抓红利,下凡以及不断冒出的工智更多人工智能威胁论、失业论等等。语音只不过,人工智能不是洪水猛兽,更像是一场渐进性的颠覆。
  人工智能并不遥远

  大众对人工智能的认知,可以追溯到《I, Robot》、《终结者》等科幻电影,亦或是智能音箱、无人超市、自动驾驶等新近兴起的概念,尽管只有小部分科技极客成为尝鲜者,却也预示着人工智能从神坛走向生活的趋势。事实上,人工智能的渗透远非如此。

  早在2011年的时候,和iPhone 4S同时亮相的还有苹果的智能语音助手Siri。一家诞生于2007年的创业公司,被苹果以2亿美金的价格收购,随后苹果与彼时全球最大的语音识别厂商Nuance合作,具备语音识别功能的Siri 横空出世。不过在2011年还鲜有媒体提及人工智能的概念,Siri也被传统的定义为虚拟个人助理。

  但在Siri的竞争者或者效仿者身上,“个人助理”的角色发生了些许转变,典型的就是微软小冰,在发布之初便被冠以“人工智能伴侣虚拟机器人”的名号。如今流行的亚马逊Alexa、GoogleAssistant、微软Cortana,乃至阿里的AliGenie、百度的DuerOS等早已被彻底打上了人工智能的印记,并藏身于手机、手表等智能终端。与此同时,苹果也邀请巨石抖森为Siri拍摄场景广告,并在全球范围内投放,无非是为了改变用户对Siri的既有印象,在这场以“人工智能”为旗帜的竞争中增加几分成功突围的胜算。

  无独有偶,人工智能也在逐渐改变互联网已有的产品形态,比如浏览器这一最“古老”的互联网产品。或许曾经让微软忌惮的网景浏览器已经不为人所知,可浏览器的产品定位在20多年来并未做出本质上的改变。

  人工智能的应用似乎是浏览器的又一转折点,从国内主流的手机浏览器来看,QQ浏览器、UC等开始尝试内容整合,效仿今日头条进行内容的算法推荐,比如针对不同用户的内容需求和喜好,推送个性化的资讯内容;搜狗手机浏览器直接上线了“智能翻译”的服务,涵盖语音对话翻译、AR实时翻译、拍照翻译、文本翻译等,满足用户在不同场景下的“翻译”需求。不难发现,从基础的语义分析、深度学习到语音识别、图片识别、AR等人工智能技术的应用,已然成为浏览器发展的新方向

  除此之外,人工智能还有很多感知并不那么明显的应用。比如搜索引擎的智能化,早期的搜索无非是更加准确的“所搜即所得”,如今的搜索引擎开始涉及更多用户行为的跟踪和学习,在搜索结果上有更多的联想,同时也进一步丰富了商业变现的方式;再比如智能手机厂商纷纷主推的拍照功能,面部识别、动作识别、算法美颜等人工智能技术已经十分成熟,美图、OPPO等手机厂商无不在营销策略上加入人工智能相关的话术。

  一个不为大多数人所关注的是,人工智能在反垃圾技术上的应用。从电子邮件到BBS到博客,再到微博、微信等移动社交工具,互联网的发展史也是网络社交的编年史。只是早期邮箱、论坛的反垃圾还停留在关键词过滤阶段,后来出现了贝叶斯过滤、肤色识别等算法来应对“图片类垃圾”,但在短视频、直播等新的内容载体上,人工智能的图像识别、语音识别、神经网络学习等早已广泛应用。

  正如来自谷歌的吴军博士所说“人工智能的商业化就是看它是否已经深入到‘黄赌毒’这种人类最基本的诉求中”。一语成谶,被神话或者妖魔化的人工智能也正在寻求商业上的变革,而机会已经悄然来临。

  可怕的是场景重塑

  人工智能的发展始终有两条路线,一个是技术上的,包括理论、顶层设计、算法研究等;另一条是商业化上的,也可以说是应用上的。值得注意的是,在前两次人工智能浪潮中,技术始终凌驾于商业之上,而在这次人工智能的爆发中,商业化开始与时俱进。

  把人工智能当做一个新事物,然后畅想其商业化前景,或者描绘出一个崭新的世界,不免有些雾里看花的感觉。可如果将人工智能视为一场渐进性的颠覆,似乎更够感知到人工智能对于商业场景乃至商业结构的冲击,这里有三个例子。

  首先是语音交互。国内外的科技巨头们几乎全部涉足于此,背后的野心绝非是更智能的语音助手。

  以智能音箱为例,在电视、手表、路由器等一大波家用设备的竞争中,智能音箱的上位和亚马逊Echo不无关系。一方面,Echo近千万台的销量对开发者产生了不小的诱惑,两万多种互动技能丰富了智能音箱的可玩性;另一方面,Echo证实了语音成为下一代交互入口之一的可行性,并打通了叫车、叫外卖、阅读新闻、网购下单等服务。

  从大的方向来看,智能音箱打造了IoT的新入口,几乎所有的玩家都在讲述与IoT相关的故事。不过更现实的是,家庭主妇们通过智能音箱就能下单买菜,找寻美甲、家政等生活服务,从需求到服务的路径被极大地缩短,这大概才是巨头们投身语音交互的现实驱动力量,尤其是天猫、亚马逊、京东等电商平台们。

  其次是工具类产品的变现。在互联网时代,工具类产品的变现一直是一件头疼的事,人工智能似乎带来了更多的盈利可能。

  作为最早的互联网工具类产品之一,浏览器的商业化并不顺利,至今仍在延续广告的变现模式,更有大批的产品在移动互联网的浪潮中惨遭淘汰。尽管人工智能对于浏览器的盈利还未出现成功的先例,UC、QQ浏览器等对内容的整合也多半处于信息流广告的目的,但搜狗手机浏览器在智能翻译上的尝试预示着另一种出路。

  以往的浏览器产品扮演的是连接人与入口的角色,且很多产品是“用完即走”,缺乏账号体系和用户留存。就搜狗手机浏览器的智能翻译来看,已经改变了原先的使用场景,比如说以往阅读外文资料时,需要关掉浏览器,将内容复制到第三方翻译APP才能完成。集成化的智能翻译同样缩短了从需求到服务的路径,而且这是一个用户习惯养成的过程,从文字翻译到图片翻译再到AR场景,用户使用搜狗手机浏览器就可以在国外实现对话、点餐、新闻阅读等服务,同时也在不断挤压翻译APP的市场份额。

  换而言之,在人工智能的应用下,包括浏览器等工具类产品已经开始朝着两个方向延伸,即聚合性和人性化。举个简单的例子,用户在浏览器上通过智能翻译浏览酒店信息,平台可以推送相关的优惠信息,由“连接”服务转为“连通”服务,这些都将是未来的方向。

  最后是对终端的重新定义。不管是语音助手还是浏览器之类的工具,人工智能出现后都发生了场景上的改变,并最终将改变对终端的认知。

  苹果或许不是最早意识到这一点的终端厂商,却是最早将其付诸于现实的公司之一。在今年六月份的WWDC上,除了新的智能硬件设备,苹果还带来了两个工具:MLKit和ARKit,前者瞄准了机器学习,后者筹谋了AR。然而,智能终端承担着云到端的载体,包括前面所说的智能音箱,无非是借助这些终端搜集用户数据,传输到云端进行分析处理后再回传用户,终端不过是管道。

  苹果的iOS生态上聚集了超过1600万的开发者,并且为这些开发者提供了700亿美金的分成,但苹果却开始有意识的改变此前“封闭”、“傲慢”的态度,MLKit和ARKit都是针对即时应用场景的工具,言外之意,苹果开始鼓励开发者开发本地化的人工智能或AR应用。原因不难理解,人工智能体系下的核心是AI,然后是平台,最后才是终端,而用户对这一体系的理解却是终端、平台、AI的逆向过程。

  亚马逊Alexa的崛起足以让苹果恐惧,开发者是逐利的,苹果想要在AI时代保持优势,势必要留住开发者并为之创造更加良性的开发环境。终端是载体和管道,同时也是平台、开发者与用户沟通的媒介。

  结语

  人工智能不再是空中楼阁,而是以接地气的方式逐渐改变我们的用户习惯和生活方式,同时这也是一场不见硝烟的商业竞争,要么接受AI对场景的重新塑造,要么逐渐驶离商业的中心,这是摆在每一家人工智能公司面前的选择。

随机为您推荐
友情链接
版权声明:本站资源均来自互联网,如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

Copyright © 2016 Powered by 下凡的人工智能,除了语音交互还有更多,上海市机械制造工艺研究所有限公司   sitemap

回顶部