专访蓦然认知:AI是实现目的的工具 服务和产品才是未来

  来源:腾讯网韩依民2018-01-31
打印本文
核心提示:深蓝,就是人工智能。 整整20年前IBM公司创造的超级计算机深蓝第一次战胜了国际象棋世界冠军卡斯帕罗夫,而今天我们用它的名字来命名这个全新的人工智能报道品牌。

导读

深蓝,就是人工智能。

整整20年前IBM公司创造的超级计算机深蓝第一次战胜了国际象棋世界冠军卡斯帕罗夫,而今天我们用它的名字来命名这个全新的人工智能报道品牌。

从大部分人看不懂的理论到每一个人都会使用的产品,技术到应用的转化,通常与工业界的探索息息相关。在人工智能热潮大背景下,智能驾驶、NLP/人机交互、图像识别、语音识别、大数据、智能硬件等不同分支都涌现了大量先行者。

无论是大公司还是初创企业,在追逐自己商业梦想的同时,它们的努力,也将影响人工智能落地日常生活的具体形态。它们是将人工智能与普通人连接起来的桥梁,是窥探人工智能发展的一个窗口。

为此,深蓝将对人工智能不同方向内最具代表性的公司进行报道,了解技术,剖析商业,一同看清潮水的方向。

语言是人类沟通的重要工具,是人类传达信息的基本载体。NLP(自然语言处理)旨在帮助机器理解人类的语言,通过理解语言来理解人类的想法和意图,是人工智能中最具魅力和挑战的问题之一。NLP的进步,会直接影响人类与机器沟通的效果。

因此,深蓝的第一个系列报道将以NLP为主题,我们选取了国内NLP领域最具代表性的企业,围绕他们的技术路径、商业模式,进行深度解析。

基本信息:

成立时间:2016年5月

产品名称:Mor小蓦机器人

团队情况:创始人戴帅湘,原百度大搜主任架构师

融资情况:

2016.12.31,A轮,1000万美元,经纬中国、源码资本、襄禾资本

2016.06.30,天使轮,200万美元,襄禾资本、经纬中国

在电视上订一杯咖啡,这是蓦然认知的员工最爱给访客演示的产品之一。

看上去,这与过去两年O2O热潮中涌现出的那批公司没什么两样,但实际上,蓦然认知是一家以NLP(自然语言处理)为主攻方向的人工智能初创企业,它的创始人来自百度。

物联网及人工智能技术进步等多重因素,让越来越多人将语音交互视为互联网的下一代交互方式,想想iPhone带来的触摸交互开创了一个怎样的时代,就不难理解下一代交互方式的巨大意义。但现实情况是,当下的语音交互距离理想状态仍有很大差距。

可观的市场前景与巨大的现实落差往往意味着难得的淘金机会,这吸引了大量的玩家投身其中,戴帅湘及其创办的蓦然认知便是其中一个。

身为蓦然认知的创始人,戴帅湘在百度搜索技术部门拥有超过九年的从业经历。去年5月,他选择离职创业,蓦然认知是他从大公司离开后,为实现语音交互真正落地而开拓的一片新实验场。

在百度的九年里,戴帅湘的主要工作是分析用户在搜索框中输入的query究竟为何意,理解它们是给出准确搜索结果的前提。

在蓦然认知的一年半时间里,戴帅湘的主要工作是让用户与机器之间的沟通从单次搜索进化到多轮对话,做到这一点是实现语音交互的前提。

NLP仍是戴帅湘及其团队主攻的技术方向,但要达到理想效果,意味着仍有多个技术难点需要解决。

人工智能热潮下,技术已经成为创业者、大公司甚至普通人津津乐道的话题,而技术实力也决定着一家人工智能初创公司在投资者眼中的价值。因此,技术显然是蓦然认知得以成立、运转、发展的支点,但却并非它的终点,甚至在戴帅湘勾勒的商业版图中,技术也不是或者说不是唯一核心。

在热衷谈论技术的新时尚下,技术出身的戴帅湘有点反其道而行之,他更乐意以技术为切入点,讲述蓦然认知规划中更大的商业故事。这是当下人工智能创业热潮中,一个颇为另类的样本。

从单轮到多轮

了解蓦然认知的技术路径,是了解它其他故事的前提。

回到文章开头的那个场景:在电视上订一杯咖啡。这一过程可以更详细的描述为:通过语音交互,进入订咖啡的场景,完成购买咖啡的交易。整个过程基于云端解决方案,无需额外安装服务应用。

例如,你可以直接对着电视说“我要一杯美式咖啡和两杯星冰乐”,也可以进行多轮对话,“星巴克最近有什么新品(出现筛选结果),我要第一个(冰拿铁),确认支付”,随即就通过全程语音完成了订咖啡的服务闭环。

上述交易包含如下环节:语音识别、语义理解、多轮对话、调取服务、完成支付。其中,语义理解和多轮对话是蓦然认知的技术核心。在戴帅湘眼中,多轮对话的实现效果是这家公司在技术上的杀手锏。

对机器说一句话与对机器说多句话,在普通用户的感知中差别并不大,但实际上,这中间有很大区别。

说一句话的情形下,机器只需理解该句话的意思,然后输出一个结果反馈回去即可。但在说多句话的情况下,机器需要记忆多句话内容,并结合上下文语境,才能理解用户表达的真正意思,进而给出正确反馈。

“你说一句话,它就是一个动作返回;你说多句话,它是一个动作序列。一个动作序列就可以完成一个任务了,所以这里面核心的,是一个连续对话的过程。”

单轮对话的典型场景是搜索,用户输入得到结果,交互结束。而多轮对话的典型场景目前仍存在于电影中,电影《Her》里如同真人陪伴般的语音助手是所有投身语音交互行业人员的终极梦想,目前没有任何公司或团队真正实现上述效果,大家在朝着同样的目标努力,尽管选择的方式可能并不相同。

戴帅湘怀揣同样的理想:“我在百度做那么多年,我一切的目标就是让机器能非常非常流畅的理解人的语言,特别是能做到上下文的连续理解,现在你们可能叫多轮对话,在我们看来就是一个上下文的连续理解。”

百度的多年历练让戴帅湘积累了实现上下文连续理解的技术能力,这一能力是构建蓦然认知技术的基础。

知识图谱、对话模型和学习系统,是蓦然认知发展多轮对话的技术路径。戴帅湘告诉深网,蓦然认知在去年已经把整个技术框架做出来。

而NLP、支持服务、对话、学习则是蓦然认知整体架构的四个核心。要真正理解蓦然认知在多轮对话上的实现效果,需要将其放在蓦然认知的整体商业逻辑中。

技术终将平庸

“通过技术挣钱的东西是不长久的”,在蓦然认知的办公室里,戴帅湘对深网说道,“长远来说技术会变得平庸化,二是技术会变得免费起来,所以你最终还是要有一个完整的产品和平台,平台要有盈利模式。”

这一理解源于戴帅湘过往的从业经历:“我在百度也是做技术的,我要把这些技术让搜索产品、广告产品、贴吧、知道用,你必须站在它的角度着想,给它带来流量、收入,带来流量,你才能给搜索用,带来搜索,才能给广告产品用,这是很现实的。”

对技术的理念很大程度上决定了蓦然认知业务运转的逻辑,蓦然认知不直接向客户贩卖技术,而是出售一套产品和解决方案,这套产品和解决方案不仅包括了其自研的多轮对话技术,还包括基于技术所延展出的硬件、语音识别解决方案,以及更重要的,技术所对接的服务。

这一链条中,语义理解、多轮对话是蓦然认知的技术核心,而硬件、语音识别以及服务,都通过第三方合作进行。

戴帅湘的办公室被改造成了蓦然认知产品的展示中心,坐在深网面前,他拿起了一个带有语音输入功能的电视遥控器,用语音与电视交互,要为在场的人各订一杯咖啡。同时,他还通过电视遥控器,演示了开关办公室窗帘、台灯的效果。

根据介绍,蓦然认知已经对接的服务有外卖、电影票,并正在接入更多的服务,如代驾、停车、跑腿、购物等。

戴帅湘特别强调,蓦然认知的产品能直接用语音交互调取服务、进入相关服务商的支付环节,完成交易。

在此之前,其他一些语音交互产品到交易环节,就必须依赖人工介入才能完成。这里面考验的核心能力即语义理解和多轮对话。

“其实我们整个多轮对话的框架没怎么变化,从创业到现在基本上是这样的框架,我们不断地优化这个框架,现在也没人做到我们这个水平。所以我们有半年到一年的领先时间,我现在发现其实我们领先的时间可能更长。”

从接入的服务中获得的数据对蓦然认知非常重要,这些数据是蓦然认知不断完善技术模型的材料。戴帅湘介绍,蓦然认知的团队具备加工新数据、从已有数据中处理出有用数据的能力,同时,也有在小数据集上训练处有效模型的能力。

将接入的诸如咖啡、外卖、电影票等服务的数据进行深加工,同时将用户的语言对应到服务上,接入交易的闭环。用特定场景下的数据不断优化模型,打造产品,然后向客户输出,这是蓦然认知的大概业务逻辑。

这意味着,蓦然认知不仅需要做好技术,还需要有连接服务的能力。

拓展场景

“对话即应用”,这是蓦然认知提出的一个概念,这个概念的核心理念是用户可以通过语音交互直接调取各种服务,其中蕴含的不仅是产品形态,还有商业模式。

蓦然认知市场总监龚思颖介绍,是否能够满足用户的头部需求是他们选择接入服务的评价标准。

“不管是Echo也好,还是国内之后跟风的这些音箱也好,都没有真正把语音交互落地,为什么?因为所有的东西都没有解决用户的头部需求,没有解决用户的头部需求,你就很难让用户去用你的语音。”谈及为何要接入服务,蓦然认知市场总监龚思颖如此解释。

那么什么是真正的头部需求?在龚思颖看来,头部需求就是衣食住行,因此当前蓦然认知已经接入的都是与日常生活相关的基本服务。

接入服务对蓦然认知的商业模式意义重大,戴帅湘介绍,接入服务本身就是有价值的,当语音交互占领了越来越多的设备,服务商必然需要通过新的渠道触达用户;而在接入服务的同时,蓦然认知可以基于对用户的了解,推送精准广告;一旦发生交易,蓦然认知、服务商、设备商三方会进行分成,未来,基于传感器或者用户历史行为,蓦然认知可以主动为用户推荐产品。

“我们是一个2B2C的模式,用户不一定需要知道他使用的产品是蓦然认知提供的,但是我们2B的最终目的是2C。”

根据设想,蓦然认知可以通过2B2C的模式获得用户并赢得商业回报,实现理想效果的前提是获得客户、进入更多设备、接入更多服务、提升产品体验。

目前,蓦然认知正努力在家和车的两个垂类中拓展场景,戴帅湘透露,他们已经与四大电视厂商和两大车厂达成了合作,不过由于需配合合作方的节奏,现在尚不能透露具体厂商名称。

在进入家庭和车内场景后,蓦然认知的下一步是计划扩展并打通更多设备,“优先做电视和汽车两个垂直的场景,好好把这个场景做好,交互得舒服,然后再以这两个为中心扩展周边的设备。”

对于技术男戴帅湘而言,当下最大的挑战来自于市场。怎样让更多目标客户真正成为合作伙伴,需要不断的向对方输出观点。

龚思颖告诉深网,他们与车厂的合作就受到市场环境的很大影响,今年CES上福特与亚马逊的合作是一剂催化剂,直接促使蓦然认知在落地车企上取得了实质性进展。

要实现目标,落地还需加快,而除了依赖大环境的转变,接下来这家人工智能初创公司,还需在市场和商务上,接受更多考验。

(编辑:此夕)


 
315记者摄影家山东站
[责任编辑: 315xwsy_susan]

免责声明:

1、本网内容凡注明"来源:315记者摄影家网"的所有文字、图片和音视频资料,版权均属315记者摄影家网所有,转载、下载须通知本网授权,不得商用,在转载时必须注明"稿件来源:315记者摄影家网",违者本网将依法追究责任。
2、本文系本网编辑转载,转载出于研究学习之目的,为北京正念正心国学文化研究院艺术学研究、宗教学研究、教育学研究、文学研究、新闻学与传播学研究、考古学研究的研究员研究学习,并不代表本网赞同其观点和对其真实性负责。
3、如涉及作品、图片等内容、版权和其它问题,请作者看到后一周内来电或来函联系删除。