全球最大的搜索引擎公司——Google的市值近期突破5000亿美元,超过了互联网公司中紧跟其后的Facebook和阿里巴巴市值的总和。然而,与其活跃的市值不相称的是,近二十年来,搜索引擎的产品形态和服务方式几乎没有变化——通过关键词匹配返回给用户数不清的网页列表。
搜索引擎真的可以“一招鲜吃遍天”吗?
当然不是。随着移动终端成为人们日常生活中获得信息的主要媒介,搜索引擎在小屏幕上的使用不便已成为一大痛点,特别是在用户需要访问搜索结果中多个页面的情况下。在很多典型的应用场景中(如汽车驾驶),手机用户需要立刻获得答案,现有的搜索引擎已经难以胜任。
场景一:言语不通,寸步难行
2014年Google收购了一家名为Quest Visual的公司,该公司开发的手机应用可以利用摄像头和后台智能技术翻译现实生活中的文字,直接将拍摄到的图片中的语言翻译成另一种文字,并用同样的视觉效果显示出来。用户在任何时候用手机摄像头对着外文,看到的是自己所认知的内容,该应用结合了成熟的图像文字识别和机器翻译技术,实时捕获场景中的文字并即时提供翻译结果。
场景二:知已知彼,百战百胜
此前,Google眼镜还曾放出一个广告片段。男孩戴着Google眼镜赴约会,在对话过程中不时地在网上查找对方的相关信息,以表现出自己博学和体贴。
对话,是一个需要秒级响应的应用场景,人工智能技术可以将全网“变成”我们的外脑,在场景中感知用户需求并且即刻产生答案,为话题的应答和延展提供线索、依据和思路,可极大地提高人们日常对话的质量和效率。
“外脑级对话”目前还没有真正实现,Google眼镜已经遇到了技术和用户体验上的瓶颈。一方面,眼镜的成像分辨率仅为640*480,难以提供清晰舒适的显示效果;另一方面,在社交场合中佩戴Google眼镜显得另类,容易涉及个人隐私问题而招致对方的反感。此外,图像识别的高准确率和秒级响应还需要人工智能技术上的进一步突破。相信随着技术性能的不断提升,“外脑级对话”的实现指日可待,但可穿戴设备需要更加的低调,并且消除人们保护隐私的疑虑。
场景三:失之毫厘,差之千里
这是个需要更多想象力的未来场景。与高手对决,差距在于反应速度。图中对手看似扣球而实为切球,球会在0.8秒后落在网前右侧,此时新手缺乏足够的经验难以及时反应。未来可穿戴的人工智能设备可以实现毫秒级的运动轨迹分析,比人类的正常反应和判断更快一步地提供预测结果,在运动、驾驶、救援等需要迅速反应的时刻有如加了“外挂”,由此带来的商业价值将是无法估量。
在以上三个应用场景中,用户需求和技术难度各不相同,但有一个共同的特点:需要在场景中感知用户需求,并提供即时答案。所以我们有理由相信,搜索引擎的更新换代产品即将能满足上述用户的典型需求,可以随时随地提供信息支持,帮助人们快速地决策和行动。早在2009年,Google的原CEO 埃里克·施密特曾对媒体说:“未来的搜索,是为用户的问题提供准确的答案,而不是数不清的网页列表”。相信这是整个搜索引擎行业共同为之奋斗的目标,也就是未来的“答案引擎”。
答案引擎和问答引擎在概念上有显著的区别——前者并不要求用户输入完整的问题,甚至可以不包含文字。换句话说,答案引擎能为任何形式的查询提供答案。
答案引擎离我们还有多远?
搜索引擎返回给用户的是一个数不清的网页列表,而答案引擎能够直接提供查询的答案。在网页中寻找答案,对人们来说都不总是一件容易的事情。就目前而言,想要获得更好的、便携性更强的答案获取方式,答案引擎需要解决这两个根本问题:
1、理解用户真正想要的是什么。统计表明,用户在使用语音时倾向于录入较为完整的句子,而在使用文字输入时平均只使用2-3个关键词。当用户的表达不够清晰、完整时,特别是包含多义词(如“苹果”可以是水果或手机,“焦裕禄”可以是人名或电影)的情况下,无法通过上下文准确判断用户的真正需求,答案引擎需要进行智能分析和预测。使用以下技术手段可以使这种预测更加准确:
l 分析共性需求。追踪那些使用相同及类似关键词查询的用户的操作内容,分析他们的最终需求作为预测结果;
l 分析个性需求。可根据该用户的历史行为进行预测。例如用户经常查询、浏览或关注电子产品,那么他查询“苹果”的目的是找手机而不是找水果的概率会更高;
l 根据地理位置信息来预测。例如用户正在逛电子市场,他找手机的概率也会更高。生活类查询(如找餐馆等)会非常依赖位置信息。
2、理解页面内容,匹配高质量答案。让计算机理解人类语言,涉及到一系列自然语言处理(NLP,Natural Language Processing)技术,如语音识别、分词、词性分析、语法树建立、命名实体抽取、语义消歧、语义角色分析、情感分析等。
相对文字理解,识别图像内容对计算机来讲难度更大,一个图像识别系统往往只能识别某一类物体,而识别另一类物体可能会采用完全不同的方法。因而,图像识别技术可以在某些特定场景(如车牌或人脸识别)中得到很好的应用,但是面对大千世界的万物,还需要技术上巨大的突破。
可喜的是,国外一些技术领先的IT企业近期纷纷将研制多年的人工智能工具免费向公众开放,如Facebook的深度学习插件、Big Sur,Google的TensorFlow,IBM的System ML,微软的DMTK。这些企业在造福全人类的同时,也将会汇集外部人才的智慧实现技术上的更大突破。
在真正理解了用户需求和网页内容的前提下,匹配高质量答案就不再困难,但是还需要处理好两个问题。第一,区别对待用户的简单查询(如谁、哪儿、什么时候)和复杂查询(如为什么、怎样),就像填空题和问答题的区别;第二,对于分散在不同页面上的答案,需要能够整合成一个完整的内容,并且具有较好的可读性和逻辑连贯性。
答案引擎可以说是时代的必然产物。虽然搜索引擎二十年来几乎一成不变,人们在PC上已经习惯于徜徉在数不清的网页列表中,但是随着移动互联网的兴起,现有搜索引擎的服务方式日渐无法满足人们在碎片化时间中快速寻求答案的需求。相信在人工智能技术突飞猛进发展的今天,答案引擎时代很快就会到来。
【钛媒体作者介绍:石忠民,加拿大西蒙弗雷泽大学计算科学博士,广州索答信息科技有限公司董事长,摘要式答案引擎主要发明人,国际搜索引擎领域专家和商业新星。】
根据《网络安全法》实名制要求,请绑定手机号后发表评论
期待答案引擎的到来。。
答案引擎
这才叫伟大的公司,某度应该掩面而逃…
现在的搜索引擎都是对关键词简单的处理,对干普通用户来说,经常是答非所问,要提高搜索引擎的体验,在算法上应该加入更多的因素。