今日话题
9392017-05-14 14:40:12

Siri蕴含的巨大潜力:苹果和神秘的暗数据

  • 新的收购


      苹果收购各种公司当然不是什么惊人的新闻,关键在于我们能从其中看出多少信息。我们都知道苹果如今对 AI 技术的重视,但它要朝着哪个方向去努力呢?可以从它不久前对 Lattice Data 的收购看出些端倪来。

      外站 TechCrunch 日前得到消息来源的爆料称,苹果已经以大概 2 亿美元的价格收购了这家据说是专门研究如何处理“暗数据(Dark Data)”的公司。通过向苹果的发言人寻求证实,我们得到了一贯的公式化回答:“苹果不时会收购小型的科技公司,我们一般不会就其目的或计划进行讨论。”

      熟悉苹果动态的粉丝们一定知道,这其实就是官方确认了收购的信息。

      别看 Lattice Data 这家公司好像完全名不见经传,其实它的来头可真不小。Lattice Data 事实上是斯坦福大学 DeepDive 项目的商业化,联合创始人之一的克里斯托弗·雷(Christopher Ré)是斯坦福大学教授,因该计划获得过麦克阿瑟天才奖,公司可谓血统纯正。其余的几位创始人也基本都曾参与过 DeepDive 的开发。公司 CEO 安迪·雅克(Andy Jacques)去年入职,是资深的企业高管。可以说 Lattice Data 事实上是拥有很强的技术力和执行力的。

      毫无疑问,Lattice Data 团队的专长就是信息处理,因此它的加入对苹果来说,将对 AI 技术和 Siri 的开发有相当大的帮助。在继续畅想之前,我们先了解一下所谓的“暗数据”。
  • 什么是暗数据?


      所谓的 DeepDive 项目,用概括的话说就是“从非结构化数据建立结构化信息”,然后将这些有效的信息整合到已有的数据库中。这个“非结构化数据”,就是我们说的暗数据。

      我们知道,现在绝大多数的系统要对信息进行管理和整合,它们依赖的是结构化,也就是说要有明确的数字,或是清晰的文字组合,如比赛得分、日程安排等。然而这样的信息毕竟只是少数,我们日常能接触到的,数据系统更多收集到的,都是埋藏在文本、表格、图标、图片里的那些非结构性数据。

      暗数据就是指的这些,现存的软件几乎无法进行分析和处理的数据,因为它们没有结构。DeepDive 系统要做的,就是在这样的数据中,整理出一个能够被系统分析和处理的形式,然后保存起来,甚至可以放进如 Excel 这样我们平时已经见惯用惯的软件里。

      暗数据处理的存在是相当有必要的。正如我们刚才所说的,数据中有很大部分都是暗数据,特别是那些由传感器和模数转换手段处理得来的信息,还包括那些较为模糊化的文字。IBM 曾预计这类数据有 90% 从未被使用过,一些企业、机构甚至根本没有意识到这类数据被采集。

      对于企业来说,大量暗数据的储存意味着资源被用到毫无价值的地方。我们个人虽说并不会因此有些什么损失,但既然 AI 技术已经确实成为了我们手掌上的存在,那么它如果能够带来更个性化的体验,那当然是最好的了。
  • Siri 即将受益?


      根据官方的说法,DeepDive 有一个特点,那就是它“意识”到了人类语言或是其他相关数据中存在的模糊性和不确定性,因此能够通过概率来寻求一个尽可能明确的解释。从这一点来看,Lattice Data 的技术或将对 Siri 的体验带来相当大的提升。

      业内人士们认为,Siri 目前的最大短板在于它对上下文不够敏感。尽管经过长时间的发展和改进,Siri 已经能够理解诸如“今天的天气”和“那明天呢”这两个问题之间的联系,但很多时候两个更加复杂的,互相相关的问题,它还是很有可能会理解成两个独立的问题,而不会识别出它们具有上下文关系。

      如果 Lattice Data 的技术在 Siri 上得到进一步应用,那么它可能就能够更好地理解我们的那些问题,甚至完全以自然语言说出的“长篇大论”Siri 都可以抓住要点。它能够从这些混乱模糊的话中提取出结构式的信息,并且加以简化,重组成为更好理解的语句。事实上苹果也确实在致力于让 Siri 更懂自然语言,它会想尽办法去准备好这一切。

      另外,在苹果历次的技术展示中我们也可以发现一个细节,那就是它试图要实现多种情况下照片里的物体识别、人物识别,并使用 AI 技术对其进行自动的整理和分类。在这一点上,我们也可以认为那是 Lattice Data 的强项。它可以把那些随意庞杂的数据分门别类。需要注意的是 DeepDive 技术不仅仅限于图片而已,还适用于大量包含信息的文件。可以想见,将来手机可以整合分类的文件类型将会更多。

      最近也有传闻称,苹果希望通过 3D 感知技术和 AI 技术结合,让系统能够直接识别摄像头“看”到的人物和物体。很难说这个传闻和此次收购直接相关,但未来有没有改进的可能呢?

      值得一提的是,这些提升本身就可以和 Siri 等服务进行结合。如果数据能够被结构化地分好类别,那么就相当于 Siri 和其他服务都可以通过这些信息更好地了解你,从而带来更加细腻的搜索查询,和更加定制化的体验了。
  • 无限可能性


      因为苹果不会对它的收购发表任何的评论,所以我们也无法从官方的口中得知 Lattice Data 团队在被收购之后将会专注哪个方向的研究。严格来说,即使它最后并不针对 AI 这块,那也是有可能的。

      然而苹果毕竟早就公开了自己对 AI 领域的重视,有许多传闻表示今年 WWDC 的一大重点就是 Siri。在这个节骨眼上苹果收购一家和数据整合分类有关的公司,很难让人不往强化 AI 性能上面想。

      在宣传上比起技术,苹果更强调体验,所以我们当然不会往后的公开表态中看到大段大段的技术综述。如果有可能的话,就从自己的实际体验中去发掘新技术有没有被应用吧。未来什么都可能发生。
锋友跟帖
人参与
人跟帖
现在还没有评论,请发表第一个评论吧!
正在加载评论
  • 威锋客户端

  • 用微博扫我

返回顶部
关闭