导语:科幻题材英剧《黑镜》(Black Mirror)第二季回归即抛出惊悚的题材:当深爱之人不幸殒命,你会用科技的力量复活他么?本期《科技万有瘾力》将聊聊替身机器人的技术基础、盈利模式和伦理反思。
《黑镜》第二季官方剧照,移动设备的黑色屏幕像一面面黑色镜子折射生活
《黑镜》剧中,女主角在痛失男友Ash后加入了一个尚在测试阶段的项目,该项目利用Ash在Facebook、Twitter等社交网络上留下的大量数据,重建了一个模拟Ash人格的AI(即人工智能)。这个“复活”了的男朋友最初通过文字,继而通过语音与女主角聊天,最后甚至通过一具机器人身体“实实在在”地陪伴在女主角身边。
剧中的替身机器人的主要功能是模仿逝去人的口吻、语调,对丧亲者进行感情陪护
科幻从来不是无根之水,剧中的替身机器人涉及的技术已初现端倪,“复活”爱人并不遥远。
大数据:分析"灵魂"的模式
剧中的Ash生前是一个重度社交网络沉迷者,他这样的人群并不在少数。据统计,互联网上的信息总量正以每年 50% 的增速不断膨胀,其中 90% 的信息来自近三年,包括每个月 Facebook 上分享的 30 亿条内容,每天 12 TB 的 Twitter 信息。目前产生的数据中,有近 80% 是由个人用户产生的。这些数量庞大、种类繁多、结构复杂的数据就是大数据。
剧照,Ash使用手机刷新社交网站
在社交网络上分享信息是一个量化自身(Quantified Self–QS)的过程。对Ash在社交网络上留下的的信息进行分析,获得模型、发现规律、统计比较,最终实现“预测”这一终极目的——预测在特定的情景下,“如果Ash活着,他会怎么做”。
相比Twitter,国内微博活跃度依靠热点事件催动,可供挖掘的个人数据不足
关系型数据库系统及分布式运算架构技术已经颇为成熟,也诞生了不少商业应用和从大数据中掘金的公司。最典型的案例就是分析大数据实现精准营销和个性化广告。比如,美国零售连锁超市Target运行大数据系统,在一位17岁女孩的父亲知晓之前分析出他的女儿已经怀孕并发出尿布促销信息。
在现实中,国外对大数据的概念已经走过了炒作阶段,以Hadoop为代表的非人工智能学习:填补数据空白
社交网络上不可能包含所有的生活情景,使得重建的人格中会有数据空白。如在剧中,替身机器人并不知道Ash生前触碰女友胸部时的性反应,因为这部分属于Ash不会在网上公开的隐私;替身也不知道Ash对车载音乐的品味,因为Ash生前与女友达成“共识”,在车上不玩手机。
如果Ash生前佩戴运动手环类产品,积累下的轨迹数据将帮助替身机器人模仿他的步态
这些数据的空白环节需要替身机器人自行学习。人工智能学习的知识有两类,一类是数据库;一类是使用过程中用户的实时反馈。比如,剧中的替身机器人从AV中学习各类姿势(学习数据库),还会经常询问女主角某个词的含义。
剧照,AI通过询问女主角学习小两口的私房词汇
自我学习的最佳例子是《科技万有瘾力》曾介绍过的IBM的超级计算机沃森(Watson)。IBM为它研发了一套集高级自然语言处理、信息检索、知识表示、自动推理、机器学习等开放式问答技术的应用。他既能够直接获取知识,还具备学习能力。比如,通过阅读医学文献和医疗文档,并在医院“实习”,沃森就能逐步成长为一名合格的医生。
在现实中,人工智能