人物简介:

  王昊奋,上海交通大学博士,上海优秀博士,深圳狗尾草智能科技有限公司(Gowild)CTO、著名知识图谱专家、中文知识图谱zhsihi.me创始人、OpenKG开放知识图谱联盟发起人之一、中国计算机学会术语专委会执委。曾任教于华东理工大学,多次主持并参与多项国家自然科学基金、863国家重大专项和国家科技支撑项目等。曾以高校技术负责人身份参与多项与Paypal中国、Google中国、Intel中国研究中心、IBM中国研究院、百度等知名企业合作的联合项目。

  

  全文共 4198 字,阅读预计您需花费 5 分 20 秒完成;

  本文您将看到:

常混A站B站的教书先生如何研究“知识图谱”?

小白机器人如何懂得了人类的喜怒哀乐?

怎样的钢铁侠战衣让教书先生毅然决然的离开了讲台奔向梦想?

  强人工智能的图景轮廓已浮出水面。这位“反差萌”专家,将如何用知识图谱这张巨网,编织钢铁侠盔甲的战衣,携带着温暖而非冰冷的人机共生愿景,奔向未来?

作者:dude

编辑校正:甲小姐

Xtecher独家

网址:www.xtecher.com

微信公众号ID:Xtecher

  常混A站B站的“教书先生”与知识图谱

  王昊奋眼睛小小的,穿着休闲随意。让他发来照片,他发来一些和大白,蜘蛛侠、美国队长的合影,这与他的背景,构成了一道让人忍俊不禁的反差萌。

  虽是个教书先生,但他的“反差萌”体现在各处:本科期间曾担任上海交通大学网络协会会长,推广组网和安全攻防等方面知识和技能;至今他还喜欢去AcFun、Bilibili等网站看动漫,他尤其喜欢漫威系列人物、最喜欢钢铁侠,梦想着有一天将技术达到像钢铁侠一样的高度。

  游走于各类弹幕节目之间,王昊奋对各种“宅基腐”口味了如指掌。他说这不是“低级趣味”,是“了解年轻人”的重要渠道。

  “我们所面对的市场是年轻人群,所以需要更多了解他们的想法,否则自己就是一个OUT的人。你去设计出你觉得你很喜欢,但他们根本无感的东西,那就是闭门造车。”

  上世纪90年代初,美国总统比尔·克林顿当政时期,美国就开始了信息高速公路的建设,如何利用好信息越来越成为一个时代课题。

  “知识图谱”所做的一件事情就是从海量脏乱的数据中提取有用的信息,并将分散的信息碎片聚合起来,以图谱的形式组织在一起,变成相对有参考信息和洞察力的知识,以辅助决策。

  2012年,谷歌率先提出知识图谱概念,并以此陆续推出下一代搜索和Google Now个人助手以来,“知识图谱”受到市场的宠爱和资本的追逐,引发国内互联网巨头们的高度关注和追捧。百度、搜狗相继推出知心、知立方等以知识图谱为核心的语义搜索引擎。

  而王昊奋的知识图谱之旅,比这些巨头都要早一步。

  本科时期,他自嘲自己“比较呆板”,为了“增加和同学之间的话题”,竟会主动去跑去参加各种讲座、展览,“不能总是吃饭的时候谈技术,这样太无聊了。”为了和同学之间多点话题,他无意间竟深埋下一颗种子——在看展览时,他发现某个东西有点儿意思,就会顺藤摸瓜研究其相关内容,丰富自己的知识——这形成他日后的研究“知识图谱”的雏形。

  他2005年还在大四的时候,就投入到知识图谱的研究当中。当时的知识图谱还不叫知识图谱,叫语义万维网(Semantic Web)。

  此后,他一直在知识图谱领域的学术研究发力:

  他从2007年开始发表关于知识图谱的论文研究,涵盖知识发现、知识融合、语义搜索、问答、自动推理等多个方面,博士期间论文数量达50余篇之多,部分成果发表于AAAI、SIGMOD, SIGIR、WWW等国际顶级会议和包括Journal of Web Semantics、IEEE Intelligent System在内的多个国际知名期刊;除此以外,他长期在AAAI、WWW、ISWC等人工智能语义技术相关的顶级会议担任程序委员会委员;在著名的本体匹配竞赛OAEI的实体匹配任务中获得全球第一名的好成绩;他带领团队构建的语义搜索系统在十亿三元组挑战赛(Billion Triple Challenge)中获得全球第二名的好成绩;他主持并参与了多项国家自然科学基金、863国家项目、国家科技支撑相关项目;在读博期间,他深入参与了IBM Watson系统的研发工作。

  知识图谱之外,他还非常关注生命科学,结合两者发了不少文章,如《基于本体的医疗健康语义知识库构建》、《中医药知识图谱构建与应用》、《电子病历文本症状自动识别方法》。

  2014年1月,他放弃了自己生活学习12年的上海交通大学的执教邀请,“不想永远在导师搭好的舞台上跳舞”,他选择了一个全新的起点—— 到华东理工大学任教,负责大数据驱动的知识图谱教学与研究工作。自此之后的两年半岁月,他在讲坛默默耕耘的同时,也将自己从大四就研究的知识图谱技术投入应用研究。事实上,王昊奋的知识图谱应用研究历程可以追溯到2009年。从那开始,他以IBM phd fellow的身份参与IBM WATSON问答机器人的研发,一直持续到2011年。

  随着研究的逐渐深入,他对知识图谱的应用价值理解愈加深刻。他认为知识图谱在生命科学、电信客服、媒体发布、金融、政府业务等方面能有巨大的发挥空间,能够创造巨大的价值。

  知识图谱通过对现有数据的再加工,通过各种数据挖掘、信息抽取和知识融合技术形成一个统一的全局知识库,将原本没有联系的数据连通,将离散的数据整合,从而提供更有价值的决策支持。

  正因对市场的巨大看好,2013年底,王昊奋开始兼职参与狗尾草(Gowild)公司的创建,担任CTO,开始研发一款机器人—— 公子小白。

  狗尾草CEO邱楠还特地为此起了个充满活力的solgan:“正青春,去撒野”。

  公子小白:当一个机器人懂得了情感的输出和表达

  

  2011年,iPhone4S因添加了Siri,引发业内外人士的一片哗然。但由于功能的不完善,网上调戏Siri的段子层出不穷,Siri几乎已沦为被人们调戏玩乐的鸡肋产品。

  鉴于Siri的“失败”,王昊奋觉得机器人以“纯功能性”为导向,就会给人冷冰冰的感觉,且用户对错误的容忍度极低。

  所以,王昊奋以及公子小白团队,选择了以“情感输出和表达”来切入机器人,以更好地贴近人性。

  “幸福很多时候来自于你和外界的交互,而不是你自己蒙在那里发酵来获得。”

  而他熟知多年的知识图谱技术及应用,成为了“小白”贴近人性一把的利器。

  图谱技术的支持,可以让机器人识别句子当中包含的实体、概念、属性、关系、事件,甚至是对用户交互的语句进行结构化抽取,来逐步构建用户画像图谱,为自我认知和个性化问答提供了支持。

  这就使得“小白”不再是冷冰冰的,它有了自己的个性,懂得了用户的个性,个性与个性之间可以碰撞、交互,绽放出情感的花火。

  除此之外,小白基于图谱数据上的智能问答技术,可以通过在图数据库上优化和执行问句语义解析,得到逻辑表达式,并得出精确的答案。在多轮对话过程中,图谱技术可以指代消解和对结构化缺失补全,甚至是服务模板填充,并且对信息进行挖掘和处理。

  这些知识图谱技术的应用,都使得“小白”能够更精准地输出以及表达。

  在“小白”的精准输出和表达的背后,有一个严密的框架在支撑运转。这个框架跟王昊奋在IBM的工作经历,有着直接而紧密的关系。他在IBM期间所在的小组为沃森机器人的研发项目组,主要负责结构化数据即现在说的知识图谱上的问答处理,具体任务包括候选答案过滤,答案选择和排序等工作,并参与了知识库构建。至今,公子小白框架中也刻有比较浓重的IBM Watson框架的影子。

  为增加情感因素,公子小白不仅功能上要满足情感输出的条件,就连外观也着实花了一番心思。

  “IP款”请来了极具人气号召力的当红男星——《我的少女时代》主演王大陆,为他量身打造了一款机器人“王小陆”,这款机器人被王大陆称为他的儿子。除了外观上参考明星王大陆以外,他们还将王小陆植入了王大陆的知识图谱(包括王大陆的动态、照片、电影等),着实是打了一张满满的情感牌,俘虏了一大批少女心。

  在“非IP款”的机器人方面,公子小白则是主打“情侣款”机器人——植入熟人、情侣社交图谱,用小白机器人传递情侣之间的悄悄话,打开彼此的心扉,触摸爱的柔软。

  成立于2013年的狗尾草公司(Gowild),在今年6月A轮融资已经过亿。

  目前,狗尾草(Gowild)已经有120人,具备了一定的规模。主要的业务模式是依托京东、天猫等平台进行线上授权代理、Gowild官网、线下零售店结合销售,平均每月销量过千,成为线上为数不多的双K机器人。

  依靠着耍宝卖萌的法宝,公子小白还登陆了美国时代广场、米兰国际时装周。冰冷的机器人,添注了情感的热度,更受到市场的欢迎。

  钢铁侠战衣梦想

  2016年中,王昊奋离开了执教两年半的华东理工大学,正式放弃了“教书先生”的铁饭碗。

  这对王昊奋而言是一个艰难而决绝的决定。

  业界不乏“兼任”的情况,但王昊奋认为这是对两边都不责任 ——他的精力和“能耗”决定了他在学术界和业界之间只能选择一个。

  这道非A即B的选择,并不是一道简单的题目。

  当时他已在学校积累了自己的口碑,在学术圈积累了自己的人脉,获得了学会、学校和学院等多级领导和专家的认可和赏识;参与并主持多个国家项目,包括:国家自然科技基金青年基金项目、国家高技术研究863重大项目——心血管疾病与肿瘤疾病中西医临床大数据处理分析与应用研究……放弃这一切,对于王昊奋而言,是一招险棋。

  举棋不定之际,他想起了当初的solgan——“正青春、去撒野”,心头热了起来。

  做一款具有技术革命性的机器人,成了更有吸引力的磁石。两者相较,他最终选择了狗尾草(Gowild)。

  与其他人工智能从业者相比,王昊奋显得更为乐观。他认为机器和人之间存在着一种温暖的关系,关键取决于我们能不能换一个视角来观察。

  “比如基础仿生的技术设计,一定有仿生的道理,但一定要跳出仿生的框架。飞机如果不是按照现在的架构,还是停留在像鸟一样,那么飞机将永远也飞不起来,或者也飞不远。人工智能同样也取决于我们能否换个视角观察——借鉴仿生的想法,用适合的方式来实现。我觉得人和机器一定可以很和谐地发展,人离不开机器,机器也离不开人,因为人和机器各自有各自的擅长。”

  2016年8月17号,有一则新闻让王昊奋备受鼓舞——世界首颗量子科学实验卫星“墨子号”成功发射升空。

  王昊奋认为量子通讯和量子计算机发展出来后,就会打破现在的一些机器体系机构,很多原来复杂的问题就会变得简单。计算能力变得更强的同时,人们可以更进一步,解决更多现在无法解决的问题。

  未来,王昊奋希望能在有生之年可以看到“强人工智能”的诞生,并能亲手参与Strong AI的构建。当然,他希望自己有机会可以亲手打造一副类似钢铁侠盔甲的战衣,将科幻电影中的一些场景带到真实世界中。

  对他而言,时机大好,技术在全速前进地发展,强人工智能的图景轮廓已浮出水面。这位“反差萌”专家,将用知识图谱这张巨网,编织钢铁侠盔甲的战衣,携带着温暖而非冰冷的人机共生愿景,向未来走去。