如何让机器拥有像人一样的思维——用户画像、人物性格与聊天机器人
[人工智能] [用户心理] ?
最近,我给我三岁的女儿买了一本绘本,名字是“Can I build another me”,她爱不释手。这本书的主角是一个厌倦了自己规律生活的孩子,他希望能训练出一个机器人代替自己按时午睡、吃饭、去幼儿园,这样他就可以自由自在地玩耍。于是,他买来一个最便宜的机器人,带回家来训练它。在这个过程中,他遇到的第一个问题就是,怎样才能让机器人才能变成他呢?于是,他试图告诉机器人各种关于自己的信息,包括他的姓名、年龄、身高、体重,父母、兄弟和宠物,甚至包括“左撇子”“易烦躁”“袜子经常破洞”这种信息。
这绘本的作者脑洞很大,他也在思考我们所思考的问题。这个故事也告诉我们,要让机器人拥有人一般的思维,第一步便是 理解自己 。因为这样我们才能告诉机器人,怎样做才能最像自己。我们从以下几个方面探讨这个问题:
1. 人工智能与心理学
2. 人格分类及推测
3. 如何让机器人像人一样思考
在很长一段时间内,我们团队一直从事用户画像的研究。什么是用户画像?简单说来,就是通过用户产生的大数据,去猜测和理解一个人的年龄、职业、兴趣爱好,也可以去描绘一群人的 生活规律 和 移动模式 。这让我们开始思考,我们能不能通过这些数据进一步走到人的内心深处,去了解她们的 性格和情感 呢?这并不容易。但是在研究的过程中,我们发现这些问题在心理学领域已经被思考了上千年。实际上,人工智能和心理学这两个领域实际上早就有交叉。
两年前,我们便开始拜访著名的心理学家和教授,试图进行跨学科合作交流。在这个过程中,我们首先想解决的问题就是人格。 从用户生成的大数据中能否计算出人的性格?
虽然人格这个术语在日常生活中很常见,但是给人格下一个准确清晰的定义却并非易事,即使是心理学家们在这个术语的定义上也很难达成共识。 人格最早的定义可以追溯到2000多年前(公元前400年) 古希腊医学家希波克拉底(Hippocrates)的体液说 ,他认为人体是由四种体液构成,包括血液、粘液、黄胆汁和黑胆汁,而这四种体液的分布便决定了人的性格:黑色的胆汁产生了忧郁型人格,血液产生了乐观型人格,**胆汁产生了冲动易怒型人格,而粘液产生了冷静型人格。尽管希波克拉底的体液说已经被现代医学所否定,但是他关于人格分类的探讨是有启发意义的,以致于后来的心理学家仍然一直探讨这个问题。
在我们与心理学家交流时,我们发现了一个有趣事实:在现代心理学中, 人格的定义其实跟语言的使用有着紧密的关系 。其实在计算机科学领域,我们对语言也有很多研究,我们称之为“自然语言理解”。在心理学里面,有一个概念叫“词汇学假说”。什么叫词汇学假说?根据这个假说,我们无需通过观察、研究各种各样的人来研究人格,我们可以简单一些,通过直接观察人类语言中相关词汇。比如说,你介绍一位朋友给我认识,可能会用一大段话来描述他:“他特别喜欢说话,每次都听到他在说话,是个话痨”等等。其实,一个词即可概括这段话:健谈。因此,心理学家决定整理这些描述性词汇。如果这个词汇不多的话,它们便可成为建立分类体系的基础。
基于这些观察,人格理论的先驱奥尔波特(Allport)和奥德伯特(Odbert)于1936年对英语词汇进行了艰难而又系统的调查研究。通过查看词典,他们按照个人特质、暂时的情绪或者行为以及智力与才干这四个类别发现大约18000个单词,并进一步从中整理出 四千多个描述性格的词汇 。虽然说四千似乎已经很少了,但对于整个用户语言来说,这仍然是很复杂的。
试想下,在描述一个人性格的时候,如果要给这四千个描述维度分别打分,这该是多大的工作量。因此,他们想在此基础上进一步缩减。在这个过程中,他们发现,这些单词间其实存在一些相关性。比如说,一般外向的人通常也比较健谈,冷静的人通常也比较理智,但他可能也比较内向。如果能定位这些相关性,便可在此基础上对四千多个词进行进一步归类。
近二十年来,人格研究者关注与支持最多的人格定义是 “大五人格理论 ” 。包括了五个高度概括的人格因素:外向性 (Extraversion),尽责性 (Conscientiousness),神经质 (Neuroticism),随和型(Agreeableness)和开放性(Openness)。每个人格因素下还有一些细分特质(比如外向性下包括了是否经常参加活动、是否热心肠等)。这样,以后你在介绍朋友时,可以将他描述为“比较外向,但不太随和,可能比较情绪化的一个人”。方式很简单,但是描述很全面。
实际上,整理这些词汇以及生成人格分类体系大多是依赖数据驱动,与计算机科学有很多很紧密的联系。那我们能不能自动的计算用户的大五人格呢?其实这也是有可能的。
在传统人格测量中,心理学家往往采用访谈和调查问卷这种形式,需要耗费大量的人力、财力和时间,受测者往往局限于几十人到几百人的规模,不可能实现大规模用户的测量。但心理学中还有一种人格测量的方法,叫做 行为测量 ,通过观察个体的行为来进行测评。行为测量的理论基础是人格理论中的人类行为的一致性。既然人格能够解释人际之间的稳定的个体差异,那么个 体行为表现出的差异性就跟个体的人格息息相关 ,因此通过观察个体行为使得预测人格变成了可能。只是在计算机技术得到广泛应用之前,心理学家很难收集到用户足够丰富的行为数据,因此数据的匮乏导致了行为测量在传统心理学中并没有被广泛采用。
近年来,随着互联网、智能手机和各种传感设备的普及,用户的行为数据被广泛收集,再加上人工智能方法在建模用户方面的推进,使得通过行为数据测量人格的方法在计算机和心理学的交叉领域得到了快速的发展。我们的研究工作在此基础上更进一步,提出 “人格推测模型” ,利用社交媒体上的 异构数据 (比如头像照片、发表的文字、表情符使用以及社交关系等)来预测大五人格。比如说针对,我们可以,算出语义表示,再将这些聚成某些类别,如卡通、自拍、合影、动植物。用基于行为数据的人工智能方法进行人格预测,首先需要收集少量用户的调查问卷结果作为标注。通过 标注用户行为特点及人格特征,将它们之间的映射和联系输入模型中,以训练出一个好的模型 。
实际上,我们找了一批志愿者,他们提供了自己的数据,并完成了问卷调查,这样我们便拥有两方面数据。在训练完模型后,新的用户便无需完成用户调查,模型可以自动计算其人格。听很抽象但其实也很具体。例如,我们可以计算用户发表文字和性格间的关系。大五人格有五个维度,我们可以 计算出文字和每一个维度间是特别正相关或者特别负相关 。例如一个经常在朋友圈写青春和自我的人可能比较外向,而常写失败和面对的用户外向性得分便很低。还有一些用户可能会写时代、社会、成功这些听起来非常正能量的词汇,我们发现这些人尽责性比较高。相反,有些人可能经常写随便、萌萌、气质这些词,我们发现他们尽责性比较低。尽责性低并不是一个贬义词:在这个模型中,在乎结果的人尽责性比较高,在乎过程的人尽责性比较低。这两个极端都有它的优势,并无好坏之分。
我们还通过计算大五人格和用户头像 类簇的皮尔逊系数 ,展示了与大五人格强烈正相关或者负相关的类簇(每个类簇选取了2张显示)。这样的计算揭示了一些有趣的现象:比如外向性得分高的用户喜欢使用包含笑脸的头像,而得分低的用户往往在头像中遮挡了面部表情或者使用侧脸;开放性得分高的用户往往使用和朋友在一起的照片作为头像,而开放性得分低的用户的头像很多是自拍照。
我们的实验结果表明单单使用头像照片,就能使个体性格预测的准确性到达0.6。我们不仅对每种维度上的行为数据提出了针对性的特征提取策略,而且使用集成学习技术(Ensemble)有效融合了不同维度的行为数据来提升大五人格预测的准确率,使得个体大五人格预测的准确性到达0.75以上。
在理解用户之后,下一步就是 如何利用这些知识来帮助机器人产生像人一样的思维 。人类希望机器人能实现的重要行为之一就是聊天,微软也提出了“Conversation as a Platform(对话即平台)”的概念,认为未来所有人机界面都将转变为对话界面。
两年前我看过一部电视剧,至今记忆犹新,是英剧《黑镜(Black Mirror)》第二季第一集“be right back”。这部电视剧描述了一家人工智能公司,它可以通过一个人的社交媒体和在线聊天数据合成一个虚拟人,来模仿人物原型的性格特点和他的女友进行对话。这看起来很科幻,但实际上离我们已经并不遥远。2016年10月一篇新闻报道中也提到,来自俄罗斯的创业者Kuyda为了纪念去世的朋友Roman,用他的8000条短信数据训练了一个聊天机器人,并于2016年5月正式发布。
尽管技术已经前进了一大步,但就算是目前最好的聊天机器人也还无法让人感觉他是一个具有稳定性格和情感、活生生的人。这就涉及到如何让机器人的语言和行为更具有个性。
随着社交网络盛行,带有用户标签的语言数据变得容易获取。就像前面提到的新闻报道描述一样,如果我们有足够的关于某个人的数据,就有可能训练出一个和他个性一样的聊天机器人。当然,我们还可以通过一群人,例如儿童、学生、甚至诗人的数据来训练出 具有一类人特点 的机器人。例如,我们是否可以收集所有现代诗人的数据,用这些数据来训练一个出口成诗的机器人?现在是可以做到的,但随着研究的深入,相信最终我们还会遇到瓶颈,例如到底如何才能让机器人具备更加真实的人类性格与情感,这还是需要和心理学家合作。
其实,最早的聊天机器人Eliza就是一个心理咨询师。大概50多年前,MIT的一位研究员Joseph开发了Eliza,在与用户聊天时,Eliza引入了心理学家罗杰斯提出的个人中心疗法(Person-Centered Therapy),更多强调对话态度,比如尊重与同理心。Eliza其实自己并不主动说新内容,它更多的是一直在引导用户说话尽可能倾诉。看似讨巧的Eliza项目取得了意外的成功,它的效果让当时的用户非常震惊。以致于后来产生一个词汇,叫ELIZA效应,即高估了机器人能力的一种心理感觉。ELIZA效应其实现在也很常见,比如击败顶尖高手的AlphaGo一出现,人们便觉得电脑已经具有下围棋的灵感,人工智能马上要超越人类。但其实,AlphaGo背后所有的程序都是人写的。 所谓的灵感,所谓的智能,实际最终都是程序实现的 。
受ELIZA项目启发,微软亚洲研究院也开展了DiPsy项目,这个项目的目标是让机器人能够和人聊天,帮助他们克服心理上的问题。在这个项目中,我们借鉴了心理咨询中常用的 认知行为疗法 (Cognitive Behavior Therapy) 和 正念疗法 (Mindfulness)。DiPsy的特点是以自然、有效的方式引导对话,让用户尽情倾诉。它还会研究用户心理过程,在数据驱动下,对用户的心理特质与精神障碍作出诊断。我们采取认知行为疗法(CBT)或早期干预,在各种治疗性的语境中,改变用户的思维与行为方式,帮助存在风险的用户缓解并管理心理问题。
在未来,我们期待这个项目能帮助解决实际的社会问题,例如农村留守儿童的心理疏导。在前不久举办的未来论坛上,微软全球执行副总裁沈向洋说,他想要解决三个和人脑息息相关的疾病:儿童自闭症、中年忧郁症、老年痴呆症。我希望我们的技术能帮助他做到这一点。当然,这些研究项目很多都还在起步阶段,里面涉及到很多跟其他领域学者的合作,包括心理学,社会学以及认知科学。希望未来可以和更多学科交流,获得更多研究上的灵感和创新。
我们希望最终能实现让机器拥有像人一样的思维,并在人需要时能提供不仅帮助,还能陪伴。当你孤独时,至少有个AI与你在一起。
知识图谱:
皮尔逊系数: 用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间。在自然科学领域中,该系数广泛用于度量两个变量之间的相关程度。
集成学习: 使用一系列学习器进行学习,并使用某种规则把各个学习结果进行整合从而获得比单个学习器更好的学习效果的一种机器学习方法。
金融数据风控体系(一):用户信用画像构建、反欺诈服务
做产品的都知道,产品分为三要素:用户、场景、需求,一切的决策都离不开这三个要点。所以作为产品狗,了解自己的用户是首要条件,那么怎么去了解自己的用户呢?
调研?访谈?还是抽取用户反馈?NONONO,这些都是老套路啦!现在都会有专门的部门,专门的同学去了解用户,描绘用户的特征,输出的成果就是——用户画像(官话是根据用户人口统计学信息、社交关系、偏好习惯和消费行为等信息而抽象出来的标签化画像)。
上图就是一个简单的用户画像,根据不同业务需要,画像内的属性标签也不尽相同,主要包含:
人口属性:姓名、性别、年龄、生日、星座、身份证等
设备属性:电话、机型、设备价格、操作系统等
地域属性:常住地点、工作地点等
社会属性:好友、职业、收入、学历、婚姻状况等
消费属性:消费水平、消费周期等
产品属性:使用自身产品的行为
其他产品属性:使用其他产品的行为
所有的标签,都是通过采集用户各类属性数据,再根据相关的算法生成。如果底层的数据缺乏真实性,那么最终得到的标签也是无法使用的。那么重点来了,这些数据都是如何采集过来的呢?
手动敲打小黑板,重点来了!下面主要以APP为例来介绍采集数据的方法。(其实这块东西处于灰色地带,所以世面上也很少有人拿出来讲,所以大家自己看看就好。。)
1、人口属性(姓名、性别、年龄、生日、星座、身份证等)
1.1、在产品内引导用户填写相关信息或进行实名认证(身份证内其实包含了性别、年龄、出生地、生日、星座)
1.2、通过第三方登录(openID)的形式,可以从第三方开放接口拿到部分信息,比如QQ(昵称、性别、年龄、生日、星座、地域)、微信(昵称、性别、地域)、微博(昵称、地域、最近发的微博)
1.3、接入第三方数据服务(如贵士、极光等),但采样率和准确率有待商榷
2、设备属性(电话、机型、设备价格、操作系统等)
2.1、安卓:一般系统有很多接口供客户端调取,机型、操作系统可直接调取,电话一般能获取联通和电信的(采样率60%左右),移动由于不在sim卡内,貌似无法拿到,但是现在三大运营商都提供号码验证的增值服务,可以通过这套服务来直接获取。设备价格的话可以通过机型,然后去爬淘宝数据来得到。
2.2、IOS:除了无法直接采集电话,其他和安卓基本一致。
2.3、接入第三方数据服务(如贵士、极光等),采样率和准确率还不错。
3、地域属性(常住地点、工作地点等)
3.1、目前来说系统已经提供接口给客户端直接采集地域数据了,开关就是你每次进入应用提示是否让该产品获取你的地域信息(但是部分安卓机就算拒绝也可以被获取到我就不说啥了),常住地和工作地可以通过使用时间变化来判断。
3.2、接入第三方数据服务(如贵士、极光等),采样率和准确率还不错。
4、社会属性(好友、职业、收入、学历、婚姻状况等)
4.1、这块数据除了好友(通过社交链或读取通讯录可以直采),其他基本无法获取,但貌似运营商那边是能提供解决方案(你懂得)
4.2、通过机器学习来训练得到(这里不详述)
4.3、接入第三方数据服务(如贵士、极光等),但采样率和准确率有待商榷
5、消费属性(消费水平、消费周期等)
5.1、对接电商产品来获得(如果你自己就是电商产品那再好不过了)
5.2、通过机器学习来训练得到(这里不详述)
5.3、接入第三方数据服务(如贵士、极光等),但采样率和准确率有待商榷
6、产品属性(使用自身产品的行为)
6.1、开发埋点,统计上报
6.2、接入第三方数据服务(一般是SDK,例如友盟),由第三方统计上报
7、其他产品属性(使用其他产品的行为)
7.1、安卓可以直接采集(安装列表、前后台运行情况),IOS无法做到
7.2、对接第三方服务(例如贵士、极光),通过IMEI获得该数据(一般提供MD5加密后的IMEI),采样率和准确率还不错。IOS无法做到(不过最近有些第三方服务正在研究这块,可以关注下)
题外话:PC上通过插件进程采集游览记录真的很普遍,大家注意呐。。
好啦,数据采集的方法就讲到这里,如果有更多的方案可以积极交流。。!
二哈,互联网产品狗,码字很慢,性格尚可,不喜可以喷,不定期更新中。。。
互联网金融的的核心在于风控系统,这篇文章就给大家讲下风控模块里边的用户信用画像构建、反欺诈服务。
?一、用户信用画像构建
说到用户信用画像的构建对于整个风控体系的作用毋庸置疑,不同的金融平台可以根据自身的业务场景以及能力构建自己用户画像,毕竟有些画像的数据自身没有也很难从其他的三方平台获取,所以构建的时候要根据自身的业务场景和公司情况量力而行。
用户信用画像的组成体系包括但不限于以下几点:用户身份信息、婚恋社交数据、芝麻信用、用户认证数据、消费收支数据、用户行为数据、人行征信报告、互金和银行黑灰名单、设备相关数据等。
1.1 用户身份信息
该信息的获取是这九大数据里边比较容易获取到的数据,其中包括用户的三身或四身数据、居住地、婚姻状况、子女情况、工作单位、职位、房产、收入、联系人数据等,该数据用途多用于贷前信用评估、用户平台入驻前的认证。
1.2 婚恋社交数据
婚恋社交数据在整个信用体系里边承担着一个什么样的角色呢?
其他数据类型可以看出一个人的信用水平、还贷能力,消费水准、用户行为等等,但是涉及到人格品质方面的评估就略显乏力了,一个人在家庭的的责任、社交的言论、人生的规划、社交圈子等种种产生的行为的数据,更能反映一个在当下社会主流的人格品质范畴属于什么角色定义。
在婚恋社交情况里边有几点数据尤为重要:家庭情况、房产情况、学历情况、生活作息、爱情规划、爱情账户等级、婚恋社交信用度、社交人脉圈等。
1.3 芝麻信用
芝麻信用在现有的信用体系里边也是占据了一定的地位,很多涉及到资金一块的信用认证多数会将芝麻信用列为评判标准之一。
其中主要包括信用评分、行业关注名单、申请欺诈评分、欺诈信息验证、欺诈关注清单、企业信用评分。
1.4 用户认证数据
现在用户的认证数据主要有几块,公积金社保、运营商通信、学历数据(学信网)、职业数据(脉脉、猎聘、BOSS等职业招聘平台的认证数据)
1.5 消费收支数据
消费数据在几个数据里边是比重比较重的一个,关系到个人的经济水平、偿还能力、以及消费行为的判断,消费收支数据主要包括以下几点:线上电商和线下消费、银联消费、银行卡收支、航旅出行数据等。
1.6 用户行为数据
用户行为数据可以将申请表单的填写时间和借款协议页面停留时间,作为参考数据之一。
1.7 人行征信报告
人行征信的数据就不用多说了,是金融征信取证的重要依据之一,包括用户的贷款信息、信贷交易信息、个人公共信息。
1.8 互金和银行黑灰名单
互金和银行的黑灰名单可以作为搭建风控里边黑灰名单的一个重要依据,黑灰名单里边包含信贷逾期名单、司法不良名单、多头申请和多头负债名单、团队欺诈名单等。
1.9 设备相关数据
设备的相关数据有几个维度的数据比较重要,设备的指纹和面部识别、设备硬件信息、GPS定位、设备安装APP数据。
二、反欺诈服务
不同的金融应用场景,有着不同的业务流程和环节,需要设计不同的风险检查环节和风控策略,构建完成基于场景、事件和规则驱动下的欺诈风险判别服务,通过灵活配置就能满足不同场景下、不同业务环节欺诈风险判定的能力。
理财应用:激活事件、注册事件、登录事件、认证事件、绑卡事件、活动时间等场景;
借贷应用:注册事件、登录事件、绑卡事件、充值事件、授信事件、放款提现事件等场景。
通过反欺诈模型、用户行为分析、风险信息库和反欺诈规则库判定客户的信用度。
2.1 评估维度
(1)身份评估模块
设备异常评估: 设备绑定认证、设备相似度评估、跨机构设备注册。
地理位置评估: GPS ip评估、陌生交易地区评估、跨地区跨机构、GPS定位与申请地址不符;
客户环境异常: IOS越狱、安卓ROOT、公共WIFI、疑似木马应用;
习惯相似度评估: 大小写习惯、阅览时间、客户输入法行为;
客户身份核查: 姓名、身份证、手机号、人体活体验证。
(2)信贷交易行为评估
交易行为:交易时间习惯、交易频率、短时间交易数量、交易金额;
(3)信用评估
欺诈信息库:设备欺诈库、IP欺诈库、账号欺诈库;
失信信息库:信贷逾期名单、司法不良名单、多头申请多头负债名单、团伙欺诈名单;
欺诈关联图谱:欺诈关联图谱。
2.2 反欺诈策略
(1)七大策略
(2)信贷全流程
用户注册: 三要素核身、客户端环境检测、注册设备是否关联多用户;
登录: 异常设备登录检测、异常登录地检测、异常登录IP检测、登录异常人脸识别
开户绑卡: 四要素核身、人脸识别、设备是否绑定多银行卡开户、银行卡是否涉及欺诈;
申请授信: 欺诈名单对比、失信名单对比、多头申请贷款对比、多头逾期负债名单对比、关联人欺诈名单对比;
确认用信: 虚假用信效验、信用行为记录;
提现: 同卡同出监控。
三、最后
本文章是作者学习内容的一些整合,最近在研究风控这块,有感而发,如果有什么好的建议可以下方评论,互相探讨下。
本文由用户上传,如有侵权请联系删除!转转请注明出处:https://nongye.s666.cn/bk/6_6572068744.html