声称性别、行为性别&真实性别

前些日子参加一个有意思的分享,分享中提到一个数据,来自淘宝

消费者在网上经常购买的商品

我当时举手问了一下,这个“性别”,是怎么知道的,主讲人表示是用户填写的。

再看另一个数据,搜索关键字“快乐女生”的用户中的性别占比,来自百度指数

 百度数据中的性别信息,又是怎么来的呢?我百度了一下,百度官方解释是(http://www.baidu.com/search/index_help.html):

人群属性分布:
根据百度用户搜索数据,采用数据挖掘方法,给出的关键词检索人群社会属性方面的统计,包括性别比例、年龄分布、职业分布、学历分布。

一个是“用户填写”,一个是“数据挖掘”。

必然结果是,存在一些场景,用户填写的属性,和数据挖掘分析行为得到的属性,是不同的。

比如一个注册为男性的账号,不停地买女性用品、化妆品、首饰之类,分析其行为,就会与大部分女性类似。我们说,这个账号的声称性别是“男”,行为性别是“女”。

当进行行为分析、以及精准营销之类的活动时,根据情况不同,应该采用不同的属性。

比如,化妆品或者女装大促营销,应该更倾向于选取行为性别为“女”的账号进行。不管是她在注册时不小心填错了性别,还是他是个热爱妇女的纯爷们儿,或者他性格婉约喜欢阴柔得打扮自己,而且,这类商品即使算法有偏差,营销推送错误,只要文案处理的别致一点,也不太会造成用户反感(卫生用品等比较敏感的商品,还是要稳妥一点,比如只投放声称性别和行为性别都是女性的用户群体)。另外,分析“为异性代付”的行为时,有可能可以使用“声称性别”与“行为性别”矛盾的用户集合,也是个思路。

相较于声称性别和行为性别,用户的真实性别在进行更精细化服务和运作,比如1v1时才显得重要起来。关于这个,我想说的是,应该利用crm等手段,尽量保证用户的声称性别与真实性别相同。

类似的概念,我想也是可以类比到其他用户属性上的,比如年龄,爱好之类。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

评论审核已启用。您的评论可能需要一段时间后才能被显示。