先把我做的数据截图贴出来,把我的思考过程写下来,有时候发现,写东西本身其实也不是完全为了分享,而是加深自己思考的印象,在写的过程中,对梳理清自己的思路起到很大作用,所以一旦有新的启发,还是得写一下,是个不错的习惯。
前面的场景是受一企业委托,向我咨询女装市场现在该如何做?首先我摸清了该企业的产品方向,属于红海市场,所以回来后,我就看了数据,把现在该类目的市场数量最多的人群画像写了下来,做人群画像分析前,先判断产品属于红海还是蓝海市场挺重要的,红海市场的话,就要选市场人群数量最多的去分析,蓝海市场就要精准分析特定人群了。
我把人群大概分成了六类,第一类18-25岁0-50元消费力的,第二类18-25岁50-100元消费力的,第三类18-25岁100-200元消费力的,第四类26-30岁0-50元消费力的,第五类26-30岁50-100元消费力的,第六类26-30岁100-200元消费力的,这六类人群画像分别都带有两种维度,一个是年龄,一个是消费力,在上图我做的数据列表中可以看到,人群画像基数最大的是18-25岁在全网人数占比30.81%,0-50元消费力的占比47.81%,即第一类人群占比78.62%,这类人群主要购买的价格区间分布在0-30元,30-50元之间,属于低端人群,逐轮人群分析对比过后,根据该企业理想中的市场定位,我给出的策略是,根据第六类人群画像做主要的产品定位,基础客单在130-250元之间,按照这类人群的偏好做产品设计,每类人群画像的偏好属性上图可以看到,休闲裤、T恤、连衣裙、雪纺衫为主要细分类目,然后再根据这类人群画像去做特定的核心词、搜索词、修饰词分析,根据这些词挑选款式,然后再设置一个50-85元客单的产品类做卡位,这类产品根据18-25岁50-100元消费力的人群画像做定位,也就是第二类人群,这样做的好处是,把18-30岁50-200元消费力的人群也卡进来了,意思是主推产品根据第六类人群做定位,这样也辐射到了第三类人群18-25岁100-200元消费力的,然后副推产品根据二类人群做定位,也辐射到了第五类人群,26-30岁50-100元消费力的人群,这样的产品组合拳涵盖的人群基数最大,简单说就是按高端定位,然后向下延伸中端市场,把低端市场踢出去,这样的一份数据有理有据,店铺还没启动前就已经完整呈现了整个店铺目标人群画像,往后的事情就是根据这个人群画像做虚拟文化输出,就是文案、拍摄、风格定调、视觉设计等工作,起初挑十来个款上车测试数据,然后根据数据微调主推款,最后配合适当营销引爆流量。
昨晚,很多人都默默打开淘宝,搜索了一下连衣裙。甚至有几个男性朋友也很好奇搜了一下——他们从来没在网上买过连衣裙,甚至很少在上面购物。
但他们就像被某种病毒感染一样,想看一下第二条和第三条推荐结果。
这种莫名其妙的行为艺术,源头是网友“风中的厂长”发的一条微博:淘宝连衣裙客单价低于128,会被淘宝方面标注为“低价人群”。
这位网友进一步论证,淘宝连衣裙客单价低于128元,或者滴滴好评率低于4.8的女性,电商行业的人都不会和她们恋爱,因为这样的人往往会比较“难搞”、“难伺候”。
很多女性“吓得”赶紧打开淘宝,然后纷纷晒出自己连衣裙的客单价。我朋友圈里,很多女性朋友晒出的客单价大多远远高于128元。
相信这些朋友不但长舒一口气,内心也很是满足:这个数字,虽然证明自己花了不少钱,但也让自己脱离了“低价人群”的嫌疑。
这种“行为艺术”,形成了某种舆论,淘宝官方很快出来回应称,所谓128元客单价以下被系统默认为“低价人群”的事并不存在。用户的偏好不是静态的,算法难就难在要做出个性化推荐,对每个人的推荐,都是基于对其消费习惯的动态捕捉上。
一、大数据正在捕获我们,这是真的
淘宝官方的回应大抵是可信的:如果说消费习惯和人的性格之间真的有某种可靠的联系,那也一定有更复杂的解释,否则花那么多钱搞数据分析就完全是浪费了。
但是,这么多人相信“风中的厂长”所发布的“128定律”,并不是毫无来由。
到了2019年,一个普通的电商用户,也知道了“大数据”这个词。有过网购经历的人都知道,平台会根据自己的购买行为,做进一步的推荐。
你买了一件连衣裙,会给你推荐连衣裙。更高明的算法,可能还会给你推荐一款用来搭配的凉鞋。
如果你买的连衣裙是128元的,推荐的凉鞋价格也不会高到哪里去——价格,毕竟是一个考虑的因素。
把连衣裙客单价低于128(也可能是别的数字)的人统一划分为一个人群,用来分析她们的消费习惯、投诉数量,也不是没有可能,因为这可以改进平台的工作效率。
但是,把用户称作“低价人群”,总是不太礼貌的行为。更重要的是,一个花128元买连衣裙的女士,也完全有可能花几千块买一个包包。
网友纷纷晒出自己在某购物APP中的搜索结果。
真正厉害的算法,应该琢磨的恰恰是更个性的东西,最终让自己的推荐更打动消费者。
换句话说,大数据对人的捕获能力,可能已经远远超过了用128客单价来区分人群这种低级阶段。我们可能被以别的标准做了区分,或者被贴的标签远远不止价格这一个。大数据为我们提供了方便,更为商家提供了方便。
很多人相信这个“128定律”,本质上就是把大数据想得太简单了。他们是把“自己的数据”理解为大数据。
事实上,大数据不但动态捕捉你自己的数据,还会在海量的数据中进行计算,背后有复杂的模型——这可能不是多数非专业人士所能想象的,而大多数相信“128定律”的人,这时候的表现就像典型的文科生(并非黑文科生)。
二、标签与认同:为自己标一个价
更值得注意的,其实是网友的反应。他们相信“128定律”,除了对大数据的误解外,还有一种情感因素。
很多朋友并没有感到被这个所谓的“128定律”冒犯,她们乐此不疲地去看自己的连衣裙价格,甚至连男人们也行动了起来,跑去搜索——大家想知道,自己是否属于这个“低价人群”。
“128定律”是否靠谱并不重要,大家需要的是一个可以区分自己的标签,最好是一个“价格标签”。
在互联网时代,每个人都想“脱颖而出”,提高自己的“能见度”,如果能被淘宝这样的大平台标注为“高端人群”,我相信很多人都会毫不犹豫地发朋友圈晒出来。
其实,不少以“低价人群”自居的,其实也在以自嘲的形式,来标榜自己的身价。
想想吧,每年底,有多少人在晒自己的年度支付账单,一方面假装后悔地反省,一方面在晒自己是多么有钱,花钱越多的人,晒得就越开心。
支付宝2018年度账单。图/视觉中国
很少有人在乎,这个账单其实也是个人数据。
这是一种新的寻求认同的方式。大数据在“捕获”我们,在分析我们,甚至在算计我们,但是我们似乎不在乎。我们爱它呈现出来的“客观性”,我们发自内心地认可它给我们的“定义”。
三、警惕反向塑造自己
这才是最值得警惕的。我们似乎正在丧失对“自我”的掌控,越来越依靠这些大数据平台为我们描绘的“画像”。
更进一步,我们会根据这些“画像”来调整自己,让自己更符合平台对我们的设定。
这可能就是那些算法工程师梦寐以求的:他们不但要懂我们、分析我们,还要真正影响我们。
最终,我们会变得越来越像一个数据。或许有那么一天,系统会提示我们,“根据你的习惯,这件128元的连衣裙就是最适合你的”,而我们也会心安理得地接受。
但可以肯定,大数据算法不可能仅仅从你的某一个行为就定义你好不好打交道,适不适合做女朋友。把穿128块钱连衣裙等同于“低价人群”,是对大数据算法的降维打击,不准确,也不客观。
□ 张丰(媒体人)
编辑 王言虎 实习生 李文隽 校对 陆爱英