大数据能力培养:一次看懂淘宝『假货门』数字真义

责任编辑:editor005

作者:邱小黑

2015-02-12 14:25:36

摘自:中国大数据

很多人都在说『大数据能力』很重要,但是在我看来很多人对『数据分析』的角度及方式都不太正确。最近刚好有一个淘宝(阿里巴巴)被中国的工商总局说正品率只有 37 25% ,引发网路热议,甚至将面临集体诉讼。

大数据

很多人都在说『大数据能力』很重要,但是在我看来很多人对『数据分析』的角度及方式都不太正确。最近刚好有一个淘宝(阿里巴巴)被中国的工商总局说正品率只有 37.25% ,引发网路热议,甚至将面临集体诉讼。但是,这数字及实际状况是正确的嘛?今天我们就以这个案例来看,数据分析最常犯,或是该建立的心态

一、数据背景

要做数据分析,首先你必须先完整的了解最塬始的数据资料(raw data),如果你要分析的资料数据是经过很多手,那这个数据可信度及实用度就差很多。所以我们溯本穷源找到最塬始的这份『2014年下半年网络交易商品定向监测结果』,我们就可以发现,很多媒体的报导『中国官方抽验:淘宝网6成山寨货』、『官方狠掴马云:淘宝网63%是假货』脑补的标题就都是错的,因为以工商总局的定义只有『正品』、『非正品』两者而已,而『非正品』的定义也很明确,只要是

1. 伪劣产品2. 翻新产品3. 非授权正规渠道4. 含量与宣传不符产品5. 无3C认证6. 非中国大陆地区官方正品7. 不符合《消费品使用说明化妆品通用标籤》要求产品

以上都属于『非正品』,所以『非正品』也就不一完全是假货, 但同样的定义放到台湾的 Y拍跟 P拍,会有怎样的结果呢?我想答案会是差不多多的数字,淘宝本来就是一个以 C2C 为基础的交易平台。水货、单帮货那些上不了 B2C 平台的,都只能在此生存。所以我们在看许多指标数字的时候,必须要先看清楚其维度分类的定义为何。就像最近我在看后台的时候,发现有个『新使用购物金数量』,对于这个定义我跟我同事都觉得怪怪的,因为ASAP的满额购物金理论上应该不会有『新使用购物金数量』(因为这是发给已购买的老客户)的出现,可见我们跟工程师那边的定义有点落差,后来经过沟通后,互相了解定义后,看到数字,才能做出正确的判断即预测。

所以马云称之为「网货」也真不过分,你也可以在 Y拍上买到海洋迪士尼限定的Dufy,也可以不用集点就可以买到超商的整套蛋黄哥,也可以用接近半价的价格买到空姐从欧洲带回来的精品包。以上在工商总的定义下都是「非正品」。大多数的『正品』其实都在 B2C 或是 B2B2C 平台去了,这 37.25% 的数字其实是值得玩味的,如果正品率真的有这么高(对,你没看错,是高),这其实淘宝带起了一股新的网路销售风潮啊。『网路品牌』的崛起,那些只打传统通路的大牌子都得要小心。

二、样本数多寡

不过 37.25% 这个数字是很瞎的,根本不值得一提,你知道这次淘宝抽样的商品数有多少嘛?51件产品!就算是部分媒体写说:淘宝买手机全都是假货,也是因为他只抽样 4 支,而且『假冒伪劣』的定义其实也不明确。在数据统计的领域内,其实看样本数的大小及组成是很重要的,像这次监测结果,就完全是个不科学且乱七八糟的统计。裡面的其他数字比例其实都可以忽略不看了…

三、谁说这数字、对谁有利?

通常一份调查报告要看之前,你必须要先了解,自从『内容行销』被广泛吹捧之后(事实上内容行销一直都存在),网路上总是充斥着许多『统计整理报告』,但是『谁讲这句话』一定很重要,相信我:绝大多数的人都只会讲对自己有利的事情,工商总在1月23号发的『2014年下半年网络交易商品定向监测结果』其实是个假议题,真正的目的是为了1月28日的『关于对阿里巴巴集团进行行政指导工作情况的白皮书』。我先做好一个大家调查报告,全部各打50大板,其中再找一个出来修理。至于为什么要修理阿里巴巴,那就不在我们的讨论範畴了。

所以我在许多场合裡面都讲过,面对数据的第一心法就是:不要相信数据,环境随时间而变,以最新的状况做判断。

链接已复制,快去分享吧

企业网版权所有©2010-2025 京ICP备09108050号-6京公网安备 11010502049343号