概述
作为一名摸爬滚打三四年的普通数据运营来说,数据分析师应该是最终的归宿,今后我将在数据分析这个板块展示我在过去几年中接触且做过的一些脱敏案例,记录自己的经历的同时也希望能帮助到可以搜索到我博客的各位;闲话不多说,我将开始今天的案例分析 ——销售数据分析。
数据介绍及解释
数据介绍
此次数据展示的是国外的数分课程作业,共有4张表,18个数据维度,共计上万条销售数据;内容为销售的各项数据,包含订单、产品销售、会员以及退换货情况,数据体量不大,但是表结构适当,维度较为丰富,适合最一开始的接触和练手。
数据解释
Order details 为订单表,主要记录了订单下单时间、发货时间、和发货方式;
Product details 为产品销售表,其中一个订单中的多个产品被拆分成多行,主要记录了产品的销售情况,包含了一部分产品本身的信息,和一部分销售金额相关的信息,该表的订单ID和产品ID都有重复;
Customers 为用户表,主要以用户的地址信息为主;
Returns 为退货信息表,记录用户的退货信息。
数据源下载
分析要求
数据的预期结果是:
描述采用的数据清理和/或数据准备步骤;
通过可视化显示获得的见解,并在报告中清晰呈现;
保持内容一致性和结构化;
总体总结和基于见解的必要建议。
报告相关的预期的结果是:
运用适当的数据分析知识和技能,以实现组织上的效益的增加。
利用数据分析有效地组织、管理、对复杂问题进行批判性分析和沟通,解释业务问题和提供机会。
简而言之就是处理对数据、根据数据解决问题。
具体的分析步骤(Excel)
分析目标确定
借助销售数据,希望通过数据分析,帮助提高业务利润收入;同时对货品选择备货等分析,尝试提出优化实际业务的方案。
查看excel源数据
源数据分为四块,分别为订单数据,产品数据,消费者数据与退货数据。
数据记录的方式为,根据产品ID与订单ID,作为联合字段,记录了产品的销售记录;核心字段包括产品的销售额、利润、品类等。
数据准确性校验
拿到数据第一时间应该先进行大概的处理,毕竟系统表或者人工表都会存在多少的问题,或者有些不算问题,只不过没有太大作用;
首先对order details表
进行去重,由于row_id(行号)
对于分析没有意义,遂将其删除。利用数据选项卡-删除重复值数据
,对数据进行操作,得到5009行订单记录。
同样对Product Details表
进行数据查看,利用透视表,发现有Order ID
和Product ID
重复出现的情况,经查看,将这样的数据认为是一个客户在同一个购物车中添加了多件商品,故不当成异常值处理,所以也就不对Product Details表
进行去重处理。
Customers表
是用户信息表,包含了重复的order id
,所以进行去重,同样得到5009行数据;
Returns表
没有重复值,所以保持原样不进行处理。
最后一定要注意,查看是否有缺失值,因为缺失值和错误值都属于着重要注意的,有些有用有些可能至关重要,利用 excel -查找-定位空值
的操作,经过操作未发现缺失值。
数据合并
数据合并可以让表进行字段的合并,从而方便处理数据,当然不分表也可以,可以利用power query、powerbi等工具进行处理,由于本节使用的是Excel,所以我们不讨论不分表的处理方式。
合并表是Excel中的基操,利用vlookup
这个我们能接触到的第一个实用的公式来进行合并操作;首先我们要单独复制出来Product Details表
作为基础表,这样的操作可以保证数据的完整性,使得原始数据不会被破坏,当然你复制的时候不要crtl c+v,最好是直接给Product Details表
建立一个新的副本。
建立新的副本后,将sheet名称改为“基础数据”;将订单表和用户表的信息匹配过来,使用带有绝对引用的vlookup
公式方便实现快速匹配;由于vlookup
函数限制,所以将其余表order id 列
移动至首列,可以选中该列,然后按住shift往前拖拽进行快速操作(图1是为了方便调整的vlookup函数,图2是总体合并后的表格)
数据清洗
将合并到一张表的基础数据表
复制一份至新的基础数据(粘贴)
,为了防止数据可能受到影响,将公式全部粘贴为值格式
。
1. 首先将Order Date
与 Ship Date
格式转换为日期格式;
2. 将returned
列的#NA值改为0,YES 改为1(可以使用查找/替换
,或者直接用if公式
);
3. 将sales
与profit
换为货币格式
;
4. 将 Postal Code
,country
,region
列隐藏。
数据分析
我们对数据进行了初步的清洗,现在要对数据进行分析,我们将从整体到部分,对数据进行细致的分析,以便可以应对业务的需求。
整体的销售及利润情况
简要分析:商城整体销售额、利润基本都在逐年增长。
对货物的分析
产品大类销售及利润占比
Furniture
类目每年平均销售占比达32.5%,但是利润平均占比却只占有6.5%,且呈现逐年下降的趋势;说明 Furniture
类目并非商城核心利润类目;我们需要进一步判断Furniture
类目的情况。
各品类的利润分布
我们对所有子类按照利润进行排序,发现了在Furniture
类目下有两个子类几乎每年都在亏损,尤其table
子类累计亏损已达16667美元;同时也在Office Supplies
类目下发现Supplies
也在逐年亏损,且亏损规模在扩大;另外Technology
下的Machines出现不稳定因素,可能需要调整销售策略;初步判断应该停止tables
、bookcases
、supplies
的进货,在处理完库存后,关闭该销售品类;在确认该确定前,需要查看子类的销量情况,因为有些品类可能存在以低利润换取销售数量的情况。
各品类的销售占比分布
从该图发现 tables+bookcases
在Furniture
中占比仅为26%,Supplies
在Office Supplies
中占比仅为3%;Machines
在Technology
内占比为6%;确认调整意见判断应该停止tables
、bookcases
、supplies
的进货,在处理完库存后,关闭该销售品类。
对地区的分析
对销售地区的分析
在去除上一节提到的三个之类后,通过查看查看有几个州销售额度不错,但是却出现大量亏损的情况。地区无法像品类一样,可以简单的停止销售。
所以我们需要具体查看是什么原因到导致了亏损。
我们知道利润=销售定价*(1-discount)-成本
,其中只有销售折扣会变动,所以我们先探究地区和折扣的关系。
利润、折扣、地区的关系
首先给源数据新建discount_bucket
列
=SWITCH(TRUE, G2>0.8,"0.8-1",G2=0,"no_discount",G2>0.6,"0.6-0.8",G2>0.4,"0.4-0.6",G2>0.2,"0.2-0.4",G2>0,"0-0.2")
由上图可以看到,利润为负的州折扣非常集中,且折扣价格都超过了20%;
从图中可以明确的看出,超过了20%的折扣,导致了近10个州的利润为负;
初步判断,对于个别州的运营策略需要调整,调整商品折扣情况;
对折扣的建议:
将亏损的州设置一个组,可以看到亏损组的平均折扣率为33.6%而其他州的平均折扣率为4.2%;
由于在售的商品的利润空间在34%,所以如果想达到其他组利润率,可以将折扣设置在5%左右;
考虑到折扣会影响到销量,可以适当将折扣设置在15%以上,并根据后面的实际销售情况不断测试数据。
按品类查看折扣率和利润的关系
首先我们引入几个字段,Average of profit_rate
是每个品类对应的利润空间,计算方式为(定价-成本)/定价(也就是在定价即售价的情况下,计算出的利润率);
Average of discount
是每个品类目前实际的折扣率,可以看到目前实际折扣率大于利润空间的有 tables and bookcases ,那这两个品类必然会亏损;
同样supplies
也是亏损的,但是实际折扣率仍在利润空间范围内,是由于受到具体商品的定价和销量所影响的,利润率可以衡量商品的盈利能力,但是具体利润需要靠 销量及利润值所决定的。
所以针对实际折扣率已经在利润空间之外的,如果不考虑停掉该品类的售卖,需要将实际折扣率至少调整至利润空间以内。tables调整到 20%以内,bookcases调整至19%以内。同样考虑到上面说的实际商品的影响,保险起见,折扣率调整在10%左右,可以保证利润~
用户RFM分析
什么是rfm?(以下内容借助ChatGPT)
RFM分析是一种客户价值分析模型,用于通过三个关键维度(R、F、M)来评估客户的行为和价值。这三个维度分别是:
1. R(Recency,最近一次消费): 客户最近一次购买行为发生的时间距离当前时间的长短。通常,最近消费的客户更有可能再次购买,因此R值越低,客户价值越高。
2. F(Frequency,消费频率): 客户在一段时间内的购买次数。通常,购买频率较高的客户更忠诚,也更有可能继续购买,因此F值越高,客户价值越高。
3. M(Monetary,消费金额): 客户在一段时间内总消费金额。消费金额越高,表明客户对公司贡献越大,因此M值越高,客户价值越高。
通过RFM分析,可以将客户划分为不同的群体,例如高价值客户、潜在流失客户、新客户等,从而帮助企业制定更有针对性的营销策略和客户管理计划。
下面做了个简单的图,以便我们可以方便用Excel进行量化分析:
客户类型 | R | F | M |
---|---|---|---|
重要价值用户 | 1 | 1 | 1 |
重要发展用户 | 1 | 0 | 1 |
重点召回用户 | 0 | 1 | 1 |
重要挽留用户 | 0 | 0 | 1 |
潜力用户 | 1 | 1 | 0 |
新用户 | 1 | 0 | 0 |
一般维持用户 | 0 | 1 | 0 |
流失用户 | 0 | 0 | 0 |
RFM计算
首先从基础数据(粘贴)表
建立新的透视表,利用透视表的分组求和等功能初步得出R、F、M的数值。
将透视表结果单独复制,然后利用excel 公式得出R(最后一次购买时间距今天数),因为数据是2017年的,所以为了真实模拟分析,所以将计算日期也就是今天设定为2018-1-1
。然后利用标准化公式计算RFM每一个字段的标准化分数,以J列R的值为例,其他以此类推=STANDARDIZE(J2,AVERAGE(J:J),STDEV.P(J:J))
。
利用=IF(K2>AVERAGE(K:K),0,1)
公式判断RFM最终得分(此处依旧以R举例)。目前采用1、0两类分组,最后按照RFM用户图可以得到8种类型的用户。
将RFM分数合并,然后利用下方公式进行判断。得到8种类型的用户。
=SWITCH(TRUE,Q2="111","重要价值用户",Q2="101","重要发展用户",Q2="011","重点召回用户",Q2="001","重要挽留用户",Q2="110","潜力用户",Q2="100","新用户",Q2="010","一般维持用户",Q2="000","流失用户")
最后根据数据制作树状图,以便清晰的看出不同类型的客户的占比情况。
RFM分析与应用
RFM是利用客户已有的购买记录,进行数字化的分析,并对用户进行分群,核心作用可以帮助企业降低营销成本,增加回报。
通过R最近消费日期距今天数,F客户累计消费次数,M客户累计消费金额三个维度,对于客户的价值进行判断,并且辨识出用户的类型,这有助于我们开展营销活动。
在上一节中,我们已经完成了用户的分群,下面提出一些不同的营销方向,具体的动作需要根据商家实际的业务情况开展,但是方向是不变的~
通过图表可以看出,有三种客户类型占比很大,我们需要对重要的用户群进行不同的策略引导:
对于重要价值用户、一般维持用户,我们可以保持现状不变;
对于新用户我们要做好新用户引导;
对于潜力用户我需要增加刺激力度,引导用户消费高客单价的产品;
对于重要发展用户,我们需要增加站内活动,引导用户进行多次消费;
对于重点召回用户,我们需要尽一切可能将其召回,同样重要挽留用户我们也需要挽留
放弃流失用户,可以在营销成本不高的情况下进行召回测试。
发货体验
常规运输方式的送达天数达5天,发货量却占比高达60%,物流快递的速度严重影响用户体验,从长远角度考虑,公司应该不断优化自己的运输周期,以便更好的留存用户。
退货分析
查看了四年的退货率,逐年略有增长。
接着对数据进行探索,查看了退货率和产品、和顾客类型,发货方式等都没有明显差异。
在分析地理位置时发现,在不同的地区退货率有明显差异。
西部地区平均退货率高达11.73%,高于其他地区退货率的四倍。建议对西部物流等影响物品运输的因素进行筛查,如果是因为物流供应商的问题,需尽快更换服务商。
附件:(原始数据和清洗后数据都在一起)
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>动态调整OneDrive嵌入</title>
<style>
/* 设置div容器的样式 */
.iframe-container {
position: relative;
width: 100%; /* 宽度为100%,即全屏宽度 */
height: 0;
padding-bottom: 86.07%; /* 根据iframe原始宽高比例计算:346 / 402 ≈ 0.8607 */
overflow: hidden;
border: 1px solid #ddd; /* 可选的边框 */
}
/* 设置iframe的样式 */
.iframe-container iframe {
position: absolute;
top: 0;
left: 0;
width: 100%;
height: 100%;
border: 0; /* 移除iframe边框 */
}
/* 设置全屏按钮的样式 */
.fullscreen-btn {
position: absolute;
bottom: 10px;
right: 10px;
background-color: rgba(0, 0, 0, 0.5);
color: white;
border: none;
padding: 8px 12px;
cursor: pointer;
font-size: 14px;
border-radius: 4px;
}
.fullscreen-btn:hover {
background-color: rgba(0, 0, 0, 0.7);
}
</style>
以上就是一个简单的excel数据分析,涵盖了比较常见的零售/电商行业,希望对你有帮助~
评论区