欢迎关注天善智能微信公众号,我们是专注于贸易智能BI,大数据,数据分析范畴的垂直社区。
对贸易智能BI、数据分析发掘、大数据、呆板学习,python,R感爱好同砚加微信:fridaybifly,约请您参加数据爱好者交换群,数据爱好者们都在这儿。
业务上要处理惩罚的Excel数据表格存储量越来越大,高出30MB就慢如蜗牛,这时表格里要是再多个IF、VLOOKUP函数什么的,电脑就直接罢工了;要是碰到向下面如许巨细的Excel表格,服务器级别的电脑都吃不消,更别谈举行数据处理惩罚和数据分析了。
碰到上图这么大存储量的Excel数据表格,小喵和小搭档们也是惊呆了,Excel玩转没多久,就碰到如许的困难,有没有能处理惩罚大存储量文件,同时又操纵简单、轻易上手的数据分析软件呢?
答案是固然是:YES,而且还是Excel的同宗兄弟,同属微软Office派系的ACCESS。
以下内容将以运营中常见的一个分析项目为案例(详情见“数据运营实操|怎样运用数据分析对某个试运营项目举行“无死角”的复盘?”),力图让做数据分析的小搭档们对ACCESS有一个根本的相识,从而找到分析大批量数据的思绪和方法。
下图是本文利用ACCESS对原始表格举行数据分析的4大目标。
一、ACCESS数据库简介
1.ACCESS和SQL语句的根本概念
Access,全称“MicrosoftOfficeAccess”,是微软OFFICE中的一个成员,由微软发布的关系数据库管理体系。它连合了MicrosoftJetDatabaseEngine和图形用户界面两项特点,是MicrosoftOffice的体系程序之一。(来自百度百科)
提到ACCESS,就不得不提SQL,只有把握了SQL,才华将ACCESS的功能发挥到极致。SQL的全称是“布局化查询语言”(StructuredQueryLanguage),是一种声明式语言。
起首要把这个概念记在脑中:“声明”。跟各人以往所知的编程语言相比,SQL语言是为盘算机声明白一个你想从原始数据中得到什么样的结果的一个范例,而不是告诉盘算机怎样可以或许得到结果。换言之,SQL的真正核心在于对表的引用。
SELECTfirst_name,last_nameFROMemployeesWHEREage=25
上面的例子很轻易明白,我们不消关心这些雇员记录从那边来,我们所必要的只是那些年龄大于便是25岁的雇员的数据(age=25)。
2.ACCESS的上风
ACCESS最显着的长处在于,它可以在不消把握很高深编程语言的条件下,处理惩罚Excel所不能承载的大存储量的数据原始文件,速率奇快,且易学易用。
3.ACCESS的常用语句
下表是ACCESS利用过程中常用的一些SQL语句,明白起来不算困难。
ACCESS数据库常用的SQL语句
要想学好数据分析工具,最紧张的是用实际案例来变更各种琐屑的工具利用知识点,在历经完备的案例分析后,短时间内就可以把握这些工具的操纵方法。
简单先容完了ACCESS和SQL语句后,让小喵带着各人开始ACCESS数据分析实操吧!
二、ACCESS数据分析实操
1.数据导入
下表是本文举行ACCESS数据分析的原始文件,数据量近230MB,Excel打开需等待好几分钟,而且得看电脑心情…出于贸易保密的目标,本文将利用此中的部分数据举行分析实操,且做肯定处理惩罚。
背景导出的原始数据
先将Excel中的文件导入ACCESS中,按下图箭头路径所示:
导入excel原始数据文件
按上述步调操纵后,主动天生主键(即ID),得到如下结果:
2.用户下单时间段分析
举行下单时间段的分析,必要将用户下单的时间转化为小时“时点”,这里利用的SQL语句是format,功能是对所选字段举行格式设定,语法为:
format(引用字段,"数据格式")
此中,“数据格式”在时间上一样平常选用H(小时)、D(天)、M(月)或Y(年)。
然后,再利用count函数,将UserID举行计数,得到的结果便是订单量。
留意,利用format和count之后,必要利用“AS”将其界说为新的字段,这里二者分别界说为“时段”和“订单量”。
在“创建”里新建一个“查询计划”,点开右下角的“SQL”,然后在SQL会话框输入如下语句:
SELECTformat(下单时间,"h")AS时段,count(UserID)AS订单量
FROM元数据
GROUPBYformat(下单时间,"h");
然后,点击“计划”下的“运行”,得到如下结果:
各个时段的订单量分布环境
举个例子来阐明上面的结果该怎样解读,假如某位顾客是12:23下单,则该时间点归到“12”这个时段里了,而“12”代表的是12~13时这个时间段。可以根据“运营实操|怎样利用微信背景数据优化微信运营”这篇文章里的方法利用函数将其变为时段表现。
3.付款区间订单量分布环境分析
盘算付款区间必要用到一个比力牛X的函数---Switch,它是按次序盘算一系列的表达式,假如某一表达式创建,则返回其随后的值。
语法:
SWITCH(条件1,结果1,条件2,结果2,条件3,结果3,…,条件N,结果N)
条件1、条件2、条件3:表现要盘算的表达式,条件1创建的话,返回值结果1,条件2创建的话,返回值结果2,依次类推。
按照上述的方法,在“创建”里新建一个“查询计划”,点开右下角的“SQL”后,输入如下语句:
SELECTuserID,付款额,switch(付款额=10,"1~10元",
付款额=20,"11~20元",
付款额=50,"21~50元",
付款额=80,"51~80元",
付款额=150,"81~150元",
付款额150,"151~220元")AS斲丧区间
FROM元数据;
点击“运行”后,得到如下结果:
此时,关于斲丧区间的数据处理惩罚还未竣事,由于这是每一条下单记录的付款额所对应的斲丧区间。我们接下来要做的是雷同于excel中数据透视表的做法,将斲丧区间放在第一列,从而对每个斲丧区间有多少订单量举行统计。
以是呢,跟上面一样,得新建一个查询了,名称改为“付款区间订单量统计”。
这里必要输入的SQL语句是:
SELECT斲丧区间,count(UserID)AS订单数量
FROM付款区间
GROUPBY斲丧区间;
点击“运行”后,得到的结果表现如下:
然后,将上述数据复制到Excel表格里,制成如下的百分比扇形图,可以直观的分析出每个斲丧区间的订单量占比环境,进而看到团体的用户斲丧程度怎样,对这段时间内的运营举行公道评估。
4.各地区订单量、用户数量及贩卖额分析
(1)各地区用户数量
这个就有点小贫苦了,用户数量用“userID”的计数间接盘算出来,但是由于绝大部分的用户下单次数不小于2次,以是直接计数的话,得出来的结果就是订单量了。鉴于此种环境,我们得换个思绪,先做出一个不重复的用户下单信息表,也就是每个用户ID下单的频次表。
新建一个“查询计划”,定名为“用户斲丧频次”。在SQL对话框里输入如下语句:
SELECTUserID,COUNT(UserID)AS斲丧次数,地区
FROM元数据
GROUPBYUserID,地区;
点击“运行”后,得到的结果表现如下:
如许,我们就可以以这张用户斲丧频次表作为跳板,在再次新建的表里盘算出每个地区的用户数量咯。
新建一个“查询计划”,定名为“各地区用户数”。在SQL对话框里输入如下语句:
SELECT地区,count(UserID)AS总用户数
FROM用户斲丧频次
GROUPBY地区;
点击“运行”后,得到的结果表现如下:
(2)各地区订单量、斲丧金额状态
新建一个“查询计划”,定名为“各地区订单环境”。在SQL对话框里输入如下语句:
SELECT地区,count(UserID)AS订单总数,sum(付款额)AS总金额,avg(付款额)AS均匀斲丧金额
FROM元数据
GROUPBY地区;
点击“运行”后,得到的结果表现如下:
再将上面的各地区用户数量整合到这张表里,就得到了关于这三个地区完备的运营环境概览表。见下表:
各地区运营环境概览
6.用户代价分析
这里的用户代价分析基于RFM模子,不外对其举行了进一步的美满,在原先“累计斲丧金额”的底子上,引入了“最低斲丧金额”、“最高斲丧金额”和“均匀斲丧金额”这三个指标,力图全面的反映斲丧者的购买力。
新建一个“查询计划”,定名为“用户斲丧环境”。在SQL对话框里输入如下语句:
SELECTuserID,min(付款额)AS最低斲丧金额,
max(付款额)AS最高斲丧金额,
avg(付款额)AS均匀斲丧金额,
sum(付款额)AS斲丧总金额,
count(付款额)AS斲丧频次,
datediff("d",max(下单日期),#2015-9-15#)AS近来一次斲丧间隔本日天数
FROM元数据
GROUPBYuserID;
点击“运行”后,得到的结果表现如下:
得到该表后,可以对其举行聚类分析,按照R、F、M这三个维度对用户举行分类,详情可参看“【数据运营实操】怎样运用数据分析对某个试运营项目举行“无死角”的复盘?”这篇文章。
末了,我们还可以得出这三个地区总的订单环境和贩卖金额环境:
新建一个“查询计划”,定名为“各地区贩卖总览”。在SQL对话框里输入如下语句:
SELECTcount(userID)AS订单总数,
sum(付款额)AS付款总额,
avg(付款额)AS均匀订单金额
FROM元数据;
点击“运行”后,得到的结果表现如下:
结语
由上面的案例可以看出,假如SQL语句用得轻微纯熟的话,ACCESS处理惩罚数据不会比Excel逊色,而且处理惩罚大批量数据正是它的刚强。
对贸易智能BI、大数据分析发掘、呆板学习,python,R感爱好同砚加微信:fridaybifly,约请您参加数据爱好者交换群,数据爱好者们都在这儿。
转载请保存以下内容:
本文泉源自天善社区高长宽的博客,公众号:运营喵是怎样炼成的。
原文链接:https://ask.hellobi.com/blog/yymzylc/6585。
我要评论