凯时K66

联系方式 Contact

凯时K66: 天气在线(北京)气象科技有限公司

凯时K66: 地址:北京市(shi)海淀区(qu)海淀西大街36号9层(ceng)

凯时K66: 电话:010-58995339

凯时K66: 手(shou)机:13701329187

凯时(shi)K66: 传真:010-58995339

凯时(shi)K66: 网(wang)址(zhi):

搜索 Search

天气驱动行业销售大数据

 2015-09-03 10:41:53  点击:

摘要:自建国(guo)以(yi)来我国(guo)的(de)(de)气(qi)(qi)象(xiang)系统(tong)已(yi)经十分完备(bei),2015年中(zhong)国(guo)气(qi)(qi)象(xiang)局(ju)发布27号令后(hou)使(shi)得气(qi)(qi)象(xiang)数(shu)(shu)据(ju)(ju)(ju)迈向(xiang)开放数(shu)(shu)据(ju)(ju)(ju)(Open Data)新阶段,行业(ye)与(yu)公众可(ke)以(yi)使(shi)用海量气(qi)(qi)象(xiang)数(shu)(shu)据(ju)(ju)(ju)助(zhu)力企业(ye),目(mu)前(qian)行业(ye)数(shu)(shu)据(ju)(ju)(ju)和海量气(qi)(qi)象(xiang)数(shu)(shu)据(ju)(ju)(ju)还没有(you)得到完全应用。本文(wen)主要研究气(qi)(qi)象(xiang)数(shu)(shu)据(ju)(ju)(ju)对销(xiao)(xiao)售(shou)(shou)的(de)(de)影响,进而(er)利用气(qi)(qi)象(xiang)数(shu)(shu)据(ju)(ju)(ju)特性(xing)完成天气(qi)(qi)驱动行业(ye)销(xiao)(xiao)售(shou)(shou)的(de)(de)预(yu)(yu)测。我们(men)(men)以(yi)两个零售(shou)(shou)行业(ye)的(de)(de)销(xiao)(xiao)售(shou)(shou)数(shu)(shu)据(ju)(ju)(ju)为例,结合(he)气(qi)(qi)象(xiang)局(ju)提(ti)供(gong)的(de)(de)天气(qi)(qi)数(shu)(shu)据(ju)(ju)(ju)进行分析。同(tong)时,我们(men)(men)在(zai)分析中(zhong)加(jia)(jia)入了经济(ji)因素(su),如上证指数(shu)(shu)和CPI数(shu)(shu)据(ju)(ju)(ju)来提(ti)供(gong)外部环(huan)境支持。与(yu)传(chuan)(chuan)统(tong)的(de)(de)预(yu)(yu)测不同(tong),在(zai)气(qi)(qi)象(xiang)数(shu)(shu)据(ju)(ju)(ju)中(zhong),我们(men)(men)不仅知(zhi)道目(mu)前(qian)时间点(dian)的(de)(de)数(shu)(shu)据(ju)(ju)(ju),也(ye)有(you)目(mu)前(qian)公众唾手(shou)可(ke)得的(de)(de)未来七天精(jing)确天气(qi)(qi)预(yu)(yu)报。我们(men)(men)采用目(mu)前(qian)流(liu)行的(de)(de)算法随机森林来建模,得到了很好的(de)(de)泛化结果。我们(men)(men)的(de)(de)预(yu)(yu)测模型可(ke)以(yi)解决销(xiao)(xiao)售(shou)(shou)行业(ye)传(chuan)(chuan)统(tong)通过从业(ye)人员的(de)(de)主观判断(duan)进行销(xiao)(xiao)售(shou)(shou)预(yu)(yu)测的(de)(de)局(ju)限,利用实现更(geng)加(jia)(jia)精(jing)确可(ke)靠的(de)(de)指导。

一、业务介绍

天气一直是指导人们生活的重要因素,德国知名的经济议题观察家弗里德黑姆˙施瓦茨(Friedhelm Schwarz)发表的著作《气候经济学》[1]提到地球上有80%的经济活动都是由于天气因素影响甚至决定的,如:农作物受寒害影响收成及市场价格、凉夏造成冰品销售下降、暖冬缩短羽绒服销售时间、出行航班受天气影响延误以及所有的户外活动等。目前我国(除西部部分人口稀少的区域)的气象系统已经十分完善,气象观测网络从在轨卫星、雷达、高空气球、地面观测站点(降水、风速、风向、相对湿度、大气压力、气温)到地下的农业观测站(土壤墒情:土表下的温度、湿度等),民众可以通过过互联网或智能手机直接了解天气预报。目前积累起来的气象数据量也十分庞大(每年以PB等级的速度增长),但是目前这些数据还没有得到充分的应用。下面我们将阐述利用行业数据和气象数据进行销售预测、使用天气规划营销活动的全过程。

在销(xiao)售(shou)(shou)领域,气(qi)(qi)象(xiang)一(yi)直是(shi)(shi)(shi)一(yi)个十(shi)分重要的(de)(de)(de)影(ying)响因(yin)(yin)素。人们根据(ju)(ju)(ju)天(tian)气(qi)(qi)来情(qing)况来决(jue)定购(gou)买的(de)(de)(de)衣服,所(suo)吃的(de)(de)(de)食物(wu),甚至是(shi)(shi)(shi)饮用的(de)(de)(de)饮品,特别(bie)是(shi)(shi)(shi)对(dui)于酒精性饮料和羽绒服非常直观受天(tian)气(qi)(qi)影(ying)响的(de)(de)(de)零售(shou)(shou)商品,天(tian)气(qi)(qi)对(dui)其销(xiao)量起了(le)重要作用。因(yin)(yin)此(ci)(ci)相关(guan)从业人员(yuan)会十(shi)分关(guan)注天(tian)气(qi)(qi)预报,并根据(ju)(ju)(ju)天(tian)气(qi)(qi)来进(jin)(jin)行产(chan)品设计(ji)(ji)、营销(xiao)方(fang)案、采购(gou)与销(xiao)售(shou)(shou)等行为的(de)(de)(de)决(jue)策。但是(shi)(shi)(shi)这种做(zuo)法只是(shi)(shi)(shi)根据(ju)(ju)(ju)从业人员(yuan)的(de)(de)(de)经验进(jin)(jin)行判断,结(jie)果(guo)十(shi)分主观,容易导致偏(pian)差而(er)做(zuo)出错误的(de)(de)(de)产(chan)销(xiao)计(ji)(ji)划(SOP: Sales & Operation Planning),因(yin)(yin)此(ci)(ci)如何利用行业数据(ju)(ju)(ju)、气(qi)(qi)象(xiang)数据(ju)(ju)(ju)与其他(ta)公众数据(ju)(ju)(ju)进(jin)(jin)行精确的(de)(de)(de)数字化销(xiao)售(shou)(shou)预测是(shi)(shi)(shi)行业研究的(de)(de)(de)热点,而(er)业务受天(tian)气(qi)(qi)等外部环境因(yin)(yin)素驱(qu)动的(de)(de)(de)关(guan)联(lian)性与因(yin)(yin)果(guo)性研究落成精准营销(xiao)也是(shi)(shi)(shi)本文强调的(de)(de)(de)重点。

气(qi)(qi)象(xiang)的(de)(de)(de)观(guan)测体系(xi)是(shi)由庞大(da)的(de)(de)(de)物联网(IOT: Internet of Things)构架而成(cheng),每分钟(zhong)都在(zai)监测相(xiang)关天(tian)(tian)气(qi)(qi)要素(风速、风向、温度、相(xiang)对湿(shi)度、大(da)气(qi)(qi)压力、降水等(deng)),协(xie)同(tong)全世界各国的(de)(de)(de)观(guan)测网络,同(tong)时结合地(di)球科学(xue)(xue)、大(da)气(qi)(qi)物理、流体力学(xue)(xue)等(deng)专业知(zhi)识,通过(guo)大(da)型(xing)计算机技(ji)术(shu)完成(cheng)数(shu)(shu)(shu)值天(tian)(tian)气(qi)(qi)预(yu)(yu)(yu)(yu)报(Numerical Weather Prediction)。目(mu)前的(de)(de)(de)预(yu)(yu)(yu)(yu)报模式(shi)提供给公众的(de)(de)(de)时间(jian)长度为(wei)15天(tian)(tian),48小(xiao)(xiao)时内为(wei)逐小(xiao)(xiao)时预(yu)(yu)(yu)(yu)报,后续为(wei)逐日(ri)预(yu)(yu)(yu)(yu)报。由于(yu)观(guan)测体系(xi)的(de)(de)(de)完备以及(ji)计算技(ji)术(shu)能力的(de)(de)(de)大(da)幅提升,预(yu)(yu)(yu)(yu)报的(de)(de)(de)精(jing)细度也(ye)已经达到平(ping)方公里涵盖以及(ji)分钟(zhong)级别,天(tian)(tian)气(qi)(qi)预(yu)(yu)(yu)(yu)报在(zai)一定的(de)(de)(de)时间(jian)周期内已经相(xiang)当成(cheng)熟(shu)且具有(you)高准确(que)度。我们透过(guo)行(xing)业数(shu)(shu)(shu)据(ju)(ju)与气(qi)(qi)象(xiang)历史数(shu)(shu)(shu)据(ju)(ju)进行(xing)相(xiang)关性(xing)分析(xi)确(que)立结果(guo)后,根据(ju)(ju)业务(wu)影响关系(xi)、数(shu)(shu)(shu)据(ju)(ju)同(tong)比影响等(deng)特性(xing),低风险地(di)进行(xing)因(yin)果(guo)性(xing)验证。天(tian)(tian)气(qi)(qi)数(shu)(shu)(shu)据(ju)(ju)有(you)可靠的(de)(de)(de)预(yu)(yu)(yu)(yu)报准确(que)度,是(shi)气(qi)(qi)象(xiang)数(shu)(shu)(shu)据(ju)(ju)可以作为(wei)天(tian)(tian)气(qi)(qi)驱动行(xing)业大(da)的(de)(de)(de)最大(da)特点。

本文主要研究两项容易受天气因素驱动(影响)的销售预测问题,业务形态特别选取B2B(Business to Business)与B2C(Business to Customer)两种目前多数的业务类型:酒精性饮料的渠道销售预测以及电商平台的羽绒服销量预测。酒精性饮料的销量由很多因素影响,Lee et al.[2]和Rojas et al.[3]研究了广告对酒精性饮料销量的影响,Voleti et al.[4]和Empen et al.[5]研究了品牌资产对于酒精性饮料销量的影响。而在酒精性饮料行业中,还有一个公认对酒精性饮料销量影响极大的指标:天气。2015年我国酒精性饮料行业整体销量下滑,很多人都归因于2015年整体气温偏低的。一般酒精性饮料销量呈现季节性变化,天气寒冷的时候消费者对于酒精性饮料的需求会下降,销量会比较低;而在天气炎热的时候,酒精性饮料的销量会明显增高;本项目不考虑终端零售数据,仅研究酒精性饮料的渠道销售情况是否受天气所驱动,也就是各阶层的渠道商实际销售情况是否受天气影响。

对于羽绒服来说,天气的影响更加明显。从生活经验来看,人们主要是在冬天购买羽绒服,而夏天基本上不会有商家出售羽绒服。中国气象局公共气象服务中心和凡客诚品等公司合作利用气象数据进行羽绒服销量的研究,仅利用平均温度的三次多项式方程就得到了比较准确的结果(刘一伶等[6]),这表明天气的确对羽绒服的销量有十分重要的影响。

在不同的(de)地区(qu),天(tian)气对(dui)销量的(de)影响(xiang)也有明(ming)显区(qu)别。在中国北方地区(qu),四季很明(ming)显,换(huan)季时(shi)时(shi)间(jian)间(jian)隔(ge)比较分(fen)明(ming),因此人们(men)能快速地根据气温(wen)变(bian)化进行反应(ying)。中国南方地区(qu)的(de)换(huan)季却十分(fen)反复(fu),经常会出现冬天(tian)穿(chuan)夏装的(de)情况,整体湿度也偏(pian)高,因此人们(men)根据季节变(bian)化和气温(wen)变(bian)化进行的(de)反应(ying)会和北方有很大差别。本(ben)文(wen)在研究天(tian)气对(dui)销量的(de)影响(xiang)时(shi),会分(fen)城(cheng)市进行分(fen)析,发现不同城(cheng)市中天(tian)气对(dui)销量的(de)影响(xiang)规(gui)律。

 

二、数据描述

(一)酒精性饮料销售数据描述

我们的(de)(de)(de)(de)酒精(jing)性饮料(liao)(liao)销(xiao)(xiao)售(shou)(shou)(shou)(shou)(shou)(shou)数(shu)据来(lai)(lai)源(yuan)于某知名酒精(jing)性饮料(liao)(liao)公司渠道(dao)(dao)(dao)销(xiao)(xiao)售(shou)(shou)(shou)(shou)(shou)(shou)数(shu)据,采集来(lai)(lai)源(yuan)为ERP(Enterprise Resource Planning)系统的(de)(de)(de)(de)一(yi)级渠道(dao)(dao)(dao)销(xiao)(xiao)售(shou)(shou)(shou)(shou)(shou)(shou)数(shu)据:销(xiao)(xiao)售(shou)(shou)(shou)(shou)(shou)(shou)订单(dan)(Sales Order)与对应的(de)(de)(de)(de)提货(huo)单(dan)(Delivery Note)以及经(jing)销(xiao)(xiao)商(shang)Go-To-Market系统的(de)(de)(de)(de)销(xiao)(xiao)售(shou)(shou)(shou)(shou)(shou)(shou)二级渠道(dao)(dao)(dao)数(shu)据。数(shu)据为2013年至2015年五个经(jing)销(xiao)(xiao)商(shang)位在(zai)城(cheng)市(shi)G、城(cheng)市(shi)S、城(cheng)市(shi)H、城(cheng)市(shi)Z、城(cheng)市(shi)W的(de)(de)(de)(de)销(xiao)(xiao)售(shou)(shou)(shou)(shou)(shou)(shou)数(shu)据;第一(yi)部分的(de)(de)(de)(de)一(yi)级渠道(dao)(dao)(dao)销(xiao)(xiao)售(shou)(shou)(shou)(shou)(shou)(shou)数(shu)据是(shi)从(cong)工(gong)厂到经(jing)销(xiao)(xiao)商(shang)的(de)(de)(de)(de)数(shu)据,第二部分的(de)(de)(de)(de)二级渠道(dao)(dao)(dao)销(xiao)(xiao)售(shou)(shou)(shou)(shou)(shou)(shou)数(shu)据是(shi)从(cong)经(jing)销(xiao)(xiao)商(shang)到售(shou)(shou)(shou)(shou)(shou)(shou)点的(de)(de)(de)(de)数(shu)据。工(gong)厂指的(de)(de)(de)(de)是(shi)酒精(jing)性饮料(liao)(liao)的(de)(de)(de)(de)生产(chan)工(gong)厂,该酒精(jing)性饮料(liao)(liao)公司在(zai)不同的(de)(de)(de)(de)城(cheng)市(shi)均有(you)经(jing)销(xiao)(xiao)商(shang)(渠道(dao)(dao)(dao)商(shang)),分为高档、中高档、中档、低挡四个等(deng)级,不同的(de)(de)(de)(de)经(jing)销(xiao)(xiao)商(shang)会(hui)根据售(shou)(shou)(shou)(shou)(shou)(shou)点的(de)(de)(de)(de)需求(qiu)要求(qiu)工(gong)厂供货(huo)。二级渠道(dao)(dao)(dao)售(shou)(shou)(shou)(shou)(shou)(shou)点一(yi)般是(shi)酒吧、KTV、餐饮、零售(shou)(shou)(shou)(shou)(shou)(shou)等(deng)。

从工厂到经销(xiao)商(shang)(shang)的(de)(de)(de)(de)(de)(de)数(shu)(shu)(shu)据(ju)(ju)也就是(shi)(shi)(shi)(shi)一(yi)级渠道(dao)销(xiao)售数(shu)(shu)(shu)据(ju)(ju),数(shu)(shu)(shu)据(ju)(ju)中(zhong)的(de)(de)(de)(de)(de)(de)字(zi)(zi)(zi)(zi)段(duan)(duan)(duan)见表1。客(ke)户所(suo)(suo)使用(yong)的(de)(de)(de)(de)(de)(de)ERP系(xi)(xi)统提供多(duo)项业(ye)务(wu)(wu)(wu)日(ri)(ri)期(qi)(qi)进(jin)行(xing)记录(lu)区(qu)分出(chu)不(bu)同业(ye)务(wu)(wu)(wu)意义:订单(dan)日(ri)(ri)期(qi)(qi)(Order Date)、需求日(ri)(ri)期(qi)(qi)(Requirement Date)、订单(dan)释放(fang)(fang)日(ri)(ri)期(qi)(qi)(Order Released Date)、发(fa)货(huo)(huo)日(ri)(ri)期(qi)(qi)(Shipping Date)、交货(huo)(huo)日(ri)(ri)期(qi)(qi)(Post Good Issue Date),交易数(shu)(shu)(shu)据(ju)(ju)皆以(yi)日(ri)(ri)为单(dan)位,明确各(ge)(ge)个交易日(ri)(ri)期(qi)(qi)数(shu)(shu)(shu)据(ju)(ju)在(zai)各(ge)(ge)地(di)区(qu)实(shi)(shi)(shi)际进(jin)行(xing)业(ye)务(wu)(wu)(wu)录(lu)入的(de)(de)(de)(de)(de)(de)商(shang)(shang)业(ye)意义是(shi)(shi)(shi)(shi)对业(ye)务(wu)(wu)(wu)数(shu)(shu)(shu)据(ju)(ju)描述理(li)解(jie)的(de)(de)(de)(de)(de)(de)第一(yi)步;(1)订单(dan)日(ri)(ri)期(qi)(qi),业(ye)务(wu)(wu)(wu)建立订单(dan)时(shi)(shi)(shi)客(ke)户ERP系(xi)(xi)统的(de)(de)(de)(de)(de)(de)日(ri)(ri)期(qi)(qi);(2)需求日(ri)(ri)期(qi)(qi),一(yi)级渠道(dao)商(shang)(shang)根据(ju)(ju)库存与销(xiao)售预测的(de)(de)(de)(de)(de)(de)需要到货(huo)(huo)日(ri)(ri)期(qi)(qi),但目(mu)前此字(zi)(zi)(zi)(zi)段(duan)(duan)(duan)没(mei)有严格要求键入实(shi)(shi)(shi)际需求日(ri)(ri)期(qi)(qi);(3)订单(dan)释放(fang)(fang)日(ri)(ri)期(qi)(qi):在(zai)客(ke)户流程中(zhong)更多(duo)的(de)(de)(de)(de)(de)(de)是(shi)(shi)(shi)(shi)指客(ke)户账(zhang)务(wu)(wu)(wu)信(xin)用(yong)额度满足;(4)出(chu)货(huo)(huo)日(ri)(ri)期(qi)(qi):指从工厂到达一(yi)级渠道(dao)经销(xiao)商(shang)(shang)的(de)(de)(de)(de)(de)(de)时(shi)(shi)(shi)间(jian),在(zai)大多(duo)数(shu)(shu)(shu)的(de)(de)(de)(de)(de)(de)运输时(shi)(shi)(shi)间(jian)都在(zai)一(yi)天(tian)以(yi)内;(5)交货(huo)(huo)日(ri)(ri)期(qi)(qi):在(zai)业(ye)务(wu)(wu)(wu)流程中(zhong)是(shi)(shi)(shi)(shi)用(yong)以(yi)界定『货(huo)(huo)权』状态的(de)(de)(de)(de)(de)(de)时(shi)(shi)(shi)间(jian)点,在(zai)本(ben)项目(mu)数(shu)(shu)(shu)据(ju)(ju)多(duo)与出(chu)货(huo)(huo)日(ri)(ri)期(qi)(qi)字(zi)(zi)(zi)(zi)段(duan)(duan)(duan)相(xiang)(xiang)同。根据(ju)(ju)业(ye)务(wu)(wu)(wu)定义应该是(shi)(shi)(shi)(shi)客(ke)户需求日(ri)(ri)期(qi)(qi)(Requirement Date)将会是(shi)(shi)(shi)(shi)天(tian)气(qi)驱(qu)动(dong)(dong)业(ye)务(wu)(wu)(wu)关(guan)系(xi)(xi)中(zhong)最(zui)强的(de)(de)(de)(de)(de)(de)字(zi)(zi)(zi)(zi)段(duan)(duan)(duan),但所(suo)(suo)取得的(de)(de)(de)(de)(de)(de)数(shu)(shu)(shu)据(ju)(ju)理(li)解(jie)发(fa)货(huo)(huo)日(ri)(ri)期(qi)(qi)(Shipping Date)更接近(jin)客(ke)户的(de)(de)(de)(de)(de)(de)实(shi)(shi)(shi)际需要的(de)(de)(de)(de)(de)(de)实(shi)(shi)(shi)际时(shi)(shi)(shi)间(jian);由于客(ke)户的(de)(de)(de)(de)(de)(de)业(ye)务(wu)(wu)(wu)流程录(lu)入时(shi)(shi)(shi)没(mei)有强制所(suo)(suo)有订单(dan)严格要求在(zai)ERP系(xi)(xi)统建立订单(dan)的(de)(de)(de)(de)(de)(de)相(xiang)(xiang)关(guan)日(ri)(ri)期(qi)(qi)字(zi)(zi)(zi)(zi)段(duan)(duan)(duan),在(zai)清洗数(shu)(shu)(shu)据(ju)(ju)时(shi)(shi)(shi)日(ri)(ri)期(qi)(qi)的(de)(de)(de)(de)(de)(de)选(xuan)择上与业(ye)务(wu)(wu)(wu)单(dan)位从实(shi)(shi)(shi)际业(ye)务(wu)(wu)(wu)流程与数(shu)(shu)(shu)据(ju)(ju)结果来选(xuan)取最(zui)能真实(shi)(shi)(shi)呈现天(tian)气(qi)驱(qu)动(dong)(dong)业(ye)务(wu)(wu)(wu)的(de)(de)(de)(de)(de)(de)日(ri)(ri)期(qi)(qi)字(zi)(zi)(zi)(zi)段(duan)(duan)(duan)。经过分析,在(zai)实(shi)(shi)(shi)际发(fa)货(huo)(huo)日(ri)(ri)期(qi)(qi)下(xia)销(xiao)量(liang)和天(tian)气(qi)的(de)(de)(de)(de)(de)(de)相(xiang)(xiang)关(guan)度也比较高,所(suo)(suo)以(yi)下(xia)面均采用(yong)实(shi)(shi)(shi)际发(fa)货(huo)(huo)日(ri)(ri)期(qi)(qi)作为时(shi)(shi)(shi)间(jian)基准。对于每个产(chan)品(pin),其容量(liang)会有很大不(bu)同,有些(xie)是(shi)(shi)(shi)(shi)罐装的(de)(de)(de)(de)(de)(de),有些(xie)是(shi)(shi)(shi)(shi)桶装的(de)(de)(de)(de)(de)(de),在(zai)饮品(pin)行(xing)业(ye)中(zhong)采用(yong)物品(pin)体积来衡量(liang)销(xiao)量(liang)的(de)(de)(de)(de)(de)(de)多(duo)少(shao),销(xiao)售数(shu)(shu)(shu)量(liang)(瓶、罐)则为辅助(zhu)说(shuo)明销(xiao)售趋势。

表1 一(yi)级渠道销售数据的(de)字段描述

数据 一级渠道销售数据(仅列出最终使用字段)
Id 字(zi)段名Field name 字段说明 备注说明
1 城市 销售城市;一级渠道所在城市 城市G、城市S、城市H、城市Z、城市W
2 产品 酒精性饮料产品描述 包括了品牌、子品牌、容量、包装等内容
3 订单日期(Order Date)需求日期(Requirement Date)

释放日期(Released Date)

发(fa)货日期(qi)(Shipping Date)

交货(huo)日期(qi)(PGI Date)

下单日期客户需要日期

订(ding)单(dan)释放日期

发货(huo)离厂日(ri)期

交货日(ri)期

2013年至2015年共计三年
4 交货单数量发货数量 实际发货数量 单位:件
5 体积 酒精性饮料的容量 饮品行业计量单位单位:百升

从(cong)一级渠(qu)道(dao)(dao)(经销(xiao)(xiao)商)到二(er)级渠(qu)道(dao)(dao)数据(ju)的(de)字段见表2。和(he)一级渠(qu)道(dao)(dao)数据(ju)相(xiang)同的(de)是(shi),该数据(ju)虽然(ran)不(bu)记(ji)录在(zai)ERP系(xi)统,而记(ji)录在(zai)渠(qu)道(dao)(dao)商的(de)GO-TO-MARKET系(xi)统中,也定义有不(bu)同业务意义的(de)日(ri)(ri)(ri)期(qi)(qi)系(xi)统审核日(ri)(ri)(ri)期(qi)(qi)(Audit Date)与(yu)发货日(ri)(ri)(ri)期(qi)(qi)(Shipping Date),两个日(ri)(ri)(ri)期(qi)(qi)在(zai)数据(ju)上几(ji)乎一致,而订单日(ri)(ri)(ri)期(qi)(qi)(Order Date)一般是(shi)在(zai)月底(di)记(ji)录(渠(qu)道(dao)(dao)销(xiao)(xiao)售返利(li)模式(shi)特性),所以该日(ri)(ri)(ri)期(qi)(qi)并(bing)不(bu)能准确反映天气驱(qu)动的(de)实际日(ri)(ri)(ri)期(qi)(qi),我们同样采用发货日(ri)(ri)(ri)期(qi)(qi)作为时间基准。对销(xiao)(xiao)量自(zi)然(ran)箱、销(xiao)(xiao)量百升、销(xiao)(xiao)量标(biao)准箱等(deng)行业特殊性记(ji)录,在(zai)与(yu)合作业务方交流后,与(yu)一级渠(qu)道(dao)(dao)数据(ju)相(xiang)同,选用销(xiao)(xiao)量百升。

表2 酒精性(xing)饮(yin)料二级渠道数据的字(zi)段(duan)描述

数(shu)据 二级渠道销售数据(仅列出最终使用字段)
Id 字段名Field name 字段说(shuo)明 备(bei)注说明
1 auditdateorderdate

shipdate

系统审核日期订单日期

发货日期

2013年1月1日到2015年11月30日
2 城市 二级渠道所在城市 城市G、城市S、城市H、城市Z、城市W
3 渠道类型 二级渠道类型 夜店、KTV、酒吧等;高端餐饮;普通餐饮;零售商;
4 品牌家族 标注品牌所属的家族名称 一个系列的大品牌
5 子品牌 品牌细分 品牌的细分
6 出货体积 酒精性饮料的容量(单位:百升) 饮品行业计量单位

酒精性(xing)饮料(liao)属(shu)于快速消费品(pin)(FMCG:Fast Moving Consumer Goods),价格的变更、促销方(fang)案、返利活动、新品(pin)上市等(deng)都会影响销售的变化(hua),导致无(wu)法真(zhen)实分析(xi)挖(wa)掘出(chu)天(tian)气驱动行业(ye)的真(zhen)实情况。业(ye)务(wu)方(fang)提供了其他方(fang)面的数据,包括含税价格和促销信息。具体见表(biao)3。

表(biao)3 酒精性饮料其他数据的字段(duan)描述

数据 其他影响销售数据
Id 字段名Field name 字段说明 备注说明
1. 日期 某个价格的期限 每一个产品的价格
2. 价格 每百升物料的月销售含税价
3. MonthStart Date

End Date

价格或促销活动月份与时间段
4. 促销分类 促销类别 22类

我们(men)(men)分(fen)别对一(yi)(yi)级渠(qu)道销售(shou)数(shu)据(ju)以及二级渠(qu)道销售(shou)数(shu)据(ju)进(jin)(jin)行整合(he),在某一(yi)(yi)个(ge)日(ri)期下(xia),有不(bu)同城市不(bu)同品牌(pai)的(de)销售(shou)数(shu)据(ju),如果某个(ge)城市的(de)某个(ge)品牌(pai)在某天无销售(shou)数(shu)据(ju),我们(men)(men)认为(wei)其销售(shou)额为(wei)0。同时由(you)于按周的(de)销量比(bi)较稳定,规律比(bi)较明显,我们(men)(men)以周为(wei)单(dan)位进(jin)(jin)行分(fen)析,销量为(wei)一(yi)(yi)周的(de)销量加(jia)总,价格为(wei)一(yi)(yi)周的(de)平均(jun)。

(二)羽绒服销售数据描述

羽(yu)绒服(fu)销(xiao)售(shou)数(shu)据(ju)来自电商平台交易(yi)记录(lu)(销(xiao)售(shou)数(shu)据(ju)不(bu)区分公司与(yu)相关(guan)品牌),时间长(zhang)度从2011年到2013年,包(bao)括了全国275个(ge)(ge)城市(shi)。我们(men)提(ti)取出和(he)酒精性(xing)饮料数(shu)据(ju)中(zhong)匹配的五个(ge)(ge)城市(shi)来分析,同时加入一个(ge)(ge)北方城市(shi):城市(shi)Q。数(shu)据(ju)中(zhong)除(chu)了日期和(he)城市(shi)两个(ge)(ge)字段之外,还有销(xiao)售(shou)总金额和(he)销(xiao)售(shou)总件数(shu)。表4总结(jie)了六个(ge)(ge)城市(shi)的数(shu)据(ju)量(liang)(Observation)。

表4 羽(yu)绒服(fu)销量数据五个城市的数据量

城市 Observation
城市G 1096
城市S 1100
城市H 1096
城市Z 1099
城市W 1100
城市Q 1079

从2011年1月1日到2013年12月31日共1096天(tian)(tian),城(cheng)市(shi)S、城(cheng)市(shi)Z、城(cheng)市(shi)W数(shu)(shu)据(ju)(ju)中(zhong)多出来(lai)的数(shu)(shu)据(ju)(ju)量是由于某一天(tian)(tian)的销(xiao)售(shou)量有两条记录导致的,我(wo)们把这些数(shu)(shu)据(ju)(ju)按天(tian)(tian)合并(bing)。而(er)城(cheng)市(shi)Q的某些天(tian)(tian)没有数(shu)(shu)据(ju)(ju),我(wo)们认(ren)为其销(xiao)量为0,气象数(shu)(shu)据(ju)(ju)则(ze)取相应时间(jian)段与观测城(cheng)市(shi)的数(shu)(shu)据(ju)(ju)。与酒(jiu)精(jing)性饮料(liao)数(shu)(shu)据(ju)(ju)一样(yang)按照日粒度(du)进(jin)行(xing)(xing)整理(li),同(tong)时将(jiang)一周销(xiao)量加总作为周销(xiao)量数(shu)(shu)据(ju)(ju),按两种时间(jian)维度(du)进(jin)行(xing)(xing)分析。

(三)天气数据描述

快速消(xiao)(xiao)费品(pin)的(de)酒(jiu)精性(xing)饮料以(yi)及(ji)功能服饰类的(de)羽绒服,业务数据(ju)的(de)最(zui)小时(shi)间(jian)颗(ke)粒度为(wei)天(tian)(tian),而天(tian)(tian)气(qi)观(guan)(guan)测(ce)(ce)数据(ju)最(zui)小时(shi)间(jian)颗(ke)粒度为(wei)分(fen)钟级。从(cong)公众气(qi)象信息的(de)获取(qu)、消(xiao)(xiao)费购(gou)物的(de)习惯以(yi)及(ji)气(qi)象数据(ju)日(ri)为(wei)单位(wei)(wei)的(de)观(guan)(guan)测(ce)(ce)数据(ju)特性(xing)出发(fa),主要(yao)以(yi)日(ri)作为(wei)天(tian)(tian)气(qi)驱动消(xiao)(xiao)费的(de)最(zui)小时(shi)间(jian)基础(chu)(chu)单位(wei)(wei),使用(yong)的(de)相关气(qi)象数据(ju)如(ru)表5。需要(yao)注意的(de)是,气(qi)象数据(ju)可(ke)能会(hui)因为(wei)设备故障(zhang)或是其他因素(su)影响造(zao)成缺测(ce)(ce)情况,我们所选(xuan)的(de)都(dou)为(wei)国家级观(guan)(guan)测(ce)(ce)站,避免(mian)缺测(ce)(ce)导致的(de)数据(ju)质量问(wen)题,而在采取(qu)以(yi)周为(wei)时(shi)间(jian)基础(chu)(chu)单位(wei)(wei)进行分(fen)析时(shi),以(yi)周天(tian)(tian)气(qi)数据(ju)记(ji)录(lu)的(de)分(fen)位(wei)(wei)数为(wei)基础(chu)(chu)。

表5 日观测气象数据要素

数据 气象数据要素(日)
Id 字段名Field name 字段说明 备注说明
1 SiteId 台站编号 根据观测台站所在位置可以明确所在地(对应到行政区,如北京市东城区)
2 Day 观测日期
3 PressureAverage 日均大气压力 (单位:MPA)
4 PressureMax 日最大大气压力 (单位:MPA)
5 PressureMin 日最小大气压力 (单位:MPA)
6 TemperatureAverage 日平均气温 (单位:℃)
7 TemperatureMax 日最高气温 (单位:℃)
8 TemperatureMin 日最低气温 (单位:℃)
9 RelativeHumidityAverage 日平均相对湿度 (单位:℃)
10 RelativeHumidityMin 日最小相对湿度 (单位:%)
11 Precipitation20_8 前一日20时至当日8时的各时段降水量的累加值 (单位:mm)
12 Precipitation8_20 由当日08时至当日20时的各时段降水量的累加值 (单位:mm)
13 Precipitation20_20 由前一日20时至当日20时的各时段降水量的累加值 (单位:mm)
14 EvaporationSmall 日最小蒸发量 (单位:mm)
15 EvaporationLarge 日最大蒸发量 (单位:mm)
16 WindSpeedAverage 平均风速 (单位: m/s)
17 WindSpeedMax 最大风速 (单位: m/s)
18 WindSpeedMaxDirection 最大风速的风向 (度)
19 WindSpeedExtreme 极大风速 (单位: m/s)
20 WindSpeedExtremeDirection 极大风速的风向 (度:角度)
21 SunshineHour 日照时长 (单位:小时)
22 SurfaceTemperatureAverage 日地表均温 (单位:℃)
23 SurfaceTemperatureMax 日地表最高温 (单位:℃)
24 SurfaceTemperatureMin 日地表最低温 (单位:℃)

气(qi)(qi)象的(de)(de)数(shu)据分析,除了以日值作为分析要(yao)(yao)(yao)点外,还有其他几(ji)个特性也是在进行天(tian)(tian)(tian)气(qi)(qi)驱(qu)动行业(ye)分析时需要(yao)(yao)(yao)考量的(de)(de),如(ru):连(lian)(lian)续几(ji)日高于(yu)35℃高温、连(lian)(lian)续几(ji)日降雨(yu)、连(lian)(lian)续几(ji)日低于(yu)10℃、日夜温差(cha)超(chao)过20℃,等天(tian)(tian)(tian)气(qi)(qi)要(yao)(yao)(yao)素模式(pattern)类型的(de)(de)组合都是天(tian)(tian)(tian)气(qi)(qi)驱(qu)动行业(ye)的(de)(de)要(yao)(yao)(yao)素,所以除了表5的(de)(de)天(tian)(tian)(tian)气(qi)(qi)要(yao)(yao)(yao)素外还要(yao)(yao)(yao)设计多种天(tian)(tian)(tian)气(qi)(qi)要(yao)(yao)(yao)素模式(pattern)。

天(tian)气上的重大事件,如台(tai)(tai)风也(ye)会对(dui)酒精(jing)性饮料(liao)销量产生影(ying)响,所以(yi)我们也(ye)将受影(ying)响的时间(jian)、台(tai)(tai)风等(deng)级加入在气象数(shu)据中(台(tai)(tai)风主要反映在天(tian)气要素的风速(su)、降雨(yu)等(deng))。

公众(zhong)目前获取最长(zhang)的(de)(de)天(tian)(tian)气预报(bao)为(wei)15天(tian)(tian),羽绒服以(yi)及(ji)酒精性(xing)饮料的(de)(de)数(shu)据(ju)都自2011年与2013年开始,当(dang)时公众(zhong)所获取的(de)(de)天(tian)(tian)气预报(bao)数(shu)据(ju)多(duo)为(wei)7天(tian)(tian),所以(yi)在数(shu)据(ju)清(qing)洗拟合也会进行多(duo)种时间窗的(de)(de)平移,以(yi)确定业务数(shu)据(ju)是受当(dang)日实际感受的(de)(de)驱动(dong),还是天(tian)(tian)气预报(bao)的(de)(de)提(ti)前反应(ying)。

(四)补充数据描述

除了(le)合(he)作方提供的(de)(de)(de)(de)销(xiao)售(shou)(shou)数(shu)据(ju)(ju)(ju)和(he)(he)气(qi)象局的(de)(de)(de)(de)数(shu)据(ju)(ju)(ju),还要考虑(lv)其他能(neng)够量(liang)(liang)化并(bing)获(huo)取(qu)的(de)(de)(de)(de)可能(neng)影响销(xiao)量(liang)(liang)的(de)(de)(de)(de)数(shu)据(ju)(ju)(ju)。消(xiao)费(fei)者的(de)(de)(de)(de)需求也(ye)可能(neng)受经济(ji)因(yin)(yin)素(su)的(de)(de)(de)(de)影响,因(yin)(yin)此(ci)我(wo)(wo)们(men)(men)抓取(qu)了(le)数(shu)据(ju)(ju)(ju)时(shi)间(jian)段(duan)内的(de)(de)(de)(de)上证(zheng)(zheng)(zheng)指(zhi)数(shu)和(he)(he)居民消(xiao)费(fei)价格指(zhi)数(shu)(Consumer Price Index,CPI)。由(you)于周末(mo)收盘,在(zai)(zai)周末(mo)没有(you)(you)上证(zheng)(zheng)(zheng)指(zhi)数(shu)数(shu)据(ju)(ju)(ju),周末(mo)的(de)(de)(de)(de)上证(zheng)(zheng)(zheng)指(zhi)数(shu)我(wo)(wo)们(men)(men)用(yong)周五的(de)(de)(de)(de)来填补。而我(wo)(wo)们(men)(men)能(neng)获(huo)得的(de)(de)(de)(de)CPI数(shu)据(ju)(ju)(ju)是一(yi)(yi)(yi)个(ge)(ge)月统计(ji)一(yi)(yi)(yi)次,因(yin)(yin)此(ci)在(zai)(zai)某一(yi)(yi)(yi)个(ge)(ge)月内,我(wo)(wo)们(men)(men)统一(yi)(yi)(yi)用(yong)一(yi)(yi)(yi)个(ge)(ge)CPI数(shu)值(zhi)。除此(ci)之外,对于酒(jiu)(jiu)精(jing)性饮料销(xiao)售(shou)(shou)来说(shuo),在(zai)(zai)有(you)(you)重(zhong)大赛事时(shi),如世(shi)界杯等,酒(jiu)(jiu)精(jing)性饮料销(xiao)量(liang)(liang)会(hui)(hui)(hui)显著(zhu)上升(sheng),因(yin)(yin)此(ci)我(wo)(wo)们(men)(men)查(cha)找了(le)数(shu)据(ju)(ju)(ju)时(shi)间(jian)段(duan)内可能(neng)会(hui)(hui)(hui)影响到酒(jiu)(jiu)精(jing)性饮料销(xiao)量(liang)(liang)的(de)(de)(de)(de)重(zhong)大事件加(jia)(jia)(jia)入数(shu)据(ju)(ju)(ju)中。加(jia)(jia)(jia)入event变(bian)量(liang)(liang),如果(guo)当天有(you)(you)重(zhong)大事件,event为(wei)1,否则(ze)为(wei)0。在(zai)(zai)法定(ding)假(jia)日时(shi),售(shou)(shou)点和(he)(he)经销(xiao)商(shang)一(yi)(yi)(yi)般会(hui)(hui)(hui)提前存货,因(yin)(yin)此(ci)公司的(de)(de)(de)(de)销(xiao)量(liang)(liang)会(hui)(hui)(hui)增加(jia)(jia)(jia),我(wo)(wo)们(men)(men)把这(zhei)个(ge)(ge)因(yin)(yin)素(su)也(ye)考虑(lv)进去(qu),在(zai)(zai)数(shu)据(ju)(ju)(ju)中增加(jia)(jia)(jia)holiday变(bian)量(liang)(liang),假(jia)如当天是法定(ding)假(jia)日标(biao)记(ji)(ji)(ji)为(wei)1,否则(ze)标(biao)记(ji)(ji)(ji)为(wei)0。同样,月末(mo)也(ye)会(hui)(hui)(hui)出(chu)现囤货的(de)(de)(de)(de)现象,与法定(ding)假(jia)期(qi)一(yi)(yi)(yi)样,我(wo)(wo)们(men)(men)将月末(mo)标(biao)记(ji)(ji)(ji)为(wei)1,否则(ze)标(biao)记(ji)(ji)(ji)为(wei)0。

 

三、数据建模

为了找到所有(you)气象要(yao)素(su)中真正影响销(xiao)量的要(yao)素(su),我们利(li)用(yong)皮尔(er)森(Pearson)相关性(xing)进行(xing)检(jian)验,发现平(ping)均温度(du)是与(yu)酒精性(xing)饮料销(xiao)量以及羽绒(rong)服(fu)销(xiao)量关系最大的要(yao)素(su)。因此(ci)在(zai)描述(shu)性(xing)分(fen)析部分(fen),我们用(yong)平(ping)均气温来探索销(xiao)量与(yu)天气之(zhi)间(jian)的关系。

(一)酒精性饮料数据的建模

(1)描述性分析(xi)

图1展示(shi)了(le)一(yi)级渠道(dao)的销(xiao)量(liang)(liang)按(an)月份的分布情况(纵轴(zhou)实(shi)际销(xiao)售体积涉(she)及商业秘密不(bu)(bu)予展示(shi),仅用(yong)于(yu)说(shuo)明(ming)趋(qu)势(shi)),不(bu)(bu)同(tong)颜色代(dai)(dai)表不(bu)(bu)同(tong)年份,横(heng)坐标(biao)代(dai)(dai)表月份、纵坐标(biao)代(dai)(dai)表百升的销(xiao)量(liang)(liang)。城(cheng)(cheng)市(shi)(shi)(shi)(shi)G和城(cheng)(cheng)市(shi)(shi)(shi)(shi)S是两个销(xiao)量(liang)(liang)大(da)城(cheng)(cheng)市(shi)(shi)(shi)(shi);夏天(tian)的销(xiao)量(liang)(liang)有明(ming)显的增高,而(er)当天(tian)气转冷的时候销(xiao)量(liang)(liang)会下降(jiang);在(zai)城(cheng)(cheng)市(shi)(shi)(shi)(shi)G,销(xiao)量(liang)(liang)在(zai)逐年上(shang)升,但是在(zai)城(cheng)(cheng)市(shi)(shi)(shi)(shi)S、城(cheng)(cheng)市(shi)(shi)(shi)(shi)Z、城(cheng)(cheng)市(shi)(shi)(shi)(shi)H、城(cheng)(cheng)市(shi)(shi)(shi)(shi)W这(zhei)四个城(cheng)(cheng)市(shi)(shi)(shi)(shi)却没(mei)有这(zhei)样的趋(qu)势(shi);城(cheng)(cheng)市(shi)(shi)(shi)(shi)S、城(cheng)(cheng)市(shi)(shi)(shi)(shi)Z、城(cheng)(cheng)市(shi)(shi)(shi)(shi)H、城(cheng)(cheng)市(shi)(shi)(shi)(shi)W这(zhei)四个城(cheng)(cheng)市(shi)(shi)(shi)(shi)七八月之(zhi)后(hou)的销(xiao)量(liang)(liang)均(jun)出(chu)现(xian)了(le)急速(su)下降(jiang)。图2展示(shi)了(le)二级渠道(dao)的销(xiao)量(liang)(liang)按(an)月份的分布情况(纵轴(zhou)实(shi)际销(xiao)售体积涉(she)及商业秘密不(bu)(bu)予展示(shi),仅用(yong)于(yu)说(shuo)明(ming)趋(qu)势(shi)),其趋(qu)势(shi)与一(yi)级渠道(dao)一(yi)样,也呈现(xian)出(chu)季节的周(zhou)期性变化(hua)。

从销(xiao)(xiao)(xiao)量(liang)(liang)(liang)(liang)按(an)月份(fen)的(de)(de)(de)趋势(shi)(shi)来看,销(xiao)(xiao)(xiao)量(liang)(liang)(liang)(liang)确实与天(tian)(tian)(tian)(tian)气(qi)(qi)(qi)有(you)(you)(you)一(yi)定的(de)(de)(de)关系。我(wo)们在(zai)(zai)分(fen)析的(de)(de)(de)时(shi)候分(fen)别(bie)以(yi)(yi)天(tian)(tian)(tian)(tian)(销(xiao)(xiao)(xiao)售(shou)日(ri)与当日(ri)天(tian)(tian)(tian)(tian)气(qi)(qi)(qi)数(shu)据,以(yi)(yi)及销(xiao)(xiao)(xiao)售(shou)日(ri)数(shu)据分(fen)别(bie)平滑1天(tian)(tian)(tian)(tian)到7天(tian)(tian)(tian)(tian);区(qu)分(fen)是受当时(shi)天(tian)(tian)(tian)(tian)气(qi)(qi)(qi)感受的(de)(de)(de)影响,还是接收天(tian)(tian)(tian)(tian)气(qi)(qi)(qi)预(yu)报后所做的(de)(de)(de)反应)还有(you)(you)(you)周(采用周天(tian)(tian)(tian)(tian)气(qi)(qi)(qi)要素的(de)(de)(de)分(fen)位数(shu)),最终(zhong)是以(yi)(yi)周为(wei)单位进(jin)行预(yu)测的(de)(de)(de),因(yin)此下(xia)面我(wo)们按(an)周对销(xiao)(xiao)(xiao)量(liang)(liang)(liang)(liang)和(he)(he)天(tian)(tian)(tian)(tian)气(qi)(qi)(qi)进(jin)行描述。图3和(he)(he)图 4分(fen)别(bie)为(wei)二(er)级(ji)渠(qu)道(dao)和(he)(he)一(yi)级(ji)渠(qu)道(dao)的(de)(de)(de)销(xiao)(xiao)(xiao)量(liang)(liang)(liang)(liang)和(he)(he)天(tian)(tian)(tian)(tian)气(qi)(qi)(qi)按(an)周的(de)(de)(de)趋势(shi)(shi),横轴(zhou)(zhou)为(wei)周,左边纵轴(zhou)(zhou)为(wei)销(xiao)(xiao)(xiao)量(liang)(liang)(liang)(liang),右边纵轴(zhou)(zhou)为(wei)平均气(qi)(qi)(qi)温(wen)(wen)。出现(xian)(xian)的(de)(de)(de)负(fu)值销(xiao)(xiao)(xiao)量(liang)(liang)(liang)(liang)表示(shi)这一(yi)周有(you)(you)(you)退(tui)货的(de)(de)(de)情(qing)况(kuang),而且(qie)退(tui)货数(shu)量(liang)(liang)(liang)(liang)要比(bi)订货数(shu)量(liang)(liang)(liang)(liang)高,在(zai)(zai)销(xiao)(xiao)(xiao)量(liang)(liang)(liang)(liang)比(bi)较(jiao)低的(de)(de)(de)城(cheng)(cheng)(cheng)市(shi)(shi)会出现(xian)(xian)这样的(de)(de)(de)现(xian)(xian)象(xiang)。在(zai)(zai)城(cheng)(cheng)(cheng)市(shi)(shi)G,销(xiao)(xiao)(xiao)量(liang)(liang)(liang)(liang)和(he)(he)天(tian)(tian)(tian)(tian)气(qi)(qi)(qi)的(de)(de)(de)趋势(shi)(shi)比(bi)较(jiao)明显(xian),而城(cheng)(cheng)(cheng)市(shi)(shi)S会出现(xian)(xian)一(yi)些异常情(qing)况(kuang),城(cheng)(cheng)(cheng)市(shi)(shi)H、城(cheng)(cheng)(cheng)市(shi)(shi)W、城(cheng)(cheng)(cheng)市(shi)(shi)Z的(de)(de)(de)趋势(shi)(shi)比(bi)较(jiao)弱,特(te)别(bie)是城(cheng)(cheng)(cheng)市(shi)(shi)W,其销(xiao)(xiao)(xiao)量(liang)(liang)(liang)(liang)整体偏低,就(jiu)算(suan)气(qi)(qi)(qi)温(wen)(wen)有(you)(you)(you)明显(xian)的(de)(de)(de)上升,其销(xiao)(xiao)(xiao)量(liang)(liang)(liang)(liang)也没有(you)(you)(you)增长。

城市G
 city1
城市S 城市Z
city2 city3
城市H 城市W
city4 city5

图(tu)1 一级渠道销量按月趋势

城市G
city6
城市S 城市Z
city7 city8
城市H 城市W
city9 city10

图2 二级渠道销量按月趋(qu)势

城市G
city11
城市S 城市Z
city12 city13
城市H 城市W
city14 city15

图3 一级渠道销(xiao)量与平均(jun)气温按周趋势(橘色曲线为天气平均(jun)温度(du)要(yao)素(su),蓝(lan)色曲线为销(xiao)量)

 

城市G
city16
城市S 城市Z
city17 city18
城市H 城市W
city19 city20

图4 二级渠道销(xiao)量(liang)与平(ping)均(jun)气温按周(zhou)趋势(橘色(se)曲线为天气平(ping)均(jun)温度要素,蓝色(se)曲线为销(xiao)量(liang))

 

(2)模型(xing)设定

时(shi)(shi)间序(xu)列数(shu)(shu)据一般(ban)由(you)长期趋(qu)势(shi)(shi)、季(ji)节(jie)变(bian)(bian)(bian)动(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)、循(xun)环(huan)变(bian)(bian)(bian)动(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)、不(bu)规则变(bian)(bian)(bian)动(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)四个(ge)部(bu)分(fen)(fen)组成。其(qi)中(zhong)(zhong)长期趋(qu)势(shi)(shi)指(zhi)的是(shi)随(sui)着时(shi)(shi)间的变(bian)(bian)(bian)化(hua);季(ji)节(jie)变(bian)(bian)(bian)动(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)指(zhi)随(sui)着季(ji)节(jie)变(bian)(bian)(bian)化(hua)的周期性变(bian)(bian)(bian)动(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong);循(xun)环(huan)变(bian)(bian)(bian)动(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)指(zhi)以若(ruo)干年(nian)为单位(wei)的变(bian)(bian)(bian)化(hua);不(bu)规则变(bian)(bian)(bian)动(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)是(shi)随(sui)机变(bian)(bian)(bian)化(hua)导致的波动(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)。本文的数(shu)(shu)据时(shi)(shi)间间隔均为3年(nian)左右(you),所以不(bu)存在循(xun)环(huan)变(bian)(bian)(bian)动(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)项(xiang)(xiang)。我们把数(shu)(shu)据分(fen)(fen)解(jie)(jie)为趋(qu)势(shi)(shi)项(xiang)(xiang)、季(ji)节(jie)项(xiang)(xiang)和(he)随(sui)机波动(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)项(xiang)(xiang),以二(er)级渠道销售(shou)(shou)数(shu)(shu)据为例(li),分(fen)(fen)解(jie)(jie)情况如图5(纵(zong)轴(zhou)实际销售(shou)(shou)体积涉及(ji)商业秘密不(bu)予展示,仅用(yong)于(yu)说(shuo)明趋(qu)势(shi)(shi))。分(fen)(fen)解(jie)(jie)之(zhi)后(hou),虽然由(you)于(yu)目前数(shu)(shu)据中(zhong)(zhong)还有很多没有测(ce)量出来的因素,白噪(zao)声部(bu)分(fen)(fen)不(bu)是(shi)完全由(you)随(sui)机波动(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)影响的,但是(shi)季(ji)节(jie)项(xiang)(xiang)按季(ji)节(jie)的周期趋(qu)势(shi)(shi)更加明显了,而趋(qu)势(shi)(shi)项(xiang)(xiang)随(sui)着时(shi)(shi)间的变(bian)(bian)(bian)化(hua)呈(cheng)现一定的波动(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)(dong)。我们对分(fen)(fen)解(jie)(jie)出的季(ji)节(jie)项(xiang)(xiang)和(he)趋(qu)势(shi)(shi)项(xiang)(xiang)分(fen)(fen)别进行(xing)预测(ce)。

对于季节项部分,我们采用随机森林进行预测。随机森林由2001年被Breiman 提出[7],是一种基于树的集成学习算法。Fernandez-Delgado et al. [8] 在121份数据集上进行了测试,证明随机森林是在支持向量机、神经网络等机器学习算法中表现得最好的一个算法。对于我们的数据来说,很难看出天气变化对销量的影响呈现特定的函数关系,因此我们选用随机森林这种不需要模型假设的非参数方法进行预测。

对于趋(qu)势(shi)项部分,我们(men)采用三次样条(tiao)进行(xing)预测。由于不同(tong)城市随着时(shi)间(jian)变化(hua)的趋(qu)势(shi)差(cha)别很(hen)大,利(li)用三次样条(tiao),我们(men)可以(yi)拟合不同(tong)形状的趋(qu)势(shi)变化(hua)。

基(ji)于公众可以(yi)便利的(de)获取气(qi)象局提(ti)供的(de)7天(tian)(最多(duo)15天(tian))天(tian)气(qi)预(yu)报前(qian)提(ti),与以(yi)往的(de)销(xiao)售预(yu)测不同(tong)(tong),我(wo)们(men)可以(yi)利用未来的(de)天(tian)气(qi)进行预(yu)测。同(tong)(tong)时(shi),呈季节(jie)变化(hua)的(de)销(xiao)量不仅受到了天(tian)气(qi)和(he)(he)经济(ji)因素的(de)影响,上(shang)一年同(tong)(tong)一个时(shi)间点的(de)销(xiao)量和(he)(he)上(shang)一周(zhou)的(de)销(xiao)量也与当(dang)前(qian)时(shi)间点的(de)销(xiao)量有关系,因此我(wo)们(men)把(ba)同(tong)(tong)比销(xiao)量和(he)(he)环(huan)(huan)比销(xiao)量也放入(ru)模型中。除此之外(wai),为了考虑经济(ji)环(huan)(huan)境的(de)影响,我(wo)们(men)加(jia)入(ru)了上(shang)证指数和(he)(he)CPI。

(3)模型(xing)结(jie)果(guo)

我们从数(shu)据(ju)中剔(ti)除出最后三(san)个月的数(shu)据(ju)来做(zuo)测试集,剩下的部(bu)分均为(wei)学(xue)习集。通过(guo)真(zhen)实值与预测值之间的误(wu)差的绝对值占真(zhen)实值的百分比来衡量预测误(wu)差,预测误(wu)差总结(jie)见表(biao)6:

表6 酒精性饮料销量的预测误(wu)差(cha)

城市 预测误差
一级渠道 二级渠道
城市G 0.1133 0.1203
城市S 0.2808 0.2228
城市H 0.2821 0.3046
城市Z 0.4103 0.1454
城市W 0.4457 0.1988

城(cheng)市(shi)G的预测效果(guo)是(shi)最好的,城(cheng)市(shi)S次之。在所(suo)有天气(qi)(qi)(qi)要素(su)(su)中(zhong)(风、温(wen)度、相对湿(shi)度、大气(qi)(qi)(qi)压力、降雨(yu)),温(wen)度要素(su)(su)与销(xiao)售量(liang)相关(guan)性(xing)最高,但是(shi)在图3和图4中(zhong),仅(jin)城(cheng)市(shi)G可(ke)以看到销(xiao)量(liang)和天气(qi)(qi)(qi)的气(qi)(qi)(qi)温(wen)要素(su)(su)走势比较一致,而(er)其他城(cheng)市(shi)会出(chu)现气(qi)(qi)(qi)温(wen)上升(sheng),销(xiao)量(liang)反而(er)下(xia)滑的情况,而(er)且城(cheng)市(shi)G的销(xiao)量(liang)波动趋势也比较平稳。

城市G
city21
城市S
city22
城市Z
city23
城市H
city24
城市W
city25

图5 二(er)级渠道(dao)销量分解(jie)情况

 

(二)羽绒服数据建模

(1)描述性(xing)分析

图6和图7分(fen)别(bie)为(wei)羽(yu)绒服销(xiao)(xiao)量(liang)与天(tian)气之(zhi)间的(de)(de)(de)趋势变化图。虽然不同城市之(zhi)间趋势有差别(bie),但(dan)是基本上(shang)都(dou)呈现(xian)当气温(wen)开始下(xia)降(jiang)的(de)(de)(de)时候,销(xiao)(xiao)量(liang)开始上(shang)升(sheng)的(de)(de)(de)趋势。同时,不管是按销(xiao)(xiao)量(liang)金额还是销(xiao)(xiao)量(liang)件数都(dou)呈现(xian)逐年上(shang)升(sheng)的(de)(de)(de)情况。但(dan)是对于城市S来说,虽然每年的(de)(de)(de)销(xiao)(xiao)量(liang)金额都(dou)在上(shang)升(sheng),但(dan)是销(xiao)(xiao)量(liang)件数却仅(jin)在11年冬季(ji)出现(xian)了(le)一个(ge)高峰后就急剧降(jiang)低(di),需要进一步结合其(qi)他数据进行探讨或是测试(shi)。

表7展示(shi)了销量(liang)与(yu)平(ping)均(jun)气(qi)温(wen)之(zhi)间的皮尔森(Pearson)相关(guan)(guan)度。除了城市S的销量(liang)件数出现了异常之(zhi)外,平(ping)均(jun)气(qi)温(wen)与(yu)销量(liang)之(zhi)间呈现负相关(guan)(guan),这(zhei)表明(ming)随着气(qi)温(wen)下降,羽绒服的销量(liang)会(hui)上升,同时,相关(guan)(guan)度均(jun)在0.3左右,说明(ming)气(qi)温(wen)与(yu)销量(liang)之(zhi)间有比较(jiao)强的关(guan)(guan)系(xi)。

表7 销(xiao)量(liang)与平(ping)均气(qi)温之(zhi)间(jian)的皮尔森(PEARSON)相关(guan)系数

城市 销量(成(cheng)交价格:元(yuan)) 销量(liang)(件(jian))
城市G -0.3980 -0.3332
城市S -0.3188 -0.0008
城市H -0.3267 -0.2888
城市Z -0.3043 -0.2828
城市W -0.3319 -0.2999
城市Q -0.2283 -0.2185

 

城市G
city26
城市S
city27
城市H
city28
城市Z
city29
城市W
city30
城市Q
city31

图6 销(xiao)量(liang)(元)与平均气温的变(bian)化趋势(shi)(红色(se)曲(qu)线为天气,蓝色(se)曲(qu)线为销(xiao)量(liang))

城市G
city32
城市S
city33
城市H
city34
城市Z
city35
城市W
city36
城市Q
city37

图7 销量(liang)(件)与(yu)平均(jun)气(qi)温的(de)变化趋势(红色曲线为天气(qi),绿色曲线为销量(liang))

(2)模型设定

和酒精性饮(yin)料数据一样,我们(men)同(tong)(tong)样将数据分解为趋势项(xiang)、季节项(xiang)和随机波动(dong)项(xiang)。对于趋势项(xiang)我们(men)依旧采用三次样条去拟合,而对于季节项(xiang),由于我们(men)仅用皮尔森(sen)(PEARSON)相关系数就已经可以(yi)测量(liang)到(dao)平(ping)均(jun)气(qi)温(wen)与销量(liang)之(zhi)间很强的相关度,因(yin)(yin)(yin)此我们(men)用线性回归来(lai)进行预(yu)测。同(tong)(tong)样,我们(men)在(zai)模型(xing)中加入(ru)了环比(bi)销量(liang)和同(tong)(tong)比(bi)销量(liang)。而从(cong)图6和7 中,可以(yi)看出,一般在(zai)气(qi)温(wen)达(da)(da)到(dao)峰(feng)值后的两个星(xing)期,销量(liang)达(da)(da)到(dao)峰(feng)值,因(yin)(yin)(yin)此我们(men)在(zai)模型(xing)中加入(ru)比(bi)当前(qian)时间点提前(qian)两个星(xing)期的天气(qi)因(yin)(yin)(yin)素。

(3)模(mo)型结果(guo)

和酒精性(xing)饮料数(shu)据一样(yang),我们(men)剔除出(chu)最后三个月的(de)(de)(de)数(shu)据来(lai)做测(ce)试集(ji),剩下的(de)(de)(de)部(bu)分(fen)(fen)均为学习集(ji)。通过(guo)真实(shi)值(zhi)与预(yu)测(ce)值(zhi)之间(jian)的(de)(de)(de)误差(cha)的(de)(de)(de)绝对(dui)(dui)值(zhi)占真实(shi)值(zhi)的(de)(de)(de)百分(fen)(fen)比来(lai)衡量(liang)预(yu)测(ce)误差(cha)。表8展示了(le)羽(yu)绒服数(shu)据的(de)(de)(de)预(yu)测(ce)误差(cha),很明显,除了(le)城市(shi)S的(de)(de)(de)销量(liang)件(jian)数(shu)之外,其他部(bu)分(fen)(fen)的(de)(de)(de)预(yu)测(ce)效果(guo)都很好,说明天气对(dui)(dui)羽(yu)绒服销量(liang)的(de)(de)(de)影响(xiang)的(de)(de)(de)确(que)十分(fen)(fen)大。

表(biao)8 羽(yu)绒(rong)服数据销(xiao)量预(yu)测结果

城市 预测误差
销量(元) 销量(件)
城市G 0.0578 0.1000
城市S 0.0452 0.1537
城市H 0.0541 0.0885
城市Z 0.0527 0.0855
城市W 0.0433 0.0673
城市Q 0.0378 0.0664

 

四、业务实施

(Data  Driven)的(de)(de)落地实施(shi)过程(cheng)中,我(wo)们与企(qi)业的(de)(de)首(shou)要(yao)(yao)目(mu)标是(shi)明确我(wo)们要(yao)(yao)解决(jue)的(de)(de)商业问题(ti)(Business Question)并(bing)进一步了解透(tou)过数据进行分(fen)析挖(wa)掘解决(jue)问题(ti)的(de)(de)可(ke)能。

我们与企业(ye)合作在设(she)定商业(ye)问题过程(cheng)中(zhong)(zhong),发现企业(ye)对于开(kai)始数据分析业(ye)务(wu)的(de)商业(ye)问题更多集(ji)中(zhong)(zhong)在可快速简单量化成绩的(de)销售业(ye)务(wu)(商品或服(fu)务(wu)的(de)销售成果)与营销业(ye)务(wu)(促销活动、广告投放等),实施全程(cheng)采取了天气驱动业(ye)务(wu)分析框架(Weather Driven Analysis Framework)如图8。

city38

图8 天气驱(qu)动业务分析(xi)框架

本文探讨的酒精(jing)(jing)性饮料以及羽绒服(fu)的商(shang)业(ye)问(wen)题(ti):销(xiao)(xiao)售预(yu)(yu)(yu)(yu)(yu)测(ce)(ce)以及支持精(jing)(jing)准(zhun)营(ying)销(xiao)(xiao)。天(tian)气驱(qu)动(dong)项目交付的是(shi)(1)可以实时(shi)运行可视化销(xiao)(xiao)售预(yu)(yu)(yu)(yu)(yu)测(ce)(ce)模型与(2)持续(xu)的精(jing)(jing)细化天(tian)气预(yu)(yu)(yu)(yu)(yu)测(ce)(ce)数据支持,示意画(hua)面(mian)如图9(因(yin)商(shang)业(ye)秘密,仅(jin)提供系统示意画(hua)面(mian));我们也称(cheng)此为天(tian)气驱(qu)动(dong)销(xiao)(xiao)售仪表板(Dashboard)。客户(hu)接入天(tian)气预(yu)(yu)(yu)(yu)(yu)测(ce)(ce)数据后、同时(shi)将假(jia)日、价格、促销(xiao)(xiao)等因(yin)子由ERP同步接入,天(tian)气驱(qu)动(dong)销(xiao)(xiao)售仪表板实时(shi)显示最新的销(xiao)(xiao)售预(yu)(yu)(yu)(yu)(yu)测(ce)(ce)数字,输出内容包括:城市、总销(xiao)(xiao)售预(yu)(yu)(yu)(yu)(yu)测(ce)(ce)量、各(ge)品牌销(xiao)(xiao)售预(yu)(yu)(yu)(yu)(yu)测(ce)(ce)量、各(ge)渠道销(xiao)(xiao)售预(yu)(yu)(yu)(yu)(yu)测(ce)(ce)量以及相(xiang)关的天(tian)气数据与预(yu)(yu)(yu)(yu)(yu)警信息(xi)。

city39

图9 天气驱(qu)动业务(wu)销售预测示意画面

由经验判(pan)断开始使(shi)用更多的数(shu)(shu)据(ju)与采用大数(shu)(shu)据(ju)相关技术(shu)开始数(shu)(shu)据(ju)驱动(Data Driven)经营企业(ye),天气驱动销售让企业(ye)做出下列(lie)举措变化(hua)与趋势:

  1. 企业的产销计划(SOP: Sales & Operation Planning)得到定量的科学化预测支持。
  2. 公司经营与渠道商开始了解天气预报与影响,根据数据进行采购与销售。
  3. 开始天气相关的营销活动(Campaign)。
  4. 根据天气因果性,开始思索如何精确的投放广告(根据目前天气预报的时长准确程度,还无法应对目前传统广告采购规则,但移动广告则非常有机会)。
  5. 电商平台根据各地天气变化预报,调整推送受天气驱动商品。

 

五、总结讨论

本(ben)文通过公共数(shu)(shu)(shu)据(ju)(ju)(ju)(气(qi)(qi)象(xiang)数(shu)(shu)(shu)据(ju)(ju)(ju))结合行业(ye)数(shu)(shu)(shu)据(ju)(ju)(ju)实(shi)际(ji)探(tan)讨两种不(bu)同交易(yi)形(xing)态(tai)的(de)(de)业(ye)务:B2B与B2C,完成(cheng)(cheng)通过实(shi)际(ji)交易(yi)数(shu)(shu)(shu)据(ju)(ju)(ju)与天气(qi)(qi)数(shu)(shu)(shu)据(ju)(ju)(ju)分析挖掘(jue)相关(guan)性(xing)与因果性(xing)实(shi)现(xian)天气(qi)(qi)驱(qu)动(dong)(dong)(Weather Driven)的(de)(de)实(shi)践,促使数(shu)(shu)(shu)据(ju)(ju)(ju)驱(qu)动(dong)(dong)(Data Driven)能够(gou)真实(shi)落地协助行业(ye)在同质化非常严重的(de)(de)产业(ye)环(huan)境(jing)中快速(su)回应挑(tiao)战;但在大(da)环(huan)境(jing)下,企业(ye)对于开(kai)始数(shu)(shu)(shu)据(ju)(ju)(ju)驱(qu)动(dong)(dong)业(ye)务管(guan)(guan)理(li),总是希望以(yi)(yi)最(zui)低(di)(di)的(de)(de)投入让现(xian)有的(de)(de)资料(liao)、数(shu)(shu)(shu)据(ju)(ju)(ju)、IT等资源以(yi)(yi)最(zui)低(di)(di)成(cheng)(cheng)本(ben)、低(di)(di)风(feng)险(xian)又有效的(de)(de)方式完成(cheng)(cheng)数(shu)(shu)(shu)据(ju)(ju)(ju)驱(qu)动(dong)(dong)的(de)(de)企业(ye)经营,造成(cheng)(cheng)执行者必须(xu)面(mian)对以(yi)(yi)有限资源追求极大(da)化成(cheng)(cheng)效的(de)(de)挑(tiao)战,也(ye)造就企业(ye)开(kai)始数(shu)(shu)(shu)据(ju)(ju)(ju)驱(qu)动(dong)(dong)业(ye)务管(guan)(guan)理(li)变革上的(de)(de)风(feng)险(xian)。

天(tian)气(qi)(qi)(qi)虽然影响众多行(xing)业,但是(shi)天(tian)气(qi)(qi)(qi)终究仅是(shi)一(yi)项影响因(yin)子;我们(men)进行(xing)天(tian)气(qi)(qi)(qi)驱(qu)动(dong)业务分析业务实(shi)践(jian)中,天(tian)气(qi)(qi)(qi)驱(qu)动(dong)销售(shou)以快(kuai)速(su)(su)消(xiao)(xiao)费(fei)品(pin)(FMCG)行(xing)业销售(shou)数据(ju)(ju)+天(tian)气(qi)(qi)(qi)数据(ju)(ju)的效果反馈(kui)(kui)最佳,主(zhu)要是(shi)因(yin)消(xiao)(xiao)费(fei)者可以用低成本(ben)抵抗(kang)天(tian)气(qi)(qi)(qi)带来的影响,本(ben)文所提(ti)及的酒(jiu)精性饮料快(kuai)速(su)(su)消(xiao)(xiao)费(fei)品(pin)的实(shi)际案例。其他像是(shi)大气(qi)(qi)(qi)污染预报、医(yi)疗保健(Healthcare)、农林渔牧也有(you)相当正(zheng)面的反馈(kui)(kui);但是(shi)对于需(xu)要产品(pin)生(sheng)命周期较长、售(shou)价较高、品(pin)牌占比较重的行(xing)业或领域则需(xu)要更进一(yi)步的探讨。

在快(kuai)速消费(fei)品(pin)的(de)天气驱动销售虽然可以得到(dao)很好(hao)的(de)效果,又(you)可以细分为(wei)不(bu)同的(de)区域(市(shi)(shi)(shi)场(chang)),以酒精性(xing)(xing)(xing)饮(yin)料(liao)为(wei)例(li),在城(cheng)市(shi)(shi)(shi)G与(yu)城(cheng)市(shi)(shi)(shi)S两(liang)个城(cheng)市(shi)(shi)(shi)该(gai)(gai)品(pin)牌(pai)(pai)已经非(fei)常成熟,最终得到(dao)的(de)预测准确性(xing)(xing)(xing)也非(fei)常高,可是在城(cheng)市(shi)(shi)(shi)W对该(gai)(gai)品(pin)牌(pai)(pai)还属于新兴市(shi)(shi)(shi)场(chang)(Emerging Market)与(yu)天气的(de)相关性(xing)(xing)(xing)远低于该(gai)(gai)酒精性(xing)(xing)(xing)饮(yin)料(liao)口(kou)(kou)碑、品(pin)牌(pai)(pai)认知与(yu)当地口(kou)(kou)味(wei)喜好(hao)等因素的(de)影(ying)响。羽绒(rong)服(fu)的(de)数据结(jie)(jie)果同样说明了类似的(de)结(jie)(jie)论,特(te)别呈现在羽绒(rong)服(fu)的(de)功(gong)能(neng)(neng)性(xing)(xing)(xing)与(yu)服(fu)饰特(te)性(xing)(xing)(xing)上,例(li)如在城(cheng)市(shi)(shi)(shi)Q这样冬天非(fei)常寒冷的(de)区域就会更重视功(gong)能(neng)(neng)性(xing)(xing)(xing),而像是城(cheng)市(shi)(shi)(shi)G地区消费(fei)者更注重的(de)是服(fu)『饰』的(de)功(gong)能(neng)(neng)。

从天气驱动销售(shou)角度来(lai)看数(shu)据采集:酒精性饮料项目的数(shu)据来(lai)源于ERP以(yi)(yi)及渠道(dao)商(shang)的GO-TO-MARKET销售(shou)数(shu)据,有(you)两项特点:(1)国内企(qi)业的ERP系统主(zhu)要(yao)(yao)追求(qiu)的目标(biao)是财(cai)务(wu)记(ji)账导向(xiang)(以(yi)(yi)符(fu)合会计准则的记(ji)录(lu)为依据),可信(xin)的是交(jiao)(jiao)易数(shu)量与金额的正(zheng)确(que),但无法(fa)记(ji)录(lu)真(zhen)实(shi)的交(jiao)(jiao)易时间;(2)渠道(dao)商(shang)的GO-TO-MARKET销售(shou)数(shu)据受到(dao)返利(Rebate)政策影响,所有(you)的交(jiao)(jiao)易数(shu)据都(dou)会因不同(tong)区域结算返利或(huo)渠道(dao)申报销售(shou)考(kao)核的时间点而(er)无法(fa)记(ji)录(lu)真(zhen)实(shi)的交(jiao)(jiao)易时间。这两项特点发生(sheng)在非(fei)常多(duo)企(qi)业CRM(Customer Relationship Management)、ERP系统上,所以(yi)(yi)若需(xu)(xu)要(yao)(yao)进行(xing)天气驱动销售(shou),需(xu)(xu)要(yao)(yao)投入更多(duo)的精力(li)了(le)解(jie)每一(yi)笔数(shu)据与每一(yi)个字段(duan)的业务(wu)含(han)义,才(cai)有(you)机会真(zhen)正(zheng)帮助(zhu)到(dao)企(qi)业开始好的数(shu)据驱动管(guan)理(理解(jie)业务(wu)才(cai)能(neng)真(zhen)正(zheng)解(jie)决商(shang)业问(wen)题)。

成(cheng)功(gong)的(de)数(shu)据(ju)(ju)驱(qu)动业(ye)(ye)务(wu)管理(li)取决(jue)于(yu)设(she)(she)定正确的(de)商(shang)业(ye)(ye)问题(Business Question),通过对(dui)(dui)行(xing)业(ye)(ye)的(de)理(li)解不断地提出可能的(de)假设(she)(she)(Hypothesis)并(bing)使用大数(shu)据(ju)(ju)的(de)方(fang)法论进行(xing)验(yan)(yan)证每一(yi)项假设(she)(she),直(zhi)到可验(yan)(yan)证数(shu)据(ju)(ju)因果性的(de)阶段,并(bing)测试成(cheng)功(gong),才(cai)是完整的(de)数(shu)据(ju)(ju)驱(qu)动业(ye)(ye)务(wu)实践(Practice)。错误的(de)问题会增(zeng)加企业(ye)(ye)在推动数(shu)据(ju)(ju)驱(qu)动管理(li)业(ye)(ye)务(wu)成(cheng)本与风险,例如我们(men)将(jiang)商(shang)业(ye)(ye)问题设(she)(she)定为酒精性饮(yin)料销售与天气(qi)要素的(de)相关性,我们(men)很容易(yi)得到天气(qi)炎热酒精性饮(yin)料销售量(liang)就会上升的(de)结(jie)论(甚至不用数(shu)据(ju)(ju)就可以得到此结(jie)论),但是对(dui)(dui)于(yu)企业(ye)(ye)需要的(de)是帮助企业(ye)(ye)用数(shu)据(ju)(ju)去掌握、洞悉(Insight)、预测商(shang)业(ye)(ye)行(xing)为,而不是为了大数(shu)据(ju)(ju)而大数(shu)据(ju)(ju)。

本文主要研究天(tian)气驱(qu)动的(de)销(xiao)售(shou)预测,在酒精性饮料(liao)销(xiao)量和(he)羽绒(rong)服销(xiao)量两个领域,利(li)用天(tian)气进行预测均取得了十(shi)分优秀的(de)效(xiao)果。本文仍有(you)(you)很多可(ke)以进一步(bu)研究的(de)空(kong)间;目(mu)前,我(wo)们(men)(men)研究的(de)时间周期(qi)都只(zhi)有(you)(you)三年,而(er)很多特(te)殊的(de)气象(xiang)现象(xiang),如(ru)厄尔尼诺(El Nino)、激烈天(tian)气等(deng),只(zhi)有(you)(you)在比(bi)较长(zhang)的(de)时间下才(cai)能(neng)(neng)表(biao)现出来,我(wo)们(men)(men)会进一步(bu)收(shou)集更多的(de)数(shu)(shu)据改(gai)善我(wo)们(men)(men)已有(you)(you)的(de)实(shi)践(jian)积累(lei)。在我(wo)们(men)(men)的(de)数(shu)(shu)据中,特(te)别是酒精性饮料(liao)数(shu)(shu)据,有(you)(you)很多异常的(de)情况无法用现有(you)(you)的(de)数(shu)(shu)据解(jie)释,需要和(he)行业(ye)(ye)(ye)进行深入交流才(cai)能(neng)(neng)够进一步(bu)呈(cheng)现出更好(hao)的(de)数(shu)(shu)据驱(qu)动业(ye)(ye)(ye)务效(xiao)果,好(hao)的(de)数(shu)(shu)据驱(qu)动业(ye)(ye)(ye)务一定是来自于深入行业(ye)(ye)(ye)了解(jie)行业(ye)(ye)(ye)的(de)努力与积累(lei)。

参考文献

[1] 施瓦茨. 气(qi)候经济学[M]. 气(qi)象出版(ban)社, 2012.

[2] Byunglak Lee, Victor J. Tremblay. Advertising and the U.S. Market Demand for Beer.[J]. Applied Economics, 1992, 24(1):69-76.

[3] Rojas C, Peterson E B. Demand for differentiated products: Price and advertising evidence from the U.S. beer market [J]. International Journal of Industrial Organization, 2008, 26(1):288-307.

[4] Voleti S, Ghosh P. A non-parametric model of residual brand equity in hierarchical branding structures with application to US beer data[J]. Journal of the Royal Statistical Society, 2014, 177(1):135–152.

[5] Empen J, Hamilton S F. How Do SUPERMARKETS RESPOND TO BRAND-LEVEL DEMAND SHOCKS? EVIDENCE FROM THE GERMAN BEER MARKET[J]. American Journal of Agricultural Economics, 2013, 95(5):1223-1229.

[6] 刘一伶, 杜春生(sheng), 张辉. 羽(yu)绒(rong)服销(xiao)量预测模型及其商业应用研究[J]. 现代经济信息, 2012(19):175-176.

[7] Breiman L. Random Forests[J]. Machine Learning, 2001, 45(1):5–32.

[8] Fernández-Delgado M, Cernadas E, Barro S, et al. Do we need hundreds of classifiers to solve real world classification problems?[J]. Journal of Machine Learning Research, 2014, 15(1):3133-3181.

来(lai)源(yuan):统计之都

作者(zhe):罗应琏(北京维艾思气象信息科技有限公司),朱珊(中山大学华南统计科学研究中心) ,何顺(中山大学华南统计科学研究中心),周翔(中山大学华南统计科学研究中心),李昶(北京维艾思气象信息科技有限公司) ,王学钦(中山大学华南统计科学研究中心)

链接:http://cos.name/2016/05/weather-driven-industry-sales-big-data/

玻璃隔断_办公室玻璃隔断墙—希格玛隔墙_好隔墙 淋浴房厂家,中山淋浴房,中山淋浴房厂家,不锈钢淋浴房-玛莎洁具 热收缩包装机_热收缩机具备厂家直销价格优势的专业提供商-青岛麦格自动化设备有限公司 滦州市捷澳建材有限公司 深圳市纺织(集团)股份有限公司 -深圳市纺织(集团)股份有限公司 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人厅 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 GD真人,GD真人官网 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人网 | 凯时K66 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 OG真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 AJ真人 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 亚游手机版 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时真人 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 凯时K66 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人 AG真人