大数据分析挖掘技术在电商的应用
发布日期:2015年01月04日 作者:Optimus Prime 来源:36dsj.com 点击率:
阿里云 ODPS (Open Data Processing Service)
- 2010年2月第一版上线
- 集团内部生产机群规模18000台机器
- 单存储和计算机群最大规模5000台机器
- 日均处理3000万个作业请求,20万个计算任务
- 日均读3PB,写1PB数据;日均上传450TB,下载50TB数据
- 服务淘宝、支付宝、阿里金融等多项集团内部业务
- 支持淘宝贷款、数据模型、聚石塔等多款产品
- 目前处于公测阶段,今年2季度正式商用
- 总量与构成:描述统计、频率分析
- 趋势变化:时间序列、小波理论、比较
- 关联分析:聚类、回归、二值逻辑、关联规则、决策树
- 预测预警:神经网络、支持向量机、面板模型、贝叶斯网络
总量与构成挖掘数据:
- 客户构成:地区、购买金额、频次、客单价
- 销量构成:品类数量结构
- 销售额构成:收入与品类贡献占比
- 利润构成:商品、客户对利润的贡献率
- 点击率和转化率:点击客户数,转化客户数