北京非凡睿诚教育咨询中心
专注信息化与数字化技术培训
新闻详情

关于“SPSS数据挖掘与数据分析案例实战”会议通知

发表时间:2020-08-09 23:05

各企事业单位、高等院校及科研院所:

SPSS是一款是世界上使用最早、最广泛、用户数最多,久享盛名的数据统计分析软件。因为具有界面友好、操作简便、易于掌握和统计分析功能强大等特点在全球财富1000家企业中,有95%的企业都使用 spss软件。自进入中国市场以来,spss已成为国内流行的统计分析和数据挖掘软件,它们分布于税务、通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研教育等多个领域和行业,是世界上应用最广泛的专业商用统计软件。为了推进国内数据分析与处理教学和科研工作,促进SPSS数据分析与处理研究和应用发展,为提升相关科技工作者的技术水平,为此北京非凡睿诚科技有限公司特举办“SPSS数据挖掘与数据分析案例实战”会议,具体事宜如下

总体定位:了解Python在数据分析、挖掘建模及可视化方面的具体应用,初步掌握其使用方法。

一、时间地点:

2019.12.26——2019.12.29   北京*高校

         (时间安排:第一天报道,授课三天,大学机房授课)

会议内容

1)数据分析基础及实战

2)数据挖掘理论及核心技术

3)数据挖掘算法原理及实现

4)数据挖掘建模实战

5SPSS Modeler数据挖掘平台使用(零代码)

三、会议特色

1. 本课程尽量避开数学公式,按照“讲清思想方法原理—结合具体案例—实现细节”思路,让即使是几乎没有什么基础的学员,不需要编程,掌握数据挖掘和可视化的基本思路和模式,打下未来深入的良好基础,能在工作和学习中结合具体问题立马上手操作解决;

2. 课程注重学练结合的方法,会采取课中练习的方法,充分调动大家思考的积极性,在做中掌握相关知识和技能;

3. 课程紧紧抓住数据挖掘和可视化的重点和难点,详细的分析和讲解,在理解难、容易出错的地方反复提醒,以便学员在课后容易的进行自己复习和相关拓展。

四、主讲嘉宾

中国科学院计算技术研究所、清华大学、北京大学、复旦大学等科研机构和大学的高级专家。大数据、机器学习、数据挖掘领域一线实战专家。主要负责各类科研人员机器学习和大数据核心技术、数据挖掘、数据分析等课程的教学,精通算法原理与编程实践。拥有多项国家专利及丰富的科研及工程技术经验。长期从事大数据、数据挖掘、机器学习、计算机视觉等领域的教学与研究工作。

五、参会人员

各省市、自治区从事金融、医疗、保险、生态、卫生、计量、统计、银行、通信、环境、基金、等金融衍生品行业与数据分析、数据挖掘等领域相关的企事业单位技术骨干、科研院所研究人员和大专院校相关专业教学人员及在校研究生等相关人员,以及机器学习爱好者等相关人员;

SPSS数据挖掘与数据分析案例实战——课程大纲

培训模块

培训内容

数据分析基础及实战

q 数据挖掘基础

介绍数据挖掘的基本概念、流程、各环节的常见问题以及数据挖掘项目的团队组建、项目实施方法。

重点:数据挖掘的本质

      数据挖掘项目的核心环节和常见的坑

      数据挖掘常见的算法

      数据挖掘常用的应用领域

      数据挖掘的实践总结

数据可视化

q 可视化分析

集合多维分析,介绍基本的统计基础、可视化基本概念,可视化设计流程以及SPSS可视化的方法;其次,介绍常见图表(拆线图、柱状图、散点图、雷达图、词云图等)的适用场景和使用方法,并结合主流的可视化软件Tableau进行了详细讲解和案例演示。

用户申请信息用于对新申请用户的初始评估,通过对用户年龄、性别、户籍、婚姻状态、教育程度、职业类别、工作年限、年收入、居住类型、车辆情况、保险缴纳、信贷情况的评估,决定是否审批通过并对审批通过的用户设定初始信用额度,有利于银行降低信用风险。根据用户日均消费金额、次数、最大消费金额等数据评估用户消费习惯,从而帮助银行决定是否需要调整客户信用等级和额度。用户拖欠数据包括拖欠时长和拖欠金额,银行可以根据用户的拖欠情况判定用户是否存在欺诈,并采取对应的措施。将这些数据可视化,能够为银行有效地建立起事前、事中到事后的信用风险控制体系。

数据挖掘算法原理及实现

回归分析

线性回归

(1) 回归的基本概念

(2) 线性回归

(3) 对率(Logistic)回归

(4) (Ridge)回归

(5) Lasso 回归

(6) Elastic Net

Logistic/Softmax回归

广义线性回归

L1/L2正则化

Ridge与LASSO

梯度下降算法:BGD与SGD

特征选择与过拟合

代码和案例实践:

1.股票数据的特征提取和应用

2.泰坦尼克号乘客缺失数据处理和存活率预测

3.环境检测数据异常分析和预测

4.模糊数据查询和数据校正方法

5.PCA与鸢尾花数据分类

6.二手车数据特征选择与算法模型比较

7.广告投入与销售额回归分析

8.鸢尾花数据集的分类

9.线性回归

决策树和随机森林

熵、联合熵、条件熵、KL散度、互信息

最大似然估计与最大熵模型

ID3、C4.5、CART详解

决策树的正则化

预剪枝和后剪枝

Bagging

随机森林

不平衡数据集的处理

利用随机森林做特征选择

使用随机森林计算样本相似度

异常值检测

代码和案例实践:

1.随机森林与特征选择

2.决策树应用于回归

3.多标记的决策树回归

4.决策树和随机森林的可视化

5.葡萄酒数据集的决策树/随机森林分类

6.泰坦尼克乘客存活率估计

数据挖掘算法原理及实现

SVM

线性可分支持向量机

软间隔

损失函数的理解

核函数的原理和选择

SMO算法

支持向量回归SVR

多分类SVM

代码和案例实践:

1.原始数据和特征提取

2.调用开源库函数完成SVM

4.数字图像的手写体识别

5.MNIST手写体识别

6.SVR用于时间序列曲线预测

7.SVM、Logistic回归、随机森林三者的比较

聚类算法

聚类算法

(1) 聚类的基本概念

(2) 聚类的评价

(3) 扁平聚类及 k-Means算法

(4) 层次聚类

(5) DBSCAN聚类

代码和案例实践:

  1.鸢尾花聚类分析

   2.社交网络人群分析

   3.银行客户分组与画像

SPSS数据挖掘建模实战案例和练习(提供数据)

1.银行客户流失

2.贷款违约预测

3.保险产品推荐

4.股票走势预测

5.汽车零部件销售分析

6.零售企业商品销售预测

7.工业蒸汽量预测

8.电子推荐等领域的应用等

研讨

1.针对学员面对的实践问题展开讨论、方案建议。

2.建立QQ群、微信群(课后免费技术指导)

注:篇幅有限,案例内容不能全部列出,上课时会有更多的实战案例展示(建议携带笔记本电脑)为本次参会学员提供《数据挖掘》系列规划书籍

六、会议费用

统一收费 3900 元/人(含资料费、证书认证费、指导费、发票费、午餐费等)住宿可统一安排,费用自理。(如需开培训费发票可提供培训通知)

七、颁发证书

参加学员通过考试后可获得:中国管理科学研究院职业资格认证培训中心颁发的《数据分析工程师》专业能力证书,该证书可作为有关单位专业技术人员能力评价、从业人员加薪、晋升、考核和任职的重要依据。

注:请准备两寸蓝底照片、身份证及学历证明(学生证、毕业证、学位证都可)

八、报名方式

联系人:姜珊         QQ:1442373885   

E-mail:1442373885@qq.com     手机(同微信):17600012363




          我们拥有包括职业教育、技能培训、互联网教育、专家访谈及企业咨询服务等在内的综合性课程服务体系,欢迎联系咨询合作                   地址:北京市海淀区信息路甲28号c座          电话:17600012363     邮箱:1756294750@qq.com
官方微信公众号