课程模块 | 课程名称 | 课程内容 |
Python认识和使用 |
python基础 |
Python版本特性介绍、Python应用场景及趋势发展、Python开发环境搭建、Python开发工具及运行环境、标识符与关键字、注释 |
Python入门 |
Python在各系统中的安装、应用场景及数据存储设计、Python程序开发基础指南、如何运行python代码 |
|
python基本语法 |
Python选择与循环、Python字符串处理、可视化python编程、数据及类型操作、Python对象、数字、序列、Python映射和集合类型、Python条件和循环、Python文件和输入输出、python错误和异常 |
|
python高级语法 |
函数和函数式编程、Python面向对象编程、Python正则表达式、Python函数编程、Python多线程编程、Python图形界面编程、Python数据库编程创建、Python扩展 |
|
数据库 |
数据库设计 |
数据库设计及运行管理、数据库设计过程讲解、概念结构设计与ER图、逻辑结构设计与ER转换规则、数据流图与数据字典、数据库设计物理模型、数据库事务与隔离级别、数据库范式及ACID特性、MySQL安装与登、数据库创建与删除 |
数据库基础 |
表结构创建,查看、字段类型与数据类型、字段增加,重命名,删除、记录的增加,修改,删除、表查询、条件查询、模糊查询、视图创建与操作、索引创建与操作 |
|
MongDB |
Mongodb初识、Mongodb快速部署、Mongodb数据库操作 Mongodb collection操作、Mongodb MapReduce、Mongodb数据导入/导出/备份/恢复、Mongodb安全、Mongodb权限控制、Mongodb Python API |
|
内存数据库Redis |
REDIS分布式缓存介绍、REDIS网络模型与内存管理、REDIS的数据一致性问题、REDIS支持的KEY类型、REDIS水平动态扩展、REDIS数据淘汰策略、REDIS访问工具、REDIS shell api、REDIS包引入、REDIS Python API |
|
高阶应用 |
urllib.lib库 |
Python urllib认识、urllib库的基本操作、urllib基本get请求、urllib基本post请求、超时配置与会话对象、代理与API |
requests库 |
Response对象与文件上传、Cookies与会话对象、超时与异常、综合应用案例、CSS选择器与bs4、BeautifulSoup基本介绍、BeautifulSoup安装、BeautifulSoup基本语法、BeautifulSoup的基本运算符、BeautifulSoup语法定位 |
|
css选择器与Xpath |
CSS选择器基本使用、Xpath基本介绍、Xpath基本语法、XPath 轴与表达式、Xpath的基本运算符、Xpath语法定位、常用的反爬虫技术、多线程与多进程爬虫、代理设置与Cookie操作、动态网页内容的抓取 |
|
Scrapy分布式爬虫 |
Selenium与PhantomJS、模拟表单登录、创建项目与定义Item、命令行工具、Spiders参数与选择器、Scrapy的Feed输出、数据收集与终端输出、Scrapy爬虫常见问题、vvScrapy爬虫调试优化 |
|
进军数据分析 |
数据分析 |
数据分析工具讲解、数值计算包学习、数据处理包Pandas、Pandas与数据库、读取文本文件、函数解析、利用DataFrame、关系型数据库驱动、非关系型数据库驱动、Web API操作网络资源 |
数据处理 |
数据清洗原理、缺失数据处理、合并数据集、数据DataFrame合并、数据轴向连接、数据样本分位数、数据聚合运算、面向列的多函数应用、定义不同列的函数、通过函数进行分组 |
|
Matplotlib |
Matplotlib基本介绍、Matplotlib可视化包认识、2D与3D图表图表使用、Matplotlib图像显示、Matplotlib应用、从文件加载数据、从网络加载数据、绘图与可视化、统计学基础、时间序列分析基础 |
|
SPSS、SK-LEARN |
序列分析周期算法与应用、机器学习知识、spss软件介绍、spss使用算法简单讲解、sk-learn算法讲解、sk-learn安装、sk-learn算法调用、pandas接入模型、statsmodels使用、线性模型估计 |
|
项目实战 |
个人用户信用评估 |
针对脱敏的几十个维度的用户数据,以及银行提供的黑名单,建立个人用户的信用评估模型;在建模过程中涉及到用户数据缺失值处理,特征筛选,特征量化,类别不平衡策略,模型参数调优;涉及到SPSS数据分析,pandas,sklearn工具的使用;通过该项目的学习,完整掌握各类数据分析软件,分析流程以及相关算法。 |
运营商数据统计分析 |
对运营商用户真实浏览记录,利用浏览数据分类,以及爬虫抓取数据扩充标签,统计用户浏览行为,给用户贴上对应标签,针对个人用户以及群体用户的特征,进行相关数据推荐;涉及到数据全量与增量统计,实时计算,协同过滤等技术与算法,分布式爬虫部署,以及反爬虫策略;通过该项目学习,完整掌握数据抓取技术,海量数据实时计算,以及主流用户推荐算法。 |
|
电商网站评价情感分析 |
针对某互联网电商平台上的商品数据,抓取其评论数据,进行情感分析,并抽取评论关键词,分析用户关心的商品问题;涉及到爬虫知识,数据筛选,清洗,去重以及贝叶斯,LDA算法等;通过该项目的学习,加深对数据处理流程的理解以及对自然语言处理知识的认识。 |
|
股票数据拟合与推荐 |
针对网上获取的实时股票数据,利用多种方法对数据进行短期拟合,评估拟合效果,并在拟合多支股票的基础上,进行有价值股票的推荐;涉及到时间序列数据拟合,预警等技术;通过该项目的学习,加深对时间序列分析与理解。 |
懂业务:从事数据分析工作的前提就是需要懂业务,即熟悉行业知识、公司业务及流程,最好有自己独特见解,若脱离行业认知和公司业务背景,分析的结果只会是脱了线的风筝,没有太大的实用价值。从另外一个角度来说,懂业务也是数据敏感的体现。不懂业务的数据分析师,看到的只是一个个数字;懂业务的数据分析师,则看到的不仅仅是数字,他明白数字代表什么意义,知道数字是大了还是小了,心中有数,这才是真正意义的数据敏感性。
15+年互联网IT技术经验
6+年大数据项目实战经验
国家大数据标准组成员
精通大数据领域各类技术Apache开源项目Hadoop、Hbase、Flink、Storm、Kafka、Spark等。 主要研究方向包括大数据架构、数据挖掘、大数据分析等领域。在企业级应用软件、大数据分析、移动互联网、教育大数据等领域有近15年的系统设计、研发、管理经验。
掌握专业技能 。很多数据分析师需要有专业技能,这里说的专业技能有社会学技能、财物管理、统计学技能、以及心理学。统计学是数据分析的基础,掌握统计学的基本知识是数据分析师的基本功。对于社会学技能来说,从社会化角度看,人都有社会性质,收到群体心理的影响。倘若数据分析师没有社会学基本技能,很难对市场现象做出合理解释。当然,如果还能懂得财务管理知识和心理学知识那就最好不过了。这些都将会使数据分析师做数据分析的过程更容易。
课程背景
数据分析是当下IT行业的热门技能之一,随着互联网、物联网等大数据时代的到来,数据分析需求越来越大,成为了各行业都需要涉及的一个重要职能。在成都,数据分析也成为了越来越多人关注的话题,不少人希望通过学习数据分析技能来提升自身竞争力。
课程特色
1. 课程全面:涵盖基础数据挖掘知识,包括数据预处理、数据可视化、数据分析建模等多个方面。
2. 实战案例:引入真实案例进行教学,让学员能够更好地掌握实际应用技能。
3. 小班授课:每个班级人数相对较小,教学效果更佳。
课程目标
1. 掌握数据分析的基本理论与方法。
2. 熟练掌握各种数据挖掘工具和技术。
3. 能够独立开展数据分析项目,并完成分析报告。
学习对象
该课程适合希望提升数据分析技能的IT从业人员、市场营销人员、商业分析人员等。
课程内容
1. 数据预处理:数据清洗、数据转化、数据集成
2. 数据可视化:数据展示、图表制作、可视化工具
3. 数据分析建模:回归、聚类、关联、分类等模型应用
学习时长
该课程时长约为2-3个月,每周3-4节课,每节课3小时。
收费范围
费用一般在8000元到15000元之间,根据不同机构和课程的不同会有所差异。
学习收获
通过学习该课程,学员可以掌握数据挖掘和分析的核心方法,提升数据分析能力;学员能够在实际工作中应用所学技能,解决实际问题,提高工作效率。
结语
以上信息仅供参考,实际情况以到校咨询为准。可联系在线客服,预约免费体验课,帮助你更好的了解课程内容和教学方式,更好地选择适合自己的机构和课程,达到事半功倍的效果。