学Python大数据分析有“钱”途

进一步了解Python大数据分析师就业趋势

学Python大数据分析,可以胜任更多“高鑫”岗位

了解更多高薪职位

为什么在易胜博备用网址易胜博主页可以成为Python大数据分析高手?

01领先行业的易胜博备用网址易胜博主页Python大数据分析专业体系

  • 第四阶段

    机器学习、深度学习

  • 第三阶段

    数据清洗、数据分析

  • 第二阶段

    数据获取与存储

  • 第一阶段

    大数据分析之语言基础

  • 教学主题 教学内容
    第一章:
    Scikit-Learn
    机器学习

    1.1什么是机器学习; 1.2机器学习的类型; 1.3机器学习的流程; 1.4机器学习中的基本问题分类; 1.5机器学习中的数据预处理; 1.6一元线性回归; 1.7模型的过拟合与欠拟合; 1.8岭回归; 1.9多项式回归; 1.10决策树原理、构建过程及API; 1.11自适应增强算法和随机森林算法原理及API; 1.12逻辑分类算法及API; 1.13朴素贝叶斯算法原理及API; 1.14评估分类效果-交叉验证; 1.15评估分类效果-混淆矩阵; 1.16评估分类效果-分类报告; 1.17超参数优选-验证曲线; 1.18超参数优选-学习曲线; 1.19超参数优选-网格搜索; 1.20支持向量机算法原理及API; 1.21K-Means算法原理及API; 1.22DBSCAN算法原理及API; 1.23均值漂移算法原理及API; 1.24凝聚层次算法原理及API;

    第二章:
    深度学习

    2.1深度学习框架Tensorflow介绍; 2.2Tensorflow的特点; 2.3Tensorflow安装; 2.4Tensorflow的结构; 2.5Tensorflow数据流; 2.6图; 2.7OP; 2.8会话; 2.9张量介绍; 2.10张量操作; 2.11Tensorflow变量; 2.12可视化Tensorboard; 2.13Tensorflow实现线性回归; 2.14Tensorflow队列; 2.15Tensorflow线程; 2.16Tensorflow文件读取流程; 2.17Tensorflow文件读取API; 2.18Tensorflow读取CSV文件; 2.19Tensorflow读取图片; 2.20Tensorflow读取二进制文件; 2.21神经网络基础; 2.22神经网络的发展; 2.23神经网络的特点; 2.24神经网络的组成; 2.25浅层人工神经网络模型; 2.26卷积神经网络; 2.27Tensorflow分布式

    第三章:
    阶段项目

    3.1基于用户相似度的推荐引擎; 3.2手写体数字识别; 3.3汽车质量评估;

    第四章:
    综合项目实战

    "4.1爬取豆瓣电影数据,利用Python数据分析工具分析电影评分、用户数据并可视化,基于推荐引擎进行电影推荐"; "4.2爬取房价数据,进行数据清洗、数据预处理、数据分析以及数据可视化,利用机器学习建模,进行房价预测"

    教学目标

    可掌握的核心能力:1)掌握机器学习常用回归、分类以及聚类算法原理及API使用; 2)掌握机器学习算法超参数优选方法,并训练模型; 3)掌握深度学习框架Tensorflow的原理及常用API的使用; 4)掌握神经网络的特点及原理; 5)在数据分析师的基础之上进一步增加核心竞争力; 6)迈进数据挖掘和人工智能大门,掌握必备的入门条件

    教学主题 教学内容
    第一章:
    Excel数据分析

    1.1Excel基础操作; 1.2Excel公式介绍; 1.3Excel逻辑函数; 1.4Excel统计函数; 1.5Excel查找函数; 1.6Excel引用函数; 1.7Excel数学函数; 1.8Excel日期时间函数; 1.9Excel文本函数; 1.10Excel信息函数; 1.11Excel数组; 1.12Excel图表; 1.13Excel数据透视表; 1.14Excel订单表; 1.15Excel游戏数据; 1.16Excel日报分析; 1.17Excel留存分析;

    第二章:
    数据分析工具
    Numpy

    2.1Numpy介绍; 2.2Numpy的特点; 2.3Numpy的核心多维数组; 2.4数组的索引; 2.5数组的切片切片; 2.6数组的属性; 2.7Numpy基本数据类型; 2.8Numpy自定义数据类型; 2.9改变数组的维度; 2.10常用统计学指标介绍; 2.11读取文件; 2.13移动均线; 2.14线性拟合; 2.15多项式拟合; 2.16矩阵运算; 2.17Numpy数组的多种运算; 2.18矢量操作

    第三章:
    数据分析工具
    Pandas

    3.1Pandas介绍; 3.2Pandas核心数据结构Series; 3.3Pandas核心数据结构DataFrame; 3.4Pandas时间序列; 3.5查看DataFrame数据; 3.6修改DataFrame数据; 3.7增加DataFrame数据; 3.8删除DataFrame数据; 3.9描述分析数据; 3.10Pandas读取CSV文件; 3.11Pandas读取Excel文件; 3.12Pandas读取其他格式文件; 3.13Pandas分组聚合; 3.14Pandas透视表; 3.15Pandas交叉表; 3.16Pandas合并数据; 3.17Pandas清洗数据; 3.18Pandas标准化数据; 3.19Pandas转换数据; 3.20Jupyter的使用;

    第四章:
    数据可视化工具
    matplotlib

    4.1绘图入门; 4.2设置线条样式; 4.3设置坐标刻度; 4.4设置坐标轴显示以及位置; 4.5设置图例; 4.6创建figure; 4.7设置主次刻度; 4.8绘制网格; 4.9为图面添加注释; 4.10设置子图; 4.11条形图; 4.12饼图; 4.13填充颜色; 4.14散点图; 4.15等高线图; 4.16直方图;

    第五章:
    数据分析工具
    Tableau

    5.1Tableau介绍; 5.2Tableau新手上路; 5.3数据源基本操作; 5.4数据连接方式; 5.5多表数据连接; 5.6异构数据混合; 5.7提取数据; 5.8工作表-常规操作; 5.9工作表-编辑元数据; 5.10工作表-字段操作; 5.11工作表-演示集成员对总额的贡献程度; 5.12Tableau函数与计算; 5.13Tableau排序与筛选器; 5.14Tableau参数; 5.15Tableau图表分析; 5.16Tableau地图绘制与图像; 5.17Tableau高级图表类型;

    第六章:
    阶段项目

    6.1泰坦尼克号生存分析; 6.2租房信息分析; 6.3金融量化分析

    教学目标

    可掌握的核心能力:1)熟练掌握大数据分析常用工具; 2)熟练掌握常用数据可视化工具; 3)掌握数据清洗、数据预处理技术; 4)可基于业务对各种指标进行分析并将结果可视化; 5)成为一个合格的数据分析师

    教学主题 教学内容
    第一章:
    网络爬虫基础

    1.1爬虫课程的介绍和概念; 1.2爬虫的流程; 1.3搜索引擎的工作原理和局限以及robots协议; 1.4http和http的概念; 1.5浏览器发送请求的流程; 1.6url的形式和http的内容和请求头以及get请求和post请求; 1.7requests模块发送请求和获取网页的字符串; 1.8requests保存图片; 1.9requests模块发送带headers的请求和带参数的请求; 1.10requests模块发送post请求; 1.11requests模块使用代理; 1.12requests模拟登陆的三种方式; 1.13寻找post的地址; 1.14寻找js和分析js; 1.15数据的分类; 1.16json模块的学习; 1.17正则和原始字符串; 1.18xml的了解; 1.19xpath的语法; 1.20lxml模块; 1.21selenium的入门使用; 1.22浏览器驱动的安装; 1.23模拟登陆; 1.24网络水军的操作; 1.25打码平台的使用; 1.26验证码识别总结; 1.27元素定位的方法和iframe的切换和selenium使用的注意点;

    第二章:
    Scrapy框架

    2.1scrapy的介绍; 2.2scrapy的流程; 2.3sacrapy的入门使用; 2.4pipeline的介绍; 2.5logging模块的使用; 2.6构造请求; 2.7item的介绍和使用; 2.8debug信息的认识; 2.9scrapy shell的使用; 2.10scrapy ettings和管道的深入; 2.11crawlspider爬虫案例; 2.12crawlspdier爬虫介绍; 2.13下载中间件的学习; 2.14携带cookie登录; 2.15发送post请求登录;

    第三章:
    MySQL数据库

    3.1什么是数据库; 3.2常见数据库软件; 3.3MySQL数据库安装和卸载; 3.4MySQL数据库登录; 3.5SQL的概念; 3.6SQL的语法和分类; 3.7DDL操作数据库; 3.8DDL操作数据表; 3.9MySQL常用数据类型; 3.10DML操作数据表; 3.11基本查询; 3.12条件查询; 3.13聚合函数; 3.14分组查询; 3.15非空约束; 3.16唯一约束; 3.17主键约束; 3.18外键约束; 3.19多表关系(一对一); 3.20多表关系(一对多); 3.21多表关系(多对多); 3.22数据库设计三范式; 3.23数据库的备份和还原; 3.24内连接查询; 3.25外连接查询; 3.26子查询; 3.27DCL; 3.28MySQL事务操作; 3.29MySQL存储引擎; 3.30MySQL调优; 3.31MySQL与Python交互; 3.32模拟用户登录操作案例

    第四章:
    阶段项目

    4.1爬取小说; 4.2Scrapy框架爬取LOL皮肤

    教学目标

    可掌握的核心能力:1)认识爬虫; 2)了解爬虫原理; 3)可从各种网页、媒体文件爬取数据; 4) 应对各种反爬; 5)能拿到自己想要的各种数据; 6)掌握数据库存储、查询技术

    教学主题 教学内容
    第一章:
    Python基础

    1.1Python介绍; 1.2Python数字; 1.3运算符与表达式; 1.4变量及其本质; 1.5垃圾回收机制; 1.6if语句; 1.7条件表达式; 1.8字符串及其常用操作; 1.9Python的编码; 1.10索引和切片; 1.11while语句; 1.12for语句; 1.13列表; 1.14元组; 1.15字典及其常用操作; 1.16字典的实现原理; 1.17集合; 1.18函数; 1.19Python作用域

    第二章:
    Python高级

    2.1函数式编程; 2.2递归; 2.3装饰器; 2.4模块 2.5常用模块API介绍; 2.6包; 2.7文件读写; 2.8异常处理;

    第三章:
    Python面向对象

    3.1类; 3.2对象; 3.3构造函数; 3.4实例方法; 3.5实例变量; 3.6类方法; 3.7类变量; 3.9静态方法; 3.10继承; 3.11封装; 3.12多态; 3.13函数重写; 3.14迭代器原理及实现;

    第四章:
    Linux基本操作

    4.1Linux的安装; 4.2操作系统介绍,常用操作系统; 4.3Linu的发行版本; 4.4Linux用户命令; 4.5Linux的路径; 4.6Linu目录操作命令; 4.7Linux文件操作命令; 4.8vi文本编辑器; 4.9Linux文件查看与查找命令; 4.10Linux文件权限管理命令;

    第五章:
    代码协同
    管理工具Git

    5.1Git介绍; 5.2Git的安装; 5.3Git的配置; 5.4Git仓库及命令; 5.5版本控制命令; 5.6标签管理; 5.7Git分支操作; 5.8Git远程仓库;

    第六章:
    阶段项目

    6.1 飞机大战; 6.2 2048游戏; 6.3 学生信息管理系统;

    教学目标

    可掌握的核心能力:1)快速融入企业的能力; 2)具备基本的Python开发能力; 3)全面了解IT行业情况; 4) 可基于Python进行简单项目的研发

    咨询完整版课程大纲

    024大专业优势,让你一技多能,融会贯通

  • 易胜博备用网址易胜博主页Python大数据分析课程,Python作为基础工具课,不占用过多教学时间,给学员的在后续进阶课程以及实战演练中留出更多时间。

    更多>
  • 易胜博备用网址易胜博主页Python大数据分析项目是基于公司实际项目研发,更加实战;

    更多>
  • 易胜博备用网址易胜博主页Python大数据分析可以作为人工智能的基础,有助于在人工智能方面进阶;

    更多>
  • 数据分析软件丰富,包括:SAS、SPSS、Tableau。

    更多>
  • 了解更多专业优势

    03行业精英教学团队,让你所学即所用

  • 大咖导师等你来撩

    04不一样的行业实力,原来你是这样的易胜博备用网址易胜博主页

  • 中科大先进技术研究院召开职话大数据高峰论坛,易胜博备用网址易胜博主页被授予中国首家大数据人才培养示范基地。

  • 易胜博备用网址易胜博主页在北京会议中心隆重启动“名企菁英•大数据应用人才联盟大会暨大数据应用人才白皮书发布会”,并获得中央电视台新闻报道。

  • 易胜博备用网址易胜博主页、凤凰网联手打造国内首档大数据思想对话栏目——职话大数据,通过解析中国互联网界在大数据方面的实践经验,为国内大数据人才培养提供职业指导。

  • 了解更多品牌实力

    05产学结合的项目化教学

  • 金融量化分析
  • Sciki-Learn机器学习
  • 用户画像的商品推荐系统
  • 分布式爬虫项目
  • 易胜博备用网址商品推荐系统
  • 金融量化分析

    项目简介

    基于Python数据分析工具Numpy、Pandas对多支股票进行各项指标分析,包括股票k线图、移动平均线、布林带、股票波动、股票相关性分析、股票趋势性分析、股票交易风险评估。利用Sciki-Learn机器学习建立模型,进行股票价格预测、股票交易策略模拟、股票交易时机分析。利用数据可视化工具matplotlib、seabron对结果予以图形化展示

    所用技术

    Numpy、Pandas、机器学习、matplotlib、seabron

    基于Sciki-Learn机器学习框架的房价影响因素深度揭秘以及房价预测

    项目简介

    使用Scrapy框架爬取各大网站房屋数据,利用Python数据分析工具分析各城市房屋均价、房屋总价、房价走势、房源数量、房屋面积分布、楼层、装修等。利用机器学习建立模型,对房价影响因素进行深度揭秘、并对房屋价格进行预测。

    所用技术

    Python爬虫、Numpy、Pandas、机器学习、可视化工具matplotlib、seabron、pyecharts

    基于用户画像的商品推荐系统

    项目简介

    收集用户基本信息、用户交易信息,构建用户画像。构建模型并进行训练,基于K-Means算法对用户进行聚类分析,用户相似度分析,基于用户相似度进行商品推荐,对不同用户实现精准营销。

    分布式爬虫项目

    项目简介

    大型门户网站和大型婚恋网站积累了海量信息,提取有用的价值,应用于数据挖掘、海量数据分析、市场分析(包括热点资讯、关键词点击、舆情分析、全国婚恋市场、个人信息分析等情况),掌握爬虫技术显得尤为重要。

    项目特色

    1、Python 多线程爬虫及其机制
    2、使用Python、requests等网络模块
    3、使用Python lxml、BeautifulSoup、re、json模块进行数据提取
    4、XPath语法规则和各CSS Selector的使用
    5、使用Selenium+Chrome实施动态HTML抓取
    6、掌握Scrapy框架,以及编写各类中间件
    7、掌握scrapy-redis分布式框架,了解各组件工作机制

    易胜博备用网址商品推荐系统

    项目简介

    使用Lambda架构整合实时计算和离线计算,借助分布式环境提升计算能力;使用Flume收集用户的点击、浏览、收藏等行为,建立用户画像和文章画像,并存储于HDFS集群;通过离线Spark SQL计算建立HIVE特征中心,存储到HBase集群;通过ALS、LR、Wide&Deep等机器学习与深度学习、推荐算法进行智能推荐,达到千人千面的用户推荐效果。

    项目特色

    1、ABTest实验平台
    2、用户反馈收集
    3、实时计算平台
    4、离线计算分析平台

    咨询获取完整项目信息

    06合作企业:合作领域广泛,与众多知名企业/机构达成深度合作

  • 更多品牌荣誉

    直播试听 免费预约

    立即预约

    *温馨提示:易胜博备用网址易胜博主页尊重并保护您的隐私*