Python
2022-04-01 18:05:59 73 举报
AI智能生成
登录查看完整内容
Python基础知识+爬虫+数据分析+金融量化分析
作者其他创作
大纲/内容
特点
解释型编译器原理
python简介
1.File->setting
2.plugin->搜索->chinese
汉化操作
解压激活码安装包
1.先在插件里添加安装包->点击确定后重启
2.点击帮助->注册->将激活码复制上去就好了
3.不懂得点击链接看视频
破解版激活
破解版操作
编译器pycharm下载安装教程
用缩进来写模块,最好为4个空格
冒号与代码缩进形式定义语句块,而非{}
行和缩进
使用斜杠(\\)将一行的语句分为多行显示
多行语句
主要表示字符串,引号的开始与结束必须是相同类型的
单引号
可以使用单引号包裹双引号,也可以相反,但不能直接用单引号包裹单引号,或双引号包裹双引号,斜杠\\加单引号或双引号直接输出引号,不影响其他
双引号
三引号可以由多行组成,编写多行文本的快捷语法,常用于文档字符串,在文件的特定地点,被当做注释
三引号
引号
换行(\)是标准的行分隔符(通常一个语句一行)
换行
每一行#后面的行将不被运行,被视为注释
多行注释可以使用三个单引号或三个双引号包裹注释内容
注释
空行并不是Python语法的一部分,书写时不插入空行,Python解释器运行也不会出错
空行的作用在于分隔两段不同功能或含义的代码,便于日后代码的维护或重构。
空行
虽然可以分号分开多个语句在同一行连续运行,但不推荐这种写法,例如:print(1);print(2)
同一行显示多条语句
使用a=100;print('A%d'%a)输出数字变量,得到A100输出
使用b='XX';print('B%s'%b)输出字符串变量,得到BXX输出
输出
同样缩进的连续代码被视为一个代码块,具有同样的语义范围
代码规则
基础规则
案例
定义
具体使用
问题描述
不同类型之间的计算
演例
变量的输入
具体实现
基本练习
变量的格式化输出
变量类型
标识符
不能使用python保留字,使用特殊用途的单词(关键词、函数名)
关键字
变量命名规则
使用小写字母
使用简短又具有描述性的定义
小写字母l,易和数字1混淆
大写字母O,易和数字0混淆
建议
变量
赋值符是一个等于符号(=),注意不是两个(==)
多重赋值
多元赋值
变量赋值
源代码脚本
一次性执行
脚本式编程
再执行
逐行输入
交互式编程
两种模式
python*.py
命令行/终端模式
#!/usr/local/bin/python
#!/usr/bin/env/python
首行添加
chomd 755 *.py
赋予权限
*.py
运行脚本
Linux下可执行脚本
%run *.py
IPython
运行Python
应用场景
答案
逻辑运算演练
if条件判断
elif
if嵌套
基础代码实现
random函数的使用
综合应用
if语句进阶
条件|循环
算术运算符
比较运算符
逻辑运算符
赋值运算符
优先级
运算符
程序的三大流程
第一个循环
Python中的计数方法
循环计算
进阶循环
实现
使用循环打印小星星
九九九乘法表
while循环嵌套
while循环
break
continue
break和continue
python循环
循环取值
常用操作
列表
常见操作
遍历循环
元组
循环遍历
字典
大小写相关操作
查找操作
性质判断
操作
格式化字符串
修剪操作
替换操作
拆分操作
编码/解码操作
基本操作
字符串的方法
字符串
创建集合
成员运算
交并差运算
比较运算
运算
集合的方法
不可变集合
集合
高级变量类型
调用
单步调试
错误执行
使用及作用
返回值
函数的注释
函数参数
函数的嵌套调用
使用模块中的函数
函数
python基础知识
注意的地方
调用类中的方法必须先实例化
简单了解
初始化方法
打印对象
类和对象
私有属性
可见性
属性装饰器
可见性和属性装饰器
区别
静态方法和类方法
动态属性
封装
语法和传递性
单继承
重写父类方法
super().父类方法
父类名.方法(self)
拓展父类方法
方法的重写
使用父类中的公有方法访问私有属性和私有方法
父类的私有属性和私有方法
MRO
新式类和经典类
使用注意事项
多继承
继承
案例演示
多态
三大特性
结论
实例
类对象
python面向对象编程
Ctrl+/
快速注释
Tab
自动缩进
Windows中Pycharm快捷键使用
简介
打开网页后右键选择网页源代码
获取网页
提取信息
保存数据
案例获取网页信息
基本流程
HTTP请求过程
开发者模式控制面板
控制面板组成
HTTP和控制面板简介
请求方法
请求的网址
请求头命令
请求头
请求体
爬虫请求介绍
常见错误
响应头
响应体
爬虫响应
GET方法
POST方法
添加头部信息
requests库
使用
安装
Xpath安装与使用
模板采集
图片信息采集
数据转excel表格
自定义采集
八爪鱼数据采集器
1.登录网易云音乐网页并找到相应歌曲
2.Fn+F12或F12打开开发者工具
3.点击网络、媒体
4.点击播放音乐,收到传到网络上的音频文件.m4a
5.双击两下文件下载
截获原理
下载网页VIP音乐
参考视频
批量下载网页图片
实操案例
python爬虫基础知识点
数据分析实现流程
安装教程
Anacinda安装
问题
jupyter连接不到kernel的情况
CMD->jupyter notebook->复制链接到网页打开
jupter notebook进入方式
快捷键
插件下载
jupter notebook安装使用
开发环境搭建
加载相关包
转换成二维表格
数据提取->含有Python字符
修改列的名称
每种编程语言出现的次数和缺失值填充
去除重复值
平均值、生成csv文件、数据的形状
两列交换
获取最大值所在的行
生成数据表
数据表信息查看
数据表清洗
数据表合并
数据提取
数据筛选
数据汇总
数据统计
数据输出
pandas使用流程
apply函数的使用
时间处理
pandas时间处理
用法
pandas时间索引和重采样
总结
pandas用法总结
机器学习之pandas
显示索引
创建
索引和切片
常见属性
头尾、去重
判空
常用方法
Series
numpy和字典创建
练习
属性
取行列
取元素
索引操作
切行列
切片操作
平均值
加分
练习问题
转换时间序列类型
作为源数据的行索引
索引和切片操作
匹配级联
内连接
外连接
append
不匹配级联
级联操作
一对一合并
一对多合并
多对多合并
当两种表没有连接的列时,可使用left_on和right_on手动指定merge中左右的哪一列作为连接的列
key的规范化
合并操作
导入文件,查看原始数据
数据合并
将数据重复的数据删除
查看存在缺失数据的列
找到NaN,进行去重
补上正确的值
合并各州面积并排序找出人口密度最高的州
需求
练习:人口项目分析
DataFrame
要求
获取历史行情数据
将互联网上获取的股票数据存储到本地
对数据进行处理
股票数据预处理
捕获股票上涨的日期
捕获股票跌幅的日期
分析
买入、卖出
总收益
收益计算
练习:股票分析
获取股票历史数据
可视化
均线计算
求金叉日期和死叉日期
金叉死叉概念
作金叉死叉标识
测试
练习:双均线策略制定
空值与NAN浮点型区别
伪造一组数据
isnull()
notnull()
方式1:对空值进行过滤
方式2:dropna
方式3:填充
处理空值操作
处理缺失值
读取
将空值对应的数据删除
填充空值
面试题
使用drop_duplicate
处理重复数据
处理异常数据
缺失值的清洗
pandas两个常用的类
映射关系表
map
映射操作
排序实现的随机抽样
查看详细的分组情况
平均重量汇总到源数据
数据的分类处理
高级数据聚合
分组聚合
读取数据库
透视表
交叉表
透视表和交叉表
总览数据
用统计学指标快速描述数值型属性的概要
异常值处理
新建一个party,统计个元素出现次数
查看各党派收到的政治献金总数
查看老兵主要支持谁
项目:美国大选政治献金
pandas高级操作
pandas
使用array()创建一维或多维数组
数组和列表的区别是什么?
尝试改变数组元素的数值查看对原始图片的影响
将外部的一张图片读取加载到numpy数组中
zero()和ones()
linespace()和arrange()
random系列
其他方式
numpy的创建
shape
ndim
size
dtype
修改数组元素类型
numpy的常用属性
numpy总结
切出前两行(列)数据
行(列)、所有元素倒置
将一张图片进行左右翻转
上下翻转
图片裁剪
numpy索引和切片操作
numpy变形操作
图片级联
numpy级联操作
numpy常用聚合操作
numpy常用的数学函数
numpy常用的统计函数
单位矩阵
矩阵相乘
numpy矩阵相关
numpy
小技巧
5个强大小技巧
进阶
单条线形图
多条线形图
设置坐标比例
设置图例
设置轴的标识
图例的保存
线性图:plt.plot()
柱状图:plt.bar()
直方图:plt.hist()
饼图:pie()
散点图:scatter()
绘图操作
matplotlib可视化基本使用
实战
jupyter notebook实战
离散可视化-seaborn
交互式可视化-plotly
web-pyecharts
Bokeh
地理信息可视化
数据可视化
商业数据指标分析-可视化
数据加载
将order_dt转换成时间类型
查看数据的统计描述
添加月份
观察数据
1.数据预处理
统计每月的消费人数
2.按月数据分析
用户消费金额和产品数量的散点图
各个用户消费总金额的直方分布图
各个用户消费总数量的直方分布图
3.用户个体消费数据分析
用户第一次消费的月份分布和人数统计
用户最后一次消费的时间分布和人数统计
新老用户占比
分析得出每个用户的总购买量和总消费金额and最近一次消费的时间的表格rfm
根据价值分层
用户分层
4.用户消费行为分析
统计每个用户每个月的消费次数
固定算法
判断本月是否消费
每月不同活跃用户的计数
5.用户的生命周期
电商-用户行为分析可视化
金融-股票趋势分布可视化
项目
python数据分析
量化投资
python金融量化投资分析与股票交易
优缺点
C/S架构
B/S架构
OSI七层模型与TCP/IP协议
公网/内网
IP
端口
UDP服务端
UDP客户端
服务端
客户端
UDP循环发送
UDP套接字
socket套接字
UDP特性
TCP套接字细节
循环接收
TCP_server
循环发送
TCP_client
监听器listen原理
文件传输服务端
文件传输客户端
TCP编程流程
三次握手
四次挥手
127.0.0.1等区别
粘包原因
TCP特性
UDP与TCP的特性
网络概述
并发与并行
代码思路
代码
位置传参
关键字传参
函数传参
多子进程
进程
计算机任务执行
多任务编程
HTML
CSS
地理/分布图
K线图
echarts
可视化图表
JAVAscript
基础
flask框架
ajax数据的传递
前后端数据动态传递
动态图表制作
网页设计
知识拓展
Python
收藏
0 条评论
回复 删除
下一页