Python2:若为两个整形数进行运算,结果为整形,但若两个数中有一个为浮点数,则结果为
Python3:为真除法,运算结果不再根据参加运算的数的类型。
Python2:返回小于除法运算结果的最大整数;从类型上讲,与"/"运算符返回类型逻辑一致。
Python3:和 Python2 运算结果一样。
Python2
raise IOError, "file error" #抛出异常 except NameError, err: #捕捉异常
Python3
raise IOError("file error") #抛出异常 except NameError as err: #捕捉异常
Python2,for 循环会修改外部相同名称变量的值
i = 1 print ('comprehension: ', [i for i in range(5)]) print ('after: i =', i ) #i=4
Python3,for 循环不会修改外部相同名称变量的值
i = 1 print ('comprehension: ', [i for i in range(5)]) print ('after: i =', i ) #i=1
Python2,round 函数返回 float 类型值
isinstance(round(15.5),int) #True
Python2 中任意两个对象都可以比较
11 < 'test' #True
Python3 中只有同一数据类型的对象可以比较
11 < 'test' # TypeError: unorderable types: int() < str()
我们在pip官方下载源pypi搜索Python2.7和Python3.5的第三方工具包数可以发现,Python2.7 版本对应的第三方工具类目数量是 28523,Python3.5 版本的数量是 12457,这两个版本在第三方工具 包支持数量差距相当大。
我们从数据分析的应用角度列举了常见实用的第三方工具包(如下表),并分析这些工具包在
分类 工具名 用途 数据收集 scrapy 网页采集,爬虫 数据收集 scrapy-redis 分布式爬虫 数据收集 selenium web 测试,仿真浏览器 数据处理 beautifulsoup 网页解释库,提供 lxml 的支持 数据处理 lxml xml 解释库 数据处理 xlrd excel 文件读取 数据处理 xlwt excel 文件写入 数据处理 xlutils excel 文件简单格式修改 数据处理 pywin32 excel 文件的读取写入及复杂格式定制 数据处理 Python-docx Word 文件的读取写入 数据分析 numpy 基于矩阵的数学计算库 数据分析 pandas 基于表格的统计分析库 数据分析 scipy 科学计算库,支持高阶抽象和复杂模型 数据分析 statsmodels 统计建模和计量经济学工具包 数据分析 scikit-learn 机器学习工具库 数据分析 gensim 自然语言处理工具库 数据分析 jieba 中文分词工具库 数据存储 MySQL-python mysql 的读写接口库 数据存储 mysqlclient mysql 的读写接口库 数据存储 SQLAlchemy 数据库的 ORM 封装 数据存储 pymssql sql server 读写接口库 数据存储 redis redis 的读写接口 数据存储 PyMongo mongodb 的读写接口 数据呈现 matplotlib 流行的数据可视化库 数据呈现 seaborn 美观的数据可是湖库,基于 matplotlib 工具辅助 jupyter 基于 web 的 python IDE,常用于数据分析 工具辅助 chardet 字符检查工具 工具辅助 ConfigParser 配置文件读写支持 工具辅助 requests HTTP 库,用于网络访问
Python2 无法安装 mysqlclient。Python3 无法安装 MySQL-python、 flup、functools32、 Gooey、Pywin32、 webencodings。
matplotlib 在 python3 环境中安装报错:The following required packages can not be built:freetype, png。需要手动下载安装源码包安装解决。
scipy 在 Python3 环境中安装报错,numpy.distutils.system_info.NotFoundError,需要自己手 工下载对应的安装包,依赖 numpy,pandas 必须严格根据 python 版本、操作系统、64 位与否。运行 matplotlib 后发现基础包 numpy+mkl 安装失败,需要自己下载,国内暂无下载源
Python2 无法安装mysql-python和 mysqlclient包,报错:EnvironmentError: mysql_config not found,解决方案是安装 mysql-devel 包解决。使用 matplotlib 报错:no module named _tkinter, 安装 Tkinter、tk-devel、tc-devel 解决。
pywin32 也无法在 centos 环境下安装。