发布网友 发布时间:2022-04-24 00:35
共2个回答
热心网友 时间:2022-04-07 13:11
这个不能一概而论的,据说python目前高达27万+个库,看你学习的方向必学模块也有不同,简单列举:
1、网络通用方面:
urllib -网络库
requests -网络库
pycurl – 网络库
httplib2 – 网络库
RoboBrowser – 浏览网页
MechanicalSoup -一个与网站自动交互Python库
socket – 底层网络接口
2、爬虫方面:
grab – 爬虫框架
scrapy – 网络爬虫框架,不支持Python3
pyspider –爬虫系统。
cola – 爬虫框架
portia – 可视化爬虫
3、HTML/XML解析方面:
lxml – 高效HTML/ XML处理库
cssselect – 解析DOM树和CSS选择器。
pyquery – 解析DOM树和jQuery选择器。
html5lib – 根据WHATWG规范生成HTML/ XML文档的DOM
feedparser – 解析RSS/ATOM feeds。
MarkupSafe – 为XML/HTML/XHTML提供了安全转义的字符串。
xhtml2pdf – 将HTML/CSS转换为PDF。
untangle – XML文件转Python对象
4、文件处理方面:
xpinyin – 将中国汉字转为拼音
tablib – 数据导出为XLS、CSV、JSON、等格式的模块
textract – 从文件中提取文本
messytables – 解析表格数据
rows – 常用数据接口
Office
python-docx – 读取,查询和修改docx文件
xlwt / xlrd – 从Excel文件读取写入数据和格式信息
Markdown
Python-Markdown – 一个用Python实现的John Gruber的Markdown。
热心网友 时间:2022-04-07 14:29
这个不能一概而论的,据说python目前高达27万+个库,看你学习的方向必学模块也有不同,简单列举: