找回密码
 会员注册
查看: 9|回复: 0

Python必备库大全,建议留用

[复制链接]

2万

主题

0

回帖

7万

积分

超级版主

积分
72146
发表于 2024-9-7 21:31:29 | 显示全部楼层 |阅读模式
urllib-网络库(stdlib)。requests-网络库。grab–网络库(基于pycurl)。pycurl–网络库(绑定libcurl)。urllib3–PythonHTTP库,安全连接池、支持文件post、可用性高。httplib2–网络库。RoboBrowser–一个简单的、极具Python风格的Python库,无需独立的浏览器即可浏览网页。MechanicalSoup-一个与网站自动交互Python库。mechanize-有状态、可编程的Web浏览库。socket–底层网络接口(stdlib)。UnirestforPython–Unirest是一套可用于多种语言的轻量级的HTTP库。hyper–Python的HTTP/2客户端。PySocks–SocksiPy更新并积极维护的版本,包括错误修复和一些其他的特征。作为socket模块的直接替换。网络爬虫框架1.功能齐全的爬虫grab–网络爬虫框架(基于pycurl/multicur)。scrapy–网络爬虫框架(基于twisted),不支持Python3。pyspider–一个强大的爬虫系统。cola–一个分布式爬虫框架。2.其他portia–基于Scrapy的可视化爬虫。restkit–Python的HTTP资源工具包。它可以让你轻松地访问HTTP资源,并围绕它建立的对象。demiurge–基于PyQuery的爬虫微框架。HTML/XML解析器1.通用lxml–C语言编写高效HTML/XML处理库。支持XPath。cssselect–解析DOM树和CSS选择器。pyquery–解析DOM树和jQuery选择器。BeautifulSoup–低效HTML/XML处理库,纯Python实现。html5lib–根据WHATWG规范生成HTML/XML文档的DOM。该规范被用在现在所有的浏览器上。feedparser–解析RSS/ATOMfeeds。MarkupSafe–为XML/HTML/XHTML提供了安全转义的字符串。xmltodict–一个可以让你在处理XML时感觉像在处理JSON一样的Python模块。xhtml2pdf–将HTML/CSS转换为PDF。untangle–轻松实现将XML文件转换为Python对象。2.清理Bleach–清理HTML(需要html5lib)。sanitize–为混乱的数据世界带来清明。文本处理用于解析和操作简单文本的库。通用difflib–(Python标准库)帮助进行差异化比较。Levenshtein–快速计算Levenshtein距离和字符串相似度。fuzzywuzzy–模糊字符串匹配。esmre–正则表达式加速器。ftfy–自动整理Unicode文本,减少碎片化。自然语言处理处理人类语言问题的库。NLTK-编写Python程序来处理人类语言数据的最好平台。Pattern–Python的网络挖掘模块。他有自然语言处理工具,机器学习以及其它。TextBlob–为深入自然语言处理任务提供了一致的API。是基于NLTK以及Pattern的巨人之肩上发展的。jieba–中文分词工具。SnowNLP–中文文本处理库。loso–另一个中文分词库。浏览器自动化与仿真selenium–自动化真正的浏览器(Chrome浏览器,火狐浏览器,Opera浏览器,IE浏览器)。Ghost.py–对PyQt的webkit的封装(需要PyQT)。Spynner–对PyQt的webkit的封装(需要PyQT)。Splinter–通用API浏览器模拟器(seleniumweb驱动,Django客户端,Zope)。多重处理threading–Python标准库的线程运行。对于I/O密集型任务很有效。对于CPU绑定的任务没用,因为pythonGIL。multiprocessing–标准的Python库运行多进程。celery–基于分布式消息传递的异步任务队列/作业队列。concurrent-futures–concurrent-futures模块为调用异步执行提供了一个高层次的接口。异步异步网络编程库asyncio–(在Python3.4+版本以上的Python标准库)异步I/O,时间循环,协同程序和任务。Twisted–基于事件驱动的网络引擎框架。Tornado–一个网络框架和异步网络库。pulsar–Python事件驱动的并发框架。diesel–Python的基于绿色事件的I/O框架。gevent–一个使用greenlet的基于协程的Python网络库。eventlet–有WSGI支持的异步框架。Tomorrow–异步代码的奇妙的修饰语法。队列celery–基于分布式消息传递的异步任务队列/作业队列。huey–小型多线程任务队列。mrq–Mr.Queue–使用redis&Gevent的Python分布式工作任务队列。RQ–基于Redis的轻量级任务队列管理器。simpleq–一个简单的,可无限扩展,基于AmazonSQS的队列。python-gearman–Gearman的PythonAPI。云计算picloud–云端执行Python代码。http://dominoup.com –云端执行R,Python和matlab代码网页内容提取提取网页内容的库。HTML页面的文本和元数据newspaper–用Python进行新闻提取、文章提取和内容策展html2text–将HTML转为Markdown格式文本python-goose–HTML内容/文章提取器自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注Python)img_convert/9f49b566129f47b8a67243c1008edf79.png)既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注Python)
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

QQ|手机版|心飞设计-版权所有:微度网络信息技术服务中心 ( 鲁ICP备17032091号-12 )|网站地图

GMT+8, 2025-1-11 02:19 , Processed in 0.499451 second(s), 26 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表