【Python】Scrapy框架的使用
Scrapy框架 Scrapy是一个高效的爬虫框架,方便我们进行爬虫的开发。 Scrapy架构图(绿线是数据流向): 1.升级pip pip install --upgrade pip 注意: 在命令…
【Python】web.py模块
web.py模块 web.py模块是一个轻量级Python web框架,它简单而且功能强大。 官方的中文文档:http://webpy.org/cookbook/index.zh-cn pip下载模块…
【Python】pip下载模块错误
问题: 在执行命令pip install XXX模块的时候报错: SyntaxError: (unicode error) 'utf-8' codec can't decode byte 0xd6 i…
【Python】Excel文件操作
Excel文件模块 本文基本都是以Python3W为基础。 使用到的模块如下: 1.操作xls格式的表格文件: 读取:xlrd 写入:xlwt 修改(追加写入):xlutils 2.操作xlsx格式的…
【Python】连接MySQL数据库
1.连接的基本语法如下: pyimport pymysql #创建连接 conn = pymysql.Connect(host="127.0.0.1", port=3306, user="root",…
【Python】爬取本网站的文章
思路 通过爬虫爬取本网站的文章标题、简介和链接。爬取的时候注意下需要解析的标签对就行。 简单的思路就是:抓取单页 -> 解析信息 -> 保存文件 -> 单线程循环/多线程循环。 pyquery库:py…
【Python】requests模块
requests模块 Python标准库中提供了:urllib、urllib2、httplib等模块以供Http请求,但是,它的 API 太渣了。它是为另一个时代、另一个互联网所创建的。它需要巨量的工…
【Python】多线程编程
[successbox title="线程的状态"] 初始化(Init):在创建线程,操作系统在内部会将其标识为初始化状态。此状态只在系统内核中使用。 就绪(Ready):线程已经准备好被执行。 延迟…
【Python】UDP编程
[successbox title="UDP协议"] UDP协议同样是建立在IP协议之上的。但是UDP协议面向无连接的通信协议,不保证数据包的顺利到达,不可靠传输,所以效率比TCP要高。 [/succ…
【Python】TCP编程
[successbox title="TCP协议"] TCP协议则是建立在IP协议之上的,TCP协议负责在两台计算机之间建立可靠连接,保证数据包按顺序到达。TCP协议会通过握手建立连接,然后,对每个I…