套接字
Python 提供了两个级别访问的网络服务。:
- 低级别的网络服务支持基本的 Socket,它提供了标准的 BSD Sockets API,可以访问底层操作系统Socket接口的全部方法。
- 高级别的网络服务模块 SocketServer, 它提供了服务器中心类,可以简化网络服务器的开发。
Socket又称"套接字",应用程序通常通过"套接字"向网络发出请求或者应答网络请求,使主机间或者一台计算机上的进程间可以通讯。
Python 中,我们用socket()
函数来创建套接字,语法格式如下:socket.socket([family[, type[, proto]]])
参数: family
: 套接字家族可以使AF_UNIX
或者AF_INET
;AF_INET
指定使用IPv4协议,如果要用更先进的IPv6,就指定为AF_INET6
。type
: 套接字类型可以根据是面向连接的还是非连接分为SOCK_STREAM
或SOCK_DGRAM
;SOCK_STREAM
指定使用面向流的TCP协议
。protocol
: 一般不填默认为0
.
Socket 对象(内建)方法
服务器端套接字
函数 | 描述 | |
---|---|---|
s.bind() | 绑定地址(host,port) 到套接字, 在AF_INET 下,以元组(host,port) 的形式表示地址。 | |
s.listen() | 开始TCP监听。backlog指定在拒绝连接之前,操作系统可以挂起的最大连接数量。该值至少为1,大部分应用程序设为5就可以了。 | |
s.accept() | 被动接受TCP客户端连接,(阻塞式)等待连接的到来 |
客户端套接字
函数 | 描述 | |
---|---|---|
s.connect() | 主动初始化TCP服务器连接,。一般address 的格式为元组(hostname,port) ,(port指端口号)如果连接出错,返回socket.error 错误。 | |
s.connect_ex() | connect() 函数的扩展版本,出错时返回出错码,而不是抛出异常 |
公共用途的套接字函数
函数 | 描述 | |
---|---|---|
s.recv() | 接收TCP数据,数据以字符串形式返回,bufsiz e指定要接收的最大数据量。flag 提供有关消息的其他信息,通常可以忽略。 | |
s.send() | 发送TCP数据,将string中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于string的字节大小。 | |
s.sendall() | 完整发送TCP数据,完整发送TCP数据。将string中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。 | |
s.recvform() | 接收UDP数据,与recv() 类似,但返回值是(data,address) 。其中data 是包含接收数据的字符串,address 是发送数据的套接字地址。 | |
s.sendto() | 发送UDP数据,将数据发送到套接字,address 是形式为(ipaddr,port) 的元组,指定远程地址。返回值是发送的字节数。 | |
s.close() | 关闭套接字 | |
s.getpeername() | 返回连接套接字的远程地址。返回值通常是元组(ipaddr,port) | |
s.getsockname() | 返回套接字自己的地址。通常是一个元组(ipaddr,port) | |
s.setsockopt(level,optname,value) | 设置给定套接字选项的值。 | |
s.getsockopt(level,optname[.buflen]) | 返回套接字选项的值。 | |
s.settimeout(timeout) | 设置套接字操作的超时期,timeout 是一个浮点数,单位是秒。值为None 表示没有超时期。一般,超时期应该在刚创建套接字时设置,因为它们可能用于连接的操作(如connect() ) | |
s.gettimeout() | 返回当前超时期的值,单位是秒,如果没有设置超时期,则返回None 。 | |
s.fileno() | 返回套接字的文件描述符。 | |
s.setblocking(flag) | 如果flag为0,则将套接字设为非阻塞模式,否则将套接字设为阻塞模式(默认值)。非阻塞模式下,如果调用recv() 没有发现任何数据,或send() 调用无法立即发送数据,那么将引起socket.error 异常。 | |
s.makefile() | 创建一个与该套接字相关连的文件 |
# 导入socket库:import socket# 创建一个socket:s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)# 建立连接:s.connect(('www.sina.com.cn', 80))
客户端
客户端要主动发起TCP连接,必须知道服务器的IP地址
和端口号
。新浪网站的IP地址可以用域名www.sina.com.cn
自动转换到IP地址
80端口是Web服务的标准端口。其他服务都有对应的标准端口号,例如SMTP服务是25端口,FTP服务是21端口,等等。端口号小于1024的是Internet标准服务的端口,端口号大于1024的,可以任意使用。
因此,我们连接新浪服务器的代码如下:
s.connect(('www.sina.com.cn', 80))
建立TCP连接后,我们就可以向新浪服务器发送请求,要求返回首页的内容: # 发送数据:s.send(b'GET / HTTP/1.1\r\nHost: www.sina.com.cn\r\nConnection: close\r\n\r\n')
60
# 接收数据:buffer = []while True: # 每次最多接收1k字节: d = s.recv(1024) if d: buffer.append(d) else: breakdata = b''.join(buffer)# 关闭连接:s.close()
接收数据时,调用recv(max)
方法,一次最多接收指定的字节数,因此,在一个while循环中反复接收,直到recv()
返回空数据,表示接收完毕,退出循环。
(header, html) = data.split(b'\r\n\r\n', 1)print(header.decode('utf-8'))# 把接收的数据写入文件:with open('sina.html', 'wb') as f: f.write(html)
HTTP/1.1 200 OKServer: nginxDate: Tue, 22 Aug 2017 08:03:04 GMTContent-Type: text/htmlContent-Length: 601703Connection: closeLast-Modified: Tue, 22 Aug 2017 07:58:35 GMTVary: Accept-EncodingExpires: Tue, 22 Aug 2017 08:04:03 GMTCache-Control: max-age=60X-Powered-By: shci_v1.03Age: 0Via: http/1.1 cnc.beixian.ha2ts4.205 (ApacheTrafficServer/4.2.1.1 [cMsSf ]), http/1.1 ctc.ningbo.ha2ts4.106 (ApacheTrafficServer/4.2.1.1 [cRs f ])X-Cache: MISS.205X-Via-CDN: f=edge,s=ctc.ningbo.ha2ts4.101.nb.sinaedge.com,c=218.75.27.189;f=Edge,s=ctc.ningbo.ha2ts4.106,c=115.238.190.101;f=edge,s=cnc.beixian.ha2ts4.213.nb.sinaedge.com,c=115.238.190.106;f=Edge,s=cnc.beixian.ha2ts4.205,c=115.238.190.101X-Cache: MISS.MERGE.106
现在,只需要在浏览器中打开这个sina.html文件,就可以看到新浪的首页了。
服务器:
- 我们使用
socket
模块的socket()
函数来创建一个socket
对象。socket
对象可以通过调用其他函数来设置一个socket
服务。- 通过调用
bind(hostname, port)
函数来指定服务的port
(端口)。 - 我们调用
socket
对象的accept
方法。该方法等待客户端的连接,并返回connection
对象,表示已连接到客户端。
- 通过调用
完整代码如下
# 文件名:server.pyimport threading# 导入 socket模块import socket# 创建 socket 对象s = socket.socket(socket.AF_INET, socket.SOCK_STREAM) # 绑定端口s.bind(('127.0.0.1', 1024))# 设置最大连接数,超过后排队s.listen(5)print('请稍后,正在连接中...')# 每个连接都必须创建新线程(或进程)来处理,否则,单线程在处理连接的过程中,无法接受其他客户端的连接:def tcplink(sock, addr): print('Accept new connection from %s:%s...' % addr) sock.send(b'Welcome!') while True: data = sock.recv(1024) time.sleep(1) if not data or data.decode('utf-8') == 'exit': break sock.send(('Hello, %s!' % data.decode('utf-8')).encode('utf-8')) sock.close() print('Connection from %s:%s closed.' % addr) while True: # 建立客户端连接 sock,addr = serversocket.accept() # 创建新线程来处理TCP连接: t = threading.Thread(target=tcplink, args=(sock, addr)) t.start()
请稍后,正在连接中...
- 客户端 接下来我们写一个简单的客户端实例连接到以上创建的服务。端口号为 9999。
socket.connect(hosname, port )
方法打开一个 TCP 连接到主机为 hostname 端口为 port 的服务商。连接后我们就可以从服务端后期数据,记住,操作完成后需要关闭连接。
完整代码如下:
# 文件名:client.py# 导入 socket模块import sockets = socket.socket(socket.AF_INET, socket.SOCK_STREAM)# 建立连接:s.connect(('127.0.0.1', 9999))# 接收欢迎消息:print(s.recv(1024).decode('utf-8'))for data in [b'Michael', b'Tracy', b'Sarah']: # 发送数据: s.send(data) print(s.recv(1024).decode('utf-8'))s.send(b'exit')s.close()
现在我们打开两个终端,第一个终端执行 server.py 文件
第二个终端执行 client.py 文件Python Internet 模块
以下列出了 Python 网络编程的一些重要模块:
协议 | 功能用处 | 端口号 | Python 模块 | |
---|---|---|---|---|
HTTP | 网页访问 | 80 | httplib, urllib, xmlrpclib | |
NNTP | 阅读和张贴新闻文章,俗称为"帖子" | 119 | nntplib | |
FTP | 文件传输 | 20 | ftplib, urllib | |
SMTP | 发送邮件 | 25 | smtplib | |
POP3 | 接收邮件 | 110 | poplib | |
IMAP4 | 获取邮件 | 143 | imaplib | |
Telnet | 命令行 | 23 | telnetlib | |
Gopher | 信息查找 | 70 | gopherlib, urllib |