本文共 18583 字,大约阅读时间需要 61 分钟。
在接下来讨论"Overlapped I/O 事件通知模型"、"Overlapped I/O 完成例程模型"、"IOCP模型"之前,先来看一下Windows的Overlapped I/O,它实际上对应于里的异步I/O(asynchronous I/O或者nonblocking I/O)。通过使用overlapped I/O,开发者可以要求操作系统主动传送数据,并且在传送完毕时通知开发者。这使得开发者的程序在I/O进行过程中,仍然可以处理其他事务。事实上,操作系统内部正是以线程来完成overlapped I/O的。
关于这一点,插上两句。我们自己在写程序的时候,一般很少会把需要循环读写的I/O操作放在主线程中,通常情况下会对此类I/O操作单独开线程处理,并通过消息队列来进行设计上的解耦,当然这需要一点点设计的技巧。如果需要操作的I/O数目很多,程序结构上设计不好的话,这通常会成为开发者的一个负担。而这正是Window的Overlapped I/O想解决的问题,在Windows的Overlapped I/O机制中,I/O的操作线程被封装在了操作系统内核中,API只暴露出有限的接口,Overlapped I/O的API并不需要用户对线程进行管理,用户对内部实现完全不可见。当然这对于想要盘根问底的程序员来说,并不是什么好事。何况在Window的异步I/O模型中,系统内部对I/O的处理在性能上有很大的优化。 让我们先来看一下,异步I/O中关键数据结构OVERLAPPED。其定义如下:typedef struct _OVERLAPPED { DWORD Internal; // 通常被保留,当GetOverlappedResult()传回False并且GatLastError()并非传回ERROR_IO_PENDINO时,该状态置为系统定的状态。 DWORD InternalHigh; // 通常被保留,当GetOverlappedResult()传回False时,为被传输数据的长度。 DWORD Offset; // 指定文件的位置,从该位置传送数据,文件位置是相对文件开始处的字节偏移量。调用 ReadFile或WriteFile函数之前调用进 // 程设置这个成员,读写命名管道及通信设备时调用进程忽略这个成员; DWORD OffsetHigh; // 64位的文件偏移位置中,较高的32位,读写命名管道及通信设备时调用进程忽略这个成员(因为流式的I/O不支持文件位置); HANDLE hEvent; // 一个手动重置的event事件,当overlapped I/O完成时被激发。ReadFileEx()和WriteFileEx()会忽略这个栏位,此时这个地方 // 可能被传递一个用户自定义的指针} OVERLAPPED, *LPOVERLAPPED;Windows的Overlapped I/O只是一种模型,它可以由内核对象(handle),事件内核对象(hEvent), 异步过程调用(apcs) 和完成端口(I/O completion)来实现。所有的I/O设备都可以使用这套机制,包括文件、管道、Socket、串口等。 OVERLAPPED定义了windows上异步I/O所需要的数据结构。在中,我们也讨论了模块之间获取异步结果的方式,有两种: 第一,调用方在异步操作后,不断向被调用方轮询调用结果。 第二,调用方在异步操作后,被调用方主动通知调用方结果。 Windows也异步操作也为上述两种方式提供了相应的接口。 1. 主动查询异步调用结果
BOOL GetOverlappedResult( HANDLE hFile, // 串口的句柄 LPOVERLAPPED lpOverlapped, // 指向重叠操作开始时指定的OVERLAPPED结构 LPDWORD lpNumberOfBytesTransferred, // 指向一个32位变量,该变量的值返回实际读写操作传输的字节数。 BOOL bWait // 该参数用于指定函数是否一直等到重叠操作结束。 // 如果该参数为TRUE,函数直到操作结束才返回。 // 如果该参数为FALSE,函数直接返回。);返回值: 如果overlapped操作成功,此函数返回TRUE,失败则返回FALSE.GetLastError()函数可以获得更详细的失败信息。如果bWait为FALSE而overlapped还是没有完成,GetLastError()函数会返回ERROR_IO_INCOMPLETE。 2. 被调用方给出通知 下面两个函数都很熟悉了,不再介绍。
DWORD WINAPI WaitForSingleObject( HANDLE hHandle, DWORD dwMilliseconds);DWORD WINAPI WaitForMultipleObject( DWORD dwCount, CONST HANDLE* phObject, BOOL fWaitAll, DWORD dwMillisecinds);如果被调用方向调用方给出通知,调用方应该向被调方设置回调函数,或者至少留下一个关联信息,在这里就是核心对象的句柄。而OVERLAPPED结构体把需要操作I/O同核心对象相绑定,如此一来通过上述函数就可以对I/O实现异步操作了。
typedef struct _WSAOVERLAPPED { DWORD Internal; DWORD InternalHigh; DWORD Offset; DWORD OffsetHigh; WSAEVENT hEvent; // 唯一需要关注的参数,用来关联WSAEvent对象} WSAOVERLAPPED, *LPWSAOVERLAPPED;相似的两个函数还包括:
BOOL WSAGetOverlappedResult( SOCKET s, // SOCKET LPWSAOVERLAPPED lpOverlapped, // 这里是想要查询结果的那个重叠结构的指针 LPDWORD lpcbTransfer, // 本次重叠操作的实际接收(或发送)的字节数 BOOL fWait, // 设置为TRUE,除非重叠操作完成,否则函数不会返回 // 设置FALSE,而且操作仍处于挂起状态,那么函数就会返回FALSE,错误为WSA_IO_INCOMPLETE LPDWORD lpdwFlags // 指向DWORD的指针,负责接收结果标志);
DWORD WSAWaitForMultipleEvents( DWORD cEvents, // 等候事件的总数量 const WSAEVENT* lphEvents, // 事件数组的指针 BOOL fWaitAll, // 这个要多说两句: 如果设置为 TRUE,则事件数组中所有事件被传信的时候函数才会返回, // FALSE则任何一个事件被传信函数都要返回,我们这里肯定是要设置为FALSE的 DWORD dwTimeout, // 超时时间,如果超时,函数会返回WSA_WAIT_TIMEOUT,如果设置为0,函数会立即返回, // 如果设置为 WSA_INFINITE只有在某一个事件被传信后才会返回,在这里不建议设置为WSA_INFINITE BOOL fAlertable // 在完成例程中会用到这个参数,这里我们先设置为FALSE);返回值: WSA_WAIT_TIMEOUT: 最常见的返回值,需要做的就是继续Wait WSA_WAIT_FAILED: 出现了错误,请检查cEvents和lphEvents两个参数是否有效 如果事件数组中有某一个事件被传信了,函数会返回这个事件的索引值,但是这个索引值需要减去预定义值 WSA_WAIT_EVENT_0才是这个事件在事件数组中的位置。 同Socket相关,特有的函数包括:
int WSARecv( SOCKET s, // 当然是投递这个操作的套接字 LPWSABUF lpBuffers, // 接收缓冲区,与Recv函数不同 // 这里需要一个由WSABUF结构构成的数组 DWORD dwBufferCount, // 数组中WSABUF结构的数量 LPDWORD lpNumberOfBytesRecvd, // 如果接收操作立即完成,这里会返回函数调用所接收到的字节数 LPDWORD lpFlags, //一个指向标志位的指针。 LPWSAOVERLAPPED lpOverlapped, // “绑定”的重叠结构 LPWSAOVERLAPPED_COMPLETION_ROUTINE lpCompletionRoutine // 完成例程中将会用到的参数,我们这里设置为 NULL);返回值: 若无错误发生且接收操作立即完成,则WSARecv()函数返回0。否则的话,将返回SOCKET_ERROR错误,应用程序可通过WSAGetLastError()来获取相应的错误代码。错误代码WSA_IO_PENDING表示重叠操作成功启动,但是I/O操作还没有完成,所以我们就需要绑定一个事件来通知我们操作何时完成。任何其他的错误表示重叠操作未能成功地启动,以后也不会有完成指示。
int WSASend ( SOCKET s, // s:标识一个已连接套接口的描述字。 LPWSABUF lpBuffers, // 一个指向WSABUF结构数组的指针。每个WSABUF结构包含缓冲区的指针和缓冲区的大小。 DWORD dwBufferCount, // lpBuffers数组中WSABUF结构的数目。 LPDWORD lpNumberOfBytesSent, // 如果发送操作立即完成,则为一个指向所发送数据字节数的指针。 DWORD dwFlags, // 标志位。 LPWSAOVERLAPPED lpOverlapped, // 指向WSAOVERLAPPED结构的指针(对于非重叠套接口则忽略)。 LPWSAOVERLAPPED_COMPLETION_ROUTINE lpCompletionRoutine // 一个指向发送操作完成后调用的完成例程的指针。(对于非重叠套接口则忽略)。);返回值: 若无错误发生且发送操作立即完成,则WSASend()函数返回0。这时,完成例程(Completion Routine)应该已经被调度,一旦调用线程处于alertable状态时就会调用它。否则,返回SOCKET_ERROR 。通过WSAGetLastError获得详细的错误代码。WSA_IO_PENDING 这个错误码(其实表示没有错误)表示重叠操作已经提交成功(就是异步IO的意思了),稍后会提示完成(这个完成可不一定是发送成功,没准出问题也不一定)。其他的错误代码都代表重叠操作没有正确开始,也不会有完成标志出现。
#includeOverlapped I/O 事件通知模型的缺点是,使用了WSAWaitForMultipleEvents函数,而该函数最多只能同时等待64个消息。所以如果想要支持更多的连接,就必须自己开辟线程去管理.该模型的所接入连接数同线程数成线性关系。在线程过多情况下,线程上下文之间的切换,将会影响程序的性能,#include #pragma comment(lib,"ws2_32.lib") #define DATA_BUF_LEN 1024 // 接收缓冲区大小 SOCKET SLisent;SOCKET SWorker[DATA_BUF_LEN] = {0}; WSABUF RecvBuffer[DATA_BUF_LEN]; WSAOVERLAPPED Overlapped[DATA_BUF_LEN]; // 重叠结构 WSAEVENT EventArray[WSA_MAXIMUM_WAIT_EVENTS]; // 用来通知重叠操作完成的事件句柄数组 DWORD dwRecvBytes = 0, // 接收到的字符长度 DWORD Flags = 0; // WSARecv的参数 DWORD volatile dwEventTotal = 0; // 程序中事件的总数 //由于EVENT数量限制,目前最多只能支持64个连接 DWORD WINAPI AcceptThread(LPVOID lpParameter) { WSADATA wsaData; WSAStartup(MAKEWORD(2,2),&wsaData); // 使用Overlapped I/O模型必须设置WSA_FLAG_OVERLAPPED参数 SLisent = WSASocket(AF_INET,SOCK_STREAM,IPPROTO_TCP,NULL,NULL,WSA_FLAG_OVERLAPPED); // 创建Socket SOCKADDR_IN ServerAddr; ServerAddr.sin_family = AF_INET; ServerAddr.sin_addr.S_un.S_addr = htonl(INADDR_ANY); ServerAddr.sin_port = htons(1234); // 监听 bind(SLisent,(LPSOCKADDR)&ServerAddr,sizeof(ServerAddr)); listen(SLisent,100); int i = 0; SOCKADDR_IN ClientAddr; int addr_length=sizeof(ClientAddr); while (TRUE) { while((SWorker[i] == 0) && (SWorker[i] = accept(SLisent,(SOCKADDR*)&ClientAddr, &addr_length)) != INVALID_SOCKET) { printf("accept %d ip:%s port:%dn",i+1,inet_ntoa(ClientAddr.sin_addr),ClientAddr.sin_port); // 创建触发事件 EventArray[i] = WSACreateEvent(); dwEventTotal++; memset(&Overlapped[i],0,sizeof(WSAOVERLAPPED)); // 绑定overlapped i/o和事件 Overlapped[i].hEvent = EventArray[i]; char * buffer = new char[DATA_BUF_LEN]; memset(buffer,0,DATA_BUF_LEN); RecvBuffer[i].buf = buffer; RecvBuffer[i].len = DATA_BUF_LEN; if(WSARecv(SWorker[i], &RecvBuffer[i], dwEventTotal, &dwRecvBytes, &Flags, &Overlapped[i], NULL) == SOCKET_ERROR) { int err = WSAGetLastError(); if(WSAGetLastError() != WSA_IO_PENDING) { printf("disconnect: %dn",i+1); closesocket(SWorker[i]); SWorker[i] = 0; WSACloseEvent(EventArray[i]); // 关闭事件 RecvBuffer[i].buf = NULL; RecvBuffer[i].len = NULL; continue; } } i = (i+1)%WSA_MAXIMUM_WAIT_EVENTS; } } return FALSE; } DWORD WINAPI ReceiveThread(LPVOID lpParameter) { DWORD dwIndex = 0; while (true) { dwIndex = WSAWaitForMultipleEvents(dwEventTotal, EventArray, FALSE, 1000, FALSE); if (dwIndex == WSA_WAIT_FAILED || dwIndex == WSA_WAIT_TIMEOUT) continue; dwIndex = dwIndex - WSA_WAIT_EVENT_0; WSAResetEvent(EventArray[dwIndex]); DWORD dwBytesTransferred; WSAGetOverlappedResult( SWorker[dwIndex], &Overlapped[dwIndex], &dwBytesTransferred, FALSE, &Flags); if(dwBytesTransferred == 0) { printf("disconnect: %dn",dwIndex+1); closesocket(SWorker[dwIndex]); SWorker[dwIndex] = 0; WSACloseEvent(EventArray[dwIndex]); // 关闭事件 RecvBuffer[dwIndex].buf = NULL; RecvBuffer[dwIndex].len = NULL; continue; } //使用数据 printf("%sn",RecvBuffer[dwIndex].buf); memset(RecvBuffer[dwIndex].buf,0,DATA_BUF_LEN); if(WSARecv(SWorker[dwInde x], &RecvBuffer[dwIndex], dwEventTotal, &dwRecvBytes, &Flags, &Overlapped[dwIndex], NULL) == SOCKET_ERROR) { if(WSAGetLastError() != WSA_IO_PENDING) { printf("disconnect: %dn",dwIndex+1); closesocket(SWorker[dwIndex]); SWorker[dwIndex] = 0; WSACloseEvent(EventArray[dwIndex]); // 关闭事件 RecvBuffer[dwIndex].buf = NULL; RecvBuffer[dwIndex].len = NULL; continue; } } } return FALSE; } void main() { HANDLE hThreads[2]; hThreads[0] = CreateThread(NULL, 0, AcceptThread, NULL, NULL, NULL); hThreads[1] = CreateThread(NULL, 0, ReceiveThread, NULL, NULL, NULL); WaitForMultipleObjects(2,hThreads,TRUE,INFINITE); printf("exitn"); CloseHandle(hThreads[0]); CloseHandle(hThreads[1]); }
#include#include #pragma comment(lib,"ws2_32.lib") #define DATA_BUF_LEN 1024 // 接收缓冲区大小 #define MAXSESSION 10000 // 最大连接数 typedef struct _SOCKET_INFORMATION { OVERLAPPED Overlapped; SOCKET Socket; WSABUF DataBuf; DWORD BytesSEND; DWORD BytesRECV; } SOCKET_INFORMATION, * LPSOCKET_INFORMATION; SOCKET ListenSocket = INVALID_SOCKET; DWORD Flags = 0; void CALLBACK WorkerRoutine(DWORD Error, DWORD BytesTransferred,LPWSAOVERLAPPED Overlapped, DWORD InFlags); DWORD WINAPI AcceptThread(LPVOID lpParameter) { WSADATA wsaData; WSAStartup(MAKEWORD(2,2),&wsaData); // 创建Socket,设置异步I/O标志WSA_FLAG_OVERLAPPED ListenSocket = WSASocket(AF_INET,SOCK_STREAM,IPPROTO_TCP,NULL,NULL,WSA_FLAG_OVERLAPPED); SOCKADDR_IN ServerAddr; ServerAddr.sin_family = AF_INET; ServerAddr.sin_addr.S_un.S_addr = htonl(INADDR_ANY); ServerAddr.sin_port = htons(1234); // 绑定 bind(ListenSocket,(LPSOCKADDR)&ServerAddr,sizeof(ServerAddr)); // 监听 listen(ListenSocket,MAXSESSION); printf("listenning.../n"); SOCKADDR_IN ClientAddr; int addr_length=sizeof(ClientAddr); while (TRUE) { LPSOCKET_INFORMATION SI = new SOCKET_INFORMATION; // 接受新连接 if ((SI->Socket = accept(ListenSocket,(SOCKADDR*)&ClientAddr, &addr_length)) != INVALID_SOCKET) { printf("accept ip:%s port:%d/n",inet_ntoa(ClientAddr.sin_addr),ClientAddr.sin_port); memset(&SI->Overlapped,0,sizeof(WSAOVERLAPPED)); SI->DataBuf.buf = new char[DATA_BUF_LEN]; SI->DataBuf.len = DATA_BUF_LEN; memset(SI->DataBuf.buf,0,DATA_BUF_LEN); // 设置回调函数 if(WSARecv(SI->Socket, &SI->DataBuf, 1, &SI->BytesRECV, &Flags, &SI->Overlapped, WorkerRoutine) == SOCKET_ERROR) { int err = WSAGetLastError(); if(WSAGetLastError() != WSA_IO_PENDING) { printf("disconnect/n"); closesocket(SI->Socket); delete [] SI->DataBuf.buf; delete SI; continue; } } } } return FALSE; } void CALLBACK WorkerRoutine(DWORD Error, DWORD BytesTransferred, LPWSAOVERLAPPED Overlapped, DWORD InFlags) { LPSOCKET_INFORMATION SI = (LPSOCKET_INFORMATION)Overlapped; if (Error != 0 || BytesTransferred == 0) { printf("disconnect/n"); closesocket(SI->Socket); delete [] SI->DataBuf.buf; delete SI; return; } // 使用数据 printf("call back:%s/n",SI->DataBuf.buf); memset(SI->DataBuf.buf,0,DATA_BUF_LEN); // 设置回调函数 if(WSARecv(SI->Socket, &SI->DataBuf, 1, &SI->BytesRECV, &Flags, &SI->Overlapped, WorkerRoutine) == SOCKET_ERROR) { int err = WSAGetLastError(); if(WSAGetLastError() != WSA_IO_PENDING) { printf("disconnect/n"); closesocket(SI->Socket); delete [] SI->DataBuf.buf; delete SI; return; } } } void main() { HANDLE hThreads = CreateThread(NULL, 0, AcceptThread, NULL, NULL, NULL); WaitForSingleObject(hThreads,INFINITE); printf("exit/n"); CloseHandle(hThreads); }
HANDLE CreateIoCompletionPort( HANDLE FileHandle, // 文件或设备(device)的handle。在Windows NT3.51之后,此栏位可设定为INVALID_HANDLE_VALUE,于是产生一个没有和 // 任何文件handle有关系的port HANDLE ExistingCompletionPort, // 如果此栏位被指定,那么上一栏位FileHandle就会被加到此port之上,而不会产生新的port。指定NULL可以产生一个新 // 的port ULONG_PTR CompletionKey, // 用户自定义的一个数值,将被交给提供服务的线程。此值和FileHandle有关联。 DWORD NumberOfConcurrentThreads // 与此I/O completion port有关联的线程个数。);返回值: 如果函数成功,则传回一个I/O completion port的handle。如果函数失败,则传回FALSE。GetLastError()可以获得更详细的失败原因。 CreateIoCompletionPort()通常要被调用两次。第一次先指定FileHandle为INVALID_HANDLE_VALUE,并设定ExistingCompletionPort为NULL,用以产生一个核心对象port。然后再为每一个欲附着上去的I/O调用一次CreateIoCompletionPort().后续的调用应该将ExistingCompletionPort设定为第一次调用所传回的handle。 在I/O Completion Port上等待
BOOL GetQueuedCompletionStatus( HANDLE CompletionPort, // CompletionPort参数对应于要在上面等待的完成端口 LPDWORD lpNumberOfBytes, // 参数负责在完成了一次I/O操作后(如WSASend或WSARecv),接收实际传输的字节数 PULONG_PTR lpCompletionKey, // 为原先传递进入CreateIoCompletionPort函数的套接字返回“单句柄数据”,最好将套接字句柄保存在这个“键”(Key)中。 LPOVERLAPPED* lpOverlapped, // 用于接收完成的I/O操作的重叠结果 DWORD dwMilliseconds // 用于指定调用者希望等待一个完成数据包在完成端口上出现的时间);返回值: 如果函数成功的将一个completion packet从队列中取出,并完成一个成功的操作,函数将传回TRUE,并填写由lpNumberOfBytes、lpCompletionKey、lpOverlapped所指向的变量内容。 如果操作失败,但completion packet已经从队列中取出,则函数传回FALSE,并将lpOverlapped设置为NULL,调用GetLastError()可以获得更详细的失败原因。同其他核心对象不同,在completion port上等待的线程是以先进后出的次序提供服务,这是因为所有的线程提供的服务都一样。 强行释放完成端口上的所有工作者线程
BOOL PostQueuedCompletionStatus( HANDLE CompletionPort, // 指定想向其发送一个完成数据包的完成端口对象 DWORD dwNumberOfBytesTransferred, // 参数负责在完成了一次I/O操作后(如WSASend或WSARecv),接收实际传输的字节数。设置为0,完成端口上的工作线程被强制释放 ULONG_PTR dwCompletionKey, // 为原先传递进入CreateIoCompletionPort函数的套接字返回“单句柄数据”,最好将套接字句柄保存在这个“键”(Key)中。 LPOVERLAPPED lpOverlapped // 用于接收完成的I/O操作的重叠结果);
对于完成端口的更多内容可以参考下面一些资料:
(版权所有,转载时请注明作者和出处 )