• 首页
  • 搜索
  • 工具
  • 分类
  • 日志
  • 友链
  • 图片

It's Geek KingYoungy

KEEP CHALLENGE
C/C++Unix/Linux应用层程序设计

Internet Domain Socket 编程:字节流与数据报套接字详解

2025-03-27 浏览量 315 暂无评论

Internet Domain Socket 编程完全指南

:&(蛆音娘_不愧是我)

1. 套接字基础与核心函数

1.1 socket() - 创建套接字

创建一个通信端点并返回一个文件描述符。

#include <sys/types.h>
#include <sys/socket.h>

int socket(int domain, int type, int protocol);

参数说明:

  • domain: 指定通信域(网络层)

    • AF_INET: IPv4 Internet 协议
    • AF_INET6: IPv6 Internet 协议
    • AF_UNIX: 本地通信
  • type: 指定通信语义(传输层)

    • SOCK_STREAM: 提供有序、可靠、双向、基于连接的字节流(TCP)
    • SOCK_DGRAM: 支持数据报(无连接、不可靠、固定最大长度)(UDP)
    • SOCK_RAW: 提供原始网络协议访问
    • SOCK_SEQPACKET: 提供有序、可靠、双向、基于连接的数据报传输路径
  • protocol: 通常为0,表示自动选择与type对应的默认协议

返回值:

  • 成功: 返回新套接字的文件描述符
  • 失败: 返回-1,并设置errno

1.2 bind() - 绑定地址到套接字

将地址(主机名+端口号)分配给套接字。

#include <sys/types.h>
#include <sys/socket.h>

int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

参数说明:

  • sockfd: socket()返回的文件描述符
  • addr: 指向要绑定的地址结构体的指针
  • addrlen: 地址结构体的长度

地址结构体(一般不直接用struct sockaddr,而是使用后面带in或in6的结构体):

  • IPv4 (struct sockaddr_in):

    struct sockaddr_in {
        sa_family_t    sin_family;  // AF_INET
        in_port_t      sin_port;    // 端口号(网络字节序)
        struct in_addr sin_addr;    // IPv4地址
        char           sin_zero[8]; // 填充
    };
    
    struct in_addr {
        uint32_t s_addr;  // IPv4地址(网络字节序)
    };
  • IPv6 (struct sockaddr_in6):

    struct sockaddr_in6 {
        sa_family_t     sin6_family;   // AF_INET6
        in_port_t       sin6_port;     // 端口号(网络字节序)
        uint32_t       sin6_flowinfo; // IPv6流信息
        struct in6_addr sin6_addr;     // IPv6地址
        uint32_t       sin6_scope_id; // 作用域ID
    };
    
    struct in6_addr {
        unsigned char s6_addr[16];  // IPv6地址
    };

地址结构体在使用前一定要做的事:
调用memset将其内存清零。即

struct sockaddr_in addr;
memset(&addr, 0, sizeof(addr)); // 清0

原因:防止结构体字段的内存忘记添加终止符\0,也防止一些系统需要将因内存对齐而填充的字节设置为0的要求
返回值:

  • 成功: 返回0
  • 失败: 返回-1,并设置errno

1.3 listen() - 监听连接

将套接字标记为被动套接字(监听套接字),用于接受连接请求并诞生连接套接字。
一个监听套接字可以调用accept()诞生无穷个连接套接字,除非超过系统资源限制。
但内核中为该监听套接字保留的已连接但未被监听套接字调用accept的未决连接数量最大值为backlog。

#include <sys/types.h>
#include <sys/socket.h>

int listen(int sockfd, int backlog);

参数说明:

  • sockfd: socket()返回的文件描述符
  • backlog: 挂起连接队列的最大长度

返回值:

  • 成功: 返回0
  • 失败: 返回-1,并设置errno

1.4 accept() - 接受连接

从监听套接字的挂起连接队列中接受一个连接。

#include <sys/types.h>
#include <sys/socket.h>

int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);

参数说明:

  • sockfd: 监听套接字的文件描述符
  • addr: 用于存储对端地址的缓冲区(可为NULL)
  • addrlen: 输入时为addr缓冲区大小,输出时为实际地址长度(可为NULL)

返回值:

  • 成功: 返回新套接字的文件描述符
  • 失败: 返回-1,并设置errno

1.5 connect() - 发起连接

发起与监听套接字的连接。

#include <sys/types.h>
#include <sys/socket.h>

int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

参数说明:

  • sockfd: socket()返回的文件描述符
  • addr: 目标地址结构体指针
  • addrlen: 地址结构体的长度

返回值:

  • 成功: 返回0
  • 失败: 返回-1,并设置errno

1.6 close() - 关闭套接字

关闭文件描述符。注意在对底层IO的深度总结中介绍,他只是断开该文件描述与内核的打开文件句柄之间的指向关系并删除该文件描述符。当内核的套接字文件打开句柄没有任何进程的文件描述符指向它时,内核向对端发送FIN。shutdown系统调用的关闭写端功能直接通知内核发送FIN。(FIN用于通知对方自己不会再发送有实质内容的TCP报文且等待对方先回传ACK再回传FIN)

#include <unistd.h>

int close(int fd);

参数说明:

  • fd: 要关闭的文件描述符

返回值:

  • 成功: 返回0
  • 失败: 返回-1,并设置errno

1.7 shutdown() - 关闭套接字的部分功能

关闭全双工连接的一部分。与close不同之处在于其功能是若关闭了写端(或读写两端一起关闭)立即触发内核发送FIN,并不对文件描述符、文件句柄做任何操作。注意关闭读端只是内核不让read,但是内核并不发送FIN。

#include <sys/socket.h>

int shutdown(int sockfd, int how);

参数说明:

  • sockfd: 套接字文件描述符
  • how: 关闭方式

    • SHUT_RD: 关闭读端
    • SHUT_WR: 关闭写端
    • SHUT_RDWR: 关闭读写两端

返回值:

  • 成功: 返回0
  • 失败: 返回-1,并设置errno

2. 数据传输函数

2.1 send() - 发送数据

通过已连接的套接字发送数据。

#include <sys/types.h>
#include <sys/socket.h>

ssize_t send(int sockfd, const void *buf, size_t len, int flags);

参数说明:

  • sockfd: 已连接的套接字文件描述符
  • buf: 要发送的数据缓冲区
  • len: 要发送的数据长度
  • flags: 标志位(可位或组合)

    • MSG_CONFIRM: 确认链路有效
    • MSG_DONTROUTE: 不通过网关发送
    • MSG_DONTWAIT: 非阻塞操作
    • MSG_EOR: 结束记录
    • MSG_MORE: 与下次调用封装在一个TCP报文中
    • MSG_NOSIGNAL: 不产生SIGPIPE信号
    • MSG_OOB: 发送带外数据

返回值:

  • 成功: 返回发送的字节数(正文)
  • 失败: 返回-1,并设置errno

2.2 recv() - 接收数据

从已连接的套接字接收数据。特别注意,网络中的数据(包括管道、FIFO等任何IPC)不单单为C语言服务。即不会遵循字符串最后以0字符结尾。传给printf打印要么自己手动加上'\0' ,要么使用格式化输出方式"%.*s"来动态指定字符串长度。

#include <sys/types.h>
#include <sys/socket.h>

ssize_t recv(int sockfd, void *buf, size_t len, int flags);

参数说明:

  • sockfd: 已连接的套接字文件描述符
  • buf: 接收数据的缓冲区
  • len: 缓冲区长度
  • flags: 标志位(可位或组合)

    • MSG_CMSG_CLOEXEC: 设置接收的文件描述符为close-on-exec
    • MSG_DONTWAIT: 非阻塞操作
    • MSG_ERRQUEUE: 接收错误信息
    • MSG_OOB: 接收带外数据
    • MSG_PEEK: 查看数据但不从缓冲区移除
    • MSG_TRUNC: 即使数据包被截断也返回实际长度
    • MSG_WAITALL: 等待所有请求数据到达

返回值:

  • 成功: 返回接收的字节数(正文)(0表示对端关闭连接)
  • 失败: 返回-1,并设置errno

2.3 sendto() - 发送数据报

通过无连接套接字发送数据报。

#include <sys/types.h>
#include <sys/socket.h>

ssize_t sendto(int sockfd, const void *buf, size_t len, int flags,
               const struct sockaddr *dest_addr, socklen_t addrlen);

参数说明:

  • sockfd: 套接字文件描述符
  • buf: 要发送的数据缓冲区
  • len: 要发送的数据长度
  • flags: 同send()
  • dest_addr: 目标地址结构体指针(可为NULL)
  • addrlen: 目标地址结构体长度(可为0)

返回值:

  • 成功: 返回发送的字节数(正文)
  • 失败: 返回-1,并设置errno

2.4 recvfrom() - 接收数据报

从无连接套接字接收数据报。

#include <sys/types.h>
#include <sys/socket.h>

ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags,
                 struct sockaddr *src_addr, socklen_t *addrlen);

参数说明:

  • sockfd: 套接字文件描述符
  • buf: 接收数据的缓冲区
  • len: 缓冲区长度
  • flags: 同recv()
  • src_addr: 用于存储源地址的缓冲区(可为NULL)
  • addrlen: 输入时为src_addr缓冲区大小,输出时为实际地址长度(可为NULL)

返回值:

  • 成功: 返回接收的字节数(正文)(0表示对端关闭连接)
  • 失败: 返回-1,并设置errno

2.5 sendmsg() - 发送消息

通过套接字发送消息(支持分散/聚集I/O和控制消息)。

#include <sys/types.h>
#include <sys/socket.h>

ssize_t sendmsg(int sockfd, const struct msghdr *msg, int flags);

参数说明:

  • sockfd: 套接字文件描述符
  • msg: 消息结构体指针
  • flags: 同send()

msghdr结构体:

struct msghdr {
    void         *msg_name;       // 可选地址
    socklen_t     msg_namelen;    // 地址长度
    struct iovec *msg_iov;        // 分散/聚集数组
    int           msg_iovlen;     // iov元素个数
    void         *msg_control;    // 辅助数据
    socklen_t     msg_controllen; // 辅助数据长度
    int           msg_flags;      // 接收消息的标志
};

struct iovec {
    void  *iov_base;  // 缓冲区起始地址
    size_t iov_len;   // 缓冲区长度
};

返回值:

  • 成功: 返回发送的字节数
  • 失败: 返回-1,并设置errno

2.6 recvmsg() - 接收消息

通过套接字接收消息(支持分散/聚集I/O和控制消息)。

#include <sys/types.h>
#include <sys/socket.h>

ssize_t recvmsg(int sockfd, struct msghdr *msg, int flags);

参数说明:

  • sockfd: 套接字文件描述符
  • msg: 消息结构体指针
  • flags: 同recv()

返回值:

  • 成功: 返回接收的字节数(0表示对端关闭连接)
  • 失败: 返回-1,并设置errno

3. IP地址转换函数

3.1 inet_addr() - 将IPv4点分十进制字符串转换为网络字节序整数

#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>

in_addr_t inet_addr(const char *cp);

参数说明:

  • cp: IPv4点分十进制地址字符串(如"192.168.1.1")

返回值:

  • 成功: 返回网络字节序的32位IPv4地址
  • 失败: 返回INADDR_NONE(通常为-1)

3.2 inet_aton() - 将IPv4点分十进制字符串转换为网络字节序结构体

#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>

int inet_aton(const char *cp, struct in_addr *inp);

参数说明:

  • cp: IPv4点分十进制地址字符串
  • inp: 存储转换结果的in_addr结构体指针

返回值:

  • 成功: 返回非零
  • 失败: 返回0

3.3 inet_ntoa() - 将网络字节序IPv4地址转换为点分十进制字符串

#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>

char *inet_ntoa(struct in_addr in);

参数说明:

  • in: 网络字节序的in_addr结构体

返回值:

  • 返回指向静态缓冲区的字符串指针(非线程安全)

3.4 inet_pton() - 将可打印地址字符串转换为网络格式(支持IPv4/IPv6)

#include <arpa/inet.h>

int inet_pton(int af, const char *src, void *dst);

参数说明:

  • af: 地址族

    • AF_INET: IPv4
    • AF_INET6: IPv6
  • src: 源地址字符串

    • INET_ADDRSTRLEN: IPv4presentation字符串最大长度
    • INET6_ADDRSTRLEN: IPv6presentation字符串最大长度
  • dst: 存储转换结果的缓冲区(in_addr或in6_addr结构体的地址)

返回值:

  • 成功: 返回1
  • 无效输入: 返回0
  • 失败: 返回-1

3.5 inet_ntop() - 将网络格式地址转换为可打印字符串(支持IPv4/IPv6)

#include <arpa/inet.h>

const char *inet_ntop(int af, const void *src, char *dst, socklen_t size);

参数说明:

  • af: 地址族(AF_INET或AF_INET6)
  • src: 网络格式的地址指针(in_addr或in6_addr结构体的地址)
  • dst: 目标缓冲区(长度至少是上述两个宏定义)
  • size: 目标缓冲区大小

缓冲区大小建议:

  • IPv4: 至少INET_ADDRSTRLEN(16)字节
  • IPv6: 至少INET6_ADDRSTRLEN(46)字节

返回值:

  • 成功: 返回dst
  • 失败: 返回NULL

4. 套接字选项控制

4.1 getsockopt() - 获取套接字选项

#include <sys/types.h>
#include <sys/socket.h>

int getsockopt(int sockfd, int level, int optname, void *optval, socklen_t *optlen);

参数说明:

  • sockfd: 套接字文件描述符
  • level: 选项级别

    • SOL_SOCKET: 通用套接字选项
    • IPPROTO_IP: IPv4选项
    • IPPROTO_IPV6: IPv6选项
    • IPPROTO_TCP: TCP选项
  • optname: 选项名称

    • SOL_SOCKET级别:

      • SO_ACCEPTCONN: 套接字是否在监听
      • SO_BROADCAST: 是否允许发送广播
      • SO_DEBUG: 是否启用调试
      • SO_DONTROUTE: 是否绕过标准路由
      • SO_ERROR: 获取并清除错误状态
      • SO_KEEPALIVE: 是否启用keepalive
      • SO_LINGER: 延迟关闭时间
      • SO_OOBINLINE: 是否将带外数据放入普通数据流
      • SO_RCVBUF: 接收缓冲区大小
      • SO_REUSEADDR: 是否允许重用本地地址,分为两个层面。第一是使得连接套接字关闭后监听套接字可以不等待2MSL的时间调用accept而不发生EADDRINUSE错误;第二是使得多个监听套接字可以绑定同一个端口。
      • SO_SNDBUF: 发送缓冲区大小
      • SO_TYPE: 获取套接字类型
    • IPPROTO_IP级别:

      • IP_TOS: 服务类型字段
      • IP_TTL: 生存时间字段
    • IPPROTO_IPV6级别:

      • IPV6_V6ONLY: 是否仅限IPv6
    • IPPROTO_TCP级别:

      • TCP_NODELAY: 禁用Nagle算法
  • optval: 存储选项值的缓冲区
  • optlen: 输入时为optval缓冲区大小,输出时为实际选项长度

返回值:

  • 成功: 返回0
  • 失败: 返回-1,并设置errno

4.2 setsockopt() - 设置套接字选项

#include <sys/types.h>
#include <sys/socket.h>

int setsockopt(int sockfd, int level, int optname, const void *optval, socklen_t optlen);

参数说明:

  • 同getsockopt()

返回值:

  • 成功: 返回0
  • 失败: 返回-1,并设置errno

5. 主机名与地址解析

5.1 gethostbyname() - 通过主机名获取主机信息(IPv4)

#include <netdb.h>

struct hostent *gethostbyname(const char *name);

hostent结构体:

struct hostent {
    char  *h_name;       // 主机正式名
    char **h_aliases;    // 别名列表
    int    h_addrtype;   // 地址类型(AF_INET)
    int    h_length;     // 地址长度
    char **h_addr_list;  // 地址列表(网络字节序)
};
#define h_addr h_addr_list[0]  // 向后兼容

返回值:

  • 成功: 返回hostent结构体指针
  • 失败: 返回NULL,并设置h_errno

5.2 gethostbyaddr() - 通过地址获取主机信息(IPv4)

#include <netdb.h>

struct hostent *gethostbyaddr(const void *addr, socklen_t len, int type);

参数说明:

  • addr: 指向网络字节序地址的指针
  • len: 地址长度(IPv4为4)
  • type: 地址类型(AF_INET)

返回值:

  • 同gethostbyname()

5.3 getaddrinfo() - 地址无关的主机名解析(支持IPv4/IPv6)

#include <sys/types.h>
#include <sys/socket.h>
#include <netdb.h>

int getaddrinfo(const char *host, const char *service,
                const struct addrinfo *hints,
                struct addrinfo **res);

详情见于解析DNS与服务名地址,IP地址与端口号

5.4 freeaddrinfo() - 释放getaddrinfo()分配的内存

#include <sys/types.h>
#include <sys/socket.h>
#include <netdb.h>

void freeaddrinfo(struct addrinfo *res);

详情见于解析DNS与服务名地址,IP地址与端口号

5.5 gai_strerror() - 获取getaddrinfo()错误描述

#include <netdb.h>

const char *gai_strerror(int errcode);

详情见于解析DNS与服务名地址,IP地址与端口号

5.6 getnameinfo() - 地址无关的地址到名称转换(支持IPv4/IPv6)

#include <sys/socket.h>
#include <netdb.h>

int getnameinfo(const struct sockaddr *addr, socklen_t addrlen,
                char *host, socklen_t hostlen,
                char *serv, socklen_t servlen, int flags);

详情见于解析DNS与服务名地址,IP地址与端口号

6. (端口、正文中的整数)字节序转换函数

字节序转换函数用于诸如信息里的整数、端口号等多字节信息单元的传递。当每个信息仅占一个字节时,如字符串,内存低位一定是字符串的前几个字符。而对于整数,大端存储——先存高位,即内存低地址存储整数高位;小端存储——先存低位,即内存低地址存储整数低位。网络字节序为大端,而本地主机由于硬件架构的不同,有的是大端而有的是小端。

6.1 htons() - 主机字节序转网络字节序(16位)

#include <arpa/inet.h>

uint16_t htons(uint16_t hostshort);

参数说明:

  • hostshort: 主机字节序的16位整数

返回值:

  • 返回网络字节序的16位整数

6.2 htonl() - 主机字节序转网络字节序(32位)

#include <arpa/inet.h>

uint32_t htonl(uint32_t hostlong);

参数说明:

  • hostlong: 主机字节序的32位整数

返回值:

  • 返回网络字节序的32位整数

6.3 ntohs() - 网络字节序转主机字节序(16位)

#include <arpa/inet.h>

uint16_t ntohs(uint16_t netshort);

参数说明:

  • netshort: 网络字节序的16位整数

返回值:

  • 返回主机字节序的16位整数

6.4 ntohl() - 网络字节序转主机字节序(32位)

#include <arpa/inet.h>

uint32_t ntohl(uint32_t netlong);

参数说明:

  • netlong: 网络字节序的32位整数

返回值:

  • 返回主机字节序的32位整数

7. 其他辅助函数

7.1 getsockname() - 获取套接字本地地址

#include <sys/socket.h>

int getsockname(int sockfd, struct sockaddr *addr, socklen_t *addrlen);

参数说明:

  • sockfd: 套接字文件描述符
  • addr: 存储本地地址的缓冲区
  • addrlen: 输入时为addr缓冲区大小,输出时为实际地址长度

返回值:

  • 成功: 返回0
  • 失败: 返回-1,并设置errno

7.2 getpeername() - 获取对端地址

#include <sys/socket.h>

int getpeername(int sockfd, struct sockaddr *addr, socklen_t *addrlen);

参数说明:

  • 同getsockname()

返回值:

  • 同getsockname()

7.3 sockatmark() - 检查是否处于带外标记

#include <sys/socket.h>

int sockatmark(int sockfd);

参数说明:

  • sockfd: 套接字文件描述符

返回值:

  • 处于带外标记: 返回1
  • 不处于带外标记: 返回0
  • 失败: 返回-1,并设置errno

- 阅读全文 -
C/C++Unix/Linux应用层程序设计

C语言结构体/共用体的赋值限制

2025-03-27 浏览量 304 暂无评论

C语言结构体/共用体的赋值限制

在C语言中,我们可以在定义结构体或共用体(联合体)变量时直接使用初始化列表进行赋值,例如:

struct Point {
    int x;
    int y;
};

struct Point p1 = {1, 2}; // 合法:初始化时赋值

但如果我们尝试在后续代码中使用类似的语法进行赋值,编译器会报错:

struct Point p2;
p2 = {3, 4}; // 错误:不能这样赋值!

为什么C语言允许在初始化时赋值,却不允许在后续赋值时使用相同的语法?这涉及C语言的设计哲学、历史背景和底层实现。本文将深入探讨这一特性的原因,并介绍如何绕过这一限制。


1. C语言的初始化与赋值的区别

在C语言中,初始化(Initialization)和赋值(Assignment)是两个不同的概念:

  • 初始化:在变量定义时赋予初始值,由编译器在程序加载或进入作用域时处理。
  • 赋值:在变量已经定义后修改其值,属于运行时的操作。

C语言对初始化更加宽松,允许使用{...}语法,但对赋值则更加严格,不允许直接使用结构化常量。


2. 为什么不允许结构化常量赋值?

(1) 语言设计哲学:简单性

C语言的设计目标是保持简洁和高效。在早期,编译器需要在有限的内存和计算资源下工作,因此:

  • 初始化在编译阶段就可以确定,编译器可以直接写入数据段(.data或.rodata)。
  • 赋值需要在运行时处理,如果允许p = {1, 2},编译器必须生成额外的代码来解析并逐成员赋值,这会增加复杂性。

(2) 语法一致性

C语言的数组也有类似的限制:

int arr[3] = {1, 2, 3}; // 合法
arr = {4, 5, 6};         // 非法

结构体和数组的初始化方式保持一致,避免引入特殊规则。

(3) 避免歧义

如果允许p = {1, 2},可能会与以下情况冲突:

  • 结构体赋值
  • 复合字面量(C99引入)
  • 类型转换表达式

C语言选择用不同的语法区分初始化和赋值,减少歧义。

(4) 历史原因

早期的C编译器(如K&R C)不支持结构化赋值,ANSI C(C89)保持了这一限制以兼容旧代码。虽然C99引入了复合字面量(Compound Literals)来改善这个问题,但直接赋值仍然不允许。


3. 如何绕过这一限制?

虽然不能直接使用p = {1, 2},但有几种替代方案:

(1) 逐成员赋值

struct Point p;
p.x = 1;
p.y = 2;

最直接的方式,适用于简单结构体。

(2) 使用复合字面量(C99)

struct Point p;
p = (struct Point){1, 2}; // 合法,C99引入

这种方式在运行时构造一个临时结构体并赋值。

(3) 使用memcpy

struct Point tmp = {1, 2};
memcpy(&p, &tmp, sizeof(p));

适用于需要批量拷贝的情况。

(4) 使用函数封装

void setPoint(struct Point *p, int x, int y) {
    p->x = x;
    p->y = y;
}

setPoint(&p, 1, 2);

提高代码可读性和复用性。


4. C++的改进

C++11引入了统一初始化语法(Uniform Initialization),允许在赋值时使用{}:

struct Point { int x, y; };
Point p;
p = {1, 2}; // C++合法,C仍然不允许

如果项目允许,可以考虑用C++替代C,以获得更灵活的语法。


5. 总结

情况C语言C++
初始化时赋值 T var = { ... }✅ 允许✅ 允许
后续赋值 var = { ... }❌ 不允许(C89/C99)
✅ 可用复合字面量 (T){ ... }(C99)
✅ 允许
统一初始化 T var{ ... }❌ 不允许✅ 允许(C++11)

C语言限制结构化常量赋值的主要原因是:

  1. 保持语言简洁,避免运行时解析{...}的额外开销。
  2. 语法一致性,与数组行为保持一致。
  3. 历史兼容性,早期C编译器不支持该特性。

虽然这一限制可能显得不够灵活,但我们可以通过逐成员赋值、复合字面量(C99)、memcpy或函数封装来绕过它。如果项目允许,C++提供了更现代化的初始化方式。

希望本文能帮助你理解C语言的这一特性!如果你有更好的方法或见解,欢迎在评论区讨论。 🚀

- 阅读全文 -
C/C++Unix/Linux应用层程序设计

Unix Domain Socket 编程:字节流与数据报套接字详解

2025-03-26 浏览量 283 暂无评论

Unix Domain Socket 编程:字节流与数据报套接字详解


一、字节流套接字(SOCK_STREAM)

1. 核心特性

• 可靠传输:提供类似 TCP 的有序、无丢失数据流,无记录边界。
• 全双工通信:支持双向数据传输,需通过 listen()/accept() 建立连接。
• 适用场景:需高可靠性的连续数据交互(如文件传输、RPC 服务)。

2. 核心系统调用

(1)socket() 创建套接字

int socket(int domain, int type, int protocol);

• 参数:
• domain:必须为 AF_UNIX 或 AF_LOCAL。
• type:设为 SOCK_STREAM。
• protocol:固定为 0。
• 返回值:成功返回文件描述符,失败返回 -1(如 EPROTONOSUPPORT 协议不支持)。

(2)bind() 绑定地址

int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

• 地址结构:

struct sockaddr_un {
    sa_family_t sun_family;    // AF_UNIX
    char sun_path[108];        // 文件路径或抽象名称
};

• 路径类型:
• 普通路径:如 /tmp/mysocket.sock,需确保路径可写且无冲突。
• 抽象命名空间(Linux 特有):sun_path[0] = '\0',后续字符为抽象名(无需文件实体)。
• addrlen 计算:offsetof(struct sockaddr_un, sun_path) + strlen(name)(抽象名需 +1)。

(3)listen() 监听队列

int listen(int sockfd, int backlog);

• backlog:最大等待连接数,建议设为 SOMAXCONN。
• 错误处理:若队列满,后续连接请求直接返回 ECONNREFUSED。

(4)accept() 接收连接

int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);

• addr 参数:通常设为 NULL(客户端地址无意义)。
• 返回值:新套接字描述符专用于该连接。

(5)数据传输

ssize_t send(int sockfd, const void *buf, size_t len, int flags);
ssize_t recv(int sockfd, void *buf, size_t len, int flags);

• flags 标志:
• MSG_OOB:带外数据(需双方支持)。
• MSG_DONTWAIT:非阻塞模式。


二、数据报套接字(SOCK_DGRAM)

1. 核心特性

• 保留消息边界:每次 send() 对应一次 recv(),数据按报文独立接收。
• 无连接特性:无需建立连接,可直接发送数据。
• 可靠性:数据不丢失但无序(与 UDP 不同,Unix 域数据报本身可靠)。
• 适用场景:日志传输、实时状态广播等低延迟场景。

2. 核心系统调用

(1)socket() 创建套接字

int socket(int domain, int type, int protocol);

• type:设为 SOCK_DGRAM。

(2)bind() 绑定地址

• 地址规则:同字节流套接字,但允许同一地址被多次绑定(需设置 SO_REUSEADDR)。

(3)直接数据收发

ssize_t sendto(int sockfd, const void *buf, size_t len, int flags,
               const struct sockaddr *dest_addr, socklen_t addrlen);
ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags,
                 struct sockaddr *src_addr, socklen_t *addrlen);

• dest_addr:目标地址(必须已绑定)。
• src_addr:接收时可获取发送方地址。

(4)连接模式(可选)

int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

• 作用:绑定默认目标地址,后续可使用 send()/recv()以及write()/read()。


三、Linux 抽象 Socket 名空间(跨进程通用)

1. 实现方式

• 命名规则:sun_path[0] = '\0',后续字符为抽象名(如 \0myapp)。
• 优势:
• 无文件系统依赖,避免路径权限问题。
• 进程退出后自动释放,无需手动清理。

2. 系统查询

ss -x -a | grep '@'        # 查看活跃抽象套接字
cat /proc/net/unix         # 内核级列表(含 inode 和权限)

四、进阶功能对比

特性字节流套接字数据报套接字
连接管理需 listen()/accept()无连接
记录边界无边界(连续流)保留边界
最大消息长度无限制受限于内核缓冲区(通常 130KB)
描述符传递支持 (sendmsg())支持 (sendmsg())
凭证传递支持(SO_PASSCRED)支持(SO_PASSCRED)

五、总结

字节流套接字适用于需要可靠连续数据流的场景(如数据库连接),而数据报套接字更适合短消息、无连接交互。Linux 抽象命名空间通过消除文件依赖提升了安全性和便捷性,尤其在容器化环境中优势显著。开发者应根据业务需求选择通信模式,并注意两者的系统调用差异。

- 阅读全文 -
C/C++Unix/Linux应用层程序设计

文件锁技术详解:flock与fcntl系统调用

2025-03-25 浏览量 304 暂无评论

文件锁技术详解:flock与fcntl系统调用


一、flock系统调用

1.1 功能描述

flock()提供文件级全局锁机制,可对整个文件施加共享锁或互斥锁。该锁为建议性锁(需主动检查),常用于进程间同步文件访问,但不保证强制排他性。该锁由内核维护,存储在内核的打开文件句柄表中。因此只有该文件句柄没有任何进程的文件描述符指向时,才会删除该锁。该锁与其文件句柄共同被删除。

1.2 函数声明

#include <sys/file.h>
int flock(int fd, int operation);

1.3 参数详解

参数类型说明
fdint文件描述符,需通过open()或fileno(FILE*)获取
operationint锁操作类型,支持以下宏组合:
- LOCK_SH:共享锁(允许多进程并发读)
- LOCK_EX:互斥锁(仅允许单进程读写)
- LOCK_UN:释放锁
- LOCK_NB:非阻塞模式(与上述宏用 `` 组合,锁冲突时立即返回)

1.4 返回值

• 成功:返回0
• 失败:返回-1,错误码存于errno,常见错误:
• EAGAIN:非阻塞模式下锁冲突
• EBADF:无效文件描述符
• EINTR:被信号中断


二、fcntl系统调用

2.1 功能描述

fcntl()称为POSIX记录锁支持,记录级细粒度锁,可对文件指定区域加锁。提供强制锁与建议锁两种模式(依赖文件系统支持),具备更精细的控制能力。直接由文件系统维护,因此父子进程即使共享文件描述符,确不共享锁。但是任何进程调用close关闭文件描述符,该锁就被删除(内核所为)。

2.2 函数声明

#include <unistd.h>
#include <fcntl.h>
int fcntl(int fd, int cmd, struct flock *lock);

2.3 参数详解

参数类型说明
fdint文件描述符
cmdint锁操作命令:
- F_GETLK:检测锁状态(不实际加锁)
- F_SETLK:非阻塞式设置/释放锁
- F_SETLKW:阻塞式设置锁(等待锁释放)
lockstruct flock*描述锁类型与范围的指针,结构体成员如下:
struct flock {                                                      
   short l_type;   // 锁类型:F_RDLCK/F_WRLCK/F_UNLCK              
   short l_whence; // 基准位置:SEEK_SET/SEEK_CUR/SEEK_END         
   off_t l_start;  // 偏移量(相对于l_whence)                     
   off_t l_len;    // 锁定字节数(0表示至文件尾)                  
   pid_t l_pid;    // 持有锁的进程ID(F_GETLK时填充)             
};                                                                  

2.4 返回值

• 成功:根据cmd不同返回不同:
• F_GETLK:非负值(锁信息存于lock结构)
• F_SETLK/F_SETLKW:0
• 失败:返回-1,常见错误:
• EACCES/EAGAIN:锁冲突(非阻塞模式)
• EDEADLK:死锁风险(仅限F_SETLKW)
• EINVAL:无效参数


三、关键特性对比

特性flockfcntl
锁粒度整个文件文件区域(字节级)
锁类型共享/互斥共享/互斥/释放
阻塞控制支持LOCK_NB非阻塞通过F_SETLK/F_SETLKW区分
锁继承子进程不继承锁子进程继承锁
锁检测需显式调用检查内置锁状态查询(F_GETLK)
跨进程兼容性与fcntl锁互斥与flock锁互斥
自动放锁关闭一个文件的所有文件描述符关闭一个文件的任意文件描述符

四、应用场景建议

• 简单同步:优先使用flock,代码简洁且适用于全文件锁定
• 高性能并发:选择fcntl,利用区域锁减少竞争
• 强制锁需求:需结合文件系统配置(如mount -o mand)
• 单实例daemon:在/var/run下创建“进程号.pid”文件,并持有该文件的POSIX写锁。一旦有另一个进程运行同一个程序,发现取得不了锁后就知道已经有一个实例在运行了。一般该文件先用truncate或fturncate截断为长度0,然后写入进程的pid,最后在程序结束的时候删除(remove或unlink)该文件防止占用文件系统资源。

- 阅读全文 -
  1. 1
  2. ...
  3. 4
  4. 5
  5. 6
  6. 7
  7. 8
  8. ...
  9. 10
  • 站点概览
author

39 日志
4 分类
Creative Commons
  • 热门文章
  • 热评文章
  • 随机文章
  • 在 Debian 服务器上部署 FileBrowser 并集成到现有博客路径
  • 高等数学重要定理总结
  • 高等数学重要定义整理
  • C语言原子量的使用
  • 高等数学刷题心得
  • 欢迎使用 Typecho
  • 对底层IO的深度总结
  • 数据结构——树
  • 库、链接与执行
  • shell作业控制的两个问题:组长叛变与SIGHUP信号
  • 算法——排序
  • Linux Daemon进程开发指南:从创建到日志管理
  • C语言原子量的使用
  • Local聊天室
  • 高等数学刷题心得

浏览量 : 11177

© 2025 It's Geek KingYoungy. Power By Typecho . Theme by Shiyi

浙ICP备2025160639号  |  浙公网安备33020502001222号

This is just a placeholder img.