728x90

TCP 기반으로 서버와 클라이언트를 작성해보자.

 

TCP로 설정하기 위해서는 socket함수에 SOCK_STREAM의 값을 넣어주면 된다.

TCP는 데이터 전송 중에 확인 과정을 거치기 때문에 상대방이 받지 못했다면 일정 시간 후에 재 전송함으로 신뢰성을 보장한다.

이 부분은 앞에서도 많이 말했기 때문에 쉽게 기억할 것이다.

 

이제 TCP 서버가 기본적으로 호출하는 함수들을 보자.

 

Server

socket() -> bind() -> listen() -> accept() -> read()/write() -> close()

 

socket(): 소켓을 생성한다.

bind(): 생성한 소켓에 주소를 할당한다.

listen(): 해당 소켓을 연결 가능 상태로 만든다.

accept(): 연결 요청이 오면 해당 연결을 허용해준다.

read()/write(): 해당 함수를 이용하여 데이터를 송수신한다.

close(): 연결을 종료한다.

 

하나씩 더 자세히 살펴보자.

 

listen

#include <sys/type.h>

int listen(int sock, int backlog);

- sock

연결 가능 상태로 만들고자 하는 소켓의 파일 디스크립터

- backlog

연결요청 대기 큐의 크기, 만약 5를 전달한다면 클라이언트의 연결 요청을 5개까지 대기시킬 수 있다.

 

accept

#include <sys/socket.h>

int accept(int sock, struct sockaddr * addr, socklen_t * addrlen);

- sock

서버 소켓의 파일 디스크립터

- addr

연결 요청이 온 클라이언트의 주소 정보를 담을 구조체

- addrlen

addr에 전달된 주소의 변수 크기를 바이트 단이로 전달한다. 크기 정보를 변수에 저장한 후에 변수의 주소값을 저장하게 된다.

return: 생성된 소켓의 파일 디스크립터, -1(fail)

 

새로운 소켓을 하나 더 생성하고 그 소켓을 이용해서 데이터의 송수신을 진행한다.

 

 

Client

이번에는 listen과 accept를 사용하지 않는 클라이언트를 확인해보자.

socket() -> connect() -> read()/write() -> close()

 

socket(): 소켓을 생성한다.

connect(): 서버에 연결을 요청한다.

read()/write(): 연결된 서버와 데이터를 송수신한다.

close(): 소켓을 닫는다.

 

당연히 connect는 서버에서 listen 상태이어야 가능하다.

 

이 함수들을 이용하여 여러 클라이언트들과 통신하는 iterative 서버를 만들어보자.

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>

void error_handling(char *message);

int main(int argc, char *argv[]){
    int serv_sock;
    int clnt_sock;
    int str_len;

    struct sockaddr_in serv_addr;
    struct sockaddr_in clnt_addr;
    socklen_t clnt_addr_size;

    char message[] = "Hello, I'm Seungkyu";

    if(argc != 2){
        printf("Usage : %s <port>\n", argv[0]);
        exit(1);
    }

    serv_sock = socket(PF_INET, SOCK_STREAM, 0);
    if(serv_sock == -1) error_handling("socket() error");

    memset(&serv_addr, 0, sizeof(serv_addr));
    serv_addr.sin_family = AF_INET;
    serv_addr.sin_addr.s_addr = htonl(INADDR_ANY);
    serv_addr.sin_port=htons(atoi(argv[1]));

    if(bind(serv_sock, (struct sockaddr*)&serv_addr, sizeof(serv_addr)) == -1) error_handling("bind() error");

    if(listen(serv_sock, 5) == -1) error_handling("listen() error");
    

    for(int i = 0; i < 5; i++){
        clnt_sock = accept(serv_sock, (struct sockaddr*)&clnt_addr, &clnt_addr_size);
        if(clnt_sock == -1) error_handling("accept() error");
        printf("Connected client %d, client_sock: %d\n", i + 1, clnt_sock);

        while((str_len = read(clnt_sock, message, BUFSIZ)) != 0) write(clnt_sock, message, str_len);

        close(clnt_sock);
        printf("close client socket: %d\n", clnt_sock);
    }

    close(serv_sock);
    return 0;
}

void error_handling(char *message){
    fputs(message, stderr);
    fputc('\n', stderr);
    exit(1);
}

이렇게 서버에서 반복문으로 5번까지  accept가 가능하게 만들어준다.

 

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>

void error_handling(char *message);

int main(int argc, char *argv[]){
    int sock;
    struct sockaddr_in serv_addr;
    char message[30];
    int str_len;

    if(argc!=3){
        printf("Usage : %s <IP> <port>\n", argv[0]);
        exit(1);
    }

    sock = socket(PF_INET, SOCK_STREAM, 0);
    if(sock == -1) error_handling("socket() error");

    memset(&serv_addr, 0, sizeof(serv_addr));
    serv_addr.sin_family=AF_INET;
    serv_addr.sin_addr.s_addr=inet_addr(argv[1]);
    serv_addr.sin_port=htons(atoi(argv[2]));

    if(connect(sock, (struct sockaddr*)&serv_addr, sizeof(serv_addr)) == -1) error_handling("connect() error!");

    while(1) {
        fputs("Input message(Q to quit): ", stdout);
        fgets(message, BUFSIZ, stdin);
        if(!strcmp(message,"q\n") || !strcmp(message,"Q\n")) break;
        write(sock, message, strlen(message));
        str_len=read(sock, message, BUFSIZ-1);
        message[str_len]=0;
        printf("Message from server: %s", message);
    }
    close(sock);
    return 0;
}

void error_handling(char *message){
    fputs(message, stderr);
    fputc('\n', stderr);
    exit(1);
}

이렇게 하면 해당 클라이언트를 5번까지 받아 줄 수 있다.

 

728x90

3주차에는 주소체계와 TCP 기반 서버/클라이언트에 대하여 공부한다.

 

  • 인터넷 주소

인터넷 주소는 당연히 인터넷 상에서 컴퓨터끼리 구분하기 위해 사용되는 주소이다.

4바이트 주소체계인 IPv4와 16바이트 주소체계인 IPv6가 존재한다.

네트워크 주소와 호스트 주소로 나뉘는데, 이름 그대로 네트워크 주소를 이용해서 네트워크를 찾고 호스트 주소를 이용해서 해당 네트워크에서 호스트를 검색한다.

클래스 A 1 Byte (네트워크 ID) 1 Byte(호스트 ID) 1 Byte(호스트 ID) 1 Byte(호스트 ID)
클래스 B 1 Byte (네트워크 ID) 1 Byte (네트워크 ID) 1 Byte(호스트 ID) 1 Byte(호스트 ID)
클래스 C 1 Byte (네트워크 ID) 1 Byte (네트워크 ID) 1 Byte (네트워크 ID) 1 Byte(호스트 ID)
클래스 D 멀티캐스트 IP 주소

 

클래스 A의 첫 번재 바이트 범위는 0이상     127이하  -> 클래스 A의 첫 번째 비트는 항상 0으로 시작

클래스 B의 첫 번째 바이트 범위는 128이상 191이하  -> 클래스 B의 첫 두 비트는 항상 10으로 시작

클래스 C의 첫 번째 바이트 범위는 192이상 223이하 -> 클래스 C의 첫 세 비트는 항상 110으로 시작

 

첫 번째 바이트 정보만 참조해도 IP주소의 클래스 구분이 가능하므로, 네트워크 주소와 호스트 주소의 경계를 구분할 수 있다.

 

  • Port

IP는 컴퓨터끼리 구분하기 위해 사용된다.

그러면 한 컴퓨터 내의 프로그램끼리는 어떻게 구분을 할까?

바로 Port를 사용해서 구분한다.

Port 번호는 소켓을 구분하는 용도로 사용이 된다.

둘 이상의 포트가 하나의 프로그램에 할당될 수도 있기는 하다.

2의 16제곱인 0 ~ 65535의 수를 포트로 지정을 할 수 있지만, 그 중에서 0 ~ 1023은 이미 용도가 지정되어 있는 포트들이라 사용을 피하는 것이 좋다.

 

  • 주소 표현을 위한 구조체
struct sockaddr_in {
	__uint8_t       sin_len;
	sa_family_t     sin_family;
	in_port_t       sin_port;
	struct  in_addr sin_addr;
	char            sin_zero[8];
};

sin_family: 주소체계 정보를 저장한다.

주소체계 의미
AF_INET IPv4 인터넷 프로토콜
AF_INET6 IPv6 인터넷 프로토콜
AF_LOCAL 로컬 통신을 위한 유닉스 프로토콜의 주소체계

sin_port: 16비트 Port 번호를 저장한다.

 

sin_addr: 32비트의 IP주소 정보를 저장한다.

in_addr 구조체는 그냥 32비트 정수 자료형이다.

 

sin_zero: 특별한 의미를 지니지 않으며, 0으로 채운다.

struct sockaddr_in의 크기를 struct_sockaddr에 맞춰주기 위해 만든 멤버이다.

 

이 sockaddr_in은 bind 함수의 인자로 전달을 하는데 bind 함수의 매개변수 타입은 sockaddr이기 때문에 형 변환이 필요하다.

sockaddr도 같은 16바이트이다.

구조체를 살펴보면

struct sockaddr {
	__uint8_t       sa_len;         /* total length */
	sa_family_t     sa_family;      /* [XSI] address family */
	char            sa_data[14];
};

이렇게 작성이 되어 있다.

sockaddr에 IPv4의 정보를 담기가 불편해서 동일한 바이트 크기를 가지는 sockaddr_in 구조체를 정의하고 sin_zero를 통해서 구조체의 크기를 맞춘 것이다.

 

  • 바이트 순서와 네트워크 바이트 순서

컴퓨터구조 시간에 빅 엔디안과 리틀 엔디안에 대해서 공부 했을 것이다.

 

- 빅 엔디안(Big Endian)

상위 바이트의 값을 작은 번지수에 저장하는 방식

 

- 리틀 엔디안(Little Endian)

상위 바이트의 값을 큰 번지수에 저장하는 방식

 

우리가 쓰는 컴퓨터가 빅 엔디안을 쓸 수도 있고, 리틀 엔디안을 쓸 수도 있다.

하지만 네트워크 바이트 순서는 빅 엔디안이 기준이다.

데이터를 전송 할 때는 바이트 단위로 데이터를 전송하기 때문에 상관 없지만 sockaddr_in 구조체의 내용을 전송할 때는 빅 엔디안으로 바꾸어 주어야 한다.

 

그럴 때는 아래의 함수들을 사용한다.

#include <stdint.h>
#include <netinet/in.h>

unsigned short htons(unsigned short);
unsigned short ntohs(unsigned short);
unsigned long htonl(unsigned long);
unsigned long ntohl(unsigned long);

h는 호스트를 의미하고, n은 네트워크를 의미한다.

htons를 예로 설명하면 호스트에서 네트워크로 short를 변경한다는 의미이다.

만약 현재 내 컴퓨터가 Big Endian 컴퓨터라면 원래의 값을 리턴해주기 때문에 본인의 컴퓨터를 신경쓰지 않고 저 코드들을 사용해주면 된다.

 

#include <stdio.h>
#include <arpa/inet.h>

int main(int argc, char *argv[]){
    
    unsigned short host_port = 0x1234;
    unsigned short net_port;
    unsigned long host_addr = 0x12345678;
    unsigned long net_addr;

    net_port = htons(host_port);
    net_addr = htons(host_addr);

    printf("Host ordered port: %#x \n", host_port);
    printf("Network ordered port : %#x \n", net_port);
    printf("Host ordered address: %#lx \n", host_addr);
    printf("Network ordered address: %#lx \n", net_addr);

    return 0;
}

해당 코드를 실행해보았을 때

Host ordered port: 0x1234 
Network ordered port : 0x3412 
Host ordered address: 0x12345678 
Network ordered address: 0x7856

이런 식으로 순서가 바뀌어 출력되게 된다면 해당 컴퓨터는 리틀 엔디안임을 의미한다.

 

우리는 IP주소를 적을 때 111.111.111.111 처럼 문자열로 작성을 하게 된다.

이렇게만 작성을 하고 우리는 수로 변환해주지 않았는 데, 이 때 inet_addr() 함수를 사용하게 된다.

#include <arpa/inet.h>

in_addr_t inet_addr(const char * string);

해당 문자열을 32비트 정수형으로 변환해준다.

 

#include <stdio.h>
#include <arpa/inet.h>

int main(int argc, char *argv[]){
    char *addr1 = "111.111.111.111";
    char *addr2 = "123.123.1.1";

    unsigned long conv_addr = inet_addr(addr1);
    if(conv_addr == INADDR_NONE) printf("Error!!!\n");
    else printf("Network ordered integer addr:  %#lx\n", conv_addr);

    conv_addr = inet_addr(addr2);
    if(conv_addr == INADDR_NONE) printf("Error!!!\n");
    else printf("Network ordered integer addr:  %#lx\n", conv_addr);

    return 0;
}

이렇게 코드를 실행해보면

Network ordered integer addr:  0x6f6f6f6f
Network ordered integer addr:  0x1017b7b

우리가 필요로 하는 32비트로 값을 얻게 된다.

 

이번에는 반환하는 것이 아니라 구조체에 저장하는 함수이다.

#include <arpa/inet.h>

int inet_aton(const char * string, struct in_addr * addr);

-string

변환할 IP 주소 정보를 담고 있는 문자열

- addr

변환된 정보를 저장할 in_addr 구조체 변수의 주소 값 전달

return: 1(success), 0(fail)

 

#include <stdio.h>
#include <stdlib.h>
#include <arpa/inet.h>

void error_handling(char *message);

int main(int argc, char *argv[]){
    struct sockaddr_in addr_inet;

    if(inet_aton(argv[1], &addr_inet.sin_addr)) printf("Network ordered integer addr: %#x\n", addr_inet.sin_addr.s_addr);
    else error_handling("Conversion error");

    return 0;
}

void error_handling(char *message){
    fputs(message, stderr);
    fputc('\n', stderr);
    exit(1);
}

이 코드를 사용해보면 &addr_inet에 데이터가 들어가게 된다.

 

이번에는 반대로 정수형태를 문자열로 바꾸는 함수이다.

#include <arpa/inet.h>

char *inet_ntoa(struct in_addr adr);

- adr

변환할 정수 값

return: 변환된 문자열의 주소 값, -1(fail)

#include <stdio.h>
#include <string.h>
#include <arpa/inet.h>

int main(int argc, char *argv[]){
    struct sockaddr_in addr1, addr2;
    char *str_ptr;
    char str_arr[20];

    addr1.sin_addr.s_addr=htonl(0x1020304);
    addr2.sin_addr.s_addr=htonl(0x1010101);

    str_ptr = inet_ntoa(addr1.sin_addr);
    strcpy(str_arr, str_ptr);
    printf("Dotted-Decimal notation1: %s \n", str_ptr);

    str_ptr = inet_ntoa(addr2.sin_addr);
    strcpy(str_arr, str_ptr);
    printf("Dotted-Decimal notation2: %s \n", str_ptr);

    return 0;
}

실행해보면 문자열로 출력이 되는 것을 볼 수 있다.

 

이제 우리가 인터넷 주소를 초기화 했던 코드들을 살펴보도록 하자.

struct sockaddr_in addr;
//IP 주소를 문자열로 선언, 보통은 받아옴
char *serv_ip = "111.111.111.111";
//PORT 번호를 문자열로 선언, 이것도 보통은 받아옴
char *serv_port = "1204";
//memset을 이용하여 현재 구조체의 모든 값을 0으로 초기화
memset(&addr, 0, sizeof(addr));
//주소 체계를 지정, 보통은 IPV4로 지정
addr.sin_family = AF_INET;
//문자열로 작성된 IP 주소를 입력
addr.sin_addr.s_addr = inet_addr(serv_ip);
//문자열로 작성된 port 번호를 입력
addr.sin_port=htons(atoi(serv_port));

이제 주소 초기화 한 함수들을 이해할 수 있을 것이다.

 

728x90

저번 주에는 서버와 클라이언트들의 소켓을 열고 통신하는 실습을 해보았다.

 

이번 주에는 그 때 사용했던 socket 함수에 대하여 더 자세히 알아보도록 하자.

 

socket

#include <sys/socket.h>

int socket(int domain, int type, int protocol);

- domain

소켓이 사용할 프로토콜 체계의 정보

- type

소켓 데이터 전송방식에 대한 정보 전달(TCP, UDP)

- protocol

두 컴퓨터간 통신에 사용되는 프로토콜 정보

return: file descriptor(success), -1(error)

 

여기에 들어가는 인자들을 하나씩 알아보자.

 

프로토콜 체계

프로토콜 체계는 Protocol Family로 줄여서 PF라고도 부른다.

프로토콜도 종류에 따라서 부류가 나뉘는데, 그 부류들을 가리켜 프로토콜 체계라고 한다.

많이 사용하는 프로토콜 쳬계들이다.

이름 프로토콜 체계(Protocol Family)
PF_INET IPv4 인터넷 프로토콜 체계
PF_INET6 IPv6 인터넷 프로토콜 체계
PF_LOCAL 로컬 통신을 위한 UNIX 프로토콜 체계
PF_PACKET Low Level 소켓을 위한 프로토콜 체계
PF_IPX IPX 노벨 프로토콜 체계

우리는 이 중에서 IPv4에 해당하는 PF_INET을 사용해 학습할 것이다.

 

소켓 타입

소켓의 타입은 데이터 전송 방식을 의미한다.

socket 함수로 소켓을 생성할 때 소켓의 타입도 같이 결정이 되어야 한다.

우리가 사용하는 PF_INET의 대표적인 소켓 타입은 TCP와 UDP에 해당하는 연결 지향형 소켓 타입과 비 연결 지향형 소켓 타입이 있다.

연결지향형(SOCK_STREAM) - TCP 비 연결지향형(SOCK_DGRAM) - UDP
중간에 데이터가 소멸되지 않는다. 순서 상관없이 빠르 속도로 전송한다.
전송 순서대로 데이터가 수신된다.(순서가 유지된다.) 데이터 손실 및 파손의 우려가 있다.
데이터의 경계가 존재하지 않는다. 데이터의 경계가 존재한다.
소켓: 소켓의 연결은 1:1의 구조로 이루어진다. 한번에 전송할 수 있는 데이터의 크기가 제한된다.

 

연결지향형 소켓을 사용시

int SOCKET = socket(PF_INET, SOCK_STREAM, IPPROTO_TCP);
int SOCKET = socket(PF_INET, SOCK_STREAM, 0);

 

비 연결지향형 소켓을 사용시

int SOCKET = socket(PF_INET, SOCK_DGRAM, IPPROTO_UDP);
int SOCKET = socket(PF_INET, SOCK_DGRAM, 0);

첫 번째, 두 번째 인자로 사실상 소켓이 결정되기 때문에 세 번째 인자는 0으로 전달 해도 된다.

 

2주차에는 1주차에서 실습했던 내용에 기능을 추가하려 한다.

1. Server에서 메시지를 전송하는 것이 아닌, Client에서 메시지를 전송
2. Server는 수신한 Message를 출력

3. 수신한 문자열의 길이를 strlen() 함수를 이용하여 출력
4. Server는 수신한 Message에 ("-> from Server")라는 문자열을 추가하여 다시 클라이언트로 전송
5. Client는 수신한 Message를 출력

 

그렇게 작성한 Server 프로그램의 코드이다.

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/types.h>
#include <sys/socket.h>

void error_handling(char *message);

int main(int argc, char *argv[])
{
	int serv_sock;
	int clnt_sock;

	struct sockaddr_in serv_addr;
	struct sockaddr_in clnt_addr;
	socklen_t clnt_addr_size;

	char message[BUFSIZ];
	
	if(argc!=2){
		printf("Usage : %s port\n", argv[0]);
		exit(1);
	}
	
	serv_sock=socket(PF_INET, SOCK_STREAM, 0);

	if(serv_sock == -1)
		error_handling("socket() error");
	
	memset(&serv_addr, 0, sizeof(serv_addr));
	serv_addr.sin_family=AF_INET;
	serv_addr.sin_addr.s_addr=htonl(INADDR_ANY); //IP 주소 할당(자기 자신의 IP 주소로)
	serv_addr.sin_port=htons(atoi(argv[1])); //PORT 번호 할당
	
	if(bind(serv_sock, (struct sockaddr*) &serv_addr, sizeof(serv_addr))==-1) //bind 함수로 IP, PORT 할당
		error_handling("bind() error"); 
	
	if(listen(serv_sock, 5)==-1)
		error_handling("listen() error");
	
	clnt_addr_size=sizeof(clnt_addr);  
	clnt_sock=accept(serv_sock, (struct sockaddr*)&clnt_addr,&clnt_addr_size);
	if(clnt_sock==-1)
		error_handling("accept() error");  
	
    //client로 부터 데이터를 읽어옴
	read(clnt_sock, message, BUFSIZ);
	printf("Received message: %s\n", message); 
    //BUFSIZ의 버퍼 중에서 문자열의 길이를 구함
	printf("Length of message : %lu\n", strlen(message));
	strcat(message, "-> from Server");
    //write 함수를 이용해 descriptor에 문자열을 작성
	write(clnt_sock, message, strlen(message) + 1);

	close(clnt_sock);
	close(serv_sock);
	return 0;
}

void error_handling(char *message)
{
	fputs(message, stderr);
	fputc('\n', stderr);
	exit(1);
}

진짜 파일 입출력 하던 것처럼 read, write를 사용했다.

 

이번엔 client 코드이다.

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/types.h>
#include <sys/socket.h>

void error_handling(char *message);

int main(int argc, char* argv[])
{
	int sock;
	struct sockaddr_in serv_addr;
	char sendMSG[BUFSIZ], recvMSG[BUFSIZ];
	
	if(argc!=3){
		printf("Usage : %s IP port\n", argv[0]);
		exit(1);
	}

	printf("Please send message: ");
	scanf("%s", sendMSG);
	
	sock= socket(PF_INET, SOCK_STREAM, 0);
	if(sock == -1)
		error_handling("socket() error");
	
	memset(&serv_addr, 0, sizeof(serv_addr));
	serv_addr.sin_family=AF_INET;
	serv_addr.sin_addr.s_addr=inet_addr(argv[1]); //IP 주소 할당
	serv_addr.sin_port=htons(atoi(argv[2])); // PORT 번호 할당
		
	if(connect(sock, (struct sockaddr*)&serv_addr, sizeof(serv_addr))==-1) 
		error_handling("connect() error!");

	//write 함수를 이용하여 해당 descriptor에 문자열을 작성
	write(sock, sendMSG, strlen(sendMSG));
    //read 함수를 이용하여 해당 descriptor에서 버퍼로 문자열을 읽어옴
	read(sock, recvMSG, BUFSIZ);

	printf("Receive message: %s", recvMSG);

	close(sock);
	return 0;
}

void error_handling(char *message)
{
	fputs(message, stderr);
	fputc('\n', stderr);
	exit(1);
}

이렇게 잘 작동하는 것을 볼 수 있다.

여기서 server 코드를 작성하면서 socket과 accept의 리턴값이 같은지 다른지 궁금해졌다.

 

그래서 어차피 int 값의 descriptor들이기 때문에 %d로 출력해보았다.

출력 값들을 보면 다른 것을 볼 수 있다.

서버에서 socket 함수의 리턴 값은 서버 자체의 소켓이고

그 소켓을 이용해서 client들과 통신할 수 있는 개별 소켓들을 열어주어야 한다.

728x90
  • Layered Architecture

우선 기본적인 Layered Architecture에 대해 살펴보자.

사실 저번 HTTP 시간에 공부했지만, 다시 한 번 살펴보는 느낌으로...

 

데이터 통신은 5가지 요소로 이루어져있다.

 

- Message

통신하려고 하는 데이터 자체를 말한다.

 

- Sender

당연히 보내는 사람을 말한다.

 

- Receiver

당연히 받는 사람을 말한다.

 

- Transmission Medium

Sender에서 Receiver로 갈 때 운반되는 물리적인 경로를 말한다.

 

- Protocol

데이터 통신을 위해 고려해야 하는 규칙들을 말한다.

 

이 중에서 Protocol을 살펴보자.

위에서 말한 것처럼 Protocol은 데이터 통신에서 Sender와 Receiver, 그리고 모든 중간 단계에서 통신을 직접적으로 하기 위해 정의한 규칙들을 말한다.

 

현재 인터넷에서 가장 많이 사용하는 TCP/IP Protocol Suite에 대해 알아보자.

TCP/IP Protocol Suite는 5계층으로 이루어져있다.

Applcation -> Layer 5
Transport -> Layer 4
Network -> Layer 3
Data link -> Layer 2
Physical -> Layer 1

 

Application 계층에서 데이터를 전송하려고 하면, Transport 계층에 해당하는 TCP or UDP로 메시지나 데이터 스트림을 전송한다.

Transport 계층은 대상 데이터를 작은 조각으로 나누고 대상 주소를 포함시켜 패킷으로 만든 후에 다음 계층으로 넘긴다.

Network 계층은 패킷을 IP 데이터그램에 포함한 후 데이터그램 헤더 및 트레일러에 넣고 데이터그램 전송 위치(대상에 직접 또는 게이트웨이에)를 결정한 후 Data link 단계로 넘긴다.

Data link 단계는 충돌과 보낼 시기를 관리하고 Physical 단계로 넘긴다.

Physical 단계는 물리적인 하드웨어를 이용하여 데이터를 전송한다.

Application Layer
      DATA
Transport Layer
    TCP 헤더 DATA
Network Layer
  IP 헤더 TCP 헤더 DATA
Data link Layer
이더넷 헤더 IP 헤더 TCP 헤더 DATA
Physical Layer

이렇게 단계를 하나씩 거칠 때마다, 헤더를 하나씩 추가한다.

수신 할 때에도 단계를 하나씩 올리면서 헤더를 하나씩 확인하며 떼어 내면서 수신하게 된다.

 

이정도만 소개하고 만약 더 필요한 내용이 있다면, HTTP 공부한 내용을 참고하기 바란다.

 

  • 네트워크 프로그래밍

네트워크 프로그래밍은 소켓을 기반으로 프로그래밍을 한다. 그렇기 때문에 소켓 프로그래밍이라고도 한다.

네트워크로 연결된 둘 이상의 컴퓨터 사이에서의 데이터 송수신 프로그램 작성을 의미한다.

 

소켓은 네트워크 연결의 도구로, 운영체제에 의해 제공이 되는 소프트웨어 장치이다.

프로그래머는 이 소켓만 이용하고, 소켓 덕분에 더 아래 계층에 대한 사용과 이해를 피할 수 있게 한다.

아래 부분은 아직 1주차에 배울 내용은 아니지만, 한 번 실습을 해보는 부분이다.

이해가 안되어도 그냥 넘어가면 된다.

 

Server 함수

소켓은 전화기라고 생각하면 된다.

하지만, 서버와 클라이언트에 따라 전화를 받는 용도의 소켓이 있으며 전화를 거는 소켓이 있다.

이 소켓은 다른 방법으로 생성을 해야한다.

 

socket

#include <sys/socket.h>

int socket(int domain, int type, int protocol);

- domain

생성할 소켓이 통신을 하기 위해 사용할 프로토콜

- type

소켓이 데이터를 전송하는 데, 사용하는 전송 타입

- protocol

소켓을 사용하기 위한 프로토콜을 지정

return: File descriptor, -1(error)

 

시스템 프로그래밍에서 사용했던 File descriptor처럼 생각을 하면 된다.

이 곳에다가 쓰면 데이터가 송신이 되고, 이곳을 읽으면 데이터를 수신하는 것이다.

 

소켓은 전화기로 생각을 하면 된다고 했었다.

하지만 전화기를 샀다고 바로 전화가 되지는 않을 것이다.

해당 전화기에 번호를 부여해 주어야 한다.

마찬 가지로 소켓에도 주소 정보를 넣어주어야 한다.

주소 정보는 당연히 IP와 PORT 번호로 구성이 된다.

 

bind

#include <sys/socket.h>

int bind(int sockfd, struct sockaddr *myaddr, socklen_t addrlen);

- sockfd

socket 함수로 생성한 file descriptor

- myaddr

IP 주소와 PORT 번호를 지정한 sockaddr 구조체

- addrlen

주소 정보를 담은 변수의 길이

return: 0(success), -1(error)

 

이렇게 번호까지 지정을 해주었다.

 

그러면 이제 이 전화기를 VOIP처럼 연결 가능상태로 만들어주어야 한다.

자리 비움이 아닌 수신 가능 상태로 설정한다고 생각하면 될 것이다.

 

특이하게 전화를 받을 수 있는 횟수가 지정이 되는데

그 값을 backlog 인수로 넣어준다.

 

listen

#include <sys/socket.h>

int listen(int sockfd, int backlog);

- sockfd

socket 함수로 생성한 descriptor

- backlog

수신할 큐의 개수 설정

return: 0(success), -1(error)

 

이제 VOIP에서 전화를 받아야 한다.

스피커 폰이 아닌 이상, 수화기를 들어야 내용을 수신할 수 있다.

 

그렇기 때문에 listen으로 연결 가능으로 설정을 해주어도, accept로 수락을 해주어야 내용을 수신할 수 있다.

수락 이후에 데이터의 송수신은 양방향으로 가능하다.

 

accept

#include <sys/socket.h>

int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);

- sockfd

socket 함수로 생성한 descriptor

- addr

sockaddr 구조체 포인터로, 연결이 성공하면 이 포인터에 클라이언트에 대한 정보를 채워 돌려주게 된다.

- addrlen

sockaddr 크기

return: file descriptor(success), -1(error)

 

이렇게 4가지를 알아보았고, 단계별로 이해하는 게 제일 쉬울 것이다.

STEP 1 소켓을 생성 socket 함수
STEP 2 IP와 PORT 번호를 할당 bind 함수
STEP 3 연결 가능한 상태로 변경 listen 함수
STEP 4 연결 요청에 대한 수락 accept 함수

 

Client 함수

클라이언트는 소켓을 생성하고 연결을 하면 된다.

 

connect

#include <sys/socket.h>

int connect(int sockfd, struct sockaddr *serv_addr, socklen_t addrlen);

- sockfd

socket 함수로 생성한 descriptor

- serv_addr

연결할 서버의 IP 주소와 PORT 번호들을 담아올 sockaddr 구조체

- addrlen

sockaddr 구조체의 크기

return: 0(success), -1(error)

 

 

다시 한 번 말하지만, 1주차에 한 번 해보는 내용으로 당연히 이해가 안 될수도 있다.

client와 server의 코드를 한 번 작성해보도록 하겠다.

 

실제 학교에서 실습했던 코드를 살짝만 수정해서 보도록 하겠다.

함수들에 들어가는 인자들은 나중에 배우도록 하겠다.

 

Server 코드

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/types.h>
#include <sys/socket.h>

void error_handling(char *message);

int main(int argc, char *argv[])
{
	int serv_sock;
	int clnt_sock;

	struct sockaddr_in serv_addr;
	struct sockaddr_in clnt_addr;
	socklen_t clnt_addr_size;

	char message[]="KNU, Han Seungkyu";
	
	if(argc!=2){
		printf("Usage : %s port\n", argv[0]);
		exit(1);
	}
	
	serv_sock=socket(PF_INET, SOCK_STREAM, 0);

	if(serv_sock == -1)
		error_handling("socket() error");
	
	memset(&serv_addr, 0, sizeof(serv_addr));
	serv_addr.sin_family=AF_INET;
	serv_addr.sin_addr.s_addr=htonl(INADDR_ANY); //IP 주소 할당(자기 자신의 IP 주소로)
	serv_addr.sin_port=htons(atoi(argv[1])); //PORT 번호 할당
	
	if(bind(serv_sock, (struct sockaddr*) &serv_addr, sizeof(serv_addr))==-1) //bind 함수로 IP, PORT 할당
		error_handling("bind() error"); 
	
	if(listen(serv_sock, 5)==-1)
		error_handling("listen() error");
	
	clnt_addr_size=sizeof(clnt_addr);  
	clnt_sock=accept(serv_sock, (struct sockaddr*)&clnt_addr,&clnt_addr_size);
	if(clnt_sock==-1)
		error_handling("accept() error");  
	
	write(clnt_sock, message, sizeof(message));
	close(clnt_sock);
	close(serv_sock);
	return 0;
}

void error_handling(char *message)
{
	fputs(message, stderr);
	fputc('\n', stderr);
	exit(1);
}

 

Client 코드

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/types.h>
#include <sys/socket.h>

void error_handling(char *message);

int main(int argc, char* argv[])
{
	int sock;
	struct sockaddr_in serv_addr;
	char message[30];
	int str_len=0;
	int idx=0, read_len=0;
	
	if(argc!=3){
		printf("Usage : %s IP port\n", argv[0]);
		exit(1);
	}
	
	sock= socket(PF_INET, SOCK_STREAM, 0);
	if(sock == -1)
		error_handling("socket() error");
	
	memset(&serv_addr, 0, sizeof(serv_addr));
	serv_addr.sin_family=AF_INET;
	serv_addr.sin_addr.s_addr=inet_addr(argv[1]); //IP 주소 할당
	serv_addr.sin_port=htons(atoi(argv[2])); // PORT 번호 할당
		
	if(connect(sock, (struct sockaddr*)&serv_addr, sizeof(serv_addr))==-1) 
		error_handling("connect() error!");

	while(read_len=read(sock, &message[idx++], 1))
	{
		if(read_len==-1)
			error_handling("read() error!");
		
		str_len+=read_len;
	}

	printf("Message from server: %s \n", message);
	printf("Function read call count: %d \n", str_len);
	close(sock);
	return 0;
}

void error_handling(char *message)
{
	fputs(message, stderr);
	fputc('\n', stderr);
	exit(1);
}

실행을 해보면 비록 스스로와의 통신이긴 하지만 잘 작동하는 것을 볼 수 있다.

컴파일 하는 방법과 실행 방법은 시스템 프로그래밍에서 배웠을 것이다.

728x90

시스템 프로그래밍 6주차에는 프로세스 정보에 관하여 배운다.

 

  • 프로세스란?

일단 프로그램과 프로세스의 차이에 대하여 먼저 알아보자.

프로그램은 실행 할 프로그램 과 데이터를 합친 컴퓨터 시스템에 실행 요청 전의 상태이다.

프로세스는 실행을 위해 커널에 등록된 작업을 말한다.

 

메모리 안에서 프로세스는

이렇게 차지하게 된다.

 

이제 리눅스 시스템에서 현재 실행중인 process 정보를 확인해보자.

윈도우의 작업관리자라고 생각하면 될 것이다.

ps를 사용하면 현재 실행중인 process 정보를 확인 할 수 있다.

옵션을 추가하자면 -j를 추가하면 job control format으로 출력이 가능하다.

 

top을 이용하면 현재 시스템 내 process 정보를 실시간 확인 가능하다.

사실 이 명령어가 ps 보다 더 작업관리자에 가깝다.

 

kill -signal pid 를 이용하면 해당 process에 signal을 전달한다.

이 부분은 나중에 더 자세히 배워보도록 하자.

 

  • 프로세스 계층

Process ID

Process에 부여된 식별 번호로 시스템 내 유일한 번호가 할당이 된다.

 

Parent process

자신을 생성한 프로세스이며, 모든 프로세스는 부모 프로세스가 있다.

최상위 process = kernel (pid = 0)

Parent process의 ID를 PPID라고 한다.

 

Getting PID/PPID

#include <sys/types.h>
#include <unistd.h>

pid_t getpid(void);
pid_t getppid(void);

parameter는 없고 Process ID와 Parent process ID를 반환한다.

 

바로 예제 코드를 작성해보자

#include <unistd.h>
#include <stdio.h>

int main(void){
	printf("PID : %d\n", (int)getpid());
	printf("PPID : %d\n", (int)getppid());

	return 0;
}

그냥 단순히 ID들을 가져오며 실행을 해보면

Process group

관련 process들을 묶은 것을 process group이라고 한다.

하나의 job 수행을 목적으로 하며, Process group에 전달 된 signal은 그룹 내 모든 프로세스에게 전달 된다.

 

그리고 그 중 가장 중심이 되는 Process를 Process group leader라고 한다.

Process Group의 ID는 leader의 PID를 따라간다.

 

Process group을 확인해보자.

우선 shell script를 작성한다.

echo test.sh ... start
ping 192.168.0.1
echo test.sh ... end

실행을 하고 터미널을 하나 더 열어서 Process ID들을 확인해본다.

이 화면이 Shell Script를 실행한 화면이고

ps -j e 명령어를 사용한 화면이다.

PGID가 같은 것들이 있는 것을 확인 할 수 있다.

 

kill -[signal num] -[groupID]로 해당 그룹 전체에 신호를 보낼 수 있다.

이 부분은 다음 시간에...

 

Setting process group ID

#include <unistd.h>

int setpgid(pid_t pid, pit_t pgid);

-pid

옮기고 싶은 target process의 pid

-pgid

설정하려는 group의 pgid

 

pid를 0으로 주면 current process로 설정하고, pgid = 0이면 pgid를 pid로 설정한다.

 

근데 여기서, 아무 group으로 이동할 수는 없고 같은 session 내에서만 이동이 가능하다.

 

session은 사용자가 로그인해 작업하고 있는 터미널 단위로 프로세스 그룹을 묶은 것을 말한다.

session은 하나의 foreground process group과 0개 이상의 background process group을 가진다.

foreground process group은 사용자의 입력을 받는 process group이고

background process group은 foreground process group 외의 process group을 말한다.

 

session에도 leader가 있는데 login shell process이다.

 

  • Process 실행 시간

Process running time = system running time + user running time 이며

 

직관적으로 알 수 있겠지만

System running time은 System call에 소요된 시간

User running time은 사용자 모드에서 수행한 시간으로 사용자 작성 코드를 실행하는데 걸린 시간이다.

 

Getting process running time

#include <sys/times.h>

clock_t times(struct tms *buf);

-buf

running time 정보를 저장할 tms 구조체의 포인터이다.

return: 특정 시점부터 경과한 시간, -1(error)

 

parameter로 들어가는 tms 구조체는

struct tms {
	clock_t tms_utime;      /* [XSI] User CPU time */
	clock_t tms_stime;      /* [XSI] System CPU time */
	clock_t tms_cutime;     /* [XSI] Terminated children user CPU time */
	clock_t tms_cstime;     /* [XSI] Terminated children System CPU time */
};

이렇게 구성이 되어 있다.

 

바로 코드를 작성해보자.

#include <sys/types.h>
#include <sys/times.h>
#include <time.h>
#include <limits.h>
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>

int main(void){
	time_t t;
	struct tms mytms;
	clock_t t1, t2;

	if((t1 = times(&mytms)) == -1) {perror("times 1"); exit(1);}

	sleep(5);

	for(int i = 0; i < 999999; i++) time(&t);

	if((t2 = times(&mytms)) == -1) {perror("times 2"); exit(1);}

	printf("Read time : %.1f sec\n", (double)(t2 - t1) / sysconf(_SC_CLK_TCK));
	printf("User time : %.1f sec\n", (double)mytms.tms_utime / sysconf(_SC_CLK_TCK));
	printf("System time : %.1f sec\n", (double)mytms.tms_stime / sysconf(_SC_CLK_TCK));

	return 0;
}

이렇게 실행시간을 측정해보면

User time과 System time까지 구할 수 있다.

 

  • 환경변수

환경 변수는 Process 실행환경에 정의되어 있는 변수를 말한다.

우선 shell 환경에서 먼저 보자면

 

env를 사용해서 환경변수 목록을 확인할 수 있다.

$export 를 사용해서 환경변수를 선언할 수 있다. ($export 환경변수명 = 값)

Getting enviroment variables

프로그램을 만들 때에도 환경 변수를 가져올 수 있다.

 

environ 전역 변수 사용

#include <stdlib.h>
#include <stdio.h>

extern char **environ;

int main(void){
	char **env;

	env = environ;
	while(*env){
		printf("%s\n", *env);
		env++;
	}

	return 0;
}

 

main의 인자로 전달

#include <stdio.h>

int main(int argc, char **argv, char **envp){
	char **env;

	env = envp;
	while(*env){
		printf("%s\n", *env);
		env++;
	}

	return 0;
}

 

#include <stdlib.h>

char *getenv(const char *name);

-name

읽어올 환경변수 명

return: 환경변수 값, NULL(error)

 

이렇게 원하는 환경변수만을 가져올 수 있다.

#include <stdio.h>
#include <stdlib.h>

int main(void){
	char *val;

	val = getenv("MY_NAME");
	if(val == NULL) printf("MY_NAME not defined\n");
	else printf("MY_NAME = %s\n", val);

	return 0;
}

 

Setting enviroment variables

#include <stdlib.h>

int putenv(char *string);
int setenv(const char *name, const char *value, int overwrite);

-string

추가할 환경변수와 값 (변수=값)

-name

추가할 환경변수의 이름

-value

추가할 환경변수의 값

-overwrite

추가되는 인수

 

Process에 의해 추가되는 환경 변수는 자신과 자식 프로세스에서만 유효하다.

#include <stdlib.h>
#include <stdio.h>

int main(void){
	char *val;

	val = getenv("MY_NAME");
	if (val == NULL) printf("SHELL not defined\n");
	else printf("1. MY_NAME = %s\n", val);

	putenv("MY_NAME=SK");

	val = getenv("MY_NAME");
	printf("2. MY_NAME = %s\n", val);

	return 0;
}

이렇게 MY_NAME에 해당하는 환경변수를 변경해도

그 process에서만 유효하다.

 

Unsetting enviroment variables

#include <stdlib.h>

int unsetenv(const char *name);

-name

삭제할 환경변수

return: 0(success), -1(error)

 

직관적으로 알 수 있듯 환경변수를 삭제하는 system call이다.

728x90

시스템프로그래밍 5주차에는 시스템 정보에 관하여 배운다.

 

MAC에서는 사용자 전환이 잘 안되어서... groom으로 진행하겠습니다.

 

  • 시스템 정보

시스템에 설치된 운영체제에 관한 정보, 호스트명 정보, 하드웨어 종류에 대한 정보 등을 얻는 방법을 알아보자.

 

uname

shell에 uname을 사용하면 시스템의 기본 정보를 출력한다.

system call로 알아보자

#include <sys/utsname.h>

int uname(struct utsname *buf);

-buf

읽은 정보를 저장할 utsname 구조체의 포인터

return: 0(success), -1(error)

 

여기에 들어가는 utsname 구조체에 대해 살펴보면

struct  utsname {
	char    sysname[_SYS_NAMELEN];  /* [XSI] Name of OS */
	char    nodename[_SYS_NAMELEN]; /* [XSI] Name of this network node */
	char    release[_SYS_NAMELEN];  /* [XSI] Release level */
	char    version[_SYS_NAMELEN];  /* [XSI] Version level */
	char    machine[_SYS_NAMELEN];  /* [XSI] Hardware type */
};

이고 이 구조체를 이용하여 시스템의 기본 정보를 가져오는 코드를 작성해보자.

#include <sys/utsname.h>
#include <stdlib.h>
#include <stdio.h>

int main(void){
	struct utsname uts;

	if(uname(&uts) == -1){
		perror("uname");
		exit(1);
	}

	printf("OSname : %s\n", uts.sysname);
	printf("Nodename: %s\n", uts.nodename);
	printf("Release: %s\n", uts.release);
	printf("Version: %s\n", uts.version);
	printf("Machine: %s\n", uts.machine);
	
	return 0;
}

sysinfo

sysinfo를 사용해서 다른 정보들을 가져올 수도 있다.

#include <sys/sysinfo.h>

int sysinfo(struct sysinfo *info);

-info

읽은 정보를 저장할 sysinfo 구조체의 포인터

return: 0(success), -1(error)

 

sysconf

#include <unistd.h>

long sysconf(int name);

-name

검색할 정보를 지칭하는 상수

return: 요청한 정보의 값, -1(error)

 

이번엔 리소스의 정보를 가져오는 system call이다.

 

상수의 예

상수 설명
_SC_ARG_MAX(1) argv[]와 envp[]를 합한 최대 크기로, 바이트 단위로 표시한다.
_SC_CHILD_MAX(2) 한 UID에 허용되는 최대 프로세스 개수를 나타낸다.
_SC_CLK_TCK(3) 초당 클록 틱 수를 나타낸다.
_SC_OPEN_MAX(5) 프로세스당 열 수 있는 최대 파일 개수를 나타낸다.
_SC_VERSION(8) 시스템이 지원하는 POSIX.1의 버전을 나타낸다.
_SC_PASS_MAX(9) 패스워드의 최대 길이를 나타낸다.
_SC_LOGNAME_MAX(10) 로그인명의 최대 길이를 나타낸다.
_SC_PAGESIZE(11) 시스템 메모리의 페이지 크기를 나타낸다.

sysconf를 이용해서 리소스의 정보를 출력해보자면

#include <unistd.h>
#include <stdio.h>

int main(void){
	printf("Clock Tick : %ld\n", sysconf(_SC_CLK_TCK));
	printf("Max Open File : %ld\n", sysconf(_SC_OPEN_MAX));
	printf("Max Login Name Length : %ld\n", sysconf(_SC_LOGIN_NAME_MAX));
	
	return 0;
}

  • 사용자 정보

사용자를 추가하거나 권한을 관리하는 방법들이다.

우선 shell에서 사용자(seungkyu)를 추가해보자.

sudo adduser [사용자 이름]을 입력하면 된다.

일단 이렇게 모두 디폴트로 설정을 하면 된다.

 

해당 사용자로 접근을 해보자.

su [사용자 이름] 명령어를 사용하면 해당 사용자로 접근할 수 있다.

exit로 나갈 수 있다.

UID는 그 사용자에게 부여된 ID 번호이며, Login name은 문자 형태의 사용자 이름이다.

이렇게 id [사용자 이름]으로 확인 할 수 있다.

Process에 입장 할 때의 사용자에 대해 알아보자.

- Real user ID

최초에 Process를 실행한 user의 UID

- Effective user ID

현재 Process가 행사하는 UID

- Saved user ID

Process의 최초의 effective user ID

 

Effective User ID는 기본적으로는 Real UID와는 같다, 실행 파일의 setuid bit가 1인 경우 해당 파일 소유자의 UID가 effective UID가 된다.

 

Getting/Setting user IDs

#include <unistd.h>
#include <sys/types.h>

uid_t getuid(void);
uid_t geteuid(void);

return: 얻으려고 하는 uid

uid와 euid를 반환 받는 getuid와 geteuid 함수이다.

 

#include <sys/types.h>
#include <unistd.h>

int seteuid(uid_t uid);

Process의 EUID를 설정할 수 있는 seteuid 함수이다.

 

바로 실습으로 가보도록 하자.

#include <sys/types.h>
#include <unistd.h>
#include <stdio.h>

int main(void){
	uid_t uid, euid;

	uid = getuid();
	euid = geteuid();
	printf("[Init] UId = %d, EUID = %d\n", (int)uid, (int)euid);

	seteuid(getuid());
	int cur_euid = (int)geteuid();
	printf("[seteuid(uid)] UID = %d, EUID = %d\n", (int)uid, (int)cur_euid);

	seteuid(euid);
	cur_euid = (int)geteuid();
	printf("[seteuid(euid)]UID = %d, EUID = %d\n", (int)uid, (int)cur_euid);

	return 0;
}

이렇게 프로세스 내에서의 userID 변동을 살펴 볼 수 있다.

 

User information

우선 /etc/passwd 라는 파일을 한 번 보도록 하자.

이렇게 사용자들의 정보가 쭉 나온다.

LoginID:PassWord:UID:GID:UserInfo:HomeDir의 정보로 출력이 된다.

 

당연히 시스템 콜에서도 사용자의 정보를 불러 올 수 있고, 사용자에 대한 구조체가 존재한다.

struct passwd {
	char	*pw_name;		/* user name */
	char	*pw_passwd;		/* encrypted password */
	uid_t	pw_uid;			/* user uid */
	gid_t	pw_gid;			/* user gid */
	char	*pw_gecos;		/* Honeywell login info */
	char	*pw_dir;		/* home directory */
	char	*pw_shell;		/* default shell */
};

이렇게 존재한다.

 

Reading the passwd file

#include <sys/types.h>
#include <pwd.h>

struct passwd *getpwnam(const char *name);
struct passwd *getpwuid(uid_t uid);

passwd 파일을 가져오는 함수들이다.

-name

passwd file에서 정보를 읽어올 사용자의 이름

-uid

passwd file에서 정보를 읽어올 사용자의 uid

return: 해당 사용자에 대한 passwd structure가 저장된 pointer, -1(NULL)

 

#include <sys/types.h>
#include <pwd.h>
#include <stdio.h>

int main(void){
	struct passwd * pw;

	pw = getpwuid(getuid());
	printf("UID : %d\n", (int)pw->pw_uid);
	printf("Login Name : %s\n", pw->pw_name);

	return 0;
}

uid로 사용자를 불러온 모습이다.

 

Reading the group file

#include <sys/types.h>
#include <grp.h>

struct group *getgrname(const char *name);
struct group *getgrgid(gid_t gid);

struct group *getgrent(void);
void setgrent(void);
void endgrent(void);

사용자 뿐만 아니라 그룹에 대한 정보도 가져올 수 있다.

위와 비슷하고 그룹이란 것만 변경이 되었기 때문에 바로 실습으로 가보도록 하겠다.

 

group의 구조체는 아래와 같다.

struct group {
	char	*gr_name;		/* [XBD] group name */
	char	*gr_passwd;		/* [???] group password */
	gid_t	gr_gid;			/* [XBD] group id */
	char	**gr_mem;		/* [XBD] group members */
};

 

그룹에 대한 정보를 읽어오는 프로그램을 만들어보자.

 

#include <stdio.h>
#include <stdlib.h>
#include <grp.h>

int main(void){
	struct group *grp;

	grp = getgrnam("root");
	printf("Group Name : %s\n", grp->gr_name);
	printf("GID : %d\n", (int)grp->gr_gid);


	return 0;
}

그룹의 이름을 이용해 정보를 가져왔다.

  • 시간 정보

리눅스의 시간은 1970년 1월 1일 0시 0분 0초를 기준으로 흘러가며 현재까지 경과한 시간을 초 단위로 저장한다.

 

Getting time

#include <sys/time.h>

time_t time(time_t *tloc);

-tloc

얻어올 초를 저장할 주소

return: 얻어온 초, -1(error)

 

하지만 이렇게 얻어온 시간은 흘러간 초로 표현이 되기 때문에 읽기가 매우 힘들다.

그래서 이 time_t를 우리가 보기 편한 시간으로 보여주는 함수가 있고 그 시간을 저장하는 구조체가 있다.

 

우선 해당 구조체부터 살펴보자면

struct tm {
	int	tm_sec;		/* seconds after the minute [0-60] */
	int	tm_min;		/* minutes after the hour [0-59] */
	int	tm_hour;	/* hours since midnight [0-23] */
	int	tm_mday;	/* day of the month [1-31] */
	int	tm_mon;		/* months since January [0-11] */
	int	tm_year;	/* years since 1900 */
	int	tm_wday;	/* days since Sunday [0-6] */
	int	tm_yday;	/* days since January 1 [0-365] */
	int	tm_isdst;	/* Daylight Savings Time flag */
};

이렇게 연부터 초들이 들어가게 되고

 

Seconds <-> tm struct

#include <time.h>

struct tm *gmtime(const time_t *timep);
struct tm *localtime(const time_t *timep);

time_t mktime(struct tm *tm);

-*timep

변환하려는 time_t 구조체

return: 변환된 tm 구조체

 

-tm

변환하려는 tm 구조체

return: 변환된 time_t 구조체

 

변환하여 출력해보자.

#include <time.h>
#include <stdio.h>

int main(void){
	struct tm *tm;
	time_t t;

	time(&t);
	printf("Time(sec) : %d\n", (int)t);

	tm = gmtime(&t);
	printf("GMTIME=Y:%d", tm->tm_year);
	printf("M:%d ", tm->tm_mon);
	printf("D:%d ", tm->tm_mday);
	printf("H:%d ", tm->tm_hour);
	printf("M:%d ", tm->tm_min);
	printf("S:%d\n", tm->tm_sec);

	tm = localtime(&t);
	printf("LOCALTIME=Y:%d", tm->tm_year);
	printf("M:%d ", tm->tm_mon);
	printf("D:%d ", tm->tm_mday);
	printf("H:%d ", tm->tm_hour);
	printf("M:%d ", tm->tm_min);
	printf("S:%d\n", tm->tm_sec);

	return 0;
}

이렇게 tm과 time_t 간에 변환이 된 모습이다.

728x90

시스템프로그래밍 4주차에는 리눅스의 파일에 관하여 배운다.

 

리눅스는 모두 파일로 저장이 되고 종류로는 Regular file, Special file, Directory, Symbolic link file... 등이 있다.

파일의 종류를 확인하고 싶으면 ls -l 명령어를 사용하면 된다.

정보 가장 앞에 나온 문자로 확인을 한다.

문자 파일의 종류
- 일반 파일
d 디렉토리
b 블록 장치 특수 파일
c 문자 장치 특수 파일
l 심볼릭 링크
  • Types of file

- Special file

장치와 데이터를 주고 받는 통로이다, 데이터 블록이 없으며 장치 번호를 inode에 저장한다.

단위에 따라 Character device file, Block device file로 나뉜다.

- Regular file

Text or binary data file이다.

- Directory(윈도우의 파일)

파일의 목록을 저장한 파일이다.

- Symbolic link file

이미 존재하는 파일이나 디렉토리에 접근 할 수 있는 새로운 이름이다.

 

  • File organization

파일을 구성하는 요소는 3가지이다.

- File name

파일의 이름으로 사용자가 파일에 접근할 때 사용한다.

- inode

파일에 대한 정보를 저장한다, 번호를 통해 관리/접근 한다.

- Data block

실제 데이터가 저장된 디스크의 공간이다.

inode는 ls -i로 확인할 수 있다.

 

2주차에서 보았던 file table을 다시 보자면

file table은 직접 해당 파일을 가리키는 것이 아니라

i-node를 가리키고 inode에서 해당 파일을 가리키는 것이다.

 

시스템 콜을 사용을 해서 i-node에 저장되어 있는 파일 정보를 읽어 올 수 있다.

 

File information

#include <fcntl.h>
#include <sys/types.h>
#include <sys/stat.h>

int stat(const char *pathname, struct stat *buf);
int fstat(int fd, struct stat *buf);

file descriptor를 사용하면 fstat를 사용한다.

- pathname(file path or file descriptor)

파일의 경로(파일의 이름을 포함한)

-buf

파일의 정보를 저장한 주소

return: 0(success), -1(error)

당연히 파일에 읽기 권한이 있어야 한다.

 

struct stat의 구조체를 살펴보면

struct stat {
	dev_t           st_dev;         /* [XSI] ID of device containing file */
	ino_t           st_ino;         /* [XSI] File serial number */
	mode_t          st_mode;        /* [XSI] Mode of file (see below) */
	nlink_t         st_nlink;       /* [XSI] Number of hard links */
	uid_t           st_uid;         /* [XSI] User ID of the file */
	gid_t           st_gid;         /* [XSI] Group ID of the file */
	dev_t           st_rdev;        /* [XSI] Device ID */
	time_t          st_atime;       /* [XSI] Time of last access */
	long            st_atimensec;   /* nsec of last access */
	time_t          st_mtime;       /* [XSI] Last data modification time */
	long            st_mtimensec;   /* last data modification nsec */
	time_t          st_ctime;       /* [XSI] Time of last status change */
	long            st_ctimensec;   /* nsec of last status change */
	off_t           st_size;        /* [XSI] file size, in bytes */
	blkcnt_t        st_blocks;      /* [XSI] blocks allocated for file */
	blksize_t       st_blksize;     /* [XSI] optimal blocksize for I/O */
	__uint32_t      st_flags;       /* user defined flags for file */
	__uint32_t      st_gen;         /* file generation number */
	__int32_t       st_lspare;      /* RESERVED: DO NOT USE! */
	__int64_t       st_qspare[2];   /* RESERVED: DO NOT USE! */
};

이렇게 작성이 되어 있다.

 

함수와 구조체를 이용하여 i-node의 정보를 가져오는 코드를 작성해보자.

#include <sys/types.h>
#include <sys/stat.h>
#include <stdio.h>

int main(void){
    struct stat buf;

    stat("stat.c", &buf);

    printf("Inode = %d\n", (int)buf.st_ino);
    printf("Mode = %o\n", (unsigned int)buf.st_mode);
    printf("Nlink = %o\n", (unsigned int)buf.st_nlink);
    printf("UID = %d\n", (int)buf.st_uid);
    printf("GID = %d\n", (int)buf.st_gid);
    printf("SIZE = %d\n", (int)buf.st_size);
    printf("Atime = %ld\n", buf.st_atime);
    printf("Mtime = %ld\n", buf.st_mtime);
    printf("Ctime = %ld\n", buf.st_ctime);
    printf("Blksize = %d\n", (int)buf.st_blksize);
    printf("Blocks = %d\n", (int)buf.st_blocks);

    return 0;
}

이렇게 우리가 작성한 stat.c의 정보를 가져오는 코드이다.

실행을 해보면

i-node 번호부터 시작해서 저장된 정보가 출력되는 것을 볼 수 있다.

 

st_mode에 저장된 데이터를 이용하면 파일의 타입까지 체크할 수 있다.

상수명 상수값(16진수) 기능
S_IFMT 0XF000 st_mode 값에서 파일의 종류를 정의한 부분을 가져옴
S_IFIFO 0X1000 FIFO 파일
S_IFCHR 0X2000 문자 장치 특수 파일
S_IFDIR 0X4000 디렉토리
S_IFBLK 0X6000 블록 장치 특수 파일
S_IFREG 0X8000 일반 파일
S_IFLNK 0XA000 심볼릭 링크 파일
S_IFSOCK 0XC000 소켓 파일

임시로 파일을 만들고 해당 파일의 타입을 확인해보자.

#include <sys/types.h>
#include <sys/stat.h>
#include <stdio.h>

int main(void){
    struct stat buf;
    int kind;

    stat("hello.txt", &buf);

    printf("Mode = %d (Hexa: %x)\n", (unsigned int)buf.st_mode, (unsigned int)buf.st_mode);

    kind = buf.st_mode & S_IFMT;

    printf("Kind = %x\n", kind);

    switch(kind){
        case S_IFIFO:
            printf("hello.txt : FIFO\n"); break;
        case S_IFDIR:
            printf("hello.txt: Directory\n"); break;
        case S_IFREG:
            printf("hello.txt: Regular File\n"); break;
    }

    return 0;
}

이렇게 and 연산에 의해 해당 파일의 모드가 출력되게 된다.

이렇게 and 연산 말고도 macro 함수를 사용할 수도 있기는 하다.

 

Checking permission

#include <unistd.h>

int access(const char *pathname, int mode);

-pathname

파일의 경로(파일 이름 포함)

-mode

R_OK, W_OK, X_OK, F_OK(파일의 존재를 확인)

#include <sys/errno.h>
#include <unistd.h>
#include <stdio.h>

extern int errno;

int main(void){
    int per;

    if(access("hi.txt", F_OK) == -1 && errno == ENOENT) printf("hi.txt: File not exist.\n");

    per = access("hello.txt", R_OK);
    if(per == 0) printf("linux.txt: Read permission is permitted.\n");
    else printf("hello.txt: Read permission is not permitted.\n");

    return 0;
}

return: 0(권한 있음), -1(error)

이렇게 파일의 권한이 있다고 보여지는 것을 볼 수 있다.

 

Changing permission

#include <sys/stat.h>

int chmod(const char *pathname, mode_t mode);
int fchmod(int fd, mode_t mode);

-pathname(file path or file descriptor)

파일의 경로

-mode

적용하려는 접근 권한

return: 0(success), -1(error)

 

해당 파일의 권한을 변경할 수 있다.

#include <sys/errno.h>
#include <unistd.h>
#include <stdio.h>

extern int errno;

int main(void){
    int per;

    if(access("hi.txt", F_OK) == -1 && errno == ENOENT) printf("hi.txt: File not exist.\n");

    per = access("hello.txt", R_OK);
    if(per == 0) printf("linux.txt: Read permission is permitted.\n");
    else printf("hello.txt: Read permission is not permitted.\n");

    return 0;
}

이렇게 변경되는 것을 볼 수 있다.

 

  • Directory

이번에는 파일이 아닌 directory를 알아보자.

file name들과 file name이 가리키는 inode 번호를 담고 있는 파일을 directory라고 한다.

 

Current directory를 기준으로 작성한 파일 경로를 상대 경로라고하고, Root directory를 기준으로 작성한 파일 경로를 root directory라고 한다.

 

우선 우리가 사용했던 mkdir, rmdir, rename을 만들어보자.

#include <sys/stat.h>
#include <sys/types.h>

int mkdir (const char *pathname, mode_t mode);

-pathname

만들 directory의 이름이다.

-mode

만들 directory의 모드이다.

#include <unistd.h>

int rmdir(const char *pathname);

-pathname

삭제할 directory의 이름이다.

#include <stdio.h>

int rename(const char *oldpath, const char *newpath);

-oldpath

변경하고 싶은 directory의 이름이다.

-newpath

변경할 이름이다.

 

바로 실습을 해보면

#include <sys/stat.h>
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>

#define PRINT_ERR_EXIT(_msg) {perror(_msg); exit(1);}

int main(void){
    if(mkdir("system", 0755) == -1) PRINT_ERR_EXIT("system");

    if(mkdir("programming", 0755) == -1) PRINT_ERR_EXIT("programming");

    if(rename("system", "systemProgramming") == -1) PRINT_ERR_EXIT("systemProgramming");

    if(rmdir("programming") == -1) PRINT_ERR_EXIT("programming");

    return 0;
}

mkdir로 system directory와 programming directory를 만들고 system directory의 이름을 systemProgramming으로 변경한다.

그리고 programming directory를 제거하는 프로그램이다.

실습을 해보면 systemProgramming directory가 생성된 것을 볼 수 있다.

 

getcwd

#include <unistd.h>

char *getcwd(char *buf, size_t size);

현재 directory 주소를 가져오는 함수이다.

-buf

경로를 저장할 buffer의 주소

- size

buffer의 사이즈이다.

return: Path가 저장된 buf의 주소, NULL(error)

 

chdir

#include <unistd.h>

int chdir(const char *path);

working directory를 변경하는 함수이다.

-path

변경할 directory의 주소

return: 0(success), -1(fail)

 

#include <stdio.h>
#include <unistd.h>

int main(void){
    char *cwd;
    char wd[BUFSIZ];

    cwd = getcwd(NULL, BUFSIZ);
    printf("1. Current Directory : %s\n", cwd);

    chdir("newDir");

    getcwd(wd, BUFSIZ);
    printf("2. Current Directory: %s\n", wd);

    return 0;
}

이렇게 실습을 진행해보면

첫번째에 현재 디렉토리가 출력되는 것을 볼 수 있고, 두번째에 변경된 디렉토리가 출력되는 것을 볼 수 있다.

Open/Close a directory file

#include <sys/types.h>
#include <dirent.h>

DIR *opendir(const char *name);

-name

열려는 디렉토리의 이름

return: 열린 디렉토리의 DIR 포인터, NULL(error)

#include <sys/types.h>
#include <dirent.h>

int closedir(DIR *dirp);

-dirp

닫으려는 DIR 포인터

return: 0(success), -1(fail)

 

Reading directory information

#include <dirent.h>

struct dirent *readdir(DIR *dirp);

-drip

읽으려는 directory file의 DIR 포인터

return: 현재 읽어온 항목의 dirent 구조체를 가리키는 포인터, NULL(더 이상 읽어올 항목이 없음)

 

여기서 dirent 구조체는

struct dirent {
	__uint64_t  d_ino;      /* file number of entry */ \
	__uint64_t  d_seekoff;  /* seek offset (optional, used by servers) */ \
	__uint16_t  d_reclen;   /* length of this record */ \
	__uint16_t  d_namlen;   /* length of string in d_name */ \
	__uint8_t   d_type;     /* file type, see below */ \
	char      d_name[__DARWIN_MAXPATHLEN]; /* entry name (up to MAXPATHLEN bytes) */ \
}

이렇게 구성이 되어 있다.

이 정보들을 하나씩 읽어오는 것이다.

 

위에서 만들었던 systemProgramming directory에 대충 파일을 하나 만든 후 실습을 해보자면

#include <stdio.h>
#include <dirent.h>
#include <stdlib.h>

int main(void){
    DIR *dp;
    struct dirent *dent;

    if((dp = opendir("systemProgramming")) == NULL){
        perror("opendir: systemProgramming");
        exit(1);
    }

    while((dent = readdir(dp))){
        printf("Name : %s   ", dent -> d_name);
        printf("Inode : %d\n", (int)dent -> d_ino);
    }

    closedir(dp);

    return 0;
}

이렇게 systemProgramming directory에 들어있는 모든 파일들이 순서대로 출력되는 것을 볼 수 있다.

 

  • Link

이번에는 link에 대해 알아본다.

 

Hard link

먼저 하드 링크부터 알아본다.

해당 inode에 mapping 된 이름을 말한다.

동일한 file system 내에 여러 개의 hard link를 생성할 수 있고

링크 수 = hard link 수이며, 링크 수 = 0 은 파일 삭제를 의미한다.

 

Soft link

실제 파일의 경로명을 저장하는 파일이며, 동일한 inode를 사용하는 하드 링크와는 다르게 새로운 inode를 사용한다.

 

링크는 shell에서 ln을 사용해서도 만들 수 있다.

ln에 -s 명령어를 추가하면 soft link를 만든다.

 

우리는 이 명령어를 직접 만드는 실습을 해보자.

 

Making a link

#include <unistd.h>

int link(const char *oldpath, const char *newpath);
//Hard link 생성
#include <unistd.h>

int symlink(const char *target, const char *linkpath);
//soft link 생성

return: 0(success), -1(fail)

 

바로 하드 링크의 코드를 작성해보면

#include <sys/types.h>
#include <sys/stat.h>
#include <unistd.h>
#include <stdio.h>

int main(void){
    struct stat buf;

    stat("hello.txt", &buf);
    printf("Before link count = %d\n", (int)buf.st_nlink);

    link("hello.txt", "hello.ln");
    
    stat("hello.txt", &buf);
    printf("After Link Count = %d\n", (int)buf.st_nlink);

    return 0;
}

새롭게 hello.ln의 파일이 생성되고 hello.txt의 링크 수가 증가하는 것을 볼 수 있다.

softlink는 매우 간단하다.

이렇게 간단하게 코드를 작성하고

#include <sys/types.h>
#include <sys/types.h>
#include <unistd.h>

int main(void){
    symlink("hello.txt", "hello.sym");

    return 0;
}

실행을 해보면

화살표로 링크를 나타내는 파일이 생긴 것을 볼 수 있다.

 

Removing a link

#include <unistd.h>

int unlink(const char *pathname);
#include <stdio.h>

int remove(const char *pathname);

링크를 제거하는 방법에는 이렇게 unlink와 remove 2가지 방법이 있다.

-pathname

삭제하려는 HardLink의 경로

return: 0(success), -1(error)

 

둘 다 File System에서 이름을 삭제하고 해당 파일이 마지막 Link인 경우, file을 삭제한다.

하지만 차이로는 remove는 directory에도 사용이 가능하지만, unlink는 불가능하다.

 

Get symbolic link file Info

#include <unistd.h>

ssize_t readlink(const char *pathname, char *buf, size_t bufsiz);

Symbolic link에 저장된 데이터를 읽는 함수이다.

-pathname

읽을 파일의 경로

-buf

데이터를 저장할 buffer

-bufsiz

읽을 크기

return: 읽은 byte의 수, -1(error)

 

#include <sys/types.h>
#include <sys/stat.h>
#include <unistd.h>
#include <stdio.h>
#define PRINT_CNT_INODE {\
    printf("hello.txt : Link Count = %d\n", (int)buf.st_nlink);\
    printf("hello.txt: Inode = %d\n", (int)buf.st_ino);}

int main(void){
    struct stat buf;

    printf("1. stat : hello.txt ---\n");
    stat("hello.txt", &buf);
    PRINT_CNT_INODE;

    printf("2. stat : hello.sym ---\n");
    stat("hello.sym", &buf);
    PRINT_CNT_INODE;

    printf("3. lstat : hello.sym ---\n");
    lstat("hello.sym", &buf);
    PRINT_CNT_INODE;
}

이렇게 hello.sym가 가진 정보를 출력해보면 lstat로 가져온 정보만 다르다는 것을 볼 수 있다.

#include <limits.h>
#include <stdlib.h>

char *realpath(const char *path, char *resolved_path);

Symbolic link가 가리키는 파일의 절대 경로를 얻는다.

-path

symbolic link file의 경로

-resolved_path

결과 값을 저장할 buffer

return: 결과가 저장된 buffer의 포인터, NULL(error)

 

#include <sys/stat.h>
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>
#define PRINT_ERR_EXIT(_msg) {perror(_msg); exit(1);}

int main(void){
    char buf[BUFSIZ];
    int n;

    n = readlink("hello.sym", buf, BUFSIZ);
    if(n == -1) PRINT_ERR_EXIT("readlink");

    buf[n] = '\0';
    printf("hello.sym : READLINK = %s\n", buf);

    realpath("hello.sym", buf);
    printf("hello.sym : READPATH = %s\n", buf);

    return 0;
}

이렇게 link로 가져온 파일의 원래 위치를 가져온다.

728x90

시스템 프로그래밍 3주차는 2주차의 내용에 연장으로 표준 입출력에 대해 공부한다.

 

  • Standard IO

Standard IO는 platform에 독립적인, user-buffering solution이다.

 

File pointer

File operation을 관리하는 구조체를 가리키는 포인터

내부적으로 file descriptor와 연동됨

 

Stream

프로그램과 file을 연결한 통로

 

파일 IO에 대한 일의 순서는

File open -> File access -> File close로

파일을 열고 사용을 한 후 파일을 닫는 순서이다.

 

  • File open & close

Opening a file/stream

#include <stdio.h>

FILE *fopen(const char *path, const char *mode);

-path(file path)

열려는 파일의 경로

-mode(file open mode)

파일 열기 모드

return: file pointer (NULL: error)

 

파일 열기 모드(mode)

  모드 파일이 존재하지 않을 때 파일이 존재 할 때
r 읽기 열기 실패 열기 성공
w 쓰기 파일이 생성 덮어 씀(기존 내용은 지워 짐)
a 덧붙이기 파일이 생성 기존 파일 뒤에 기록
r+ 읽기+ 모드 / 쓰기 모드로 전환 가능 읽기 <-> 쓰기 모드 전환 시,
반드시 fflush(), fseek(), fstepos(), rewind() 중 하나를 호출해야 함
w+ 쓰기+ 모드/  읽기 모드로 전환 가능
a+ 덧붙이기+ / 읽기 모드로 전환 가능
b 이진 파일 모드 이진 파일 형식으로 파일을 연다
읽기/쓰기 모드는 위의 지정자들로 지정

이진 파일은 사람이 읽을 수 있는 문자로 채워진 Ascii 파일과 다르게 이진 데이터가 직접 저장된 파일을 말한다.

 

Closing a files/streams

#include <stdio.h>

int fclose(FILE *stream);

-stream

닫으려는 stream

return: 0(-1: error)

 

열고 닫는 방법을 배웠으니 바로 한 번 해보도록 하자.

#include <stdio.h>
#include <stdlib.h>

int main(void){
    FILE *fp;

    if ((fp = fopen("hello.txt", "w")) == NULL){
        perror("fopen: hello.txt");
        exit(1);
    }

    fclose(fp);

    return 0;
}

딱 파일만 열고 바로 닫는 예제이다.

실행을 해보면 w 모드이기 때문에 

없던 hello.txt 파일이 생성되는 것을 볼 수 있다.

 

  • File read & write

파일을 열고 닫는 방법을 공부했으니 이제 순서의 중간인 파일의 사용에 대해 공부해보자

 

Character-based

Chararcter-based reading

#include <stdio.h>

int fgetc(FILE *stream);
int getc(FILE *stream); //macro 형태로 구현되어 있어, 인자에서 계산은 X
int getchar(void); //getc(stdin), 표준입력에서 입력을 받음

-stream

File operation을 수행할 stream

return : 읽은 문자 (-1: error)

 

파일로부터 문자 하나씩 읽는 방법이다.

 

Character-based writing

#include <stdio.h>

int fputc(int c, FILE *stream);
int putc(int c, FILE *stream);
int putchar(int c); //putc(c, stdout)

-stream

File operation을 수행할 stream

-c

쓰려는 문자

return: 기록한 문자(-1:error)

 

Characted-based로 실습을 해보자

#include <stdlib.h>
#include <stdio.h>

int main(void){
    FILE *rfp, *wfp;
    int c;

    if((rfp = fopen("hello.txt", "r")) == NULL){
        perror("fopen: hello.txt");
        exit(1);
    }

    if((wfp = fopen("hello.out", "w")) == NULL){
        perror("fopen: hello.out");
        exit(1);
    }

    while((c = fgetc(rfp)) != EOF){ //하나씩 계속 읽어서 hello.out에 작성
        fputc(c, wfp);
    }

    fclose(rfp);
    fclose(wfp);

    return 0;
}

이렇게 파일을 작성하면 hello.txt에서 문자를 하나씩 읽어서 hello.out에 저장하게 된다.

String-based

String-based reading

#include <stdio.h>

char *gets(char *s); //get from stdin
char fgets(char *s, int n, FILE *stream);

-s

읽은 문자열을 저장할 buffer

-n

buffer의 크기

-stream

File operation을 수행할 stream

return: Buffer의 시작 주소(NULL: error)

 

String-based writing

#include <stdio.h>

int puts(char *s); //put to stdout
int fputs(char *s, FILE *stream);

-s

기록할 문자열을 저장한 buffer

-stream

File operation을 수행할 stream

return: 양수(음수: error)

 

문자열 단위로 실습을 해보자

#include <stdio.h>
#include <stdlib.h>

int main(void){
    FILE *rfp, *wfp;
    char buf[BUFSIZ];
    printf("BUFSIZ = %d\n", BUFSIZ);

    if((rfp = fopen("hello.txt", "r")) == NULL){
        perror("fopen: hello.txt");
        exit(1);
    }

    if((wfp = fopen("hello.out", "a")) == NULL){
        perror("fopen: hello.txt");
        exit(1);
    }

    while(fgets(buf, BUFSIZ, rfp) != NULL) fputs(buf, wfp);

    fclose(rfp);
    fclose(wfp);

    return 0;
}

문자열 단위로 읽어와서 hello.out에 저장한다.

이렇게 문자열 단위로 잘 가져오는 것을 볼 수 있다.

 

Binary IO

#include <stdio.h>

size_t fread(void *ptr, size_t size, size_t nmemb, FILE *stream);
size_t fwrite(const void *ptr, size_t size, size_t nmemb, FILE *stream);

-ptr

Pointer to buffer

-size

size of an item

-nmemb

number of items to read/write

-stream

File operation을 수행 할 stream

return: read/write 한 item의 수(EOF: 파일의 끝)

 

이진 파일을 작성하는 예제이다.

#include <stdio.h>
#include <stdlib.h>

int main(void){
    char *fileName = "binary.bin";
    int data[5] = {10, 20, 30, 40, 50};
    FILE *fp;

    if(!(fp = fopen(fileName, "wb"))){
        fprintf(stderr, "Fail to open the file - %s\n", fileName);
        exit(1);
    }

    size_t i = fwrite(data, sizeof(int), 5, fp);
    printf("Success to write %d objects.\n", i);

    fclose(fp);
    return 0;
}

그러고 cat으로 파일을 확인해보면 이진파일이기 때문에 알 수 없는 내용이 출력된다.

해당 이진파일의 내용을 그대로 보고 싶다면

xxd binary.bin을 사용하면 된다.

이제 이진파일을 읽어보자

#include <stdio.h>
#include <stdlib.h>

int main(void){
    int buf[5] = {0};
    FILE *fp = fopen("binary.bin", "rb");

    if(!fp){
        fprintf(stderr, "Fail to open the file - %s\n", "binary bin");
        exit(1);
    }

    size_t i = fread(buf, sizeof(int), 5, fp);
    printf("Success to read %d object\n", i);
    for(int i = 0; i < 5; i++) printf("%d ", buf[i]);

    fclose(fp);
    return 0;
}

이렇게 이진파일을 정수로 읽어오는 것을 볼 수 있다.

이진 파일은 사람이 바로 읽을 수 없지만 동일한 데이터를 저장하는 데 Ascii 파일보다 적은 공간을 요구한다는 장점이 있다.

 

Formatted IO

#include <stdio.h>

int scanf(const char *format, ...);
int fscanf(FILE *stream, const char *format, ...);

int printf(const char *format, ...);
int fprintf(FILE *stream, const char *format, ...);

-format

입출력 형식

-stream

File operation을 수행 할 stream

return: 입출력 한 문자의 수(음수: error)

 

자세히 볼 필요도 없을만큼 많이 사용한 함수들이다.

바로 작성을 하는 예제이다.

#include <stdio.h>
#include <stdlib.h>

typedef struct{
    int ID;
    char name[8];
    float score;
}Student;

int fileOpen(FILE **fp, char *fileName, char *mode){
    *fp = fopen(fileName, mode);
    if(!*fp){
        printf("Fail to open - %s\n", fileName);
        return -1;
    }
    return 0;
}

int main(void){
    Student info = {0};
    char *fileName = "StudentList.txt";
    FILE *fp = NULL;

    if(fileOpen(&fp, fileName, "a") < 0) exit(1);

    while(1){
        printf("Enter Id Name Score (Exit: -1): ");
        scanf("%d", &info.ID);
        if(info.ID < 0) break;
        scanf("%s %f", &info.name, &info.score); getchar();
        fprintf(fp, "%d %s %.1f\n", info.ID, info.name, info.score);
    }

    fclose(fp);

    return 0;
}

-1을 입력할 때까지 입력을 받고 StudentList.txt에 작성을 하는 예제이다.

이렇게 StudentList.txt를 만들어 그곳에 작성을 하는 것을 볼 수 있다.

 

이제 이 파일을 읽어보자

#include <stdio.h>
#include <stdlib.h>

typedef struct{
    int ID;
    char name[8];
    float score;
}Student;

int fileOpen(FILE **fp, char *fileName, char *mode){
    *fp = fopen(fileName, mode);
    if(!*fp){
        printf("Fail to open - %s\n", fileName);
        return -1;
    }
    return 0;
}

int main(void){
    Student info = {0};
    char *fileName = "StudentList.txt";
    FILE *fp = NULL;
    
    if(fileOpen(&fp, fileName, "r") < 0) exit(1);

    int numStudent = 0;
    float sum = 0;
    while(!feof(fp)){
        fscanf(fp, "%d %s %f\n", &info.ID, &info.name, &info.score);
        sum += info.score;
        numStudent++;
    }

    printf("%d students, Average = %2.f\n", numStudent, sum / numStudent);

    fclose(fp);
}

해당 파일을 잘 읽는 것을 볼 수 있다.

 

Synchronizing with the disk

#include <stdio.h>

int fflush(FILE *stream);

-stream

File operation을 수행 할 stream

return: 0(-1:error)

 

stream에 있는 내용들을 바로 디스크에 작성하는 방법

 

  • File offset & File pointer

Handling file offset

#include <stdio.h>

int fseek(FILE *stream, long offset, int whence);
int ftell(FILE *stream);
void rewind(FILE *stream);
int fsetpos(FILE *stream, const fpost_t *pos);
int fgetpos(FILE *stream, fpost_t *pos);

-stream

File operation을 수행 할 stream

-offset

이동시킬 byte 수(양수, 음수 모두 가능)

-whence

기준 위치(SEEK_SET, SEEK_CUR, SEEK_END)

-pos

offset을 저장 할 fpost_t 주소

 

File Pointer <-> File Descriptor

#include <stdio.h>

FILE *fdopen(int fd, const char *mode);

-fd

file descriptor

-mode

파일 열기 모드

return: File pointer(NULL: error)

 

#include <stdio.h>

int fileno(FILE *stream);

-stream

변환 할 stream

return: File descriptor(-1: error)

 

서로 pointer와 descriptor간의 변환하는 함수이다.

+ Recent posts