ㅂㄱ
HTTP 본문
Tim Berners-Lee
HTTP를 개발한 영국의 컴퓨터 엔지니어로 하이퍼텍스트를 개발했으며, URL, HTTP, HTML을 설계했다. HTTP와 HTML, 하이퍼텍스트의 영향이 워낙에 강력하고 광범위해서 인터넷의 아버지라고 부른다.
HTTP 프로토콜이란?
HTTP(Hypertext Transfer Protocol)는 인터넷상에서 데이터를 주고 받기 위한 서버/클라이언트 모델을 따르는 프로토콜이다.
애플리케이션 레벨의 프로토콜로 TCP/IP위에서 작동한다.
HTTP는 어떤 종류의 데이터든지 전송할 수 있도록 설계돼 있다.
HTTP로 보낼 수 있는 데이터는 HTML문서, 이미지, 동영상, 오디오, 텍스트 문서 등 여러종류가 있다.
하이퍼텍스트 기반으로(Hypertext) 데이터를 전송하겠다(Transfer) = 링크기반으로 데이터에 접속하겠다는 의미이다.
작동방식
HTTP는 서버/클라이언트 모델을 따른다.
클라이언트에서 요청(request)를 보내면 서버는 요청을 처리해서 응답(response)한다.
[클라이언트]
서버에 요청하는 클라이언트 소프트웨어(IE, Chrome, Firefox, Safari ...)가 설치된 컴퓨터를 이용한다.
클라이언트는 URI를 이용해서 서버에 접속하고, 데이터를 요청할 수 있다.
[서버]
클라이언트의 요청을 받아서, 요청을 해석하고 응답을 하는 소프트웨어가 설치된 컴퓨터(Apache, nginx, IIS, lighttpd) 등이 서버 소프트웨어다.
웹서버는 보통 표준포트인 80번 포트로 서비스한다.
웹브라우저의 통신 과정
클라이언트에서 요청(request)를 보내면 서버는 요청을 처리해서 응답(response)한다.
- URL 분석 및 접속
웹 브라우저는 URL을 분석해 서버의 IP 주소와 포트(기본은 80)를 이용해 서버와 TCP/IP 연결을 요청합니다. - Request 헤더 전송
브라우저에서 요청 파일명 등이 기술된 헤더를 전송합니다. - Request 바디 전송
필요한 경우에, 로그인 폼에 입력한 데이터나 첨부 파일 등의 추가적인 데이터를 전송합니다. - Response 헤더 해석
서버에서 헤더를 수신하고 응답 상태(404 등)를 확인하며, 바디의 Content-Type 등을 확인합니다. - Response 바디 해석
바디가 있는 경우에, 서버에서 수신한 바디를 헤더에 기술된 Content-Type에 따라서, text/html인 경우에 HTML을 렌더링하고, image/jpeg인 경우에는 그림을 띄우는 등 적절히 해석합니다.
Connectionless & Stateless
HTTP는 Connectionless 방식으로 작동한다.
서버에 연결하고, 요청해서 응답을 받으면 연결을 끊어버린다.
기본적으로는 자원 하나에 대해서 하나의 연결을 만든다.
[장점]
불특정 다수를 대상으로 하는 서비스에 적합한 방식이다.
수십만명이 웹 서비스를 사용하더라도 접속유지는 최소한으로 할 수 있기 때문에, 더 많은 유저의 요청을 처리할 수 있다.
[단점]
연결을 끊어버리기 때문에, 클라이언트의 이전 상태를 알 수가 없다.
이러한 HTTP의 특징을 stateless라고 하는데, Connectionless 로 부터 파생되는 특징이라고 할 수 있다.
클라이언트의 이전 상태 정보를 알 수 없게 되면, 웹 서비스를 하는데 당장에 문제가 생긴다.
클라이언트가 과거에 로그인을 성공하더라도 로그 정보를 유지할 수가 없다. HTTP는 cookie를 이용해서 이 문제를 해결하고 있다.
Cookie는 클라이언트와 서버의 상태 정보를 담고 있는 정보조각이다.
로그인을 예로 들자면, 클라이언트가 로그인에 성공하면,
서버는 로그인 정보를 자신의 데이터베이스에 저장하고 동일한 값을 cookie형태로 클라이언트에 보낸다.
[첫 요청 시]
클라이언트가 로그인에 성공하면 서버는 로그인정보를 자신의 DB에 저장한다.
(서버는 cookie를 키로하는 값을 데이터베이스에 저장하는 방식으로 "세션"을 유지한다)
그리고 서버는 쿠키를 클라이언트에게 준다.
클라이언트는 다음 번 요청때 cookie를 서버에 보내는데,
서버는 cookie 값으로 자신의 데이터베이스를 조회해서 로그인 여부를 확인할 수 있다.
[두번쨰 요청 시]
클라이언트 request(cookie) to server then 서버는 자신의 DB 조회 and then 로그인여부 확인
URI(Uniform Resource Identifiers)
클라이언트 소프트웨어(IE, Chrome, Firefox, Safari ...)는 URI를 이용하여 자원의 위치를 찾는다.
URI는 HTTP와는 독립된 다른 체계다.
HTTP는 전송 프로토콜이고, URI는 자원의 위치를 알려주기 위한 프로토콜이다.
Uniform Resource Identifiers 의 줄임로, World Wide Web 상에서 접근하고자 하는 자원의 위치를 나타내기 위해서 사용한다.
자원은 HTML문서, 이미지, 동영상, 오디오, 텍스트 문서 등 모든 것이 될 수 있다.
웹페이지의 위치를 나타내기 위해서 사용하는 https://www.dcinside.com/index.php 등이 URI의 예다.
https://www.dcinside.com/index.php 를 분해하여 분석해보자.
https : 자원에 접근하기 위해서 https 프로토콜을 사용한다.
|
이렇게 "프로토콜", "위치", "자원명"으로 어디에 있던지 자원에 접근할 수 있다.
https://www.dcinside.com/index.php 이라고 하면 https 프로토콜을 사용할거고 도메인(ip주소)는 이거구 그 ip주소에 있는 index.php를 요청합니다. 가 되는 것이다.
Method(메서드)
메서드는 요청의 종류를 서버에게 알려주기 위해서 사용한다.
다음은 요청에 사용할 수 있는 메서드들이다.
GET : 정보를 요청하기 위해서 사용한다. (SELECT)
POST : 정보를 밀어넣기 위해서 사용한다. (INSERT)
PUT : 정보를 업데이트하기 위해서 사용한다. (UPDATE)
DELETE : 정보를 삭제하기 위해서 사용한다. (DELETE)
HEAD : (HTTP)헤더 정보만 요청한다. 해당 자원이 존재하는지 혹은 서버에 문제가 없는지를 확인하기 위해서 사용한다.
OPTIONS : 웹서버가 지원하는 메서드의 종류를 요청한다.
TRACE : 클라이언트의 요청을 그대로 반환한다. 예컨데 echo 서비스로 서버 상태를 확인하기 위한 목적으로 주로 사용한다.
각 용도에 맞는 메서드가 준비돼 있음에도 GET과 POST만으로도 모든 종류의 요청을 표현할 수 있다.
명시적으로 메서드를 사용하지 않아도 웹 서비스 개발에 큰 문제는 없지만
Restful API 서버의 경우에는 GET, POST, DELETE, PUT을 명시적으로 구분한다.
자원의 위치 뿐만 아니라 자원에 할 일 까지 명확히 명시할 수 있기 때문에,
Open API 서버를 만들기 위해서 널리 사용한다. 아래는 사용 예다.
- GET api.joinc.co.kr/user/list : 유저 목록을 가져온다.
- POST api.joinc.co.kr/user/create : 유저를 생성한다. 생성에 필요한 유저 정보는 POST 데이터 형식으로 전달할 수 있다.
- PUT api.joinc.co.kr/usr/123 : 유저 ID가 123인 유저의 정보를 업데이트 한다.
- DELETE api.joinc.co.kr/user/123 : 유저 ID가 123인 유저를 삭제한다.
요청데이터 포맷
웹 브라우저는 웹 서버에 데이터를 "요청"하는 "클라이언트 프로그램" 이다. 요청은 서버가 인식할 수 있는 약속된 형식(HTTP 형식)을 따라야 한다.요청 데이터는 "HEADER"와 "BODY"로 구성된다.
헤더에는 요청과 요청 데이터에 대한 메타정보들이 들어있다. 다음은 헤더의 일반적인 모습이다.
1 GET /cgi-bin/http_trace.pl HTTP/1.1\r\n
2 ACCEPT_ENCODING: gzip,deflate,sdch\r\n
3 CONNECTION: keep-alive\r\n
4 ACCEPT: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8\r\n
5 ACCEPT_CHARSET: windows-949,utf-8;q=0.7,*;q=0.3\r\n
6 USER_AGENT: Mozilla/5.0 (X11; Linux i686) AppleWebKit/535.1 (KHTML, like Gecko) Chrome/13.0.782.24\r\n
7 ACCEPT_LANGUAGE: ko-KR,ko;q=0.8,en-US;q=0.6,en;q=0.4\rn
8 HOST: www.joinc.co.kr\r\n
9 \r\n
HTTP 헤더는 라인피드와 캐리지 리턴(/r/n)을 함께 사용한다. HTTP 헤더를 파싱할 때 주의해야 한다.
필수 요소로 요청의 제일 처음에 와야 한다 3개의 필드로 이뤄져 있다.
- 요청 메서드 : GET, PUT, POST, PUSH, OPTIONS 등의 요청 방식이 온다.
- 요청 URI : 요청하는 자원의 위치를 명시한다.
- HTTP 프로토콜 버전 : 웹 브라우저가 사용하는 프로토콜 버전이다. (2013년 6월)현재
응답헤더 포맷
응답 헤더포멧이다. 응답 헤더는 서버의 여러 상태 정보를 포함하기 때문에, 꽤 복잡해질 수 있다. wget을 이용하면 헤더 정보를 가져올 수 있다.
# wget -S http://www.test.co.krsdf
HTTP/1.1 200 OK\r\n
Date: Fri, 08 Jul 2011 00:59:41 GMT\r\n
Server: Apache/2.2.4 (Unix) PHP/5.2.0\r\n
X-Powered-By: PHP/5.2.0\r\n
Expires: Mon, 26 Jul 1997 05:00:00 GMT\r\n
Last-Modified: Fri, 08 Jul 2011 00:59:41 GMT\r\n
Cache-Control: no-store, no-cache, must-revalidate\r\n
Content-Length: 102\r\n
Keep-Alive: timeout=15, max=100\r\n
Connection: Keep-Alive\r\n
Content-Type: text/html\r\n
\r\n
- wget으로 헤더 정보를 출력했다.
- 프로토콜과 응답코드 : 반드시 첫줄에 와야 한다. 3개의 필드로 구성돼 있다.
- HTTP/1.1 : 응답 프로토콜과 버전
- 200 : 응답 코드
- OK : 응답 메시지. Not Found, Internal Server Error 등의 메시지다.
- 날짜
- 서버 프로그램및 스크립트 정보.
- 응답헤더에는 다양한 정보를 추가할 수가 있다. 어떤 정보를 추가할지는 사실 개발자 마음이다. HTTP 기반의 서버/클라이언트 제품을 만든다면, 헤더에 애플리케이션 정보를 추가해서 사용하면 된다.
- 컨텐츠의 마지막 수정일
- 캐쉬 제어 방식.
- 컨텐츠 길이.
- Keep Alive기능 설정이다.
keep alive는 클라이언트측에 연결을 유지하라는 신호를 보내기 위해서 사용한다. 그러면 클라이언트는 최대 timeout에 지정된 시간동안 연결을 유지한다 . 이 시간동안 클라이언트는 이미 맺어진 연결로 요청을 계속 보낼 수 있다 . Keep Alive는 따로 자세히 설명한다.
- Content-Type. 응답에 실어 보내는 컨텐츠가 HTML 문서인지, 이미지인지, CSS, JavaScript인지 혹은 다른 애플리케이션 형태인지를 알려준다. 웹 애플리케이션들은 Content-Type에 따라서 Body의 데이터를 어떻게 읽을지를 결정한다. 따라서 전송 데이터에 맞는 content-type를 명시해야 한다.
응답코드
서버는 응답코드로 서버의 상태를 알려준다. 3자리의 숫자로 이루어져 있다. 주요 응답코드를 정리했다. 응답코드는 응답헤더의 첫번째 줄에 위치하다.
- HTTP/1.1 200 OK\r\n
- HTTP/1.1 404 Not Found\r\n
- HTTP/1.1 500 Internal error\r\n
1xx 조건부 응답
이건 사용해 본적이 없다. 없을 뿐만 아니라 문서를 읽어도 도대체 무슨내용인지 알 수 없어서 공백으로 뒀다. 아시는 분은 코멘트 부탁.HTTP 요청은 수신 됐고, 다음 처리를 계속해야함을 의미합니다.
2xx 성공
서버가 요청을 성공적으로 처리했음을 의미한다.
코드번호 | 설명 | 비고 |
200 | 성공 | 서버가 요청을 제대로 처리했다. |
201 | 생성됨 | 요청이 성공했으며, 새로운 리소스를 만들었다. |
202 | 허용됨 | 요청을 받았으나, 아직 처리하지는 못했다. |
204 | 컨텐츠 없음 | 요청을 처리했지만, 컨텐츠를 제공하지 않는다. |
205 | 컨텐츠 재 설정 | 요청을 처리했지만, 컨텐츠를 표시하지 않는다. 그리고 문서를 재 설정할 것을 요구한다. |
206 | 일부 성공 | 요청의 일부만 성공적으로 처리 |
207 | 다중상태 |
3xx 리다이렉션
때때로 요청을 완료하기 위해서, 다른 페이지로 보내야 할 때가 있다. 예컨데, 로그인을 성공하고 나서 메인 페이지로 보낸다거나, 다운로드 페이지로 보내는 등의 용도로 사용할 수 있다.
코드번호 | 설명 | 비고 |
300 | 여러 선택 항목 | |
301 | 영구이동 | 요청한 페이지가 다른 위치로 영구이동 했다. |
302 | 임시이동 | 요청한 페이지가 다른 위치로 임시이동 했다. 요청자는 여전히 현재 페이지를 요청해야 한다. |
303 | 기타위치 보기 | 요청자가 다른 위치에 별도의 GET 요청을 하여 응답을 검색할 경우 |
304 | 수정되지 않음 | 마지막 요청 이후 요청한 페이지가 수정되지 않았다. if-Modified-Sine 헤더에 지정된 날짜/시간 이래로 지정된 문서가 변경된 사실이 없는 경우 이 code로 응답한다. |
305 | 프록시 사용 | 요청자는 프록시를 사용하여 요청한 페이지만 접근할 수 있다. |
4xx 요청 오류
클라이언트 요청에 오류가 있음을 의미한다.
코드번호 | 설명 | 비고 |
400 | 잘못된 요청 | 주로 헤더 포멧이 HTTP 규약에 맞지 않을 경우 |
401 | 권한 없음 | 인증을 필요로 하는 요청이다. Basic access authentication에 사용한다. |
403 | 금지 | 서버가 요청을 거부하고 있다. |
404 | 찾을 수 없음 | 요청한 자원이 서버에 존재하지 않는다. |
405 | 허용하지 않는 방법 | 요청에 지정한 방법을 사용할 수 없다. |
406 | 허용되지 않음 | 요청한 페이지를 콘텐츠 특성 때문에 응답할 수 없다. |
408 | 요청시간 초과 | 서버의 요청대기가 시간을 초과 |
410 | 사라짐 | 요청한 자원이 삭제되었음. 404와 비슷하지만, 410은 과거에 있었으나 지금 없는 자원이다. 예컨데, 게시판에서 삭제한 포스트에 접근하는 경우 |
411 | 길이필요 | 유효한 컨텐츠 길이를 명시해야 한다. |
Keep Alive
HTTP 1.1 부터는 keep-alive 기능을 지원한다.
HTTP는 하나의 연결에 하나의 요청을 하는 것을 기준으로 설계가 됐다.
요즘 웹 서비스의 경우 간단한 페이지라고 해도 수십개의 데이터(문서, image, css, js)가 있기 마련인데,
HTTP의 원래 규격대로라면 웹페이지를 하나 표시하기 위해서는 연결을 맺고 끝는 과정을 수십번을 반복해야 한다.
당연히 비효율적일 수 밖에 없다.
연결을 맺고 끝는 것은 TCP 통신 과정에서 가장 많은 비용이 소비되는 작업이기 때문이다.
예를들어 HTML로 표현된 문서를 다운로드 받는다고 가정해 보자.
이 문서에는 20개 정도의 image, css, js 파일이 있다.
Keep alive를 지원하지 않을 경우 다음과 같은 과정을 거친다.
- 웹 서버에 연결한다.
- HTML 문서를 다운로드 한다.
- 웹 서버 연결을 끊는다.
- HTML 문서의 image, css, javascript 링크들을 읽어서 다운로드해야할 경로를 저장한다.
- 웹 서버에 연결한다.
- 첫번째 이미지를 다운로드
- 연결을 끊는다.
- 웹 서버에 연결한다.
- 두번째 이미지를 다운로드
- 연결을 끊는다.
- 모든 링크를 다운로드 할 때까지 반복한다.
Keep-alive 설정을 하면, 지정된 시간동안 연결을 끊지 않고 요청을 계속해서 보낼 수 있다.
- 웹 서버에 연결한다.
- HTML 문서를 다운로드 한다.
- Image, css, javascript 들을 다운로드 한다.
- 모든 문서를 다운로드 받았다면 연결을 끊는다.
Keep alive 설정
Keep-alive는 HTTP/1.1 부터 사용할 수 있다. 모든 웹서버와 브라우저는 HTTP/1.1을 지원한다고 가정해도 무방하다. 아래와 같은 과정을 거쳐서 keep alive를 설정을 한다.웹 브라우저는 요청 헤더에 keep-alive 방식의 연결을 할 것을 명시한다. 웹 브라우저로 www.joinc.co.kr로의 연결 요청을 캡춰했다.
Accept:text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Charset:windows-949,utf-8;q=0.7,*;q=0.3
Accept-Encoding:gzip,deflate,sdch
Accept-Language:ko-KR,ko;q=0.8,en-US;q=0.6,en;q=0.4
Connection:keep-alive
Host:www.joinc.co.kr
Referer:http://www.joinc.co.kr/
User-Agent:Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.31 (KHTML, like Gecko) Chrome/26.0.1410.63 Safari/537.31
웹 서버의 설정이 kepp-alive 방식을 지원하도록 설정돼 있다면, 응답 헤더에 keep-alive 정보를 실어 보낸다. www.joinc.co.kr 서버의 응답 헤더의 일부분이다.
Connection:Keep-Alive
Keep-Alive:timeout=5, max=100
Content-Encoding:gzip
Content-Length:5933
Content-Type:text/html
Vary:Accept-Encoding
- connection:Keep-Alive : 연결을 keep-alive 상태로 유지한다.
- Keep-Alive:timeout=5, max=100 : 하나의 연결당 5초동안 유지한다. Keep-alive 연결은 최대 100개까지 허용한다. keep-alive는 하나의 연결로 여러 요청을 처리하기 때문에 효율적이긴 하지만, 연결이 그만큼 길어지기 때문에 동시간대 연결이 늘어난다. 운영체제에 있어서 연결은 "유한한 자원"이다. 연결을 다 써버리면, 서버는 더 이상 연결을 받을 수 없게 된다. Max 값을 이용해서 keep-alive 연결을 제한하는 이유다.
세션관리
HTTP를 기반으로 하는 웹 서비스는 connectless방식으로 이전의 상태정보를 유지할 수 없다. 결국 클라이언트의 상태정보를 정보조각 형태로 서버와 클라이언트(웹 브라우저)에 남기는 방식으로 문제를 해결한다. 이 정보조각을 cookie(이하 쿠키)라고 한다. 서버는 cookie를 이용해서 세션정보를 관리한다.세션과 cookie 관계를 정리하자면
- 서버는 클라이언트와 cookie를 주고 받는 것으로 상태를 확인할 수 있다.ex) 클라이언트가 로그인을 한 상태인지
- 서버는 cookie를 키로하는 값을 데이터베이스에 저장하는 방식으로 "세션"을 유지한다. ex) 로그인한 클라이언트가 "물건 - A"를 구매했다면, 클라이언트의 cookie id를 key로 데이터베이스에 구매정보를 update 한다.
쿠키
'WEB' 카테고리의 다른 글
HTTP 1.0 (0) | 2021.05.07 |
---|---|
WEB 1.0/2.0/3.0 Enterprise (0) | 2021.05.06 |
HTTP cookie (0) | 2021.05.06 |
AJAX (Asynchronous Javascript And XML) (0) | 2021.05.04 |
WEB 1.0/2.0/3.0 (0) | 2021.05.04 |