第六章：应用层

恭喜，这里是计算机网络体系结构的顶层。

概述

应用层是计算机网络体系结构的最顶层，是设计和建立计算机网络的最终目的，也是计算机网络中发展最快的部分。

我们将介绍：

万维网www
域名系统DNS
动态主机配置DHCP
电子邮件
文件传送FTP和P2P文件共享
多媒体网络应用

客户/服务器方式(C/S方式)和对等方式(P2P方式)

客户/服务器(Client/Server,C/S)方式

客户和服务器是指通信中所涉及的两个应用进程。
客户/服务器方式所描述的是进程之间服务和被服务的关系。
客户是服务请求方，服务器是服务提供方。
服务器总是处于运行状态，并等待客户的服务请求。服务器具有固定端口号（例如HTTP服务器的默认端口号为80)，而运行服务器的主机也具有固定的P地址。

C/S方式是因特网上传统的、同时也是最成熟的方式，很多我们熟悉的网络应用采用的都是C/S方式，包括万维网WWW、电子邮件、文件传输FTP等。

基于C/S方式的应用服务通常是服务集中型的，即应用服务集中在网络中比客户计算机少得多的服务
器计算机上。

由于一台服务器计算机要为多个客户机提供服务，在C/S应用中，常会出现服务器计算机跟不上众多客户机请求的情况。
为此，在C/S应用中，常用计算机群集
(或服务器场)构建一个强大的虚拟服务器。

对等(Peer-to-Peer,P2P)方式

在P2P方式中，没有固定的服务请求者和服务提供者，分布在网络边缘各端系统中的应用进程是对等的，被称为对等方。对等方相互之间直接通信，每个对等方既是服务的请求者，又是服务的提供者。
目前，在因特网上流行的P2P应用主要包括P2P文件共享、即时通信、P2P流媒体、分布式存储等。
基于P2P的应用是服务分散型的，因为服务不是集中在少数几个服务器计算机中，而是分散在大量对等计算机中，这些计算机并不为服务提供商所有，而是为个人控制的桌面计算机和笔记本电脑，它们通常位于住宅、校园和办公室中。

P2P方式的最突出特性之一就是它的可扩展性。因为系统每增加一个对等方，不仅增加的是服务的请求者，同时也增加了服务的提供者，系统性能不会因规模的增大而降低。
P2P方式具有成本上的优势，因为它通常不需要庞大的服务器设施和服务器带宽。为了降低成本，服务提供商对于将P2P方式用于应用的兴趣越来越大。

动态主机配置协议DHCP

DHCP是一种网络管理协议，它能自动为网络中的设备分配IP地址、子网掩码、默认网关和DNS服务器等配置信息。

所谓分配，实际上是客户端向DHCP服务器租用某个IP地址，他免去了手工配置麻烦，易出错的痛点。

DHCP工作原理

如图，起初，DHCP客户端广播寻找DHCP服务器，服务器接收后提供IP地址租用服务并从自己的地址池中选择一个可用的IP地址连通其他配置封装为数据报返回一个“DHCP OFFER”报文。客户端可能接收到多个DHCP报文，一般选择最先收到的那个，客户端处理报文但不会使用内部的IP地址，会回复一个“DHCP请求”报文申请使用那个IP地址。DHCP服务器收到请求后传回ACK数据报。

接收到ACK确认后，客户端会用ARP检查IP地址是否被其他主机占用，如未占用，IP租用正式成立，DHCP客户端将IP地址等配置使用在自己的端口上。

租用期不是永久的，需要续约。

在租用期过半的时候，客户端会向服务器发送DHCP续约请求报文，若服务器同意传回ACK，那就得到新的租用期，若没有同意，那客户端必须停止使用原IP地址并重新申请IP地址。

若DHCP服务器仍不响应，客户端将在租用期到达0.875时重新申请。

若DHCP服务器还在装死，那租用期到后，客户端会重新申请IP地址。

另外，客户端可以随时向DHCP服务器终止IP租用合约，只需要向服务器发送释放请求即可。

DHCP中继代理

黄色的主机不可使用DHCP，因为广播报文不会被路由器转发，而是丢弃。

方法是给该路由器配置DHCP服务器的IP地址并使之成为 DHCP中继代理。

当路由器接收到DHCP请求后，会将其单播转发给DHCP服务器。

域名系统DNS

我们在访问某个url来获取网站信息时，实际上计算机访问了对应服务器的IP地址，因为访问地址才符合计算机网络的设计。但是对于人类，域名显然比IP要好记得多，所以需要一个东西来实现域名到IP的转换。

DNS是域名系统（Domain Name System）的简称，它的核心作用是将我们容易记住的域名（例如 www.qq.com）翻译成计算机能识别的IP地址（例如 14.18.240.1）。

这种域名和ip键值对在本地会存有一部分，但是用户访问的网站是无限可能的，所以遇到本地查询不到的情况就需要询问DNS域名系统。

遗憾的是，DNS服务器不可只有一个，因为因特网过于庞大，任何计算机都难以承受，且中心化的代价就是如果该DNS中心发生停电，整个世界的网络都会瘫痪。

早在1983年，因特网就开始采用层次结构的命名树作为主机的名字(即域名)并使用分布式的域名系统DNS, DNS使大多数域名都在本地解析，仅少量解析需要在因特网上通信，因此系统效率很高。

由于DNS是分布式系统，即使单个计算机出了故障，也不会妨碍整个系统的正常运行

分布式DNS

因特网采用层次树状结构的域名结构。

域名的结构由若干个分量组成，各分量之间用“点”隔开，分别代表不同级别的域名。

..	四级域名	三级域名	二级域名	顶级域名

每一级的域名都由英文字母和数字组成，不超过63个字符，不区分大小写字母。
级别最低的域名写在最左边，而级别最高的顶级域名写在最右边。
完整的域名不超过255个字符。
域名系统既不规定一个域名需要包含多少个下级域名，也不规定每一级的域名代表什么意思。
各级域名由其上一级的域名管理机构管理，而最高的顶级域名则由因特网名称与数字地址分配机构ICANN进行管理。

如该博客：

blog.willmo.top

top是顶级域名，是我向域名服务商namesilo购买的
willmo是我购买时填入的二级域名
blog是我在DNS中分配的三级域名

顶级域名TLD(Top Level Domain)分为以下三类：

国家顶级域名nTLD
采用S03166的规定。如cn表示中国，us表示美国，uk表示英国、等等。
通用顶级域名gTLD
最常见的通用顶级域名有七个，即：com(公司企业)、net(网络服务机
构)、org(非营利性组织)、int(国际组织)、edu(美国教育结构)、
gov(美国政府部门)、mil(美国军事部门)。
反向域arpa
用于反向域名解析，即IP地址反向解析为域名。

在国家顶级域名下注册的二级域名均由该国家自行确定。例如，顶级域名为jp的日本，将其教育和企业机构的二级域名定为ac和co，而不用edu和com。

因特网域名空间

像是一颗倒着生长的树：

DNS域名分布式解析

等我慢慢转成文字。

查询方式有：

递归查询

迭代查询

由于递归查询对于被查询的域名服务器负担太大，通常采用以下模式：从请求主机到本地域名服务器的查询是递归查询，而其余的查询是迭代查询。

为了提高DNS的查询效率，并减轻根域名服务器的负荷和减少因特网上的DNS查询报文数量，在域名服务器中广泛地使用了高速缓存。高速缓存用来存放最近查询过的域名以及从何处获得域名映射信息的记录。

由于域名到P地址的映射关系并不是永久不变，为保持高速缓存中的内容正确，域名服务器应为每项内容设置计时器并删除超过合理时间的项（例如，每个项目只存放两天）

不但在本地域名服务器中需要高速缓存，在用户主机中也很需要。许多用户主机在启动时从本地域名服务器下载域名和P地址的全部数据库，维护存放自己最近使用的域名的高速缓存，并且只在从缓存中找不到域名时才向域名服务器查询。同理，主机也需要保持高速缓存中内容的正确性。

DNS报文使用UDP进行封装。

文件传送协议FTP

将某台计算机中的文件通过网络传送到可能相距很远的另一台计算机中，是一项基本的网络应用，即文件传送。
文件传送协议FTP(File Transfer Protocol)是因特网上使用得最广泛的文件传送协议。

FTP提供交互式的访问，允许客户指明文件的类型与格式（如指明是否使用ASCII码），并允许文件具有存取权限（如访问文件的用户必须经过授权，并输入有效的口令）。
FTP屏蔽了各计算机系统的细节，因而适合于在异构网络中任意计算机之间传送文件。

FTP基于某个服务器计算机，为了保证访问性和稳定性，应该采用大存储，高稳定性的服务器来搭建。但是为了短暂测试也可以用个人PC搭建。

FTP的工作原理

主动模式

FTP用户端向一直在监听熟知端口号21的服务器建立控制TCP链接，该链接用于传输命令，从始至终一直存在。

当有数据需要传输时，就建立另一个文件传输TCP链接，该链接用于传送文件，只有在传输文件时在存活。

被动模式

控制链接的建立与主动模式没什么不同，但是文件传输链接的建立有不同：

当需要传输数据时，客户端通过控制连接发送命令。服务器收到后，会随机开启一个高端端口（例如1024以上）并监听，然后将这个端口号通过控制连接告诉客户端。客户端主动向服务器的这个指定端口发起连接，从而建立数据通道。

电子邮件

电子邮件(E-mail)是因特网上最早流行的一种应用，并且仍然是当今因特网上最重要、最实用的应用之一。

发件人将邮件发送到自己使用的邮件服务器：
发件人的邮件服务器将收到的邮件按其
目的地址转发到收件人邮件服务器中的收件人邮箱：
收件人在方便的时候访问收件人邮件服务器中自己的邮箱，获取收到的电子邮件。
电子邮件使用方便、传递迅速而且费用低廉。它不仅可以传送文字信息，而且还可附上声音和图像。

电子邮件系统采用客户/服务器方式。
电子邮件系统的三个主要组成构件：用户代理，邮件服务器，以及电子邮件所需的协议。

用户代理是用户与电子邮件系统的接口，又称为电子邮件客户端软件。
邮件服务器是电子邮件系统的基础设施。因特网上所有的ISP都有邮件服务器，其功能是发送和接收邮件，同时还要负责维护用户的邮箱。
协议包括邮件发送协议（例如SMTP)和邮件读取协议（例如POP3,IMAP)

下面解释过程:

发送方使用SMTP协议与发送方服务器建立TCP链接并传输邮件，随后发送方服务器与接收方服务器建立链接后完成传输，随后接收方通过POP3协议从接收方服务器中读取邮件。分为接收方和发送方是因为实际过程中收发双方的邮件服务很可能不一样，比如QQ邮箱和谷歌邮箱。

邮件发送SMTP工作原理

多说无益，自己看吧。

电子邮件的信息格式

电子邮件的信息格式并不是由SMTP定义的，而是在RFC822中单独定义的。这个RFC文档已在2008年更新为RFC5322。一个电子邮件有信封和内容两部分。而内容又由首部和主体两部分构成。

补充：邮件的抄送人（CC， Carbon Copy）是指除了主要收件人（“收件人”栏）之外，发送方希望其知晓邮件内容、但通常不要求其直接回复或采取行动的人。

SMTP的局限

SMTP协议只能传送ASCI码文本数据，不能传送可执行文件或其他的二进制对象。
SMTP不能满足传送多媒体邮件（例如带有图片、音频或视频数据）的需要。并且许多其他非英语国家的文字
(例如中文、俄文、甚至带有重音符号的法文或德文)也无法用SMTP传送。
为解决SMTP传送非ASCII码文本的问题，提出了多用途因特网邮件扩展MIME(Multipurpose Internet Mail Extensions)

MINE做到了：

增加了5个新的邮件首部字段，这些字段提供了有关邮件主体的信息。
定义了许多邮件内容的格式，对多媒体电子邮件的表示方法进行了标准化。
定义了传送编码，可对任何内容格式进行转换，而不会被邮件系统改变。

实际上，MIME不仅仅用于SMTP,也用于后来的同样面向ASCII字符的HTTP。

邮件读取POP和IMAP

邮局协议POP(Post Office Protocol),POP3是其第三个版本，是因特网正式标准非常简单、功能有限的邮件读取协议。
- 用户只能以下载并删除方式或下载并保留方式从邮件服务器下载邮件到用户方计算机。不允许用户在邮件服务器上管理自己的邮件。（例如创建文件夹，对邮件进行分类管
  理等)。
因特网邮件访问协议IMAP(Internet Message Access Protocol)),IMAP4是其第四个版本，目前还只是因特网建议标准功能。
- 比POP3强大的邮件读取协议，用户在自己的计算机上就可以操控邮件服务器中的邮箱，就像在本地
  操控一样，因此IMAP是一个联机协议。

POP3和IMAP4都采用基于TCP连接的客户/服务器方式。POP3使用熟知端口110，IMAP4使用熟知端口143。

基于万维网的电子邮件

通过浏览器登录（提供用户名和口令）邮件服务器万维网网站就可以撰写、收发、阅读和管理电子邮件。这种工作模式与MAP很类似，不同的是用户计算机无需安装专门的用户代理程序，只需要使用通用的万维网浏览器。
邮件服务器网站通常都提供非常强大和方便的邮件管理功能，用户可以在邮件服务器网站上管理和处理自己的邮件，而不需要将邮件下载到本地进行管理。

万维网

万维网WWW(World Wide Web)并非某种特殊的计算机网络。它是一个大规模的、联机式的信息储藏所，是运行在因特网上的一个分布式应用。
万维网利用网页之间的超链接将不同网站的网页链接成一张逻辑上的信息网。

浏览器最重要的部分是渲染引擎，也就是浏览器内核。负责对网页内容进行解析和显示。

不同的浏览器内核对网页内容的解析也有不同，因此同一网页在不同内核的浏览器里的显示效果可能不同：
网页编写者需要在不同内核的浏览器中测试网页显示效果。

为了方便地访问在世界范围的文档，万维网使用统一资源定位符URL来指明因特网上任何种类“资源”的位置。
URL的一般形式由以下四个部分组成：

<协议>：//<主机>：<端口>/<路径>

而万维网的文档是html，css和javascript。

超文本标记语言HTML(HyperText Markup Language)
使用多种“标签”来描述网页的结构和内容
层叠样式表CSS(Cascading Style Sheets)
从审美的角度来描述网页的样式
js，一种脚本语言（和Java没有任何关系）
控制网页的行为

超文本传输协议HTTP

HTTP定义了浏览器（即万维网客户进程）
怎样向万维网服务器请求万维网文档，以及万维网服务器怎样把万维网文档传送给浏览器。

HTTP/1.0采用非持续连接方式。在该方式下，每次浏览器要请求一个文件都要与服务器建立TCP连接，当收到响应后就立即关闭连接。

每请求一个文档就要有两倍的TT的开销。若一个网页上有很多引用对象（例如图片等），那么请求每一个对象都需要花费2RTT的时间。
为了减小时延，浏览器通常会建立多个并行的TCP连接同时请求多个对象。但是，这会大量占用万维网服务器的资源，特别是万维网服务器往往要同时服务于大量客户的请求，这会使其负担很重。

HTTP/1.1采用持续连接方式。在该方式下，万维网服务器在发送响应后仍然保持这条连接，使同一个客户（浏览器）和该服务器可以继续在这条连接上传送后续的HTTP请求报文和响应报文。这并不局限于传送同一个页面上引用的对象，而是只要这些文档都在同一个服务器上就行。

为了进一步提高效率，HTTP/1.1的持续连接还可以使用流水线方式工作，即浏览器在收到HTTP的响应报文之前就能够连续发送多个请求报文。这样的一个接一个的请求报文到达服务器后，服务器就发回一个接一个的响应报文。这样就节省了很多个RTT时间，使TCP连接中的空闲时间减少，提高了下载文档的效率。

HTTP的报文格式

HTTP是面向文本的，其报文中的每一个字段都是一些ASCII码串，并且每个字段的长度都是不确定的。

使用Cookie在服务器上记录用户信息
现在，用户可以通过万维网实现各种复杂的应用，如网上购物、电子商务等。这些应用往往需要万维网服务
器能够识别用户。

Cookie提供了一种机制使得万维网服务器能够“记住”用户，而无需用户主动提供用户标识信息。也就是说，Cookie是一种对无状态的HTTP进行状态化的技术。

万维网缓存

在万维网中还可以使用缓存机制以提高万维网的效率。
万维网缓存又称为Web缓存(Web Cache),可位于客户机，也可位于中间系统上，位于中间系统上的
Web缓存又称为代理服务器(Proxy Server)。
Web缓存把最近的一些请求和响应暂存在本地磁盘中。当新请求到达时，若发现这个请求与暂时存放的请求相同，就返回暂存的响应，而不需要按URL的地址再次去因特网访问该资源。

代理服务器内的文件资源存在一个过期时间，若到了时间，就需要重新向原始服务器发送请求，通过提供修改日期，原始服务器查看代理服务器中的文件与自己的是否一致，如果一致就发回304响应，若不一致就将新文件传到代理服务器。这样代理服务器就完成了文档的更新。

至此，应用层完结

计算机网络

#计算机网络

计算机网络第七章：网络安全上一篇

计算机网络第五章：运输层下一篇

计算机网络第六章：应用层