您好,登錄后才能下訂單哦!
本文旨在用最通俗的語言講述最枯燥的基本知識
面試過前端的老鐵都知道,對于前端,面試官喜歡一開始先問些HTML5新增元素啊特性啊,或者是js閉包啊原型啊,或者是css垂直水平居中怎么實現啊之類的基礎問題,當你能倒背如流的回答這些之后,面試官臉上會劃過一絲詭異的笑容,然后晴轉多云,故作深沉的清一下嗓子問:從用戶輸入URL到瀏覽器呈現頁面經過了哪些過程?如果你懂,巴拉巴拉回答了一堆,他又接著問:那網頁具體是如何渲染出來的呢?如果你還懂,又巴拉巴拉的回答了一堆,他還會繼續問:那你有哪些網頁性能優化的經驗呢?當你還能巴拉巴拉的回答了一堆之后,面試官這下心里就有逼數了,轉而去問你一些和技術無關的七大姑八大姨之類的事情,這時候,你就可以歡呼你的offer基本已經到手了。
那么各位問題來了,真正輪到你去面試的時候
你能否很好的回到這些問題呢?
- 用戶輸入URL回車之后,瀏覽器到底做了啥?
- 頁面渲染的完整流程是怎樣的?
- 前端性能優化有哪些經驗?
如果不能,那我們往下走:
(有人會疑惑說不是講前端嗎?為毛要講TCP、DNS這些與前端無關的知識?別慌咯,跟著文章走吧,多學無害!)
文章提綱:
- TCP
- UDP
- 套接字socket
- HTTP協議
- DNS解析
- HTTP請求發起和響應
- 頁面渲染的過程
- 頁面的性能優化
TCP:Transmission Control Protocol, 傳輸控制協議,是一種面向連接的、可靠的、基于字節流的傳輸層通信協議。
說的這么專業,有啥用呢?
先來舉個栗子吧
還記得小時候我們做的紙杯電話么?兩個紙杯用一條繩子連到一起,兩個各拿一個紙杯把線拉直,一個對著紙杯講,一個用耳朵對著紙杯聽。
這其實就是一種最簡單的連接通信,兩人通過一根線連接起來,聲音從這邊的紙杯發出通過線傳輸到另一個紙杯接收,擴展到現在家家戶戶都有的固定電話也是如此,它的通信也是建立在雙方可接受并且信任的基礎上進行,如:
- A拿起電話,撥通0775-6532122,開始呼叫B
- B聽到電話聲響起,拿起電話,此時A收到B已經拿起電話的聲音
- 雙方開始講話。
回到我們的tcp協議,其實它和上面所說的電話協議差不多,只不過電話的協議是服務于電話通信,而tcp是服務于網絡通訊的一種協議,類似的,通訊雙方建立一次tcp連接,也需要經過三個步驟(握手)。
- 客戶端發送syn包(syn=j)到服務器,并進入SYN_SEND狀態,等待服務器確認。
- 服務器收到syn包,必須確認客戶的SYN(ack=j+1),同時自己也發送一個SYN包(syn=k),即SYN+ACK包,此時服務器進入SYN_RECV狀態。
- 客戶端收到服務器的SYN+ACK包,向服務器發送確認包ACK(ack=k+1),此包發送完畢,客戶端和服務器進入ESTABLISHED狀態,完成三次握手。
<img src="https://jaybril.oss-cn-shenzhen.aliyuncs.com/wchat/tcp%E4%B8%89%E6%AC%A1%E6%8F%A1%E6%89%8B.png">
上面幾個唧唧歪歪的英文看的有點懵逼,翻譯一下吧:
(大家最好記一下這些狀態碼,在服務器連接數的性能優化中會經常用到)
SYN:synchronous 建立聯機
ACK:acknowledgement 確認
SYN_SENT:請求連接
SYN_RECV:服務端被動打開后,接收到了客戶端的SYN并且發送了ACK時的狀態。再進一步接收到客戶端的ACK就進入ESTABLISHED狀態。
值得注意的是:tcp在握手過程中并不攜帶數據,(就像你打電話給酒店訂房時,在確認對方是酒店客服人員之前,你也不會馬上把×××號碼報給他吧?),而是在三次握手完成之后,才會進行數據傳送。
至于它的應用場景,其實是根據它本身的特點而定的,比如對網絡通訊質量有要求,需要保證數據準確性時,就需要用到TCP協議了,如HTTP、ftp等文件傳輸協議、或一些郵件傳輸協議(SMTP、pop等)
(UDP協議并非本文需要重點著筆的內容,但是講到TCP了,作為他的互補兄弟,在此掠過一筆)
UDP :User Datagram Protocol 用戶數據報協議
相比于TCP的面向連接需要反復確認的繁瑣步驟,UDP是一中性格特立獨行并且主觀性超強的非面向連接的協議,使用udp協議經常通信并不需要建立連接,它只是負責把數據盡可能快的發送出去,簡單粗暴,并且不可靠,而在接收端,UDP把每個消息斷放入隊列中,接收端程序從隊列中讀取數據。
有人會說,UDP協議這么不可靠,為啥還會造出來呢?
話說回來,天底下沒有無用之人,只有你不懂用的人而已,雖然UDP不可靠,但是它的傳輸速度快,效率高,在一些對數據準確性要求不高的場景,UDP就變得很有用了,比如qq語音、qq視頻。
為什么要說嵌套字?
那是因為就像前面說的,TCP或UDP都是一種協議,也就是計算機網絡通信中在傳輸層的一種協議,簡單地說,就是一種約定,就像合作雙方的合同一樣,然后合同是死的,只有履行合同才是實質性的行動,因此無論是TCP還是UDP要產生作用,都需要有實際的行為去執行才能體現協議的作用,
那么,有什么辦法讓這些協議作用呢?
這就要說到socket了。
socket:也叫嵌套字 ,是一組實現TCP/UDP通信的接口API,也就是說無論TCP還是UDP,通過對scoket的編程,都可以實現TCP/UCP通信,作為一個通信鏈的句柄,它包含網絡通信必備的5種信息:
- 連接使用的協議
- 本地主機的IP地址
- 本地進程的協議端口
- 遠地主機的IP地址
- 遠地進程的協議端口
可見,socket包含了通信本方和對方的ip和端口以及連接使用的協議(TCP/UDP)。通信雙方中的一方(暫稱:客戶端)通過scoket(嵌套字)對另一方(暫稱:服務端)發起連接請求,服務端在網絡上監聽請求,當收到客戶端發來的請求之后,根據socket里攜帶的信息,定位到客戶端,就相應請求,把socket描述發給客戶端,雙方確認之后連接就建立了。
因此套接字之間的連接過程有三個步驟:
- 服務器監聽:服務器實時監控網絡狀態等待客戶端發來的連接請求
- 客戶端請求:客戶端根據遠程主機服務器的IP地址和協議端口向其發起連接請求
- 連接確認:服務端收到套接字的連接請求之后,就響應請求,把服務端套接字描述發給客戶端,客戶端收到后一旦確認,則雙方建立連接,進行數據交互。
通常情況下socket連接就是TCP連接,因此socket連接一旦建立,通訊雙方開始互發數據進行通信,直到其中一方或雙方斷開連接為止。
socket在即時通訊(qq等各種聊天軟件)等應用上應用廣泛。
HTTP協議:Hypertext Transfer Protocol 也叫超文本傳送協議 ,它是一種基于TCP/IP協議棧、在表示層和應用層上的協議(TCP在傳輸層的協議),通俗一點說就是:
- TCP/IP是位于傳輸層上的一種協議,用于在網絡中傳輸數據;
- HTTP協議是應用層協議,基于TCP協議,用于包裝數據,程序使用它進行通信,可以簡單高效的處理通信中數據的傳輸和識別處理
而在現在應用非常廣泛的HTTP連接則是建立在HTTP協議上的、處于應用層中的一種具體應用。
上面說到socket連接一旦建立就保持連接狀態,而HTTP連接則不一樣,它基于tcp協議的短連接,也就是客戶端發起請求,服務器響應請求之后,連接就會自動斷開,不會一直保持。
前面講了tcp、udp、http...等等都是為了講一個具體問題而做的知識點鋪墊,那就是:我們開發的web應用中請求的發起和響應,是一個怎樣的底層原理。
我們都知道,web應用絕大部分都是通過HTTP來進行請求的,而URL則是HTTP用來做連接建立和傳輸數據的一種具體實現,因此在此要簡單講一下URL。
URL:Uniform Resource Locator 統一資源定位符。說白了就是網絡上用來標識具體資源的一個地址,包含了用戶查找該資源的信息,HTTP使用它來傳輸數據和建立連接
一個URL有以下組成部分:
- 協議
- 服務器地址(域名或IP+端口)
- 路徑
- 文件名
比如:https://www.baidu.com/index.html
其中
- https://是一種協議 當然,HTTP也是 ftp也是...
- www.baidu.com是服務器地址,當然你知道百度的IP也可以,例如我用ping命令得到百度的ip
14.215.177.39,那么我可以用http://14.215.177.39打開百度- index.html包含了路徑和文件名,當然通常index.html是可以省略的,所以你打開百度時,并沒有看到這個。
DNS:Domain Name Server,域名服務器。
是進行域名(domain name)和與之相對應的IP地址 (IP address)轉換的服務器。DNS中保存了一張域名(domain name)和與之相對應的IP地址 (IP address)的表,以解析消息的域名。
在平時我們進行開發時,后端提供的接口地址通常是有IP地址加上端口號(8080什么鬼的)組成的,但是當我們把網站發布出去時,通常都需要把IP改成用域名。
為什么呢?
你想想哦,比如谷歌的地址是89.12.21.221:9090,百度的地址是132.21.33.221:8766。。。
這么一看你根本沒有欲望是記住這些亂七八糟的數字吧?
但是域名就不一樣了,比如谷歌的google.com,百度的baidu.com 是不是一遍就記住了呢?
所以為了處理這個問題,就需要用域名去映射IP地址,達到易記易用的目的。
因此,當用戶在瀏覽器輸入https://www.baidu.com回車時,它經歷了以下步驟:
- 瀏覽器根據地址去本身緩存中查找dns解析記錄,如果有,則直接返回IP地址,否則瀏覽器會查找操作系統中(hosts文件)是否有該域名的dns解析記錄,如果有則返回。
- 如果瀏覽器緩存和操作系統hosts中均無該域名的dns解析記錄,或者已經過期,此時就會向域名服務器發起請求來解析這個域名。
- 請求會先到LDNS(本地域名服務器),讓它來嘗試解析這個域名,如果LDNS也解析不了,則直接到根域名解析器請求解析
- 根域名服務器給LDNS返回一個所查詢余的主域名服務器(gTLDServer)地址。
- 此時LDNS再向上一步返回的gTLD服務器發起解析請求。
- gTLD服務器接收到解析請求后查找并返回此域名對應的Name Server域名服務器的地址,這個Name Server通常就是你注冊的域名服務器(比如阿里dns、騰訊dns等)
- Name Server域名服務器會查詢存儲的域名和IP的映射關系表,正常情況下都根據域名得到目標IP記錄,連同一個TTL值返回給DNS Server域名服務器
- 返回該域名對應的IP和TTL值,Local DNS Server會緩存這個域名和IP的對應關系,緩存的時間有TTL值控制。
- 把解析的結果返回給用戶,用戶根據TTL值緩存在本地系統緩存中,域名解析過程結束。
如果這篇文章的主題是網絡通信,那到這里已經可以告一段落了,但今天我們要講的是web應用中請求的發起和響應以及頁面渲染的原理,因此以上只是鋪墊。
在一個web程序開發中,一般都有前端和后端之分,前端負責向后端請求數據和展示頁面,后端負責接收請求和做出響應發回給前端,他們之間的協作的橋梁是什么呢?
是API
API是什么?不就是一個URL嗎?
URL又是啥呢?上面說到就是HTTP連接的一種具體的載體
因此,
無論對于前端或者是后端,理解HTTP,無論是對自身對編程的理解,還是和同事協作,都是好處大大的,
下面,根據上面各個知識點的理解,我們來整理一下并解決一下上面提到的第一個問題:
從用戶輸入URL,到瀏覽器呈現給用戶頁面,經過了什么過程
- 用戶輸入URL,瀏覽器獲取到URL
- 瀏覽器(應用層)進行DNS解析(如果輸入的是IP地址,此步驟省略)
- 根據解析出的IP地址+端口,瀏覽器(應用層)發起HTTP請求,請求中攜帶(請求頭header(也可細分為請求行和請求頭)、請求體body),
header包含:
- 請求的方法(get、post、put..)
- 協議(http、https、ftp、sftp...)
- 目標url(具體的請求路徑已經文件名)
- 一些必要信息(緩存、cookie之類)
body包含:
- 請求的內容
- 請求到達傳輸層,tcp協議為傳輸報文提供可靠的字節流傳輸服務,它通過三次握手等手段來保證傳輸過程中的安全可靠。通過對大塊數據的分割成一個個報文段的方式提供給大量數據的便攜傳輸。
- 到網絡層, 網絡層通過ARP尋址得到接收方的Mac地址,IP協議把在傳輸層被分割成一個個數據包傳送接收方。
- 數據到達數據鏈路層,請求階段完成
- 接收方在數據鏈路層收到數據包之后,層層傳遞到應用層,接收方應用程序就獲得到請求報文。
- 接收方收到發送方的HTTP請求之后,進行請求文件資源(如HTML頁面)的尋找并響應報文
- 發送方收到響應報文后,如果報文中的狀態碼表示請求成功,則接受返回的資源(如HTML文件),進行頁面渲染。
當一個請求的發起和響應都完成之后,瀏覽器就會收到響應內容,但瀏覽器收到的是一串串的代碼或URL鏈接,怎么把這些代碼轉化成用戶可以看得懂的界面呈現出來,就是瀏覽器的工作了。
目前市場上的瀏覽器已經不下百種,各個瀏覽器根據內核又可以分成幾大類,每一類瀏覽器對頁面的渲染原理和過程有所差異。
但總的來說,各個瀏覽器渲染頁面都基本遵循如下圖的流程:
圖中有幾處英文詞匯可能不好理解,沒關系,先做一下解釋:
- HTML parser:HTML解析器,其本質是將HTML文本解釋成DOM tree。
- CSS parser:CSS解析器,其本質是講DOM中各元素對象加入樣式信息
- JavaScript引擎:專門處理JavaScript腳本的虛擬機,其本質是解析JS代碼并且把邏輯(HTML和CSS的操作)應用到布局中,從而按程序要的要求呈現相應的結果
- DOM tree:文檔對象模型樹,也就是瀏覽器通過HTMLparser解析HTML頁面生成的HTML樹狀結構以及相應的接口。
- render tree:渲染樹,也就是瀏覽器引擎通過DOM Tree和CSS Rule Tree構建出來的一個樹狀結構,和dom tree不一樣的是,它只有要最終呈現出來的內容,像<head>或者帶有display:none的節點是不存在render tree中的。
- layout:也叫reflow 重排,渲染中的一種行為。當rendertree中任一節點的幾何尺寸發生改變了,render tree都會重新布局。
- repaint:重繪,渲染中的一種行為。render tree中任一元素樣式屬性(幾何尺寸沒改變)發生改變了,render tree都會重新畫,比如字體顏色、背景等變化。
所以,根據關鍵詞匯的解釋以及順著流程圖的流程,可以總結出,瀏覽器解析渲染頁面主要包括以下過程:
- 瀏覽器通過HTMLParser根據深度遍歷的原則把HTML解析成DOM Tree。
- 將CSS解析成CSS Rule Tree(CSSOM Tree)。
- 根據DOM樹和CSSOM樹來構造render Tree。
- layout:根據得到的render tree來計算所有節點在屏幕的位置。
- paint:遍歷render樹,并調用硬件圖形API來繪制每個節點。
對于頁面渲染基本上這樣就是一個的流程,看完之后,有沒有什么感覺在實際編碼中可以優化的點呢?沒有吧?因為很多細節都沒有講述,因此為了找到可優化的點,在此對頁面渲染過程的幾個關鍵步驟做一下陳述:
上面講到,HTML解析是瀏覽器的HTML解析器把HTML解析成dom tree,而在解析過程,瀏覽器根據HTML文件的結構從上到下解析html,HTML元素是以深度優先的方式解析,而script、link、style等標簽會使解析過程產生阻塞,阻塞的情況有:
- 外部樣式會阻塞內部腳本的執行。
- 外部樣式與外部腳本并行加載,但外部樣式會阻塞外部腳本執行。
- 如果外部腳本帶有async屬性,則外部腳本的加載與執行不受外部樣式影響
- 如果link標簽是動態創建(js生成),不管有無async屬性,都不會阻塞外部腳本的加載與執行。
CSS Parser作用就是將很多個CSS文件中的樣式合并解析出具有樹形結構Style Rules,在對樣式解析的過程中,默認CSS選擇器是從右往左進行解析的。至于為什么是從右到左,而不是從左到右、也是不會從左到左...
下面舉個栗子來說一下:
假如現在有這樣的一個樣式:#parent .ch2 .dh2 {} .fh2 .ch2 .dh2{} .ah2 .ch2 .eh2 {} #parent .fh2 {} .ch2 .dh2{}
我們來比較從左到右和從右到左兩種方式的結果:
從兩個圖的比較就可以看幾點:
- 右邊的tree復雜度要比左邊的低
- 右邊的tree公用樣式重合度比左邊的低
- 右邊的tree從根開始的節點數要比左邊的少
可能光看這幾點沒看出什么問題,但你要知道:瀏覽器中的css解析器負責css的解析,并為每個節點計算出樣式,因此雖然css解析器要做的事情不多,但要每個節點都要進行遍歷查找計算,計算量極大,因此解析的方式是決定其性能的關鍵點。
就如
#parant .a{}
和
.a{}
估計絕大多數人都會認為前者要比后者性能更優,其實不然,在解析過程中
#paran .a{}意味著css解析器要先找到#parent再找到他下面的.a所在節點
而后者可以直接定位到.a{}因此哪一種方式更優,顯而易見。
瀏覽器解析HTML時,當遇到\<script>標簽就會立即解析腳本,同時阻塞解析文檔直到腳本執行完畢(你可能問為什么要這樣設計,明顯啊,腳本的執行是改變css和dom,會造成render tree不停的重繪和重排的),而當\<script>是引入外部js文件時,會阻塞到js文件下載完成并且執行完成為止(除非加了defer或者async屬性)。腳本在解析過程中將對dom或css的操作解析出來加入到DOM Tree和cssom中。
把這些度講完之后,對于性能優化的點,相信大家心里都有點X數了吧,下面簡單總結一下日常開發過程中常用的性能優化的地方:
- 優化選擇器路徑:健全的css選擇器固然是能讓開發看起來更清晰,然后對于css的解析來說卻是個很大的性能問題,因此相比于 .a .b .c{} ,更傾向于大家寫.c{}。
- 壓縮文件:盡可能的壓縮你的css文件大小,減少資源下載的負擔。
- 選擇器合并:把有共同的屬性內容的一系列選擇器組合到一起,能壓縮空間和資源開銷
- 精準樣式:盡可能減少不必要的屬性設置,比如你只要設置{padding-left:10px}的值,那就避免{padding:0 0 0 10px}這樣的寫法
- 雪碧圖:在合理的地方把一些小的圖標合并到一張圖中,這樣所有的圖片只需要一次請求,然后通過定位的方式獲取相應的圖標,這樣能避免一個圖標一次請求的資源浪費。
- 避免通配符:.a .b *{} 像這樣的選擇器,根據從右到左的解析順序在解析過程中遇到通配符(*)回去遍歷整個dom的,這樣性能問題就大大的了。
- 少用Float:Float在渲染時計算量比較大,盡量減少使用。
- 0值去單位:對于為0的值,盡量不要加單位,增加兼容性
- 盡可能把script標簽放到body之后,避免頁面需要等待js執行完成之后dom才能繼續執行,最大程度保證頁面盡快的展示出來。
- 盡可能合并script代碼,
- css能干的事情,盡量不要用JavaScript來干。畢竟JavaScript的解析執行過于直接和粗暴,而css效率更高。
- 盡可能壓縮的js文件,減少資源下載的負擔
- 盡可能避免在js中逐條操作dom樣式,盡可能預定義好css樣式,然后通過改變樣式名來修改dom樣式,這樣集中式的操作能減少reflow或repaint的次數。
- 盡可能少的在js中創建dom,而是預先埋到HTML中用display:none來隱藏,在js中按需調用,減少js對dom的暴力操作。
- 避免再HTML中直接寫css代碼。
- 使用Viewport加速頁面的渲染。
- 使用語義化標簽,減少css的代碼,增加可讀性和SEO。
- 減少標簽的使用,dom解析是一個大量遍歷的過程,減少無必要的標簽,能降低遍歷的次數。
- 避免src、href等的值為空。
- 減少dns查詢的次數。
以上就是文章的所有內容,總的來說,入門的文章是領人入門,進階的文章帶人進階,就像Java的書會有入門教程和進階教程一樣,這個文章里邊寫的大部分知識點都是為了讓讀者對頁面請求和呈現有一個鋪墊和整體的認知,由于涉及的知識點過多,每個知識點拎出來都可以寫一本書,所以大家把本文作為一個引路文,需要對某個知識點進行深入研究時再找相關書籍研究,不喜勿噴。
覺得本文對你有幫助?請分享給更多人
關注「編程×××」,提升裝逼技能
<br>
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。