您好,登錄后才能下訂單哦!
這期內容當中小編將會給大家帶來有關如何進行QQ會員AMS平臺PHP7升級,文章內容豐富且以專業的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
QQ會員活動運營平臺(AMS),是QQ會員增值運營業務的重要載體之一,承擔海量活動運營的Web系統。AMS是一個主要采用PHP語言實現的活動運營平臺, CGI日請求3億左右,高峰期達到8億。然而,在之前比較長的一段時間里,我們都采用了比較老舊的基礎軟件版本,就是PHP5.2+Apache2.0(2008年的技術)。尤其從去年開始,隨著AMS業務隨著QQ會員增值業務的快速增長,性能壓力日益變大。
于是,自2015年5月,我們就開始規劃PHP底層升級,最終的目標是升級到PHP7。那時,PHP7尚處于研發階段,而我們討論和預研就已經開始了。
2015年就PHP性能優化的方案,有另外一個比較重要的角色,就是由Facebook開源的HHVM(HipHop Virtual Machine,HHVM是一個Facebook開源的PHP虛擬機)。HHVM使用JIT(Just In Time,即時編譯是種軟件優化技術,指在運行時才會去編譯字節碼為機器碼)的編譯方式以及其他技術,讓PHP代碼的執行性能大幅提升。據傳,可以將PHP5版本的原生PHP代碼提升5-10倍的執行性能。
HHVM起源于Facebook公司,Facebook早起的很多代碼是使用PHP來開發的,但是,隨著業務的快速發展,PHP執行效率成為越來越明顯的問題。為了優化執行效率,Facebook在2008年就開始使用HipHop,這是一種PHP執行引擎,最初是為了將 Fackbook的大量PHP代碼轉成 C++,以提高性能和節約資源。使用HipHop的PHP代碼在性能上有數倍的提升。后來,Facebook將HipHop平臺開源,逐漸發展為現在的 HHVM。
HHVM成為一個PHP性能優化解決方案時,PHP7還處于研發階段。曾經看過部分同學對于HHVM的交流,性能可以獲得可觀的提升,但是服務運維和PHP語法兼容有一定成本。有一陣子,JIT成為一個呼聲很高的東西,很多技術同學建議PHP7也應該通過JIT來優化性能。
2015年7月,我參加了中國PHPCON,聽了惠新宸關于PHP7內核的技術分享。實際上,在2013年的時候,惠新宸(PHP7內核開發者)和Dmitry(另一位PHP語言內核開發者之一)就曾經在PHP5.5的版本上做過一個JIT的嘗試(并沒有發布)。PHP5.5的原來的執行流程,是將PHP代碼通過詞法和語法分析,編譯成opcode字節碼(格式和匯編有點像),然后,Zend引擎讀取這些opcode指令,逐條解析執行。
而他們在opcode環節后引入了類型推斷(TypeInf),然后通過JIT生成ByteCodes,然后再執行。
于是,在benchmark(測試程序)中得到非常好的結果,實現JIT后性能比PHP5.5提升了8倍。然而,當他們把這個優化放入到實際的項目WordPress(一個開源博客項目)中,卻幾乎看不見性能的提升。原因在于測試項目的代碼量比較少,通過JIT產生的機器碼也不大,而真實的WordPress項目生成的機器碼太大,引起CPU緩存命中率下降(CPU Cache Miss)。
總而言之,JIT并非在每個場景下都是點石成金的利器,而脫離業務場景的性能測試結果,并不一定具有代表性。
從官方放出Wordpress的PHP7和HHVM的性能對比可以看出,兩者基本處于同一水平。
PHP7是一個比較底層升級,比起PHP5.6的變化比較大,而就性能優化層面,大致可以匯總如下:
將基礎變量從struct(結構體)變為union(聯合體),節省內存空間,間接減少CPU在內存分配和管理上的開銷。
部分基礎變量(zend_array、zend_string等)采用內存空間連續分配的方式,降低CPU Cache Miss的發生的概率。CPU從CPU Cache獲取數據和從內存獲取,它們之間效率相差可以高達100倍。舉一個近似的例子,系統從內存讀取數據和從磁盤讀取數據的效率差別很大,CPU Cache Miss類似遇到缺頁中斷。
通過宏定義和內聯函數(inline),讓編譯器提前完成部分工作。無需在程序運行時分配內存,能夠實現類似函數的功能,卻沒有函數調用的壓棧、彈棧開銷,效率會比較高。
... ...
就提升PHP的性能而言,可以選擇的是2015年就可直接使用的HHVM或者是2015年底才發布正式版的PHP7。會員AMS是一個訪問量級比較大的一個Web系統,經過四年持續的升級和優化,積累了800多個業務功能組件,還有各種PHP編寫的公共基礎庫和腳本,代碼規模也比較大。
我們對于PHP版本對代碼的向下兼容的需求是比較高的,因此,就我們業務場景而言,PHP7良好的語法向下兼容,正是我們所需要的。因此,我們選擇以PHP7為升級的方案。
對于一個已經現網在線的大型公共Web服務來說,基礎公共軟件升級,通常是一件吃力不討好的工作,做得好,不一定被大家感知到,但是,升級出了問題,則需要承擔比較重的責任。為了盡量減少升級的風險,我們必須先弄清楚我們的升級存在挑戰和風險。
于是,我們整理了升級挑戰和風險列表:
Apache2.0和PHP5.2這兩個2008-2009年的基礎軟件版本比較古老,升級到Apache2.4和PHP7,版本升級跨度比較大,時間跨度相差7-8年,因此,兼容性問題挑戰比較高。實際上,我們公司的現網PHP服務,很多都停留在PHP5.2和PHP5.3的版本,版本偏低。
AMS大量使用自研tphplib擴展,tphplib很早在公司內部就沒有人維護了,這個擴展之前只有PHP5.3和PHP5.2的編譯so版本,并且,部分擴展沒有支持線程安全。支持線程安全,是因為我們以前的Apache使用了prefork模式,而我們希望能夠使用Apache2.4的Event模式(2014年中,在prefork和worker之后,推出的多進程線程管理模式,對于支持高并發,有更良好的表現)。
語法兼容性問題,從PHP5.2到PHP7的跨度過大,即使PHP官方號稱在向下兼容方面做到99%,但是,我們的代碼規模比較大,它仍然是一個未知的風險。
新軟件面臨的風險,將Apache和PHP這種基礎軟件升級到最新的版本,而這些版本的部分功能可能存在未知的風險和缺陷。
部分同學可能會建議采用Nginx會是更優的選擇,的確,單純比較Nginx和Apache在高并發方面的性能,Nginx的表現更優。但是就PHP的CGI而言,Nginx+php-ftpm和Apache+mod_php兩者并沒有很大的差距。另一方面,我們因為長期使用Apache,在技術熟悉和經驗方面積累更多,因此,它可能不是最佳的選擇,但是,具體到我們業務場景,算是比較合適的一個選擇。
從一個2008年的Apache2.0直接升級到2016年的Apache2.4,這個跨度過于大,甚至使用的http.conf的配置文件都有很多的不同,這里的需要更新的地方比較多,未知的風險也是存在的。于是,我們的做法,是先嘗試將Apache2.0升級到Apach3.2,調整配置、觀察穩定性,然后再進一步嘗試到Apach3.4。所幸的是,Apache(httpd)是一個比較特別的開源社區,他們之前一直同時維護這兩個分支版本的Apache(2.2和2.4),因此,即使是Apache2.2也有比較新的版本。
于是,我們先升級了一個PHP5.2+Apache2.2,對兼容性進行了測試和觀察,確認兩者之間是可以比較平滑升級后,我們開始進行Apache2.4的升級方案。
PHP5.2的升級,我們也采用相同的思路,我們先將PHP5.2升級至PHP5.6(當時,PHP7還是beta版本),然后再將PHP5.6升級到PHP7,以更平滑的方式,逐步解決不同的問題。
于是,我們的升級計劃變為:
Apache2.4編譯為動態MPM的模式(支持通過httpd配置切換prefork/worker/event模式),根據現網風險等實時降級。
Prefork、Worker、Event三者粗略介紹:
prefork,多進程模式,1個進程服務于1個用戶請求,成本比較高。但是,穩定性最高,不需要支持線程安全。
worker,多進程多線程模式,1個進程含有多個worker線程,1個worker線程服務于1個用戶請求,因為線程更輕量,成本比較低。但是,在KeepAlive場景下,worker資源會被client占據,無法響應其他請求(空等待)。
event,多進程多線程模式,1個進程也含有多個worker線程,1個worker線程服務于1個用戶請求。但是,它解決了KeepAlive場景下的worker線程被占據問題,它通過專門的線程來管理這些KeepAlive連接,然后再分配“工作”給具體處理的worker,工作worker不會因為KeepAlive而導致空等待。
關于Event模式的官方介紹:
http://httpd.apache.org/docs/2.4/mod/event.html
(部分同學可能會有event模式不支持https的印象,那個說法其實是2年多以前的國內部分技術博客的說法,目前的版本是支持的,詳情可以瀏覽官方介紹)
開啟動態切換模式的方法,就是在編譯httpd的時候加上:
--enable-mpms-shared=all
從PHP5.2升級到PHP5.6相對比較容易,我們主要的工作如下:
清理了部分不再使用的老擴展
解決掉線程安全問題
將cmem等api編譯到新的版本
PHP代碼語法基于PHP5.6的兼容(實際上變化不大)
部分擴展的同步調整。apc擴展變為zend_opcache和apcu,以前的apc是包含了編譯緩存和用戶內存操作的功能,在PHP比較新版本里,被分解為獨立的兩個擴展。
從PHP5.6升級到PHP7.0的工作量就比較多,也相對比較復雜,因此,我們制定了每一個階段的升級計劃:
技術預研,PHP7升級準備。
環境編譯和搭建,下載相關的編譯包,搭建完整的編譯環境和測試環境。(編譯環境還是需要比較多的依賴so)
兼容升級和測試。PHP7擴展的重新編譯和代碼兼容性工作,AMS功能驗證,性能壓測。
線上灰度。打包為pkg的安裝包,編寫相關的安裝shell安裝執行代碼(包括軟鏈接、解決一些so依賴)。然后,灰度安裝到現網,觀察。
正式發布。擴大灰度范圍,全量升級。
因為從PHP5.2升級到PHP5.6的過程中,很多問題已經被我們提前解決了,所以,PHP7的升級主要難點在于tphplib擴展的編譯升級。
涉及主要的工作包括:
PHP5.6的擴展到PHP7.0的比較大幅度改造升級(工作量比較大的地方)
兼容apcu的內存操作函數的改名。PHP5的時候,我們使用的apc前綴的函數不可用了,同步變為apcu前綴的函數(需要apcu擴展)。
語法兼容升級。實際上工作量不算大,從PHP5.6升級到PHP7變化并不多。
我們大概在2016年4月中旬份完成了PHP7和Apache的編譯工作, 4月下旬進行現網灰度,5月初全量發布到其中一個現網集群。
在升級和重新編譯PHP7擴展時,如果執行結果不符合預期或者進程core掉,很多錯誤都是無法從error日志里看見的,不利于分析問題。可以采用以下幾種方法,可以用來定位和分析大部分的問題:
var_dump/exit
從PHP代碼層逐步輸出信息和執行exit,可以逐步定位到異常執行的PHP函數位置,然后再根據PHP函數名,反查擴展內的實現函數,找到問題。這種方法比較簡單,但是效率不高。
gdb –p/gdb c
這種方法主要用于分析進程core的場景,我們采用的編譯方式,是將mod_php
(PHP變成Apache的子或塊的方式),使用gdb –p
來監控Apache的服務進程。
命令:ps aux|grep httpd
gdb調試指定進程:
命令:gdb -p
使用c進行捕獲,然后構造能夠導致core的web請求:
Apache通常是多進程模式,為了讓問題比較容易復現,可以在http.con里修改參數,將啟動進程數修改為1個(下圖中的多個參數都需要調整,以達到只啟動單進程單線程的目的)。
當然還有一種更簡單的方法,因為Apache本身就支持單進程調試模式的。
./apachectl -k start -X -e debug
然后再通過gdb –p
來調試就更簡單一些。
通過strace命令查看Apache進程具體在做了些什么事情,根據里面的執行內容,分析和定位問題。
strace -Ttt -v -s1024 -f -p pid
(進程id)
備注:執行這些命令,注意權限問題,很可能需要root權限。
zval
php7的誕生始于zval
結構的變化,PHP7不再需要指針的指針,絕大部分zval**
需要修改成zval*
。如果PHP7直接操作zval
,那么zval*
也需要改成zval
,Z_*P()
也要改成Z_*()
,ZVAL_*(var, …)
需要改成ZVAL_*(&var, …)
,一定要謹慎使用&符號,因為PHP7幾乎不要求使用zval*
,那么很多地方的&也是要去掉的。
ALLOC_ZVAL
,ALLOC_INIT_ZVAL
,MAKE_STD_ZVAL
這幾個分配內存的宏已經被移除了。大多數情況下,zval*
應該修改為zval
,而INIT_PZVAL
宏也被移除了。
/* 7.0zval結構源碼 */ /* value字段,僅占一個size_t長度,只有指針或double或者long */ typedef union _zend_value { zend_long lval; /* long value */ double dval; /* double value */ zend_refcounted *counted; zend_string *str; zend_array *arr; zend_object *obj; zend_resource *res; zend_reference *ref; zend_ast_ref *ast; zval *zv; void *ptr; zend_class_entry *ce; zend_function *func; struct { uint32_t w1; uint32_t w2; } ww; } zend_value; struct _zval_struct { zend_value value; /* value */ union { 。。。 } u1;/* 擴充字段,主要是類型信息 */ union { … … } u2;/* 擴充字段,保存輔助信息 */ };
整型
直接切換即可:
long->zend_long
/* 定義 */ typedef int64_t zend_long; /* else */ typedef int32_t zend_long;
字符串類型
PHP5.6版本中使用 char* + len的方式表示字符串,PHP7.0中做了封裝,定義了zend_string類型:
struct _zend_string { zend_refcounted_h gc; zend_ulong h; /* hash value */ size_t len; char val[1]; };
zend_string
和char*
的轉換:
zend_string *str; char *cstr = NULL; size_t slen = 0; //... /* 從zend_string獲取char* 和 len的方法如下 */ cstr = ZSTR_VAL(str); slen = ZSTR_LEN(str); /* char* 構造zend_string的方法 */ zend_string * zstr = zend_string_init("test",sizeof("test"), 0);
擴展方法,解析參數時,使用字符串的地方,將‘s’替換成‘S’:
/* 例如 */ `zend_string` `*zstr`; if (zend_parse_parameters(ZEND_NUM_ARGS() , "S", &zstr) == FAILURE) { RETURN_LONG(-1); }
自定義對象
源代碼:
/* php7.0 zend_object 定義 */ struct _zend_object { zend_refcounted_h gc; uint32_t handle; zend_class_entry *ce; const zend_object_handlers *handlers; HashTable *properties; zval properties_table[1]; };
zendobject
是一個可變長度的結構。因此在自定義對象的結構中,zendobject
需要放在最后一項:
/* 例子 */ struct clogger_object { CLogger *logger; zend_object std;// 放在后面 }; /* 使用偏移量的方式獲取對象 */ static inline clogger_object *php_clogger_object_from_obj(zend_object *obj) { return (clogger_object*)((char*)(obj) - XtOffsetOf(clogger_object, std)); } #define Z_USEROBJ_P(zv) php_clogger_object_from_obj(Z_OBJ_P((zv))) /* 釋放資源時 */ void tphp_clogger_free_storage(zend_object *object TSRMLS_DC) { clogger_object *intern = php_clogger_object_from_obj(object); if (intern->logger) { delete intern->logger; intern->logger = NULL; } zend_object_std_dtor(&intern->std); }
數組
7.0中的hash表定義如下,給出了一些注釋:
/*7.0中的hash表結構 */ typedef struct _Bucket { /* hash表中的一個條目 */ zval val; /* 刪除元素zval類型標記為IS_UNDEF */ zend_ulong h; /* hash value (or numeric index) */ zend_string *key; /* string key or NULL for numerics */ } Bucket; typedef struct _zend_array HashTable; struct _zend_array { zend_refcounted_h gc; union { struct { ZEND_ENDIAN_LOHI_4( zend_uchar flags, zend_uchar nApplyCount, zend_uchar nIteratorsCount, zend_uchar reserve) } v; uint32_t flags; } u; uint32_t nTableMask; Bucket *arData; /* 保存所有數組元素 */ uint32_t nNumUsed; /* 當前用到了多少長度, */ uint32_t nNumOfElements; /* 數組中實際保存的元素的個數,一旦nNumUsed的值到達nTableSize,PHP就會嘗試調整arData數組,讓它更緊湊,具體方式就是拋棄類型為UDENF的條目 */ uint32_t nTableSize; /* 數組被分配的內存大小為2的冪次方(最小值為8) */ uint32_t nInternalPointer; zend_long nNextFreeElement; dtor_func_t pDestructor; };
其中,PHP7在zend_hash.h中定義了一系列宏,用來操作數組,包括遍歷key、遍歷value、遍歷key-value等,下面是一個簡單例子:
/* 數組舉例 */ zval *arr; zend_parse_parameters(ZEND_NUM_ARGS() , "a", &arr_qos_req); if (arr) { zval *item; zend_string *key; ZEND_HASH_FOREACH_STR_KEY_VAL(Z_ARRVAL_P(arr), key, item) { /* ... */ } } /* 獲取到item后,可以通過下面的api獲取long、double、string值 */ zval_get_long(item) zval_get_double(item) zval_get_string(item)
PHP5.6版本中是通過zend_hash_find
查找key,然后將結果給到zval **
變量,并且查詢不到時需要自己分配內存,初始化一個item,設置默認值。
duplicate參數
PHP5.6中很多API中都需要填入一個duplicate
參數,表明一個變量是否需要復制一份,尤其是string類
的操作,PHP7.0中取消duplicate
參數,對于string相關操作,只要有duplicate
參數,直接刪掉即可。因為PHP7.0中定義了zval_string
結構,對字符串的操作,不再需要duplicate
值,底層直接使用zend_string_init
初始化一個zend_string
即可,而在PHP5.6中string
是存放在zval
中的,而zval
的內存需要手動分配。
涉及的API匯總如下:
add_index_string
、add_index_stringl
、add_assoc_string_ex
、add_assoc_stringl_ex
、add_assoc_string
、add_assoc_stringl
、add_next_index_string
、add_next_index_stringl
、add_get_assoc_string_ex
、add_get_assoc_stringl_ex
、add_get_assoc_string
、add_get_assoc_stringl
、add_get_index_string
、add_get_index_stringl
、add_property_string_ex
、add_property_stringl_ex
、add_property_string
、add_property_stringl
、ZVAL_STRING
、ZVAL_STRINGL
、RETVAL_STRING
、RETVAL_STRINGL
、RETURN_STRING
、RETURN_STRINGL
MAKE_STD_ZVAL
PHP5.6中,zval變量是在堆上分配的,創建一個zval變量需要先聲明一個指針,然后使用MAKE_STD_ZVAL
進行分配空間。PHP7.0中,這個宏已經取消,變量在棧上分配,直接定義一個變量即可,不再需要MAKE_STD_ZVAL
,使用到的地方,直接去掉就好。
ZEND_RSRC_DTOR_FUNC
修改參數名rsrc為res /* PHP5.6 */ typedef struct _zend_rsrc_list_entry { void *ptr; int type; int refcount; } zend_rsrc_list_entry; typedef void (*rsrc_dtor_func_t)(zend_rsrc_list_entry *rsrc TSRMLS_DC); #define ZEND_RSRC_DTOR_FUNC(name) void name(zend_rsrc_list_entry *rsrc TSRMLS_DC) /* PHP7.0 */ struct _zend_resource { zend_refcounted_h gc;/*7.0中對引用計數做了結構封裝*/ int handle; int type; void *ptr; }; typedef void (*rsrc_dtor_func_t)(zend_resource *res); #define ZEND_RSRC_DTOR_FUNC(name) void name(zend_resource *res)
PHP7.0中,將zend_rsrc_list_entry
結構升級為zend_resource
,在新版本中只需要修改一下參數名稱即可。
二級指針宏,即Z_*_PP
PHP7.0中取消了所有的PP宏,大部分情況直接使用對應的P宏即可。
zend_object_store_get_object被取消
根據官方wiki,可以定義如下宏,用來獲取object,實際情況看,這個宏用的還是比較頻繁的:
static inline user_object *user_fetch_object(zend_object *obj) { return (user_object *)((char*)(obj) - XtOffsetOf(user_object, std)); } /* }}} */ #define Z_USEROBJ_P(zv) user_fetch_object(Z_OBJ_P((zv)))
zend_hash_exists、zend_hash_find
對所有需要字符串參數的函數,PHP5.6中的方式是傳遞兩個參數(char* + len)
,而PHP7.0中定義了zend_string
,因此只需要一個zend_string
變量即可。
返回值變成了zend_bool類型:
/* 例子 */ zend_string * key; key = zend_string_init("key",sizeof("key"), 0); zend_bool res_key = zend_hash_exists(itmeArr, key);
參考資料:
1、php5 to phpng,http://yaoguais.com/?s=md/php/php7-vm.md
2、PHP擴展開發及內核應用, http://www.walu.cc/phpbook/10.1.md
3、PHP 7中新的Hashtable實現和性能改進 ,http://gywbd.github.io/posts/2014/12/php7-new-hashtable-implementation.html
4、深入理解PHP7之zval, https://github.com/laruence/php7-internal/blob/master/zval.md
5、官方wiki, https://wiki.php.net/phpng-upgrading
6、php手冊 ,http://php.net/manual/zh/index.php
7、PHP7 使用資源包裹第三方擴展的實現及其源碼解讀 ,https://mengkang.net/684.html
現網服務是一個非常重要而又敏感的環境,輕則影響用戶體驗,重則產生現網事故。因此,我們4月下旬完成PHP7編譯和測試工作之后,就在AMS其中一臺機器進行了灰度上線,觀察了幾天后,然后逐步擴大灰度范圍,在5月初完成升級。
這個是我們壓測AMS一個查詢多個活動計數器的壓測結果,以及現網CGI機器,在高峰相同TGW流量場景下的CPU負載數據:
就我們的業務壓測和現網結果來看,和官方所說的性能提升一倍,基本一致。
AMS平臺擁有不少的CGI機器,PHP7的升級和應用給我們帶來了性能的提升,可以有效節省硬件資源成本。并且,通過Apache2.4的Event模式,我們也增強了Apache在支持并發方面的能力。
我們PHP7升級研發項目組,在過去比較長的一個時間段里,經過持續地努力和推進,終于在2016年4月下旬現網灰度,5月初在集群中全量升級,為我們的AMS活動運營平臺帶來性能上大幅度的提升。
PHP7的革新,對于PHP語言本身而言,具有非凡的意義和價值,這讓我更加確信一點,PHP會是一個越來越好的語言。同時,感謝PHP社區的開發者們,為我們業務帶來的性能提升。
上述就是小編為大家分享的如何進行QQ會員AMS平臺PHP7升級了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關知識,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。