您好,登錄后才能下訂單哦!
這期內容當中小編將會給大家帶來有關Oracle 徹底 kill session的示例分析,文章內容豐富且以專業的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
killsession是DBA經常碰到的事情之一。如果kill掉了不該kill的session,則具有破壞性,因此盡可能的避免這樣的錯誤發生。同時也應當注意,
如果kill的session屬于Oracle后臺進程,則容易導致數據庫實例宕機。
通常情況下,并不需要從操作系統級別殺掉Oracle會話進程,但并非總是如此,下面的描述中給出了在Oracle級別殺掉會話以及操作系統級別殺掉進程。
一、獲得需要kill session的信息(使用V$SESSION和GV$SESSION視圖)
SETLINESIZE180
COLUMNspid FORMAT A10
COLUMNusername FORMAT A10
COLUMNprogram FORMAT A40
SELECTs.inst_id,
s.sid,
s.serial#,
p.spid,
s.username,
s.program,
s.paddr,
s.STATUS
FROM gv$session s
JOINgv$process pONp.addr = s.paddrANDp.inst_id = s.inst_id
WHERE s.type !='BACKGROUND';
INST_ID SID SERIAL# SPID USERNAME PROGRAM PADDR STATUS
---------- ---------- ---------- ---------- ---------- --------------------------------------------- -------- --------
1 146 2327573 TEST sqlplus@oracle10g (TNS V1-V3) 4C621950INACTIVE
1 160 1727610 SYS sqlplus@oracle10g (TNS V1-V3) 4C624174 ACTIVE
1 144 4227641 SCOTT sqlplus@oracle10g (TNS V1-V3) 4C624730INACTIVE
二、使用ALTERSYSTEMKILLSESSION命令實現
語法:
SQL>ALTERSYSTEMKILLSESSION'sid,serial#';
SQL>ALTERSYSTEMKILLSESSION'sid,serial#'IMMEDIATE;
對于RAC環境下的killsession,需要搞清楚需要kill的session位于哪個節點,可以查詢GV$SESSION視圖獲得。
killsession的時候僅僅是將會話殺掉。在有些時候,由于較大的事務或需要運行較長的SQL語句將導致需要kill的session并不能立即殺掉。對于這種情
況將收到"marked for kill"提示(如下),一旦會話當前事務或操作完成,該會話被立即殺掉。
altersystemkillsession'4730,39171'
*
ERRORatline1:
ORA-00031:sessionmarkedforkill
在下面的操作中將殺掉會話146,144
sys@AUSTIN>altersystemkillsession'146,23';
Systemaltered.
sys@AUSTIN>altersystemkillsession'144,42';
Systemaltered.
sys@AUSTIN>selectinst_id,saddr,sid,serial#,paddr,username,status,programfromgv$sessionwhereusernameisnotnull;
INST_ID SADDR SID SERIAL# PADDR USERNAME STATUS PROGRAM
---------- -------- ---------- ---------- -------- ---------- -------- ---------------------------------------------
14C70BF04 144 424C6545A0SCOTT KILLED sqlplus@oracle10g (TNS V1-V3)
14C70E6B4 146 234C6545A0TEST KILLED sqlplus@oracle10g (TNS V1-V3)
14C71FC84 160 174C624174SYS ACTIVE sqlplus@oracle10g (TNS V1-V3)
注意:在查詢中可以看到被殺掉的會話的PADDR地址發生了變化,參照查詢結果中的紅色字體。如果多個session被kill掉,則多個session的PADDR
被改為相同的進程地址。
通過下面的語句來找回被kill掉的ADDR先前的地址
SELECTs.username,s.status,
x.ADDR,x.KSLLAPSC,x.KSLLAPSN,x.KSLLASPO,x.KSLLID1R,x.KSLLRTYP,
decode(bitand(x.ksuprflg,2),0,null,1)
FROMx$ksupr x,v$session s
WHEREs.paddr(+)=x.addr
andbitand(ksspaflg,1)!=0;
USERNAME STATUS ADDR KSLLAPSC KSLLAPSN KSLLASPO KSLLID1RKSD
---------- -------- -------- ---------- ---------- ------------ ---------- -- -
ACTIVE 4C623BB8 99 427468 275EV1
ACTIVE 4C623040 9 2427444 0 1
ACTIVE 4C622A84 101 427480 274EV1
ACTIVE 4C6224C8 1 4827450 0 1
ACTIVE 4C621F0C 1 4827450 0 1
ACTIVE 4C6235FC 2 427468 0 1
SYS ACTIVE 4C624174 2 1527442 0
ACTIVE 4C62081C 1 4827440 0 1
ACTIVE 4C621394 1 4827440 0 1
ACTIVE 4C620DD8 11 2427476 0 1
ACTIVE 4C61F6E8 15 427610 0 1
ACTIVE 4C620260 222 2427450 0 1
ACTIVE 4C61FCA4 7 2527573 0 1
ACTIVE 4C61F12C 6 2527573 0 1
ACTIVE 4C61EB70 4 2427458 0 1
ACTIVE 4C61E5B4 1 4827440 0 1
ACTIVE 4C61DFF8 2 2427444 0 1
4C624730 0 0 0
4C621950 0 0 0
4C61DA3C 0 0 0
或者根據下面的語句來獲得發生變化的addr
sys@AUSTIN>selectp.addrfromv$process pwherepid <>1
2 minus
3 selects.paddrfromv$session s;
ADDR
--------
4C621950
4C624730
三、在操作系統級別殺掉會話
尋找會話對應的操作系統的進程ID
sys@AUSTIN>selectSPIDfrom v$processwhereADDRin('4C621950','4C624730') ;
SPID
----------
27573
27641
使用kill命令來殺掉操作系統級別進程ID
killsession-927573
killsession-927641
四、獲得當前會話的SID
SQL>selectuserenv('sid')fromdual;
USERENV('SID')
--------------
627
五、多個會話需要kill的處理辦法
1.根據給定的SID(用戶名)查找需要殺掉會話的信息,包括位于哪一個實例
setlinesize160
col program format a35
col username format a18
selectinst_id,saddr,sid,serial#,paddr,username,status,programfromgv$session
wheresidin('2731','2734','2720','2678','2685')
andusername='CTICUST'
orderbyinst_id;
INST_ID SADDR SID SERIAL# PADDR USERNAME STATUS PROGRAM
---------- ---------------- ---------- ---------- ---------------- ------------------ -------- ---------------------------
100000003DAF8F870 2678 826500000003DBC6CA08 MSS4USR INACTIVE JDBC Thin Client
100000003DAF98E48 2685 8300000003DBC08510 MSS4USR ACTIVE JDBC Thin Client
100000003DAFC7B80 2720 500000003DBBEDA20 MSS4USR INACTIVE JDBC Thin Client
100000003DAFD66F8 2731 300000003DBBE9AE0SYS ACTIVE racgimon@svdg0028(TNS V1-V3)
100000003DAFDA730 2734 1500000003DBBEC268 MSS4USR INACTIVE JDBC Thin Client
200000003DAFD66F8 2731 100000003DBBE92F8 ACTIVE oracle@svdg0029 (ARC0)
上面的查詢中有一個SID為2731的位于節點2上。
也可以通過下面的方式來獲得RAC的節點信息,便于確定需要kill的session究竟位于哪一個節點。
setlinesize160
col HOST_NAME format a25
SQL>selectINSTANCE_NUMBER,INSTANCE_NAME,HOST_NAME,VERSION,STATUSfromgv$instanceorderby1;
INSTANCE_NUMBER INSTANCE_NAME HOST_NAME VERSION STATUS
--------------- ---------------- ------------------------- ----------------- ------------
1O02WMT1A svd0051 10.2.0.4.0 OPEN
2O02WMT1B svd0052 10.2.0.4.0 OPEN
3O02WMT1C svd0053 10.2.0.4.0 OPEN
2.使用下面查詢來生成killsession的語句
select'alter system kill session '''||sid||','||SERIAL# ||''''||';' from gv$session
wheresidin('2731','2734','2720','2678','2685')
orderbyinst_id;
獲得下列kill session的語句,根據要求由于此次需要殺掉的session全部位于節點1,因此登錄到節點節點1執行下面的語句
altersystemkillsession'2678,8265';
altersystemkillsession'2685,83';
altersystemkillsession'2720,5';
altersystemkillsession'2731,3';
altersystemkillsession'2734,15';
altersystemkillsession'2731,1'; --此條命令不需要執行,該session位于節點2。
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
與Kill Session相關的其他幾篇文章
原文地址:http://www.eygle.com/archives/2004/06/kill_session.html
作者:eygle | </SCRIPT. class=English target="_blank" href="http://translate.google.com/translate?langpair=zh-CN%7Cen&hl=zh-CN&ie=UTF8&u=http%3A//www.eygle.com/archives/2004/06/kill_session.html" English Version 【轉載時請以超鏈接形式標明文章出處和作者信息及本聲明】
鏈接:http://www.eygle.com/archives/2004/06/kill_session.html
itpub link:
http://www.itpub.net/235873.html
我們知道,在Oracle數據庫中,可以通過kill session的方式來終止一個進程,其基本語法結構為:
alter system kill session 'sid,serial#' ;
被kill掉的session,狀態會被標記為killed,Oracle會在該用戶下一次touch時清除該進程.
我們發現當一個session被kill掉以后,該session的paddr被修改,如果有多個session被kill,那么多個session
的paddr都被更改為相同的進程地址:
SQL> select saddr,sid,serial#,paddr,username,status from v$session where username is not null; SADDR SID SERIAL# PADDR USERNAME STATUS -------- ---------- ---------- -------- ------------------------------ -------- 542E0E6C 11 314 542B70E8 EYGLE INACTIVE 542E5044 18 662 542B6D38 SYS ACTIVE SQL> alter system kill session '11,314'; System altered. SQL> select saddr,sid,serial#,paddr,username,status from v$session where username is not null; SADDR SID SERIAL# PADDR USERNAME STATUS -------- ---------- ---------- -------- ------------------------------ -------- 542E0E6C 11 314 542D6BD4 EYGLE KILLED 542E5044 18 662 542B6D38 SYS ACTIVE SQL> select saddr,sid,serial#,paddr,username,status from v$session where username is not null; SADDR SID SERIAL# PADDR USERNAME STATUS -------- ---------- ---------- -------- ------------------------------ -------- 542E0E6C 11 314 542D6BD4 EYGLE KILLED 542E2AA4 14 397 542B7498 EQSP INACTIVE 542E5044 18 662 542B6D38 SYS ACTIVE SQL> alter system kill session '14,397'; System altered. SQL> select saddr,sid,serial#,paddr,username,status from v$session where username is not null; SADDR SID SERIAL# PADDR USERNAME STATUS -------- ---------- ---------- -------- ------------------------------ -------- 542E0E6C 11 314 542D6BD4 EYGLE KILLED 542E2AA4 14 397 542D6BD4 EQSP KILLED 542E5044 18 662 542B6D38 SYS ACTIVE
在這種情況下,很多時候,資源是無法釋放的,我們需要查詢spid,在操作系統級來kill這些進程.
但是由于此時v$session.paddr已經改變,我們無法通過v$session和v$process關聯來獲得spid
那還可以怎么辦呢?
我們來看一下下面的查詢:
SQL> SELECT s.username,s.status, 2 x.ADDR,x.KSLLAPSC,x.KSLLAPSN,x.KSLLASPO,x.KSLLID1R,x.KSLLRTYP, 3 decode(bitand (x.ksuprflg,2),0,null,1) 4 FROM x$ksupr x,v$session s 5 WHERE s.paddr(+)=x.addr 6 and bitand(ksspaflg,1)!=0; USERNAME STATUS ADDR KSLLAPSC KSLLAPSN KSLLASPO KSLLID1R KS D ------------------------------ -------- -------- ---------- ---------- ------------ ---------- -- - 542B44A8 0 0 0 ACTIVE 542B4858 1 14 24069 0 1 ACTIVE 542B4C08 26 16 15901 0 1 ACTIVE 542B4FB8 7 46 24083 0 1 ACTIVE 542B5368 12 15 24081 0 1 ACTIVE 542B5718 15 46 24083 0 1 ACTIVE 542B5AC8 79 4 15923 0 1 ACTIVE 542B5E78 50 16 24085 0 1 ACTIVE 542B6228 754 15 24081 0 1 ACTIVE 542B65D8 1 14 24069 0 1 ACTIVE 542B6988 2 30 14571 0 1 USERNAME STATUS ADDR KSLLAPSC KSLLAPSN KSLLASPO KSLLID1R KS D ------------------------------ -------- -------- ---------- ---------- ------------ ---------- -- - SYS ACTIVE 542B6D38 2 8 24071 0 542B70E8 1 15 24081 195 EV 542B7498 1 15 24081 195 EVSYS INACTIVE 542B7848 0 0 0 SYS INACTIVE 542B7BF8 1 15 24081 195 EV 16 rows selected.
我們注意,紅字標出的部分就是被Kill掉的進程的進程地址.
簡化一點,其實就是如下概念:
SQL> select p.addr from v$process p where pid <> 1 2 minus 3 select s.paddr from v$session s;
Ok,現在我們獲得了進程地址,就可以在v$process中找到spid,然后可以使用Kill或者orakill在系統級來殺掉這些進程.
實際上,我猜測:
當在Oracle中kill session以后, Oracle只是簡單的把相關session的paddr 指向同一個虛擬地址.
此時v$process和v$session失去關聯,進程就此中斷.
然后Oracle就等待PMON去清除這些Session.所以通常等待一個被標記為Killed的Session退出需要花費很長的時間.
如果此時被Kill的process,重新嘗試執行任務,那么馬上會收到進程中斷的提示,process退出,此時Oracle會立即啟動PMON
來清除該session.這被作為一次異常中斷處理.
-The End-
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
原文地址:http://space.itpub.net/22578826/viewspace-702988
很多時候由于異常或程序錯誤會導致個別進程占用大量系統資源,需要結束這些進程,通常可以使用以下命令Kill進程:
alter system kill session 'sid,serial#';
但是此命令釋放資源極為緩慢,為了更快速的釋放資源,通常我們使用如下步驟來Kill進程:
1.首先在操作系統級kill進程
2.在數據庫內部kill session
這樣通常可以快速中止進程,釋放資源。
今天就遇到這樣一個案例,其他朋友在數據庫里kill session,可是長時間仍無效果:
[oracle@danaly ~]$ sqlplus "/ as sysdba"
SQL*Plus: Release 10.2.0.1.0 - Production on Thu Oct 27 11:09:50 2005
Copyright (c) 1982, 2005, Oracle. All rights reserved.
Connected to:
Oracle Database 10g Enterprise Edition Release 10.2.0.1.0 - Production
With the Partitioning, Oracle Label Security, OLAP and Data Mining Scoring Engine options
SQL> select sid,username,status from v$session;
SID USERNAME STATUS
---------- ------------------------------ --------
....
154 SCOTT KILLED
...
30 rows selected.
那按照我前面提到的步驟,首先查詢得到該session對應的OS進程號:
SQL> select 'kill -9 '||spid from v$process where addr = (select paddr from v$session where sid=&sid);
Enter value for sid: 154
old 1: select 'kill -9 '||spid from v$process where addr = (select paddr from v$session where sid=&sid)
new 1: select 'kill -9 '||spid from v$process where addr = (select paddr from v$session where sid=154)
'KILL-9'||SPID
--------------------
kill -9 22702
SQL> !
在操作系統級kill該進程:
[oracle@danaly ~]$ ps -ef|grep 22702
oracle 22702 1 0 Oct25 ? 00:00:02 oracledanaly (LOCAL=NO)
oracle 12082 12063 0 11:12 pts/1 00:00:00 grep 22702
[oracle@danaly ~]$ kill -9 22702
[oracle@danaly ~]$ ps -ef|grep 22702
oracle 12088 12063 0 11:12 pts/1 00:00:00 grep 22702
[oracle@danaly ~]$ exit
exit
SQL> select sid,username,status from v$session;
SID USERNAME STATUS
---------- ------------------------------ --------
...
154 SCOTT KILLED
...
30 rows selected.
SQL> select sid,serial#,username from v$session where sid=154;
SID SERIAL# USERNAME
---------- ---------- ------------------------------
154 56090 SCOTT
再次在數據庫中kill該session,并指定immediate選項:
SQL> alter system kill session '154,56090' immediate;
System altered.
SQL> select sid,serial#,username from v$session where sid=154;
no rows selected
此時該進程被迅速清除。
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
原文地址:http://space.itpub.net/17203031/viewspace-683786
Kill會話過程分析
在實際開發中,我們常常需要將用戶的會話強制斷開。比如:事務執行超時、代碼出現死循環、死鎖或者無意中將數據表鎖住。這個使用kill session是很實用的方法。那么,kill session的時候,系統究竟發生了什么呢?
基礎知識
用戶連接到數據庫,涉及到幾個對象。首先是監聽器,我們常常使用的本地命名服務(tnsname.ora),實際上連接的就是監聽器。但是,對于我們連接過程來說,與監聽器打交道的時間還是很短暫的(詳細可以見筆者其他討論監聽器和連接的文章)。其次是Server Process,是客戶端應用在數據庫服務器上的操作代表。所有對于數據庫實例、數據文件和SGA的操作,實際執行都是Server Process來進行的。最后就是以PMON為代表的后臺進程(影子進程),他們負責管理實例的方方面面,保證各方面職能正確實現。
另一個邏輯層次上,用戶會話session是一個重要概念。在特定的情況下,我們可以說用戶與數據庫的交互,就是在一個持續的session中完成。在一個session中,用戶可以執行多個事務,可以處在閑置狀態(Inactive)。
在任何情況下,如果我們強制性的斷開連接,放開session(主動)。PMON后臺進程會主動的做回收處理工作(在繁忙的時候存在延時)。回收包括清理會話信息,回滾未提交事務,釋放Server Process資源(專用模式下)。
在一些時候,我們可以借助alter system kill session ‘sid, serial#’;來手工強制斷開用戶連接。那么,Oracle進行kill的時候,究竟發生了什么呢?讓我一起來研究。
實驗環境構建
Connected to Oracle Database11gEnterpriseEdition Release11.2.0.1.0
Connected as SYS
//查看組件版本:使用SYS登錄
SQL> select * from v$version;
BANNER
--------------------------------------------------------------------------------
Oracle Database11gEnterpriseEdition Release11.2.0.1.0 - Production
PL/SQL Release11.2.0.1.0 - Production
CORE 11.2.0.1.0 Production
TNS for Linux: Version11.2.0.1.0 - Production
NLSRTL Version11.2.0.1.0 - Production
首先,為了簡便,筆者啟動了PL/SQL Developer,并且打開一個Command窗口。之后,啟動一個sqlplus窗口,觀察這個窗口對應的會話情況。
在sqlplus窗口中。
SQL> conn scott/tiger@wilson
已連接。
觀察會話情況,查詢v$session。
SQL> select saddr, sid, serial#, paddr, username, program,action,status from v$session where username in ('SYS','SCOTT');
SADDR SID SERIAL# PADDR USERNAME PROGRAM ACTION STATUS
-------- ----- ---------- -------- ---------- --------------- --------------- --------
382F0074 1 64 38BC6C94 SCOTT sqlplusw.exe INACTIVE
382B30C0 24 80 38BC61BC SYS plsqldev.exe Main session INACTIVE
3829B2F4 33 10 38BC8244 SYS plsqldev.exe Command Window ACTIVE
- New
可以發現,會話中多了三個session。兩個用戶名SYS的會話是PL/SQL Developer開啟的(原理見之前博客內容)。另一個SCOTT用戶開啟的sqlplusw.exe是我們的實驗對象,發現其sid=1,Serial#=64。會話對應的Server Process物理地址為38BC6C94。
之后,我們查找的對應的server Process信息,從v$process。
SQL> select addr,pid,spid,username,serial#,program from v$process where addr='38BC6C94';
ADDR PID SPID USERNAME SERIAL# PROGRAM
-------- ---------- ------------------------ ---------- ---------- -------------------------
38BC6C94 25 5803 oracle 23 oracle@oracle11g
我們可以看出,Scott用戶會話SID=1對應的Server Process,進程編號為5803(PID為Oracle相關進程的內部編號,SPID表示的是操作系統級別)。
最后,我們查看操作系統級別進程信息。
[oracle@oracle11g~]$ ps -ef | grep LOCAL
oracle 5780 1 0 05:47 ? 00:00:03 oraclewilson (LOCAL=NO)
oracle 5788 1 0 05:48 ? 00:00:00 oraclewilson (LOCAL=NO)
oracle 5803 1 0 05:50 ? 00:00:00 oraclewilson (LOCAL=NO) //對于的那個Server Process
實驗kill會話。
在觀察PL/SQL Developer里,將SCOTT會話斷開。
SQL> alter system kill session '1,64';
System altered
Kill操作執行完成,沒有報錯。那么,這個會話信息真的被刪除了嗎?我們重新檢查v$session。
//發現,會話SCOTT(SID=1,Serial#=64信息還存在)
SQL> select saddr, sid, serial#, paddr, username, program,action,status from v$session where username in ('SCOTT');
SADDR SID SERIAL# PADDR USERNAME PROGRAM ACTION STATUS
-------- ----- ---------- -------- ---------- ------------------------- --------------- --------
382F0074 1 64 38058594 SCOTT sqlplusw.exe KILLED
//按照原來的Server Process地址查找Server Process信息還存在;
SQL> select addr,pid,spid,username,serial#,program from v$process where addr='38BC6C94';
ADDR PID SPID USERNAME SERIAL# PROGRAM
-------- ---------- ------------------------ ---------- ---------- -------------------------
38BC6C94 25 5803 oracle 23 oracle@oracle11g
“怪事”發生了,我們kill掉了會話。但是會話信息還存在,與剛才的結果區別是兩個:其一為會話的狀態變為了KILLED狀態,表示已經被kill。其二是對應Server Process的地址被修改,該到了38058594的位置上。
而查看v$process進程視圖,發現原來為其服務的Server Process信息仍然存在!那么,是真的存在嗎?我們查看操作系統層面:
[oracle@oracle11g~]$ ps -ef | grep LOCAL
oracle 5780 1 0 05:47 ? 00:00:03 oraclewilson (LOCAL=NO)
oracle 5788 1 0 05:48 ? 00:00:00 oraclewilson (LOCAL=NO)
oracle 5803 1 0 05:50 ? 00:00:00 oraclewilson (LOCAL=NO)
看來Server Process確實存在。那么這個新Server Process地址38058594是什么呢?
SQL> select addr,pid,spid,username,serial#,program from v$process where addr='38058594';
ADDR PID SPID USERNAME SERIAL# PROGRAM
-------- ---------- ------------------------ ---------- ---------- -------------------------
綜合上述:在kill的時候,Oracle做了兩件事。一件是將會話的狀態修改了KILLED,相當于打了一個標記。第二件是通過將會話對應的Server Process地址修改為一個虛擬地址,切斷會話信息與Server Process的映射關聯。此外,Server Process并沒有回收。
等待一會之后,發現依然如此!沒有PMON主動的回收動作。
那么,如果此時被kill掉的會話發起一個操作,如何?
在sqlplus上:
SQL> select * from emp;
select * from emp
*
第1行出現錯誤:
ORA-00028:您的會話己被終止
被斷開的會話拒絕操作,告知說會話已經被終止。
此時,系統還能查看到這個會話信息嗎?
SQL> select saddr, sid, serial#, paddr, username, program,action,status from v$session where username in ('SCOTT');
SADDR SID SERIAL# PADDR USERNAME PROGRAM ACTION STATUS
-------- ----- ---------- -------- ---------- ------------------------- --------------- --------
SQL> select addr,pid,spid,username,serial#,program from v$process where addr='38BC6C94';
ADDR PID SPID USERNAME SERIAL# PROGRAM
-------- ---------- ------------------------ ---------- ---------- -------------------------
38BC6C94 25 5803 oracle 23 oracle@oracle11g
結論:當我們在原有窗口執行操作,嘗試會話通信時,被拒絕。通過視圖查詢,發現原有被kill的會話信息被回收。但是Server Process還存在在視圖上,但不與任何會話對應。
那操作系統層面上:
[oracle@oracle11g~]$ ps -ef | grep LOCAL
oracle 5780 1 0 05:47 ? 00:00:03 oraclewilson (LOCAL=NO)
oracle 5788 1 0 05:48 ? 00:00:00 oraclewilson (LOCAL=NO)
oracle 5803 1 0 05:50 ? 00:00:00 oraclewilson (LOCAL=NO)
該Server Process還存在,沒有回收。
注意:當我們關閉掉sqlplusw窗口之后,也就是我們關掉客戶端的時候,我們再次查詢發現:
[oracle@oracle11g~]$ ps -ef | grep LOCAL
oracle 5780 1 0 05:47 ? 00:00:03 oraclewilson (LOCAL=NO)
oracle 5788 1 0 05:48 ? 00:00:00 oraclewilson (LOCAL=NO)
Server Process被回收,v$process自然也應當沒有對應記錄存在了。
SQL> select addr,pid,spid,username,serial#,program from v$process where addr='38BC6C94';
ADDR PID SPID USERNAME SERIAL# PROGRAM
-------- ---------- ------------------------ ---------- ---------- -------------------------
38BC6C94 255956 oracle 26 oracle@oracle11g(J000)
誒,為什么有記錄呢?仔細看看:SPID已經發生變化,不是5803,而是5956,是一個新啟動的進程。只是使用了剛剛被釋放的地址。
結論:駐留在數據庫服務器的Server Process會一直存在,直到客戶端應用斷開連接,不在于Server Process通信。注意,這時如何客戶端重新連接conn,客戶端是重新與監聽器溝通,獲取一個新的Server Process重定向,不會找過去的那個舊Server Process。一旦重新登錄,舊的Server Process就會被回收釋放掉。
綜上所述:在kill研究中,我們搞清楚了幾個方面問題:
1、alter system kill session:只是將session標記為可以回收,切斷會話與Server Process的映射關系。沒有進行資源釋放回收工作;
2、一旦嘗試連接,PMON會主動開始清理被kill的會話,同時Oracle拒絕連接操作;
3、Server Process是一個忠實于客戶端的進程,只要客戶端還在啟動,維持著兩個之間的聯系。Server Process是不會被回收的。直到客戶端主動停止與Server Process的通信,Server Process釋放;
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
原文地址:http://space.itpub.net/17203031/viewspace-684039
Kill會話過程分析(二)
本文為筆者“Kill會話過程分析”(http://space.itpub.net/17203031/viewspace-683786)的續篇。做一些更深入的分析。
我們知道,當需要強制斷開一個會話的時候,可以通過SQL命令alter system kill session ‘sid, serial#’;強制的將會話斷開。其中,SID為會話的編號,Serial為會話的系列號。這兩個值是唯一標志Oracle一個會話。而會話的相關信息,可以通過查詢v$session視圖來獲取到。
根據前文我們的分析,認為alter system kill session命令是存在一些不足的。
首先,kill session命令是在會話層面的強制斷開。本質上相當于進行了一個標志,切斷了Server Process與會話之間的映射關系。會話所占有的資源是不會直接被回收;
其次,kill session命令在一些特殊場合,應對效果不佳。比如在Oracle Job里面運行的時候,是不能定位到相應的會話對象的。
最后,一些緊急的時候,kill session還存在一些適應性較差的情況。比如當前根本無法登陸SQL命令窗口;
那么,比kill session更有效直接的做法是什么呢?針對Server Process的kill操作,也就是OS操作系統級別的kill。當我們不能夠使用alter system kill session或者使用其無效的時候,可以考慮使用這種方法。
首先,我們研究一些Linux環境。選擇是專用連接模式。
在沒有連接的時候,我們查看連接情況。
[oracle@oracle11g~]$ ps -ef | grepwilson| grep -v grep
oracle 5583 1 0 02:52 ? 00:00:00 ora_pmon_wilson
oracle 5585 1 0 02:52 ? 00:00:00 ora_vktm_wilson
……(篇幅原因,有省略部分)
oracle 5672 1 0 02:52 ? 00:00:00 ora_q001_wilson
oracle 5700 1 0 02:57 ? 00:00:00 ora_smco_wilson
oracle 5702 1 0 02:57 ? 00:00:00 ora_w000_wilson
在沒有連接的時候,進程列表中只能看到實例多個background process的運行情況。此時,我們連入一個客戶端。查看進程情況:(為省略篇幅,設置篩選條件)
[oracle@oracle11g~]$ ps -ef | grep LOCAL | grep -v grep;
oracle 5777 1 1 03:09 ? 00:00:00oraclewilson (LOCAL=NO)
[oracle@oracle11g~]$
連入了一個客戶端,在專用模式下有一個Server Process與之關聯。這里對各列含義略作說明。
第一列表示執行用戶Owner,第二列是PID,表示進程的系統唯一編號。第三列表示該進程的父進程PPID編號,就是該進程是由哪個進程啟動的。之后有兩個時間值,分別為進程啟動到現在時間與占用CPU時間。最后一列一般為啟動命令行。
其中,我們比較關注的就是PID。PID唯一的標識,如果強制終止這個進程,我們就可以強制的結束會話(皮之不存,毛將焉附)。同時,在OS層面的強制終止,進程會話對應的資源可以直接回收。
在Unix/Linux平臺下,可以使用kill -9 PID,實現刪除。
[oracle@oracle11g~]$ kill -9 5777//終止
[oracle@oracle11g~]$ ps -ef | grep LOCAL | grep -v grep;//確認
[oracle@oracle11g~]$
使用后,操作系統進程樹上的Server Process被清除。此時,連接的客戶端如果發起請求。
//之前建立的連接
SQL> conn scott/tiger@wilson
已連接。
//kill之后,嘗試連接
SQL> select count(*) from emp;
select count(*) from emp
*
第1行出現錯誤:
ORA-03113:通信通道的文件結束//報錯!
使用kill -9命令,還可以對background process進程進行管理,對一些問題進程進行殺死重建,也是我們經常使用的手段。
結論:在Linux平臺上,當需要在操作系統級別進行kill的時候,可以使用kill -9命令。
接下來,我們在Windows平臺上,就有一些問題了。由于體系結構的不同,Oracle在Windows下實現的實例結構,并不是多進程架構方式,而采用的是多線程模式。Unix/Linux下的background process和Server Process,成為了一個ORACLE.exe進程里的線程。那么,這種情況下,我們如何處理?
為了應對這種情況,Oracle提供了一個為orakill.exe的命令。這個命令本質上和alter system kill session的功能相同,但是不需要登錄連接數據庫。只需要輸入線程編號和SID就可以。
這樣,問題轉化為我們如果獲取到一個線程的線程編號。在Windows平臺上,有很多查看線程的工具。如Qslice.exe、QuickSlice.exe以及Pstat。
語法:orakill <sid> <thread>;
其中,sid為Oracle的sid號。Thread為會話對應的線程的編號。我們可以通過v$session和v$process的信息獲取。
SQL> select b.username, a.spid, b.username, b.sid, b.osuser, b.action
2 from v$process a, v$session b
3 where a.ADDR=b.PADDR and b.username='SYS';
USERNAME SPID USERNAME SID OSUSER ACTION
--------- ------------ ---------- ------------------------------ --------------------------------
SYS 1464 SYS 152 WWW-0E6111DFF74\Administrator Command Window - New
SYS 632 SYS 141 WWW-0E6111DFF74\Administrator Main session
注意下v$process的SPID列。在Linux/Unix環境下,這個列的SPID表示Process的編號。在Windows環境下,這列就表示在ORACLE.exe進程下的線程編號。
我們嘗試刪除命令窗口線程(SPID=1464)。
C:\>orakill orcl 1464
Kill of thread id1464 ininstance orcl successfully signalled.
命令窗口再次嘗試連接時。
SQL> select count(*) from dba_objects;
Warning: connection was lost and re-established
說明:連接被切斷。
此外,orakill命令也可以在SQL命令提示中使用。
SQL> host orakill orcl 3140
Kill of thread id3140 ininstance orcl successfully signalled.
SQL>
結論:在Windows平臺上,可以使用orakill工具進行session和server的殺死工作。
最后,筆者還要強調一下。無論是kill session還是kill -9操作,都是一種危險的操作,特別是在生產環境下。原因在于,后臺進程特別是核心后臺進程(PMON,SMON,DBWN,LGWR)如果被誤刪除,相當于實例死掉,是一件重大事故。在沒有確認需要、沒有專業人員許可的情況下,盡可能的選取破壞性小的方案進行處理。
上述就是小編為大家分享的Oracle 徹底 kill session的示例分析了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關知識,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。