基于SIP的集中式視頻會議模型介紹
張俊九 2007/09/27
近幾年來,隨著計算機技術、通信技術和互聯(lián)網(wǎng)技術的飛速發(fā)展,視頻會議的應用范圍正逐漸從傳統(tǒng)的專業(yè)領域、大型企業(yè)等高端用戶向中小企業(yè)等普通用戶和個人用戶拓展。據(jù)有關機構的分析結果顯示,2004年我國視頻會議市場的規(guī)模已經(jīng)達到18.7億元,并以每年26%的速度遞增,市場前景十分廣闊。
視頻會議系統(tǒng)的主流技術標準
目前,視頻會議系統(tǒng)的主流技術標準有2個,H.323和SIP。前者是由ITU-TSG16定義,包括H.225呼叫控制信令和RAS信令、H.245媒體控制信令和H.450補充業(yè)務信令規(guī)范;后者由IETFMMUSIC工作組定義,包括SDP媒體描述規(guī)范。
H.323系統(tǒng)沿用傳統(tǒng)電信網(wǎng)的設計理念,兼顧傳統(tǒng)PSTN呼叫流程和IP網(wǎng)特點而發(fā)展成熟,吸取了許多電信網(wǎng)的組網(wǎng)、互聯(lián)和運營經(jīng)驗,能與PSTN網(wǎng)、窄帶視頻業(yè)務以及其他數(shù)據(jù)業(yè)務和應用網(wǎng)互聯(lián)互通,近年來得到了廣泛的應用,尤其是在組建VoIP大網(wǎng)方面凸現(xiàn)了其技術優(yōu)勢。H.323協(xié)議范圍廣,涵蓋了各種獨立設備、個人計算機技術以及點對點和點對多點的視頻會議,該協(xié)議解決了視頻會議中呼叫與會話控制、多媒體與帶寬管理等許多問題。也正是因為H.323系統(tǒng)在設計的時候考慮的問題太多,整個體系結構顯得龐大且較為復雜,限制了其在中小企業(yè)的部署。
SIP是用來建立、修改和終結多媒體會話的應用層控制協(xié)議,主要完成用戶定位、用戶能力交換、呼叫建立、呼叫處理等功能。它繼承了互聯(lián)網(wǎng)協(xié)議的設計理念,與H.323協(xié)議相比,具有簡單靈活、擴展方便的特點,可方便地與其他互聯(lián)網(wǎng)協(xié)議結合提供豐富的IP多媒體業(yè)務,以便在各種網(wǎng)絡環(huán)境下部署。
目前,大規(guī)模商用VoIP網(wǎng)絡和會議系統(tǒng)都采用H.323標準,但隨著VoIP技術的進一步發(fā)展和視頻會議系統(tǒng)應用的逐漸普及,SIP協(xié)議正日益受到業(yè)界的重視。3GPP已經(jīng)確定將SIP協(xié)議作為第三代移動通信全IP網(wǎng)絡的控制協(xié)議,制訂了基于SIP的IP多媒體子系統(tǒng)(IMS)。業(yè)界也已經(jīng)確定將SIP作為下一代網(wǎng)絡(NGN)的核心控制協(xié)議。與此同時,SIP協(xié)議及其應用的標準化工作也在積極的進行之中,這其中就包括由IETFSIPPING工作組領導的集中式多媒體會議的標準化工作和XCON工作組領導的會場控制和CPCP(ConferencePolicyControl
Protocol)的標準化工作。隨著這些標準的制訂,基于SIP的視頻會議系統(tǒng)必將獲得越來越廣泛的應用。
集中式會議系統(tǒng)模型
下面介紹一種基于SIP的集中式會議模型。所謂集中式是指該模型相對于多播會議、全分布式會議等會議模型而言,具有信令集中控制、媒體集中處理的特點。該會議模型也是應用最廣泛的一種情形。
該模型主要包括與會者(Participant)、會議控制中心(Focus)、會議策略服務器(CPS)、會議策略(CP)、會議通告服務(CNS)、媒體混合服務器(Mixer)等邏輯功能模塊。其中,F(xiàn)ocus、CPS、CNS、CP和Mixer構成會議服務器,完成多媒體會議的核心功能。此會議模型中各模塊功能如下。
a)會議的控制中心:會議的控制中心與每個與會者之間存在SIP對話聯(lián)系。它一方面根據(jù)會議成員策略管理整個會議,如會議接入控制、與會人員管理等,另一方面它又根據(jù)會議媒體策略,對媒體混合服務器進行控制,保證每個與會者能夠接收到會議的媒體流。
每一個會議控制中心都有一個會議URI與其相對應,此URI在全局范圍內(nèi)是惟一的。當用戶需要加入會議時,需向相應會議URI發(fā)送INVITE請求。
b)與會者:與會者是指會議中和會議控制中心維持SIP對話的SIP用戶代理。此用戶代理可以是PC應用程序、SIP電話或者是PSTN網(wǎng)關,也可以是其他會議控制中心。當與會者是其他會議的會議控制中心時,會議的拓撲結構是分級的,這種會議結構具有良好的可擴展性,所有區(qū)域性的子會議有單獨的會議控制中心,這些會議控制中心再連接到主會議的會議控制中心上,進行分級控制和管理。
c)CPS:CPS是系統(tǒng)的邏輯功能模塊,用來存儲和操作會議策略,為用戶和支配會議操作的會議策略之間提供接口。用戶可以使用non-SIP方法和CPS交互,完成會議策略的制定、修改等操作。
d)CP:會議策略包含了支配會議控制中心進行會議操作的規(guī)則,一個會議對應一個會議策略,包括會議成員策略和會議媒體策略。會議成員策略主要用于會議成員的管理,包括用戶接入控制、用戶權限管理等。會議媒體策略用于會議媒體混合及分發(fā)的控制,包括媒體混合策略、同步策略、媒體分發(fā)策略等。用戶可以通過Web方式或其他non-SIP方式對會議策略進行維護。
e)CNS:會議控制中心可以提供CNS功能,工作機制由RFC3265定義,主要完成向與會人員通知相應的會議事件和會議狀態(tài)。與會者在加入會議后可向會議控制中心發(fā)送SUBSCRIBE請求,訂閱會議事件和狀態(tài)通知服務。會議通知服務器將通過NOTIFY消息定時向與會者通告預定的會議事件和會議狀態(tài)。例如,用戶可以預定會議成員的在席信息,當有與會者加入或退出會議時,會議通知服務器將向該用戶發(fā)送會議成員變更的情況。
f)媒體混合服務器:媒體混合服務器負責完成會議媒體的混合和分發(fā),接收者可以是會議的與會者或其他的媒體混合服務器。媒體流的混合處理由會議控制中心根據(jù)媒體策略進行直接或間接控制,處理過程因媒體流類型的不同而不同。
視頻會議系統(tǒng)結構設計
根據(jù)前面介紹的會議模型以及多媒體會議的一般功能要求,我們設計了一個視頻會議系統(tǒng)的實現(xiàn)方案。
該系統(tǒng)由多媒體會議終端、會議管理服務器、會議控制服務器、媒體服務器和系統(tǒng)數(shù)據(jù)庫5部分構成。呼叫服務器(CS)是SIPProxy服務器,負責SIP消息的轉發(fā),并集成了注冊服務器的功能。
下面分別介紹各組成部分的功能。
1.多媒體會議終端
多媒體會議終端是用戶用來參加會議的桌面應用程序。會議終端啟動時會發(fā)送REGISTER消息向注冊服務器注冊,注冊成功后便保持在線狀態(tài),可以隨時發(fā)起呼叫或接收呼叫請求。在加入會議后,可以發(fā)送SUBSCRIBE請求,預定會議狀態(tài)信息報告,以便獲得最新的會議狀態(tài)變更情況。與會者可通過多媒體會議終端進行申請發(fā)言、釋放申請、釋放發(fā)言等操作?梢赃M行即時消息的發(fā)送和接收,實現(xiàn)會議文字聊天功能。
2.會議管理服務器
會議管理服務器在圖2中對應為Web服務器,主要完成通過Web界面管理會議的功能,包括會議的預定、修改和取消,會議策略的制定和修改等。另外,還可以通過會議管理服務器對會議控制服務器的系統(tǒng)參數(shù)進行配置,并提交到系統(tǒng)數(shù)據(jù)庫保存。會議控制服務器在啟動時可以從系統(tǒng)數(shù)據(jù)庫將系統(tǒng)參數(shù)下載到本地,進行系統(tǒng)的初始化。
3.會議控制服務器
會議控制服務器是此系統(tǒng)的控制中心,模型中的會議控制中心功能,包括會議的創(chuàng)建、啟動、刪除、會場管理和控制、會議狀態(tài)信息的采集和發(fā)布、會議成員的在席管理、處理會議成員請求等。會議控制服務器通過MEGACO/H.248命令對媒體服務器的媒體混合處理進行控制。
會議控制服務器主要由總控模塊、Web管理模塊、啟動/注冊模塊、即時會議模塊、會議狀態(tài)通告模塊、會議控制模塊和會議列表等幾部分組成。其中總控模塊主要負責系統(tǒng)的初始化工作和各個模塊之間的通信調(diào)度等功能;啟動/注冊模塊主要負責會議的啟動和結束等操作;會議狀態(tài)通告模塊負責完成會議狀態(tài)信息通知服務,遵從RFC3265標準;會議控制模塊是會議控制服務器的主要功能模塊,采用基于事件觸發(fā)的工作機制。會議列表負責維護會議的狀態(tài)信息,包括會議屬性、成員列表、請求隊列和消息隊列等,并提供對這些數(shù)據(jù)進行操作的接口函數(shù)。
4.媒體服務器
媒體服務器可采用純軟件方式實現(xiàn)媒體混合等處理,與傳統(tǒng)的采用硬件板卡的方式相比,具有巨大的成本優(yōu)勢。會議控制服務器通過MEGACO/H.248命令控制媒體服務器,完成創(chuàng)建關聯(lián)域、增加終端、刪除終端、修改終端屬性、刪除關聯(lián)域等操作。媒體服務器接收與會者發(fā)來的媒體流,按照媒體策略進行混合后,再分發(fā)給與會者,從而實現(xiàn)會議媒體流的交互。
視頻會議系統(tǒng)工作原理
在介紹了集中式視頻會議系統(tǒng)的結構之后,下面簡單介紹此系統(tǒng)的工作原理。
1.創(chuàng)建會議
此系統(tǒng)支持預約式會議和即時會議2種會議類型。
預約式會議的創(chuàng)建可通過Web管理系統(tǒng)來完成。會議預定成功后,將向系統(tǒng)數(shù)據(jù)庫的會議數(shù)據(jù)表插入一條記錄。會議控制服務器的Web管理模塊對系統(tǒng)數(shù)據(jù)庫的會議數(shù)據(jù)表進行周期掃描,若發(fā)現(xiàn)新的會議記錄,則按照預定要求生成新的會議節(jié)點,添加到會議列表中。
即時會議的創(chuàng)建可通過多媒體會議終端完成。用戶只需向指定的會議工廠URI發(fā)送INVITE請求即可創(chuàng)建一個即時會議。新會議的URI由302響應的Contact頭域帶回。
2.加入會議
與會者可以通過以下5種方式加入到會議中:
a)Call-In方式。用戶可通過E-mail、Web公告、即時消息等方式事先獲得會議URI,然后向會議URI發(fā)送INVITE消息,請求加入會議。
b)Call-Out方式。會議開始后,會議控制中心向用戶發(fā)送INVITE消息,邀請其加入會議。會議控制中心需事先存儲與會者的URI列表。
c)第三方通過向會議URI發(fā)送REFER請求,觸發(fā)會議控制中心邀請用戶加入會議。
d)第三方通過向用戶發(fā)送REFER請求,觸發(fā)用戶主動加入會議。
e)若用戶不知道會議URI,但可能通過其他途徑獲得會議中的某一個會話ID,則可通過發(fā)送帶有Join頭域的INVITE消息來加入會議。
3.會議狀態(tài)信息通告機制
與會者在會議進行期間可以獲得會議的事件及狀態(tài)信息,這通過會議通告服務(CNS)來實現(xiàn)。如圖4中的F9-F12所示,與會者在加入會議后可向會議控制中心發(fā)送SUBSCRIBE請求。訂閱感興趣的會議事件和狀態(tài)通知的服務,當某類事件發(fā)生或會議的狀態(tài)發(fā)生變化時,會議通告服務器將生成狀態(tài)報告的事件包,通過NOTIFY請求發(fā)送給訂閱者,通告發(fā)生的事件或狀態(tài)的變化情況。
4.會場控制機制
會場控制(FloorControl)是指對共享資源的訪問控制,如對發(fā)言權、視頻顯示等公共資源的控制。會場控制消息是在會議主席、會議服務器和會議成員之間傳遞的,可分為2部分:會議控制命令和會議控制事件。會議控制命令是從會議主席或經(jīng)過授權的會議參與者發(fā)往會議服務器的更改會場資源狀態(tài)的請求。而會議控制事件消息是一種關于會場資源狀態(tài)信息的報告,由會議服務器發(fā)往會議參與者。控制命令的內(nèi)容可以是添加會場資源、請求使用會場資源、主席批準/拒絕請求或改變會議策略等?刂剖录⻊t用來向會議參與者報告有關會場資源占用情況的變化、會議策略或媒體配置的變更等情況。
會場控制命令采用SOAP格式封裝,由SIP協(xié)議的INFO消息作為承載消息。會場控制事件消息的傳送可以通過會議狀態(tài)信息通告機制來實現(xiàn)。
5.結束會議
預約型會議的結束時間在預定時已經(jīng)確定,當會議的結束時間到,但會議中仍有與會者時,則會議控制中心向其發(fā)送BYE消息并將其刪除,然后執(zhí)行去注冊過程。去注冊成功后,會議控制服務器將此會議節(jié)點刪除。
即時會議因在創(chuàng)建時沒有確定結束時間,故不能依據(jù)會議的結束時間來結束會議。即時會議判斷結束的條件是會議中的與會者數(shù)目。當會議中的最后一個與會者退出會議后,認為會議結束,執(zhí)行去注冊過程,去注冊成功后即刪除會議節(jié)點。
結束語
目前,SIP多媒體會議的相關標準還在制定之中,相關技術的發(fā)展也很迅速,本系統(tǒng)所涉及的很多技術在實際應用中還需要進一步完善,尤其是會議策略控制技術、會場控制機制、會議級聯(lián)、子會議系統(tǒng)、會議安全機制以及商用模式下的計費方案等方面。
用基于SIP和SOAP相結合的會場控制機制,采用基于MEGACO/H.248協(xié)議控制的純軟件媒體服務器,可實現(xiàn)級聯(lián)會議、子會議系統(tǒng)等多種會議模式的媒體處理。該方案的實現(xiàn)對基于SIP的集中式視頻會議的研究具有一定的實踐和參考意義。
eNet硅谷動力(cio.enet.com.cn)
相關鏈接: