時間:2022-02-09 09:54:06
導語:在水印技術論文的撰寫旅程中,學習并吸收他人佳作的精髓是一條寶貴的路徑,好期刊匯集了九篇優(yōu)秀范文,愿這些內容能夠啟發(fā)您的創(chuàng)作靈感,引領您探索更多的創(chuàng)作可能。

關鍵詞:水泥混凝土;溫度;裂縫;原因;預防
Abstract: This paper is mainly about the cement concrete temperature cracks, the concrete temperature control and crack prevention measures are discussed.
Key words: concrete; temperature crack; reason; prevention;
中圖分類號:TU528.45 文獻標識碼:A文章編號:2095-2104(2012)
前言
長期以來,水泥混凝土工程的裂縫較為普遍,尤其在橋梁工程和路面工程中,裂縫更是不少。究其原因,主要涉及到混凝土的原材料、配合比、施工工藝及所處的環(huán)境因素等。水泥混凝土因所處環(huán)境中溫度的變化,造成應力的變化,從而產生破壞性裂縫,這是裂縫裂縫產生的重要原因。在施工中混凝土常常出現(xiàn)的溫度裂縫,破壞了結構的整體性和耐久性,對工程質量具有顯著的不容忽視的影響。
一、裂縫的原因
混凝土中產生裂縫有多種原因,主要是溫度和濕度的變化、混凝土的脆性和不均勻性、結構不合理、原材料不合格、模板變形以及基礎不均勻沉降等。
混凝土是一種脆性材料,抗拉強度是抗壓強度的1/10左右,短期加荷時的極限拉伸變形只有(0.6~1.0)×10-4, 長期加荷時的極限位伸變形也只有(1.2~2.0)×10-4。由于原材料不均勻,水灰比不穩(wěn)定,及運輸和澆筑過程中的離析現(xiàn)象,造成同一塊混凝土中其抗拉強度是不均勻的,存在著許多抗拉能力很低,易于出現(xiàn)裂縫的薄弱部位。在鋼筋混凝土中,拉應力主要是由鋼筋承擔,混凝土只是承受壓應力。在素混凝土內或鋼筋混凝上的邊緣部位如果結構內出現(xiàn)了拉應力,則須依靠混凝土自身承擔。一般設計中均要求不出現(xiàn)拉應力或者只出現(xiàn)很小的拉應力。但是在施工中混凝土由最高溫度冷卻到穩(wěn)定溫度,往往在混凝土內部引起相當大的拉應力,有時溫度應力可超過其它外荷載所引起的應力。因此掌握溫度應力的變化規(guī)律對于進行合理的結構設計和施工極為重要。混凝土硬化期間水泥放出大量水化熱,內部溫度不斷上升,在表面引起拉應力。后期在降溫過程中,由于受到基礎或老混凝上的約束,又會在混凝土內部出現(xiàn)拉應力。氣溫的降低也會在混凝土表面引起很大的拉應力。當這些拉應力超出混凝土的抗裂能力時,即會出現(xiàn)裂縫。許多混凝土的內部濕度變化很小或變化較慢,但表面濕度可能變化較大或發(fā)生劇烈變化。如養(yǎng)護不及時、時干時濕,表面干縮形變受到內部混凝土的約束,也往往因干縮導致裂縫。
二、 溫度應力的分析
2.1根據溫度應力的形成過程可分為三個階段。
早期:自澆筑混凝土開始至水泥放熱基本結束,一般約30天。這個階段的兩個特征,一是水泥放出大量的水化熱,二是混凝土彈性模量的急劇變化。由于彈性模量的變化,這一時期在混凝土內形成殘余應力。
中期:自水泥放熱作用基本結束時起至混凝土冷卻到穩(wěn)定溫度時止,這個時期中,溫度應力主要是由于混凝土的冷卻及外界氣溫變化所引起,這些應力與早期形成的殘余應力相疊加,在此期間混凝上的彈性模量變化不大。
晚期:混凝土完全冷卻以后的運轉時期。溫度應力主要是外界氣溫變化所引起,這些應力與前兩種的殘余應力相迭加。
2.2根據溫度應力引起的原因可分為兩類,這兩類溫度應力往往和混凝土的干縮所引起的應力共同作用。
自生應力:邊界上沒有任何約束或完全靜止的結構,如果內部溫度是非線性分布的,由于結構本身互相約束而出現(xiàn)的溫度應力。例如,橋梁臺身,結構尺寸相對較大,混凝土冷卻時表面溫度低,內部溫度高,在表面出現(xiàn)拉應力,在中間出現(xiàn)壓應力。
約束應力:結構的全部或部分邊界受到外界的約束,不能自由變形而引起的應力。如箱梁頂板混凝土和護欄混凝土。
三、溫度的控制和防止裂縫的措施
為了防止裂縫,減輕溫度應力可以從控制溫度和改善約束條件兩個方面著手。
3.1 控制溫度的措施
采用改善骨料級配,用干硬性混凝土,添加外加劑,如引氣劑或塑化劑等措施以減少混凝土中的水泥用量;在已經澆注完成的混凝土表面鋪設水管,養(yǎng)生的同時進行降溫處理;熱天澆筑混凝土時用水冷卻碎石,避開日最高溫度時段以降低混凝土的澆筑溫度;施工中長期暴露的混凝土澆筑塊表面或薄壁結構,在寒冷季節(jié)采取保溫措施;規(guī)定合理的拆模時間,氣溫驟降時進行表面保溫,以免混凝土表面發(fā)生急劇的溫度變化。
3.2 改善約束條件的措施
合理地設置伸縮縫及沉降縫;避免基礎開挖過大;合理的安排施工工序,避免過大的高差和側面長期暴露。改善混凝土的性能,提高抗裂能力,加強養(yǎng)護,防止表面干縮,特別是保證混凝土的質量對防止裂縫是十分重要。應特別注意避免產生通縫,出現(xiàn)后要恢復其結構的整體性是十分困難的。
當混凝土溫度高于氣溫時應適當考慮拆模時間,以免引起混凝土表面的早期裂縫。當拆模過早,會在表面引起很大的拉應力,出現(xiàn)“溫度沖擊”現(xiàn)象。但如果在拆除模板后及時在表面覆蓋一輕型保溫材料,如草簾海棉等,對于防止混凝土表面產生過大的拉應力,具有顯著的效果。
加筋對大體積混凝土的溫度應力影響很小,因為大體積混凝土的含筋率極低。只是對一般鋼筋混凝土有影響。在溫度不太高及應力低于屈服極限的條件下,鋼的各項性能是穩(wěn)定的,而與應力狀態(tài)、時間及溫度無關。在混凝土中想要利用鋼筋來防止細小裂縫的出現(xiàn)很困難。但加筋后結構內的裂縫一般就變得數(shù)目多、間距小、寬度與深度較小了。而且如果鋼筋的直徑細而間距密時,對提高混凝土抗裂性的效果較好。混凝土和鋼筋混凝土結構的表面常常會發(fā)生細而淺的裂縫,其中大多數(shù)屬于干縮裂縫。雖然這種裂縫一般都較淺,但它對結構的強度和耐久性仍有一定的影響。
為保證混凝土工程質量,防止開裂,提高混凝土的耐久性,正確使用外加劑也是減少開裂的重要措施之一。
關鍵詞:數(shù)字水印;離散小波變換(DWT);不可見性;魯棒性;中頻系數(shù)
中圖分類號:TP301文獻標識碼:A文章編號:1009-3044(2008)19-30137-04
Based on Wavelet Transform in Middle Frequency Watermarking Algorithm
JIANG Liang-hua, HAN Xiao
(Guilin University of Technology, Guilin 541004, China)
Abstract: Digital watermarking is to address information security and copyright protection effective, multimedia has become a hot field of information security technology. Existing digital watermarking technology algorithm mainly concentrated in the space domain to transform domain two, and discrete wavelet transform (DWT) owing to the time-frequency characteristics of the double, and the human visual system(HVS) to match the characteristics of the application of digital watermarking technology more and more widely. In this paper, to overcome the existing wavelet transform low-frequency and high-frequency domain algorithm embedded in the shortcomings raised from the wavelet transform part of the IF choice to be embedded coefficient, and in accordance with human visual characteristics of embedded strength to adjust. The experiment results show that the algorithm can not visible and the robustness of the compromise reached better.
Key words: Digital watermark; Discrete wavelet transform (DWT); Unobtrusiveness; Robustness; middle frequency parts
1 引言
隨著數(shù)字技術或因特網的發(fā)展,各種形式的多媒體數(shù)字作品(圖像、視頻、音頻等)紛紛以網絡形式發(fā)表。然而數(shù)字作品的便利性和不安全性并存的,它可以降低成本,高速度地被復制和傳播,這樣就為創(chuàng)造者和使用者提供了很大的便利,但這些特性也容易被盜版者利用,因而,采取多種手段對數(shù)字作品進行保護,對侵權者進行懲罰已經成為十分迫切的工作。除了與傳統(tǒng)作品版權保護相類似的法律和管理手段外,還應該針對數(shù)字作品本身的特點為其提供技術上的保護,數(shù)字水印技術的研究就是在這種應用下迅速發(fā)展起來的。數(shù)字水印是實現(xiàn)數(shù)字作品版權的有效方法,它通過在原始數(shù)據中嵌入秘密信息(水印)來證實該作品的所有權[2-4]。
數(shù)字水印技術主要集中在空間域和變換域兩類方法[1,3]。基于分塊的離散余弦變換(DCT)和離散小波變換(DWT)是常用的兩種變換。
在現(xiàn)有的DWT域數(shù)字圖像水印的兩大類方法中,在低頻部分(逼近子圖)嵌入水印盡管抗各種信號處理能力較強,但卻容易引起圖像質量下降,從而影響水印的不可見性;在高頻部分(細節(jié)子圖)嵌入水印可以保證圖像質量不會有較大的下降,但卻對各種信號處理敏感,水印的魯棒性不強。因此,如能通過適當?shù)钠胶猓瑢λ〉牟豢梢娦院汪敯粜跃C合考慮,將會提高水印系統(tǒng)的實用性。設計出一種既能保證不可見性又能獲得較好魯棒性的水印嵌入方法是本文的幕標。為實現(xiàn)這一目標,本文將以二維離散小波變換為基礎,結合自適應技術,通過對水印嵌入位置的自適應選擇(不同載體圖像選擇的嵌入位置不同)和嵌入強度的自適應調整,達到不可見性和魯棒性的最佳折中。
2 離散小波變換(DWT)[5]
小波變換是近幾年興起的的一個嶄新的信號分析理論。它具有良好的時域和頻域局部化特征。通過小波變換,信號被分解為不同頻段不同時段的各個成分。離散小波變換是對連續(xù)小波變換的尺度和位移按照2的冪次進行的離散化得到的,又稱二進制小波變換。離散小波變換可以表示為:
■
其中Ψ(t)是小波母函數(shù)。
實際上,人們是在一定尺度上認識信號的,人的感官和物理儀器都有一定的分辨率,對低于一定尺度的信號的細節(jié)是無法認識的,因此對低于一定尺度信號的研究也是沒有意義的。為此應該將信號分解為對應不同尺度的近似分量和細節(jié)分量。小波分解的意義就在于能夠在不同尺度上對信號進行分析,還能對不同尺度的選擇根據不同的目的來確定。信號的近似分量一般為信號的低頻分量,他的細節(jié)分量一般為信號的高頻分量,因此對信號的小波分解可以等效于信號通過了一個濾波器組,其中一個濾波器為低通濾波器,另一個為高通濾波。
如圖1為三級小波分解,可得到原圖像的多級分辨率子圖。
■
圖1 圖像DWT分解模型
其中最高層的低頻子圖集中了被分解圖像的絕大部分信急.刻畫了圖像的主體特征。所以被稱為分解圖像的逼近子圖,人眼對這部分比較敏感;而高頻子圖包含了圖像的細節(jié)信息,刻畫了圖像的邊緣信息,人眼對這部分比較不敏感,但是高頻部分包含圖像的邊緣信息,高頻部分任何的些微改動將影響到圖像的視覺效果。因而為了保持數(shù)字水印的魯棒性,在保證圖像的不可見性的前提下,常常將水印嵌入到圖像的低頻部分,使得圖像的不可見性和魯棒性得到最佳的交匯。
3 水印的嵌入與檢測算法
3.1 水印嵌入算法
3.1.1 水印生成算法
作為版權保護的初始水印大多為有意義的二值圖像或二值圖標,在嵌入之前,往往需要對其進行預處理,以適應嵌入算法。由于本文采用小波變換嵌入水印,而小波變換后系數(shù)有正有負,所以需要對原始水印數(shù)據(讀取二值圖像得到的0,1序列)進行值域轉化,使其變成雙極性序列{-1,1}本文轉換方法比較簡單,直接將二值水印序列中的“0”變?yōu)椤?1”,而“1”不變。算法如下:
■(1)
式中,mk為原始水印信息(mk∈{0,1}),M為水印長度,ω為變換后的一維水印序列。
3.1.2 嵌入位置選擇
為了使水印不可見性和魯棒性得到最佳折中,應該在小波變換中頻部分嵌入水印。cox等提出水印應該嵌入到視覺感知最重要(幅值最大)的分量上,其理由是感覺上重要的分量是圖像信號的主要成分,攜帶的信號能量較多,在圖像有一定失真的情況下,仍能保留主要成分。根據文獻,水印應按小波分解頻帶重要性由高到低的順序嵌入(一層小波分解頻帶重要性由高到低為:LL3、HL3、LH3、HH3、HL2、LH2、HH2. HL1、LH1、HH1)。由此,本文采用層閾值法從小波變換中頻子帶HL3、LH3、HH 3、HL2、LH2、HH2中選擇 個視覺感知重要的系數(shù),作為待嵌入水印的系數(shù)。
選擇系數(shù)的過程如下:①為每層設置一個初始閾值■,Cj為第j層所有數(shù)絕對值的最大者(j=2,3),按照先第三層、后第二層的順序,選擇幅值(絕對值)超過Tj,的系數(shù),設第三層選中的系數(shù)個數(shù)為N3第二層選中的系數(shù)個數(shù)為N2;②若選出的系數(shù)的總個數(shù)少于M(水印序列長度),即N3+N2
3.2 水印嵌入算法
為了保證嵌入水印后的圖像質量和水印對信號處理的魯棒性,水印應嵌入到原始載體圖像的中頻部分,為了達到水印不可見性和魯棒性的最佳折中,對水印的嵌入強度進行自適應調整。原始載體圖像為灰度圖像時水印嵌入過程如下[6]:
第一步,將原始圖像進行三層小波分解(考慮到JPEG2000壓縮也是進行三層小波分解),得到10幅子圖,記為LL3、HL3、LH3、HH3、HL2、LH2、HH2、HL1、LH1、HH1。
第二步,按照上文所述系數(shù)選擇方法,從HL3、LH3、HH3、HL2、LH2、HH2中選出M個(水印序列長度)待嵌入水印的系數(shù)。
第三步,按照乘性規(guī)則,將二值水印序列嵌入到第二步選出的待嵌入系數(shù)上(用水印序列去修改選出的待嵌入系數(shù)),嵌入時,根據待嵌入系數(shù)所在的層及子帶方向,對嵌入強度進行自適應調整。嵌入水印的公式如下:
■(2)
其中,Xi,j,Xwi,j分別為嵌入水印前和嵌入水印后的小波系數(shù),(i,j)為嵌入位置坐標,ω={ωk,0≤k≤M}為水印序列,a為全局嵌入強度(可調),ρlθ為考慮頻率掩蔽特性的局部加權因子,l為系數(shù)所在的層(l=2,3),θ為系數(shù)字帶方向(θ∈{HL,LH,HH})。本文采用的計算公式為
■ (3)
由于人眼對高頻部分不敏感,所以高頻部分應采用較大的嵌入強度。在一小波分解示意圖中,第一層的頻率最高,第三層的頻率最低,同一層中,HH子帶的頻率最高,LL子帶的頻率最低。所以上式中第2層比第3層采用較大的加權因子,HH子帶比其已子帶采用較大的加權因子,很好地匹配了人類視覺系統(tǒng)的頻率掩蔽特性。
第四步,將嵌入水印后的系數(shù)(包括被水印修改的系數(shù)和未被水印修改的系數(shù))進行三層小波逆變換,得到含水印圖像。
當原始圖像為RGB彩色圖像時,應首先將圖像數(shù)據轉化為YUV格式,然后利用上述步驟將水印嵌入到Y分量子圖三層小波變換后的系數(shù)上,最后再將嵌入水印后的Y分量子圖結合U、V分量子圖重構RGB彩色圖像。RGB格式與YUV格式相互轉化的公式如下[5]:
■ (4)
■(5)
3.3 水印提取算法
水印的提取算法恰是嵌入算法的反序。步驟如下[6-9]:
第一步,將含水印圖像進行三層小波分解,得到 10 幅子圖LL3'、HL3'、LH3'、HH3'、HL3'、LH2'、HH2'、HL1'、LH1'、HH1' 將原始圖像也進行三層小波分解得到 10 幅子圖LL3、HL3、LH3、HH3、HL2、LH2、HH2、HL1、LH1、HH1。如果原始圖像和含水印圖像為RGB彩色圖像,則先把已們轉化為YUV格式,再對其Y分量子圖進行小波分解。
第二步,根據選擇待嵌入系數(shù)時保存的位置密鑰,提取出水印序列。提取公式如下:
■ (6)
式中,(i,j)為嵌入位置坐標,■wi,j和Xi,j分別為含水印圖像(可能經過信號處理)和原始圖像坐標為(i,j)處的小波變換系數(shù)。
此水印提取公式的導出比較簡單,由于嵌入的水印是(-1,1)二值序列,αρlθ為非0正數(shù),由式(2)可知,無論待嵌入系數(shù)Xi,j是正值或者負值,嵌入水印位“1”時,
嵌入水印后系數(shù)的絕對值將大于嵌入水印前系數(shù)的絕對值,即有|■wi,j|>|Xi,j|;同理,當嵌入水印位為“-1”時,有|■wi,j|=|Xi,j|。對于|■wi,j|=|Xi,j|的情況,簡單的令■wi,j>0時,提取出的水印位■k=1,■wi,j
第三步,將上一步提取出的一維水印序列變?yōu)槎S,恢復出二值水印圖像。
4 實驗仿真
本文實驗采用512×512的lena標準圖,水印采用桂林工學院的校徽。
4.1 嵌入水印后圖像及檢測
水印的不可見性可以通過主觀觀測方法或定量方法來評價。前者在實際中會受到不同觀察者的主觀影響,所以研究中經常采用定量方法來度量。本文我們使用峰值信噪比PSNR(PeakSignal-Noise Ratio)來度量水印的不可見性。■。PSNR常用來衡量原始圖像與重構圖像之間的相似程度,當PSNR>30時,人的視覺很難分辨出原始圖像與重構圖像之間的差異。PSNR越大,說明被檢測圖像與原始圖像越相似,水印不可見性越好,相似檢測值PSNR=32.3473,說明具有不可見性。除了用肉眼觀察是否提取出了有效水印,還采用歸一化相關系數(shù)NC來評價原始水印與提取出的水印之間的相似程度,■,NC=1.0000。
■
圖2 Lena 原始圖像圖3 水印圖像
■
圖4加入水印后的圖像圖5 相似度檢測(32.3473)
4.2 魯棒性實驗結果
在魯棒性實驗中,我們對于水印常遇到的攻擊進行了評測。對于攻擊后的圖像提取相關的水印圖像和檢測其PSNR值,來衡量其魯棒性。具體見表1。
表1 對于各種攻擊的魯棒性
■
從表中我們可以看出,在剪切比很小的時候,我們提取出來的圖像水印非常清晰,隨著剪切比的增加,認證圖像的小波系數(shù)也發(fā)生了很大的改變,導致圖像水印的失真增大,但此時圖像的質量也嚴重受損,所以在保證圖像質量的前提下,我們的方法對剪切操作來說魯棒性還是很強的。另外,我們提取出來的水印的失真情況與壓縮因子的大小有直接關系,隨著壓縮因子的減小,圖像的壓縮比增大,我們提取的水印失真也不斷增大,但即使這樣,圖像水印的字跡還是可以辨認的,具有一定的魯棒性。同時,對于各種濾波、噪聲攻擊也具有一定的魯棒性。在今后的工作中,我們可以把它應用于彩色圖像,以證明它的普遍實用性。
參考文獻:
[1] Chiou-Ting Hsu and Ja-Ling Wu.Hidden Digital Watermarking in Images[J]. IEEE Trans. On Image Processing,1998,8(1):58-68.
[2] Raymond B. Wolfgang and Edward H. Delp[J]. A Watermark for Digital Images.Proc. Of IEEE,1996:219-222.
[3] 涂燕瓊,賈昔玲.數(shù)字水印技術綜述[J]. 科技情報開發(fā)與經濟,2006,16(12):143-145
[4] 鄭涵容,祁享年,陳孝威.數(shù)字水印技術綜述[J],湖州師范學院學報,2006,16(2):100-103
[5] 王炳錫.數(shù)字水印技術[M]. 西安:西安電子科技大學出版社,2003:6-13,33-40,44-55.
[6] 馮少輝.一種基于小波變換的數(shù)字圖像水印算法[D]. 北京大學碩士論文,2007.5.
[7] 張冠男,王樹勛,溫泉.一種嵌入可讀水印的自適應盲水印算法[J]. 電子學報,2005,33(2):308-312.
[8] A.Lumini and D.Maio.A Wavelet-based Image Watermarking Scheme[J].International Conference on Information Technology: Coding and Computing, March 27-29,2000:122-27.
[9] 向德生,文宏,熊岳山.小波域魯棒自適應圖像水印嵌入方案[J].計算機工程與應用,2004(36):81-83.
[10] 張洪.基于小波變換的數(shù)字圖像水印技術研究[D]. 電子科技大學碩士論文,2006.
關鍵詞:數(shù)字版權;數(shù)字水印;流媒體應用
中圖分類號:TP309 文獻標識碼:A文章編號:1007-9599 (2010) 10-0000-01
The Applications and Practice of Digital Watermark
in Streaming Media
Zhang Qiaorong
(Northwest Normal University,Lanzhou730070,China)
Abstract:In recent years,digital watermarking industry solved the contradictions have begun to appear,as the watermark capacity is relatively small,can not achieve the desired effect.This paper presents a digital watermarking algorithm food and for its small capacity,it presents an improved scheme.
Keywords:Digital copyright;Digital watermarking;Streaming media applications
隨著Internet的迅猛發(fā)展為流媒體行業(yè)的進步起了關鍵性的作用,可以說,為流媒體業(yè)務的增加提供了市場推動力。于此同時,也進一步豐富了流媒體的吸引力,使之更加強大。但擺在我們面前的難題就是,這種迅速發(fā)展的網絡和數(shù)字產品的可復制性,使得侵權、篡改和惡意盜版,這些已經極大危害了數(shù)字資源的版權機構。
作為數(shù)字版權的保護的有效技術手段之一,數(shù)字水印技術應運而生。數(shù)字水印信息嵌入并隱藏在主文件中,這樣既能夠得到保護又不影響美觀性和可視性。在我國,數(shù)字水印的研究重點是在圖像水印,并取得了很驕人的碩果。在文中我們推出了一種新型的適用于非壓縮視頻的空間域水印方法。并且我們在對改算法分析的同時,對于這種方法容量比較小的現(xiàn)狀,列出了解決的方案。
一、非壓縮視頻的空間域水印算法
非壓縮視頻的空間域水印算法,指的是基于psycho-visual模型,也就是人眼對高紋理或者比較復雜紋理的區(qū)域失真不很敏感,而且分不清運動快速的物體的具體細節(jié)。實驗確定high-detail雜紋理在時間軸上的迅速改變的區(qū)域來進行水印嵌入。
找出這些區(qū)域是算法的意義所在。為了達到這個目標,本算法出示了2個選擇嵌人區(qū)域的規(guī)則:motion-detection和detail-detection。這兩個規(guī)則可以進行簡化,就是將其應用到圖像分塊的DCT緩緩的系數(shù)的能量上。在這種思路上,一個變換塊的DC系數(shù)集中了塊的平均能量強度,描述了對應塊的視頻內容的基本屬性,所以,算法用相鄰幀的DC系數(shù)做為motion-detection規(guī)則;同時,算法用變換塊的AC系數(shù)做為detail―detection規(guī)則來確定塊中是否包含high-detail信息。整個塊選擇過程如下。
在視頻序列中抽取k幀的片斷,該幀的大小是m×n,Xi;是原始視頻中的第i幀,這里i=0,1,…,k一1。第一,當前幀Xi;被分成8×8的互不重疊的塊,其中Xi,j表示第i幀的第j塊,j=0,1,…,(m/n)/64―1。對每個塊做DCT變換,得到變換塊Xi,j。不失一般性,DCT系數(shù)從低頻到高頻排列,例如,Xi,j,o。是DC系數(shù)。接著,這塊在2個層次上做如下劃分:在inter-frame層次上,根據AC系數(shù)能量把幀中塊劃分為2類:low-detail類和high-detail類。這里,變換塊Xi,j中的AC系數(shù)的能量用EAC (i,j)表示,即
如果EAC (i,j)表小于一個預先定義的閾值TD,那么塊Xi,j就被劃分到low-detail類,相反,它被劃分到high―detail類,該類用集合S1:{Xi,d1,Xi,d2,…}表示。在intra-frame層次上,當前幀的變換塊Xi,j。需要和臨近幀中對應的塊比較。在這里為了簡單起見,算法只考慮上前一幀,即第(i-1)幀。這里定義DDC(i,j)表示相鄰2塊DC系數(shù)差的絕對值,作為motion―detection規(guī)則,表示為:
DDC(i,j)=丨X’I,j,o-X’i-1+j+0丨
如果DDC(i,j)小于一個預先定義好的閾值TM,那么當前幀的X“被劃分到slow―motion類中,相反,該塊被劃分到fast―motion類中,該類用集合表示為
S2:{Xi,m1,Xi,m2,…Xi,mp}
對于每一個幀,那些同時在集合S1和S2中的塊的集合表示為
S3:{Xi,e1,Xi,e2,…,Xi,en}
只有在集合S3中的塊才適合嵌入水印。對所有的幀都做如上選擇,就可以得到每個幀中適合嵌入水印的塊。這里,選擇合適的TD和TM達到視頻質量和水印冗余度的一個折中。
二、測試結果及分析
測試中,Visual 2003環(huán)境下,實現(xiàn)上述算法,并在一段視頻中嵌入了“中國論文下載”字,是一個20×20的圖像,水印信息為400位,下面給出了圖1-圖2的實驗測試效果圖。
圖1與圖2對比可以看到,水印的嵌入并沒有影響源視頻質量,從測試結果可以看到,效果是可以接受的,能夠分辨出嵌入的水印信息,達到了預期目的。
參考文獻:
[1]郭培源.水印系統(tǒng)自動控制新技術[M].科學出版社,2001
[2]沈曙明.新一代地區(qū)數(shù)字水印SCADA/EMS/DMS/MIS自動化系統(tǒng)[J].電力自動化設備,2001,21,l
[3]錢宗鈕,區(qū)惟煦,壽國礎.流媒體入網技術及其應用[M].人民郵電出版社,1998
[4]陳志杰,齊建群.數(shù)字水印技術在上海的組網應用[J].電力系統(tǒng)通信,2004,5
關鍵詞:DCT變換;盲水印;水印嵌入;水印提取
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2014)06-1280-02
隨著3G、4G網絡的逐漸普及,人們應用數(shù)字圖像已經不僅僅局限于普通PC機,而是逐漸擴展到平板電腦、只能手機登領域。由于數(shù)字圖像包含的信息量巨大,很容易被人們接受和傳播,不僅僅給人們的工作帶來便利,也為業(yè)余生活帶進了更多的色彩。然而,多媒體數(shù)字圖像的版權保護問題則日顯突出。而數(shù)字水印技術是當今知識產權保護的一種新方法,并逐漸被人們所接受。簡單地講,數(shù)字圖像水印技術是指在不破壞原有數(shù)字作品自身價值的情況下,將某些標志性信息(水印)利用一些特定算法嵌入到數(shù)字作品(載體)中去。這些被嵌入的標志性信息(數(shù)字水印)可以表示數(shù)字作品版權所有者、發(fā)行者、日前、作品控制等信息。一旦發(fā)現(xiàn)數(shù)字作品有盜版情形,利用相應水印提取算法可以提取出這些水印信息來證明數(shù)字作品的版權歸屬,便可以作為指控盜版者侵權的法律依據。另外,還可以在使用數(shù)字作品前,通過檢測數(shù)字作品中的水印信息,來限制該數(shù)字作品的操作權限,如復制次數(shù)等等。這是常規(guī)加密方法難以辦到的。
普通的數(shù)字水印技術一般都能具有不可見性、安全性和可證明性,其不足則是魯棒性較低。具體來講,圖像經過常規(guī)的信號處理操作化,所能檢測到的水印可能變得模糊不清。鑒于此,該文在常規(guī)魯棒盲水印方法上提出一種改進的方式,從而提高水印的魯棒特性。
所謂魯棒數(shù)字水印是水印技術中的一個分支,是相對于普通水印技術而言的,一般是指通過在原始數(shù)據中嵌入秘密信息——水印(watermark)來證實該數(shù)據的所有權。魯棒數(shù)字水印技術與傳統(tǒng)數(shù)字水印技術除都具有信息隱藏的功能外,其具有較強的魯棒性、安全性和透明性等特點。是一種具有很好前景和巨大競爭力的新技術。
1 DCT域的盲水印算法原理
數(shù)字水印(Digital Watermarking)的基本思想是利用圖像處理技術將標志信息(如版權所有者、發(fā)行者、日前、作品控制等)嵌入到數(shù)字圖像、音頻、視頻等數(shù)字作品中,用以實現(xiàn)對該數(shù)字產品的盜版跟蹤、知識產權維護、完整性確認、真?zhèn)舞b別等功能。通常而言,嵌入的秘密信息需要經過相應的圖像預處理后才形成水印信息。數(shù)字水印信息可以定義為:
[w=wi|wi∈O,i=0,1,2,…,N-1]
其中,[N]表示水印長度,[O]表示值域。[O]可以是二值形式,即[O=0,1]或[O=-1,1]或[O=-r,r]等,也可以是高斯白噪聲(均值為0,方差為1,[N0,1])。水印信號可以是一維序列,還可以是二維矩陣,或者三維乃至高位信號。為了進一步研究盲水印的實現(xiàn)過程,首先研究DCT變化的基本原理。
1.1 DCT域變換介紹
DCT(離散余弦變換)是一種可逆變換,分為正向(FDCT)和逆向(IDCT)離散余弦變換。其中,正向離散余弦變換(FDCT)是為獲得DCT域中的頻域系數(shù),由空間域中的像素數(shù)據變換而來;逆向離散余弦變換(IDCT)則是將前者變換的頻域數(shù)據恢復到原有的圖像像素數(shù)據;兩者互逆,一般要配合使用。在圖像處理中,F(xiàn)DCT具有圖像壓縮編碼的功能,原因在其具有去除數(shù)據相關性的能力。
1.2 DCT域變換算法
對于圖像而言,二維FDCT/IDCT的定義可以描述如下:
設[fx,y|x=0,1,…,M-1;y=0,1,…,N-1]為[M×N]的二維圖像像素矩陣,則二維FDCT/IDCT定義為:
[Fu,v=CuCv2MNx=0M-1y=0N-1fx,ycos2x+1uπ2Mcos2y+1vπ2N] (1)
[fx,y=2MNx=0M-1y=0N-1CuCvFu,vcos2x+1uπ2Mcos2y+1vπ2N] (2)
其中,[u=0,1,…,M-1];[v=0,1,…,N-1];[Cu]、[Cv]與一維情形相同。
1.3 DCT域盲水印原理
對二維圖像進行水印處理,一般要完成兩個過程,及水印嵌入和水印提取。
1) 嵌入水印
首先對圖像進行分塊處理,如對原圖像進行[16×16]、[32×32]、[64×64]等分塊,再將各個子塊進行DCT處理,然后定義兩個高度不相關的[m]序列,利用置亂后的二值水印圖像信息對其進行控制,并按照一定規(guī)則使對相應分塊圖像DCT變換后屬于中頻位置嵌入相應的水印圖像(這里的水印圖像也進行相應的DCT變換),最后對分塊圖像進行DCT逆變換,在按著原有分塊的順序排列,即可恢復為具有水印的新圖像。
2) 提取水印
對含數(shù)字水印的圖像進行分塊處理要依據原有圖像的分塊原則,再按著順序對分塊進行DCT變換。然后生成兩個高度不相關的[m]序列與各分塊圖像DCT變換后水印嵌入位置上的數(shù)據做自相關計算,即可使得水印信息從各個分塊圖像中被提出出來。最后,根據處理前給定的密鑰反置亂提取到的水印信息,便得了嵌入在圖像中的水印信息。
2 DCT盲水印算法實現(xiàn)過程
2.1 水印潛入
1) 水印圖像置亂
所謂水印圖像置亂即“擾亂”圖像,其原理是對數(shù)字圖像的像素位置或灰度級等做變換運算,從而獲得一定程度的“混亂”狀態(tài),從而實現(xiàn)置亂的目的。經典的置亂算法有Arnold函數(shù),表述如下:
[x′y′=11kk+1xymod N k∈1,N] (3)
其中,[k]是控制參數(shù),[N]表征矩陣大小,[x,y]和[x′,y′]表示像素在變換前后的位置,然后對所有的[x,y]都進行式(5)的變化,變產生了一幅加密圖像,解密過程即為其反變換過程。
2) 水印嵌入過程
?設圖像[IM×N]為原始圖像,圖像[WM×N]為水印圖像;
?計算原始圖像大小,并與水印圖像相比較,當原始圖像小于水印圖像時返回;否則計算原始圖像分塊的大小為[MN×MN];
?用Arnold函數(shù)對水印圖像[WM×N]進行置亂運算,設定密鑰為“O”;[W′M×N]為置亂后的二值水印圖像;
?將原始圖像[IM×N]分塊[Iij],并對各子塊的原始圖像依次進行二維DCT變換,得到系數(shù)矩陣[Mij],即[Mij=DCTIij];
?分別生成兩個長度為[MN]的隨機序列[m1]、[m2],依據密鑰1和密鑰2;
?對[Mij]嵌入水印信息,具體過程如下:
[Mij1,M/N=Mij1,M/N+a?k1Mij2,M/N=Mij1,M/N-1+a?k2?MijM/N,1=MijM/N,1+a?kMN]
其中,[a]為嵌入強度,[k]為隨機序列[m1]或[m2],定義如下:
當[Wij=1]時,[k=m1],其中[ki=m1i],[i=1,2,…,N];
當[Wij=0]時,[k=m2],其中[ki=m2i],[i=1,2,…,N];
?對[Mij]進行IDCT變換,得到[I′ij],并按分塊順序從新組合為含水印的圖像。
3) 水印嵌入實例
圖1 原始圖像W 圖2 水印I 圖3 嵌入水印圖像
2.2 水印提取
水印提取與上述過程相反,可簡要描述如下:
?讀取含水印圖像[I′];
?將其分塊,并做DCT變換;
?對各分塊內的水印信息讀取;
?用密鑰1、密鑰2分別生成兩個長度為[MN]的隨機序列[m1]、[m2];
?分別求出自相關系數(shù)[c1]、[c2];
?當[c1≥c2],則估計水印信息[Wij=1],否則[Wij=0];
?利用密鑰“O”對水印圖像的估計矩陣進行Arnold函數(shù)反置亂運算。
實驗選用圖像為256級灰度、尺寸[512×512]的圖像,水印圖像為[32×32]的“數(shù)字信息”水印,通過嵌入與提取,嵌入水印圖像和原始圖像沒有太大差別,從而實現(xiàn)盲水印的嵌入。
3 結束語
本文通對水印分類的研究理解的基礎上,對脆弱水印、盲水印、魯棒盲水印有了較深刻的理解,然后利用基于DCT域變換的方法實現(xiàn)了水印的嵌入與提取,通過實驗驗證發(fā)現(xiàn),論文給出的算法具有較好的效果,從嵌入效果看與原始圖像沒有太大差別,實現(xiàn)了數(shù)字信息的隱藏。
參考文獻:
[1] H.P.Lu,X.X.Shi,Y.Q.Shi,A.C.Kot and L.H.Chen.Watermark Embedding in DC Components of DCT for Binary Images.International Workshop on Multimedia Signal Processing(MMSP’02),Dec.9-11,2002:300-303
[2] I.J.Cox,Mattew L.Miller,and Jeffrey A.Bloom.數(shù)字水印[M].王穎,黃志蓓,等,譯.電子工業(yè)出版社, 2003.
[3] 朱巧明,李培峰,吳嫻,朱曉旭,等.中文信息處理技術教程[M]. 北京:清華大學出版社, 2005
關鍵詞:Java,保護技術,研究
一、本地化技術
Java本地化,是指通過將Java應用程序編譯成本地應用程序,如Windows
操作系統(tǒng)下擴展名為.ex。的應用程序,來達到增加反編譯的難度,實現(xiàn)軟件保護的方法實現(xiàn)步驟如下:首先編寫Java源代碼,然后通過Java編譯器將Java源代碼編譯成Java類文件,最后使用本地編譯工具將Java類文件編譯成二進制的本機應用程序。
Java本地化技術產生的是二進制格式的可執(zhí)行文件,與在虛擬機中執(zhí)行的Java應用程序相比,可以產生更快的執(zhí)行速度和更小的內存占用。由于程序已經從類文件被編譯成二進制的可執(zhí)行文件,原本類文件由于自身結構特性所帶來的安全隱患也就隨之消失了,反編譯不再成為Java軟件的安全威脅,在這種情況下,Java軟件的安全性達了到與傳統(tǒng)的用C/C++等語言開發(fā)的軟件一樣的強度。。目前許多本地編譯工具被開發(fā)出來,并獲得廣泛的使用。
本地化技術雖然能夠很好的保護Java類文件,使其達到與傳統(tǒng)的用C/C++等語臺開發(fā)的軟件一樣的安全強度,但也存在以下幾個問題:
1、失去了“一次編譯,到處運行”的跨平臺性
本地編譯得到的是二進制格式的可執(zhí)行文件,它依賴于具體的運行平臺,只能在具體編譯過程執(zhí)行的同一種平臺上運行,因而失去了跨平臺的特性。
2、無法應用于B/S結構的網絡應用軟件
本地化技術依賴于具體的運行平臺,生成的是一個可執(zhí)行程序,這種解決方案可以較好的保護單機應用軟件。但卻無法應用于網絡應用軟件,因為服務器端程序運行在Java應用服務器上,因此本地化的解決方案明顯不支持這種類型的應用程序。
3、錯誤定位困難
Java軟件本地化處理是一個相對較新的課題,診斷分析的理論基礎薄弱,要準確的診斷和定位本機編譯產生的Java應用程序中出現(xiàn)的問題十分困難,尤其當Java類文件版本中沒有發(fā)生該錯誤的時候。
二、遠程接口訪問技術
分布式結構是現(xiàn)代軟件開發(fā)中廣泛采用的一種體系結構,通常將軟件分為客戶端和服務器端,核心的功能模塊和業(yè)務流程都部署在服務器端為客戶端提供服務,客戶端負責采集數(shù)據、提交服務請求和與服務器端通信,這種體系結構的采用可以提高系統(tǒng)的可移植性和互操作性,大幅度降低軟件的開發(fā)成本。現(xiàn)在通過接口提供服務的標準和協(xié)議越來越多。把實現(xiàn)核心功能的類文件放在遠程服務端,這種模式就是現(xiàn)在流行的Java服務器應用程序,也稱為web應用程序。
Web應用程序模式的發(fā)展不但適應了各種計算環(huán)境的需要,從另外一個角度看也實現(xiàn)了源代碼的隔離,起到了保護Java軟件的作用。可以通過遠程接口訪問達到軟件保護的目的,防止黑客或者其他軟件分析人員通過反編譯核心算法所在的類文件得到源代碼。所謂遠程接口訪問是指將應用和實現(xiàn)相分離,將軟件的核心算法等關鍵部分部署在遠程的應用服務器上,用戶通過訪問應用服務器的接口提交服務請求和獲得服務,在整個過程中用戶無法訪問到關鍵部分的類文件。遠程接口訪問技術使得用戶無法獲得類文件,也就從根本上防止了對類文件進行反編譯獲得源代碼的可能性。
遠程接口訪問技術能有效地保護關鍵的Java類文件,從而達到軟件保護的目的。。但是這種方式也存在著明顯的局限性和很大的安全隱患:
1、遠程接口訪問技術只適用于B/S結構或者分布式結構的軟件,而對單機運行的應用軟件則不適用。
2、遠程接口訪問技術實際上是將保護的焦點從關鍵的類文件轉移到了應用服務器上。在這種體系結構下,制定完善的安全機制來保護端口至關重要,因為如果應用服務器被攻破,那么所有部署在服務器上的服務模塊和類文件就完全暴露在攻擊者面前,后果不堪設想。
三、軟件數(shù)字水印技術
軟件數(shù)字水印是眾多數(shù)字水印的一種,它的主要保護對象是計算機代碼,包括源代碼和機器碼。使得它們免于或者減少遭受非法復制和非法篡改的危險。由于計算機代碼是不能容忍任何錯誤的,因此一些傳統(tǒng)的利用可允許錯誤范圍內修改計算機程序從而嵌入水印的方法將不適用于計算機軟件。
1、軟件數(shù)字水印的用途
(1)作為侵犯知識產權的證據
在一般情況下,發(fā)生剽竊事件時,由于難以舉證,常常難以判斷真正的原創(chuàng)者。引入軟件數(shù)字水印技術后,在程序中嵌入代表作者身份的軟件數(shù)字水印,那么在對被懷疑的程序進行驗證時,就可以用水印解碼的方法從程序中得到真正的作者的信息。
(2)發(fā)現(xiàn)被剽竊的程序
要確定一款軟件中是否包含剽竊的程序模塊是一件很困難的事情,因為通常相對于程序整體而言,剽竊的程序模塊只是很小的一部分,非法程序和原程序的具體規(guī)范可能會有很大的不同。利用數(shù)字水印可以有效的找到被盜的程序模塊,對于在互聯(lián)網上流通的程序,有一種爬蟲技術,它在互聯(lián)網上到處活動,搜尋特定的目標,可以利用爬蟲找到包含特定數(shù)字水印的程序,從而發(fā)現(xiàn)被盜模塊。
(3)追蹤非法拷貝的源頭
由于計算機軟件極其容易被無差異復制,不法分子在獲得授權版本后可以對其進行非法復制和分發(fā)以獲得經濟利益。因此,有必要登記授權用戶信息以追查非法拷貝的源頭。僅僅登記授權用戶信息是不夠的,因為這無法將特定的授權版本和具體的授權用戶聯(lián)系起來。為了達到追蹤目的,必須提供這種聯(lián)系,而且這種聯(lián)系必須是隱秘的,否則很容易給破壞。數(shù)字水印正好可以滿足這些要求,它通過在把授權用戶信息嵌入到授權版本來建立這種內在聯(lián)系。當發(fā)現(xiàn)市場上流通的盜版軟件時,可以檢測水印信息從而獲得授權用戶信息。對參與盜版的授權用戶進行懲罰,從而減少這種行為的發(fā)生。
2、軟件數(shù)字水印的不足
軟件數(shù)字水印技術也存在一些不足,比如:需要插入額外的代碼,需要仔細地編寫啞函數(shù)及其調用,否則容易被有經驗的反編譯者識破,從而擦除水印。另外,靜態(tài)軟件數(shù)字水印算法的健壯性相對較差,而動態(tài)軟件數(shù)字水印算法雖然具有很好的健壯性,但是它只能保護整個應用程序,而不能保護某一部分特定的代碼,同時,動態(tài)軟件數(shù)字水印的檢測方式令它的某些應用受到限制。目前的水印算法在提供可靠的版權證明方面或多或少都有一些的尚不完善的地方,因此尋找能提供完全可靠版權保護的軟件數(shù)字水印算法成為一個重要的課題。
四、混淆技術
1、混淆的定義
代碼混淆技術是目前比較成熟和流行的一種軟件保護技術。代碼混淆技術是對類文件進行代碼語義、程序流程和邏輯結構的重新組織,代碼混淆并不能增加反編譯的難度,使用反編譯器仍然可以對混淆后的類文件進行反編譯,得到代碼,但此時的代碼是經混淆后的代碼,可讀性己經大大降低,難以從代碼中發(fā)現(xiàn)源代碼的編寫思路和關鍵算法,從而達到保護軟件的目的。典型的混淆技術包括去除所有的調試信息,使用機器生成的名稱重命名包、類和方法等。目前的混淆程序提供的功能則更強大,通過重構現(xiàn)有的邏輯和插入不執(zhí)行的偽代碼來改變控制流程。混淆的前提是變換不會破壞字節(jié)碼的有效性,也不會改變對外所表現(xiàn)的功能。混淆的可行與反編譯的可行是出于同一原因:Java字節(jié)碼是標準化的,而且是很容易歸檔的。混淆程序加載Java類文件,分析其格式然后根據所支持的特性進行變換。。當所有的變換完成后,字節(jié)碼就保存成一個新的類文件。新文件具有不同的內部結構,而其行為與原始文件一致。
2、混淆技術存在的問題
從安全性角度看,混淆確實可以在很大程度上破壞反編譯代碼的可讀性,增加逆向工程的難度,有效地保護軟件,但并不是絕對的。實踐證明,除非使用控制流程的混淆,打亂程序的流程,否則閱讀和處理混淆的代碼并不是很困難的事情。即便使用了流程控制,具備重量級的調試程序和足夠經驗的攻擊者仍然可能破解軟件。
【參考文獻】
【1】申茜.JAVA軟件面臨的風險及其保護.電腦知識與技術(學術交流).2007/23
【2】胡燕京.軟件保護研究及其在Java軟件保護中的應用.現(xiàn)代電子技術.2007/15
【3】甘晟科.Java軟件的加密方法研究與應用.計算機與現(xiàn)代化.2005/02
會議開幕式由學會常務理事、中國科學技術大學韓正甫教授主持,中國科學技術大學副校長朱長飛、安徽省委辦公廳副主任、省密碼管理局局長徐飛、中國科學院院士郭光燦分別致辭,開幕式還安排了學會會士頒證儀式,在歡快的樂曲聲中,蔡吉人、郭光燦院士為中國密碼學會首批7位會士頒發(fā)了會士證書。
本次會議就密碼學的理論和應用進行了廣泛的學術交流,重點討論密碼學理論方面的前沿進展,內容涉及密碼學各研究領域,包括:基礎算法和理論、對稱密碼、公鑰密碼、量子密碼、數(shù)字簽名、信息隱藏與水印等。這些論文反映了我國當前密碼學的研究動態(tài),也展現(xiàn)了我國密碼學研究與應用的實際水平。
為提升中國密碼學會年會的整體水平,也為了給參加中國密碼學會年會的國內學者提供良好的學習交流機會,大會還特別邀請了6位國內外知名的密碼學家進行演講并回答現(xiàn)場提問。圖靈獎獲得者,以色列魏茨曼科學研究所教授、著名RSA算法創(chuàng)始人之一Adi Shamir,作了題為“Improved Attacks on Multiple Encryption”的報告,該報告介紹了一種新的針對多重加密的攻擊方法;中國科學院軟件所張振峰研究員的報告題目為“Proxy Re—encryption: Strong Security, Efficient Construction and Non—interactive Opening”;中國科學技術大學的李宏偉博士介紹了量子密碼安全性相關研究的思路和最新進展;來自丹麥工業(yè)大學的Christian Rechberger教授作了題為“Cryptanalytic ideas applied to AES and SHA”的報告;威斯康星大學(密爾沃基)的許光午教授討論了數(shù)論和代數(shù)中許多優(yōu)美的思想和構造在密碼設計、分析和算法中的應用;清華大學白國強教授回顧和總結了利用集成電路技術實現(xiàn)密碼算法的歷史和現(xiàn)狀,介紹了當前利用集成電路技術實現(xiàn)密碼算法時所面臨的挑戰(zhàn)和主要問題,并對新技術突破性的發(fā)展將如何影響密碼學發(fā)展提出自己的看法。
本次會議首次增設了自由討論環(huán)節(jié),讓密碼學界特別是青年學者們有一個自由發(fā)表自己觀點和見解的場合,可以說開辟了一個自由學術討論的環(huán)境,對學術新人的成長起到了很好的推動作用。
本次大會不僅重視理論的創(chuàng)新,也同樣重視實踐和應用,在中國密碼學會領導的支持下,大會不僅得到了承辦單位中國科技大學的全力配合,更得到了協(xié)辦單位國網電力科學研究院通信與用電技術分公司和北京中電華大電子設計有限責任公司的大力支持。兩家企業(yè)也在會上展示了密碼學在產業(yè)和市場應用方面的經驗、成果,并指出了面臨的難題和密碼學應用研究的新方向。這些創(chuàng)新環(huán)節(jié)也都得到了參會者的肯定。
會議休息期間,主辦方還組織參會代表參觀了中國科大校史館、少年班以及合肥市內著名景點包公祠、李鴻章故居等,宣傳了中國科大的文化和理念以及合肥的人文歷史,給每一位參會者留下了深刻而美好的印象。閉幕式上,裴定一理事長就中國密碼學會的年會改革方案做了詳細的說明,高
度贊揚承辦單位中國科學技術大學的優(yōu)質組織和服務,為年會優(yōu)秀論文頒發(fā)了證書,并宣布下一屆年會承辦單位為福州大學。
我國的電子檔案保護技術經過20年發(fā)展逐漸穩(wěn)定、成熟,為了全面了解幾十年以來電子檔案保護技術領域的研究情況,筆者對1994-2013年間發(fā)表在中國知網核心期刊上的有關電子檔案保護技術研究論文進行統(tǒng)計與分析,以期對我國電子檔案保護技術研究現(xiàn)狀有一宏觀了解,為進一步深入研究提供借鑒和思考。
一、數(shù)據來源
電子檔案保護技術學是探索數(shù)字信息的完整,安全、可靠的技術手段和法規(guī)體系的學科,其目的是保持數(shù)字信息的真實性、可靠性和長期可讀性。某學科(或專業(yè)、或專題)的核心期刊,是指該學科所涉及的期刊中,刊載論文較多(信息量較大的),論文學術水平較高的,并能反映本學科最新研究成果及本學科前沿研究狀況和發(fā)展趨勢的,較受學科讀者重視的期刊。對于整個期刊出版業(yè)來說,核心期刊具有示范作用。研究核心期刊對于發(fā)展科學事業(yè)、推動科學研究具有重要意義。本文選取1994-2013年間發(fā)表在中國知網中文核心期刊,按核心期刊表分類的中文核心期刊涉及到檔案事業(yè)類的有9種核心期刊,即《檔案學通訊》、《檔案學研究》、《蘭臺世界》、《山西檔案》、《檔案管理》、《中國檔案》、《北京檔案》、《檔案與建設》、《浙江檔案》;以及涉及到非檔案事業(yè)類的其他10種核心期刊,即《檔案》、《湖北檔案》、《計算機工程與設計》、《農機化研究》、《山西財經大學學報》、《水利水電技術》、《思想戰(zhàn)線》、《四川檔案》、《現(xiàn)代圖書情報技術》、《中國市場》上的有關電子檔案保護技術研究論文進行統(tǒng)計與分析,借助電子查詢,通過中國學術期刊網(CNKI),以主題為檢索方式,以“電子檔案”、“保護”、“修復”為主要檢索詞,精確匹配,統(tǒng)計了1994-2013年中國知網的19種核心刊物上的電子檔案保護技術研究論文,這些論文是本文分析的依據。近二十年來,中國知網19種核心期刊共發(fā)表電子檔案保護技術研究學術論文108篇。
二、統(tǒng)計分析
1.研究發(fā)展歷程分析
1994-2013年20年期間電子檔案保護技術研究論文的逐年統(tǒng)計結果表明,年度論文數(shù)有較大的波動,見圖1。波動曲線大致可劃分為3個階段,表明了這一階段我國電子檔案保護技術的發(fā)展歷程[1]。
第一階段:從1994到1996年,電子檔案保護技術作為一門學科在我國醞釀和產生,是學科發(fā)展的起步階段。在這一階段,除《湖北檔案》外,其它核心期刊尚未涉及電子檔案保護或者電子檔案修復相關研究,包括電子檔案保護技術在內的檔案保護技術研究隊伍也很小,因此,電子檔案保護技術研究論文為數(shù)不多。
第二階段:從1997年至2002年。電子檔案保護技術研究在經過90年代中的低谷期后,步入了平穩(wěn)發(fā)展階段。圖1表明,自1997年始,相關核心期刊刊載的電子檔案保護技術論文持續(xù)增多,在這一階段,年均3.5篇。這表明,1997年后的電子檔案保護技術研究已明顯超過90年代中的研究力度,呈現(xiàn)出一種平穩(wěn)的發(fā)展態(tài)勢。
第三階段:從2003年初到2013年底,電子檔案保護技術研究在第二階段的研究水平的基礎上發(fā)展。電子檔案保護技術研究出現(xiàn)了前所未有的發(fā)展態(tài)勢,并在2012年形成了一個高峰。圖1的曲線表明,從2003年到2013年底,電子檔案保護技術研究論文一直持續(xù)穩(wěn)定地增長,在近幾年達到了頂峰。統(tǒng)計表明,從2003年到2013年,年均7.8篇,比前一階段年均增加論文4.3篇,是電子檔案保護技術研究的繁榮時期,近幾年電子檔案保護技術學研究達到了。
2.核心作者分析
從本文統(tǒng)計的108篇論文的作者組成來看,在近20年的發(fā)展過程中,我國電子檔案保護技術研究逐漸形成了一支由大學教師、檔案局檔案保護工作者、研究所檔案科研人員等組成的研究力量。幾十年以來,電子檔案保護技術研究之所以碩果累累,與他們的辛勤耕耘密不可分。在這個不斷壯大的研究隊伍中,以遼寧大學和福建師范大學為代表的學術骨干是這個隊伍的核心,組成了電子檔案保護技術研究的核心作者群。統(tǒng)計表明,核心作者人均發(fā)表在核心期刊上論文數(shù)為2.7篇,最高達6篇。
3.來源期刊分析
由統(tǒng)計數(shù)據進行分析可知:
第一,在20種中國知網核心期刊中,總體看來,只有《北京檔案》和《檔案學通訊》兩種期刊20年中刊載電子檔案保護技術論文數(shù)量基本穩(wěn)定,沒有出現(xiàn)“0”發(fā)文現(xiàn)象。這表明,電子檔案保護技術研究尚未趨于常態(tài)化、理性化,也從側面反映出電子檔案保護技術研究隊伍的不穩(wěn)定性。
第二,《蘭臺世界》、《檔案學通訊》、《檔案管理》與《檔案學研究》4種期刊刊載電子檔案保護技術研究論文數(shù)量居多,這些期刊學術研究性和理論性較強,對電子檔案保護技術較為關注。
第三,從年度論文數(shù)量分布來看,《檔案與建設》、《蘭臺世界》、《農機化研究》、《山西財經大學學報》、《山西檔案》、《浙江檔案》、《中國檔案》自1998年以后發(fā)表數(shù)量逐漸增加,可能與這些期刊對電子檔案保護類論文的重視不無關系。
第四,《檔案學通訊》、《檔案學研究》、《計算機工程與設計》、《水利水電技術》、《思想戰(zhàn)線》、《四川檔案》、《現(xiàn)代圖書情報技術》、《中國市場》8種期刊近二十年在電子檔案保護技術發(fā)文量上均穩(wěn)中有減。分析其原因,由于經過幾十年的研究探索,傳統(tǒng)的檔案保護技術研究已經較為成熟,而數(shù)字環(huán)境下電子文件的保護研究工作對于保護技術學者來說還是個巨大挑戰(zhàn),處于潛心研究階段,因此公開數(shù)量暫時略有減少[2]。
4.論文內容分析
依據搜索到的1994-2013年期間電子檔案保護技術研究所包含內容范圍,及現(xiàn)有電子檔案保護技術學科結構,我們把108篇論文分為九大類,按年度進行相關統(tǒng)計。
從研究內容來看,在1994-2013年期間,電子檔案保護技術研究的內容十分豐富,研究領域在不斷拓展,不僅涉及到前人的研究、信息的安全保護措施相關內容,而且還更多關注了檔案保護技術發(fā)展、電子文件的安全、長期存儲、電子文件的載體、電子文件與紙質檔案保護的比較、數(shù)字化技術保護等問題。但是,電子檔案保護技術的研究在不同時期所體現(xiàn)出的側重點有所差別,例如在2009-2013年,雖然論文發(fā)文總量有所增多,但是在電子檔案長期存儲方面,發(fā)文數(shù)量卻減少,這體現(xiàn)出電子檔案保護技術研究內容理論與實踐的緊密結合,也從側面折射出電子檔案保護技術學是一門與社會實踐相伴互動的學科[3]。
從研究類別來看,電子文件保護的綜述、信息的安全保護措施、電子文件的安全和檔案保護技術發(fā)展等方面的研究是1994-2013年期間關注較多的內容。例如,電子文件保護的綜述方面36篇,占到總1994-2013年期間總發(fā)文量的近33.3%,檔案保護技術發(fā)展方面19篇,占1994-2013年期間總發(fā)文量的17.6%。
從研究熱點看,信息的安全保護措施、電子文件的安全成為近年來檔案保護技術研究的熱點。之所以成為熱點,是因為隨著計算機技術、網絡技術和通訊技術的迅猛發(fā)展,人們在工作、學習和生活中更多地使用和保存電子文件,電子文件、電子檔案也成為檔案保護技術的重要對象,但鑒于電子文件的安全性不足和法律地位尚待明確,電子文件的安全性保護必然成為檔案保護技術研究和電子文件研究人員共同關注的熱點。
三、總結與思考
盡管我國的電子檔案保護技術研究在20世紀90年代至今發(fā)展的頭二十年內碩果累累,但是仔細分析卻也仍然存在諸多這樣或那樣的問題,比如說對國外電子檔案保護技術理論和技術的吸收不多、與國際電子檔案保護界接軌緩慢、重復性研究成果較多、科學研究成果真正應用于實踐的較少、專業(yè)分工程度不高、電子檔案保護理論研究基礎薄弱、研究深度不夠等等。這是不可忽視的,需要進一步加強研究。可以說,這些問題解決的程度直接關系到21世紀今后的電子檔案保護技術研究的方向和發(fā)展的水平。在上述論文統(tǒng)計分析的基礎上,我們提出以下未來電子檔案保護技術研究發(fā)展的幾個方向,旨在分享、交流,共同促進電子檔案保護技術研究的向前發(fā)展。
第一,深化現(xiàn)有研究。電子檔案保護技術研究是一個深化、持續(xù)的過程。在未來,電子檔案保護技術研究應在現(xiàn)有研究基礎上,不斷深化和拓展研究領域。如在電子檔案制成材料耐久性上方面不斷創(chuàng)新、研制更加有利于延長電子檔案壽命的材料,針對材料性質采取更加科學有效的防治措施;在電子檔案保護技術管理研究方面,更加突出非技術因素的作用。
第二,數(shù)字檔案及電子文件(電子檔案)備份中心建設。檔案數(shù)字化及數(shù)字檔案的網絡化應用已經成為網絡時代服務的新模式,也是保護珍貴檔案原件的根本措施,包括數(shù)字信息檔案內容的真實可靠性保護、數(shù)字信息檔案長期可存取性保護和數(shù)字信息檔案載體保護三個方面。
關鍵詞:關鍵詞:井史 ;數(shù)字化 ;應用
中圖分類號:TP39 文獻標識碼:A 文章編號:
1.前言
隨著油田開發(fā)不斷深入,生產管理信息化進程也不斷的深入和完善,目前有大量非結構化歷史檔案資料尚未電子化。通過對井史紙質資料電子化,以及井基礎數(shù)據、作業(yè)數(shù)據、管柱數(shù)據、抽油桿數(shù)據、壓裂成果數(shù)據的結構化整理來為專業(yè)應用提供數(shù)據。研究人員可以基于專業(yè)數(shù)據查詢平臺(ArchBank系統(tǒng))進行數(shù)據綜合分析,為研究人員的專業(yè)應用提供可量化的數(shù)據支持,同時為各級領導和相關部門提供可量化的決策依據。開創(chuàng)油田技術檔案數(shù)字化應用先河。
2.井史資料電子化的實現(xiàn)內容
2.1井史資料電子化
對83556口開發(fā)井在1960年至2000年產生的紙質資料和約2000口勘探井的紙質資料折合A4幅面約146萬頁(折算比例為:A4:A3 =1:4,A4:A0=1:20)進行掃描、編輯、集成、添加水印、編寫書簽等一系列的工作,最終形成清晰的PDF電子文檔成果,電子成果達到技術指標為:電子文檔命名遵照分公司井史資料存檔規(guī)范;井史報告掃描分辨率在200dpi以上,附圖掃描分辨率在300dpi以上;圖像處理端正、清晰、無明顯雜點,圖片大小一致;標簽依據原始資料添加。
2.2部分數(shù)據結構化
依據數(shù)據庫結構,通過對數(shù)據源分析、錄入、自校、校對、審核、入庫六個環(huán)節(jié)把1990-2000年約9.3萬條井史數(shù)據從井史報告中采錄、校對、審核、建庫,成果數(shù)據達到的技術指標為:實現(xiàn)與用戶在用數(shù)據庫對接,數(shù)據表的關鍵字準確率100%。
3.井史資料電子化實現(xiàn)方法
3.1井史資料電子化工作流程
整理流程一般包括借閱、整理、分發(fā)、掃描、轉換、校對/檢查、審核、驗收、入庫、歸還等環(huán)節(jié),其中,不同類型的資料及存儲介質在掃描、轉換、校對/檢查兩個環(huán)節(jié)上是不同的。下圖是資料整理的工作流程。
圖1 資料整理工作流程
3.1.1掃描
按照《紙質檔案數(shù)字化技術規(guī)范》(DA/T31-2005)要求,一般資料采用200dpi灰度方式掃描即可,針對含有很多非常小的文本或腳標(小六號或更小)根據實際情況調高分辨率,以保障資料的清晰度。由于文件長度按分辨率的平方大幅度增長的,所以需要有針對性的選擇。
對于絕大多數(shù)的圖件(如A0圖),要求最低300dpi分辨率,對于部分圖件需要提高分辨率到400dpi左右,但針對圖幅過寬、過長等特殊圖件,由于掃描生成文件過大,導致無法正常瀏覽,只能在保證圖元正確顯示的基礎上,適當降低像素值。所有掃描成果要求保證1∶1打印效果清晰。
3.1.2圖片編輯
采取相應技術措施確保圖像質量。主要工作包括圖文糾編、去黑邊、去噪聲、任意旋轉、影像增強等。編輯處理的圖片效果用以下幾個圖片來對比展示。
圖2資料拼接效果圖對比圖
3.1.3圖片校對
數(shù)據資源建設項目的成敗取決與成品質量,為了確保成品質量,項目采用多年積累的三級質量控制措施進行質量控制,分別是錄入階段錄入自校,通過后由獨立的校對人員進行校對,最后再由專業(yè)人員審核。
圖片校對重點關注以下四方面:
圖片分辨率
確認目的:確認頁面清晰度;
確認方式:利用Photoshop軟件RGB方式打開JPG文件,圖像菜單圖像大小選項讀取分辨率數(shù)據;
確認指標:頁面分辨率不小于200dpi或比對不低于原文件的清晰度視為該項指標合格。
檔案資料還原程度
確認目的:掃描形成的電子文件的清晰度應最大限度地接近(等同于)原件,掃描內容要完整。凡原件中可識別的內容(污跡除外),在PDF文件的打印結果和屏幕顯示結果中應亦可識別;
確認方式:進行1∶1打印后與原件進行對比;
確認指標:符合檔案的原貌視為該項指標合格。
圖像內容整潔
確認目的:保證圖像的美觀與整潔度;
確認方式:用ACDSee看圖軟件將圖片放大至150%,上下移動檢查是否有黑邊、污跡、折痕等無信息價值的圖元存在;
確認指標:頁面整潔,背景色適中,并無黑邊、污跡、折痕等無信息價值的圖元存在視為該項指標合格。
頁面糾偏
確認目的:資料頁面端正;
確認方式:使用Photoshop軟件RGB方式打開確認文件,視圖菜單水平和垂直參考線,與文件內容比較;
確認指標:頁面的糾偏傾斜度不超過±0.5度視為該項指標合格。
漏頁、多頁或重頁
確認目的:確認PDF文件的完整性;
確認方式:與原文件逐頁對照;
確認指標:無漏頁、多頁或重頁的現(xiàn)象視為該項指標合格。
3.1.4書簽著錄
參照有關標準,并結合原文目錄結構及實際章節(jié)結構,采用人工方式進行書簽著錄,即提取目錄建立索引,使生成的PDF文件形成一本瀏覽方便的電子書。
3.1.5添加水印
為了保護資料的所有權,在生成PDF文件的同時,增加分公司標志的靜態(tài)水印標記。參數(shù)如下:
• 外觀旋轉:45°
• 不透明度:11%
• 水印文件相對于目標頁面比例:100%
• 位置:在頁面中心
• 顯示要求:打印時顯示,瀏覽時不顯示
3.1.6專家審核
專家審核是內部三級質量控制中的最后一個環(huán)節(jié)。審核采用抽查的方式,比例不小于百分之三十。最終成果對照紙質檔案資料逐頁審核,檢查有無漏頁、多頁或重頁現(xiàn)象。頁面分辨率不小于200dpi或比對不低于原文件的清晰度。形成的電子文件的清晰度應最大限度地接近(等同于)原件,且內容要完整。逐個檢查PDF書簽與內容是否匹配。審核元數(shù)據內容是否正確、規(guī)范。
經抽檢審核不合格的資料,成批次返還相應崗位進行整改,重新按整理流程進行處理。
4.井史數(shù)字化系統(tǒng)的應用前景及價值(結論)
4.1數(shù)字井下、數(shù)字油田的需要
油田井史檔案“進機”是我們的夙愿!地質大隊現(xiàn)存油田勘探開發(fā)井史資料近十萬口(卷、冊),這些資料是油田開發(fā)50年來幾代石油人的心血和汗水的結晶,是油田彌足珍貴的技術財富。井史檔案數(shù)字化是一個運用現(xiàn)代科技手段的數(shù)字資源系統(tǒng)工程,涉及到信息資源加工、存儲、傳輸、檢索和利用的全過程,是信息基礎建設的重要組成部分。
4.2檔案工作的需要
目前油田開發(fā)設計編制人員在編制設計時,需靠手工查詢紙張原件。 由于檔案量巨大,數(shù)據分類信息復雜,查詢檔案需花費幾個小時的時間查找、抄寫,耗時、耗力;其次檔案需長期保存,為提高存儲環(huán)境,避免可能造成文檔紙張受潮、蟲蝕以及火災等情況發(fā)生,每年投入大量的文檔保管經費已在所難免,且因無備份而又為每年不得不有的文檔損失擔憂;由于檔案需反復查閱,不可避免的存在原件受損或遺失,給文檔的保管與利用帶來管理上的困擾。因此,為幫助油田開發(fā)分析人員進行高效的信息查詢、確保檔案資料長期安全保存,我們在將歷史檔案資料信息化方面努力做些應用嘗試。
4.3實現(xiàn)井史檔案信息化管理和網絡共享
井史資料電子化有利于對油田科學認識的有效積累和應用,從長遠來說,也是分公司發(fā)展的重要推動力。
參考資料:
[1] 毛軍等著,數(shù)據庫原理及應用。1997年7月 重慶大學出版社
[2] 何嘉蓀著,辦公自動化系統(tǒng)與電子檔案管理。2003年1月 浙江大學出版社
[3] 王萍著,電子檔案著錄標準及其應用。2010年1月 吉林大學出版社
【關鍵詞】Podcast Producer;iSCSI;自動轉碼;講座網
【中圖分類號】G40-057 【文獻標識碼】A 【論文編號】1009―8097(2010)04―0103―05
一 前言
大學是人才的培養(yǎng)基地,豐富多彩的講座對于繁榮校園文化,活躍學術氣氛,鼓勵理論研究和學術創(chuàng)新等都具有良好的促進作用。由于講座的重要性,學校常常會錄制各種講座用于資料保存與共享。
學生要聽講座、學校相關部門要錄制講座,這都需要講座預告信息的及時、準確和暢通。而目前在北大獲得講座預告信息的方式主要有三種:通過查看“三角地”的講座宣傳海報和傳單;登陸bbs講座信息版塊;查看各院系最新新聞相關的講座信息。傳統(tǒng)的講座預告信息是分散的而且和其他信息混在一起不利于用戶及時有效地查詢和講座預告信息。與此同時,傳統(tǒng)的講座錄制流程也存在著很多弊端:添加講座視頻的片頭片尾,添加版權保護水印需要進行人工轉碼;講座視頻的需要人工查看其他站點或者紙質的講座預告信息,然后找到已經人工轉碼的相應的講座視頻到網站上。這些過程都是線性的,需要等到添加片頭片尾、編輯轉碼等工作完成之后才能進行工作,這樣一來就需要消耗大量的人力物力,并且出現(xiàn)錯誤的幾率也較大。所以,為了更好地促進北大講座信息的有效送達,提高講座錄像在教學科研中的利用效率,在北大信息化管理辦公室的領導下,北大現(xiàn)代教育技術中心承擔了“北大講座網”的建設和技術支持工作。
二 系統(tǒng)設計目標
讓講座預告信息的與管理及時準確地提供給廣大師生,讓講座預告信息與講座錄制、編碼和過程在支撐平臺上實現(xiàn)信息的整合,通過該系統(tǒng)可以方便地分派拍攝任務、監(jiān)控拍攝狀態(tài)、自動編碼轉碼和自動以提高整個錄制過程的效率是該系統(tǒng)的設計目標。具體說來基于Podcast Producer的講座資源支撐平臺主要解決兩個方面的問題:
1 方便師生了解講座預告信息,訪問和查詢講座資源,它為北京大學各部門提供一個統(tǒng)一的講座信息和講座資源的平臺。用戶無須注冊就能在PC、iPod和移動電話等設備上觀看、訂閱和下載講座資源。通過認證的注冊用戶還可以自主講座信息和講座資源。
2 為講座拍攝單位提供講座拍攝信息,并完成講座拍攝任務分配、拍攝狀態(tài)監(jiān)控、講座視音頻自動轉碼、添加片頭片尾和版權保護水印以及講座原始素材的自動備份管理和流媒體共享等。
三 平臺的設計與實現(xiàn)
1 Podcast Producer簡介
Podcast Producer是美國蘋果公司(Apple Inc.)提供的一個用于編碼、和分配高質量播客的端對端的解決方案。Podcast Producer在設計上使用了Xgrid和Xsan技術,能在網絡上的多臺Mac機和Xserver上分配編碼任務,以適用于大量的制作工作和制作高清晰度的視頻內容。Podcast Producer將Xsan作為一個共享文件系統(tǒng),讓每個編碼系統(tǒng)能通過區(qū)塊級直接訪問文件。因為每個系統(tǒng)都能同時訪問同一個數(shù)據源,所以編碼和制作播客的時間將會大大減少。隨著用戶對播客制作要求的增加,只需簡單地添加Podcast Producer計算節(jié)點,并連接到同一個Xsan即可。此外,通過Podcast Producer,管理員還可以創(chuàng)建完全是自動化工作流程的播客制作項目。目前,最新版本Podcast Producer 2.0是Mac OS X Server version 10.6 Snow Leopard的一個組件,將現(xiàn)有系統(tǒng)升級到Mac OS X Server version 10.6 Snow Leopard就會得到Podcast Producer2.0。
2 工作流程設計
(1)搜集和講座信息
信息來源:A、講座網派專人搜集并講座預告信息。B、各院系信息管理員主動講座預告信息。
信息內容:信息內容主要包括:*講座標題、副標題、*主講人、講座人簡介、講座簡介、聯(lián)系方式、*講座地點、*講座時間、*所屬部門(加星號的為必填項)。
信息查詢:按照院系分類、提供全文搜索、按日期快速定位查詢等。
(2)講座視頻拍攝
派單:根據已的講座預告信息,通過支撐平臺的派單系統(tǒng)下發(fā)講座拍攝任務單給拍攝人員。
拍攝:拍攝人員持講座拍攝單去現(xiàn)場拍攝。
回執(zhí):拍攝完成后登陸系統(tǒng)提交拍攝回執(zhí),回執(zhí)信息包括拍攝狀態(tài),主講人授權情況等。
(3)將拍攝的原始視頻數(shù)據轉為MPEG-2格式
拍攝完之后,把原始數(shù)據轉換為MPEG-2格式,主要參數(shù)如表1所示。
(4)講座視頻
人員:圖書館、現(xiàn)代教育技術中心、經過認證的各院系信息員。
平臺:由現(xiàn)代教育技術中心搭建的基于蘋果系統(tǒng)的Podcast Producer的web平臺。
人員將轉換的MPEG-2格式的視頻文件提交給web平臺,并導入講座信息數(shù)據(講座標題、主講人、簡介、所屬院系等),由事先編制在蘋果系統(tǒng)里面的工作流將員提交的MEPG-2視頻數(shù)據和資源信息提交到素材資源系統(tǒng)進行備份,同時將提交的MPEG-2視頻數(shù)據按照定制的格式(目前暫定為MPEG-4)進行視頻壓縮編碼、自動添加片頭片尾和版權保護水印,最后自動提交到講座資源系統(tǒng)到講座網,提供講座的視頻點播與查詢服務。
3 系統(tǒng)網絡結構設計
該系統(tǒng)依托現(xiàn)有校園網架構,以CERNET為應用擴展,分布結構如圖2所示。
服務器采用蘋果公司的Xserver機架式服務器,具體配置為一顆四核Xeon CPU (每個CPU 主頻為3.0GHZ),內存為6GB,硬盤為2×146GB,雙千兆以太網卡,QLogic 4GB光纖通道卡(用于連接SAN存儲系統(tǒng)),集成RAID 1,雙電源冗余。根據需求不同分別建立兩套存儲系統(tǒng),對于MPEG-4資源采用基于光纖通道的SAN存儲系統(tǒng),并且通過XSAN系統(tǒng)使多臺服務器可以共享讀寫訪問以滿足高速、高并發(fā)量的訪問需求,Podcast Producer將Xsan作為一個共享文件系統(tǒng),讓每個編碼系統(tǒng)能通過區(qū)塊級直接訪問文件。因為每個系統(tǒng)都能同時訪問同一個數(shù)據源,所以編碼和制作播客的時間將會大大減少。隨著對編碼、轉碼要求的增加,只需簡單地添加 Podcast Producer 服務器,并連接到同一個Xsan即可。對于要求高質量視頻信息作為素材保存的MPEG-2采用iSCSI存儲解決方案,該方案在得到大容量存儲空間的同時由于采用基于以太網傳輸?shù)膇SCSI技術,該資源庫可以很方便地與其它媒體資源管理系統(tǒng)共享資源。為了提高系統(tǒng)安全,將數(shù)據庫服務器、編碼服務器放置在以太網LAN后,后端網絡不直接與外網相連,編碼時只需通過web服務器提交編碼需求,該服務器通過xgrid控制器分派工作流任務給編碼服務器集群,同時通過文件系統(tǒng)將需要編碼的原始文件提交給編碼服務器。編輯完成后,編碼服務器將原始的MPEG-2素材文件通過以太網LAN備份到iSCSI存儲,同時將編輯好的MPEG-4文件通過光纖網絡寫入到XSAN存儲,并提交該視頻文件的相關元數(shù)據和鏈接地址給數(shù)據庫服務器,以便于web服務器和流媒體服務器講座信息和講座視頻。軟件環(huán)境方面,操作系統(tǒng)采用Mac OS X Server version 10.6 Snow Leopard,iSCSI服務器采用由rPath Linux驅動的Openfiler搭建,Web服務器采用Apache 2.2.11,數(shù)據服務器采用MySQL 5.0.24。
4 模塊設計
該系統(tǒng)主要分為三大模塊:普通用戶瀏覽模塊、講座模塊和后臺管理模塊,如圖3所示。
(1)普通用戶瀏覽模塊――該模塊主要提供普通用戶查看講座預告信息,訂閱、下載和觀看講座視頻。講座預告和講座視頻按院系劃分并支持關鍵字全文搜索,用戶可以很方便地找到自己需要的內容,點擊講座網首頁日歷中的日期,可以得到當天講座預告,同時用戶可以通過RSS訂閱講座視頻。
(2)講座模塊――該模塊主要提供電教中心、圖書館和院系信息員講座預告信息,同時該模塊還為拍攝單位的拍攝任務下發(fā)、拍攝回執(zhí)、監(jiān)控拍攝狀態(tài)和授權情況、自動編碼、轉碼,講座視頻并根據回執(zhí)狀態(tài)自動到合適的區(qū)域、設置訪問范圍限制等。另外本系統(tǒng)已經完成于北京大學IAAA(統(tǒng)一安全認證系統(tǒng))的對接,對于沒有注冊的在校學生和教職工可以通過校園卡統(tǒng)一賬號登陸講座預告信息(需要管理員審核)。該模塊包括:幻燈片管理、預告管理、講座視頻管理、派單管理,用戶管理和個人信息管理幾個子模塊,結構如圖5所示。
(a)幻燈片管理子模塊――提供用戶與管理首頁海報幻燈片,幻燈片管理采用隊列技術,將幻燈片分為等待隊列、正在展示和已經下架三個隊列,登陸用戶根據權限不同可分為無權限、申請權限和管理權限三種。
(b)預告管理子模塊――提供用戶與管理講座預告信息,審核IAAA用戶的講座預告信息申請。登陸用戶根據自身所屬單位與用戶權限信息分為無權限、院系內、跨院系、管理本單位和管理權限五種。
(c)講座視頻管理子模塊――提供用戶與管理講座視頻。視頻功能后端與podcast producer 工作流相連,它將用戶提交的相關信息傳遞給用戶選選的工作流,工作流按照預定編碼方案進行編碼、轉碼、添加片頭片尾,添加版權保護水印等工作,編碼完成后將視頻的相關信息和視頻鏈接地址返回給數(shù)據庫,通過該子模塊的講座視頻管理功能可以管理講座視頻的相關信息和控制講座點播的授權范圍。
(d)派單管理子模塊提供給拍攝單位下發(fā)講座拍攝任務、監(jiān)控拍攝狀態(tài)、自動匹配講座視頻功能。當講座預告信息后進入派單系統(tǒng)可以對未過期的講座預告信息進行派單并打印講座授權書,拍攝人員持拍攝單到現(xiàn)場拍攝并請主講人簽署講座授權書,拍攝完成后拍攝人員填寫回執(zhí)單并根據授權范圍講座視頻給相應的工作流。
(e)用戶管理子模塊――用來管理用戶信息和用戶模板,該功能主要提供兩種用戶模型:院系信息員和拍攝單位工作人員。可以通過自定義用戶模板方便的控制用戶在各個子模塊中的權限。
(f)個人信息管理子模塊――提供給用戶管理和修改自己的相關信息和密碼。
(3)后臺管理模塊――該模塊主要由站點參數(shù)管理、服務管理、分類管理、HTML生成、數(shù)據庫管理、安全管理幾個子模塊構成。提供給系統(tǒng)管理員設置平臺的基本參數(shù),包括院系一級分類、二級分類、站點域名、上傳大小限制、數(shù)據表命名規(guī)則、版本號、靜態(tài)HTML生成、數(shù)據庫優(yōu)化備份、安全策略等如圖6所示。
5 關鍵技術
(1)Podcast Producer Workflow與數(shù)據庫對接
通過自主開發(fā)基于Ruby on Rails的中間件實現(xiàn)工作流與數(shù)據庫的對接,用戶通過網頁上傳視頻文件到服務器通知調用相應的工作流,該工作流接收到用戶傳來的數(shù)據自動進行原始素材備份、編碼、轉碼、添加片頭片尾等工作,這些工作結束后工作流中調用該中間件將必要的數(shù)據信息寫入到數(shù)據庫。
(2)高性能分布式計算的調配
采用Xgrid 技術結合 Mac OS X Server 的 UNIX 基礎、零配置 Bonjour 技術與目錄服務架構來簡化配置,同時使用管理工具可以輕松地管理 Xgrid 集群、提交工作、監(jiān)控進程以及重新找回結果。當計劃越來越復雜時,Xgrid 控制器可以隨之擴展。Xgrid 需要處理很多天的工作,因此它也需要適時處理系統(tǒng)中斷。當一個系統(tǒng)不再工作時,Xgrid 可以自動察覺,并將任務重新指派給另一系統(tǒng),由于基本的工作信息都儲存在磁盤上,所以當你需要重新啟動控制器時,網格可以即刻恢復工作。
(3)利用iSCSI技術實現(xiàn)桌面系統(tǒng)與計算網格之間共享虛擬存儲的無縫對接
iSCSI(iSCSI:Internet Small Computer System Interface)技術是一種由IBM公司研究開發(fā)的,是一個供硬件設備使用的可以在IP協(xié)議的上層運行的SCSI指令集,這種指令集合可以實現(xiàn)在IP網絡上運行SCSI協(xié)議,使其能夠在諸如高速千兆以太網上進行路由選擇。iSCSI技術是一種新儲存技術,該技術是將現(xiàn)有SCSI接口與以太網絡(Ethernet)技術結合,使服務器可與使用IP網絡的儲存裝置互相交換資料。我們通過利用由rPath Linux驅動的Openfiler搭建起iSCSI Targets服務,在mac平臺利用GlobalSAN客戶端接入,windows平臺利用Microsoft iSCSI Initiator接入。
(4)利用Xsan實現(xiàn)計算節(jié)點和客戶端的文件并行訪問
早期的并行計算采用NFS(Network File System的簡寫,即網絡文件系統(tǒng))來交換數(shù)據,但是NFS利用以太網來交換數(shù)據在處理大數(shù)據量的高清視頻數(shù)據時成為整個系統(tǒng)的瓶頸,采用Xsan系統(tǒng)消除了使用較慢的Gigabit以太網傳輸,如高密格式HD視頻的傳統(tǒng)網絡文件服務器的瓶頸。通過光纖通道的4G端口連接增加數(shù)據傳輸,同時,光纖通道還可以與多路徑光纖通道一起使用獲得較大的集合吞吐量。對需要獲得最高限度應用處理能力的快速數(shù)據訪問,Xsan支持靈活的文件訪問權限,它不但支持Mac客戶端的文件訪問權限,而且與 Windows Server、Windows Vista 和 Windows XP 完全兼容。通過文件系統(tǒng)的 ACLs,任何文件項目可以分配給多用戶和工作組,包括工作組內的工作組。每個文件項目也能被同時賦予允許和拒絕訪問權限,以及一套嚴格的管理控制權限,讀取、寫入和刪除等操作。為了增強系統(tǒng)安全性,Xsan 支持文件權限的繼承方式,當文件移動到 San 系統(tǒng)時或文件拷貝到 San 系統(tǒng)重新寫入時,Xsan 確保用戶權限同時轉移。
(5)與北京大學IAAA 統(tǒng)一安全系統(tǒng)的對接
使用SOAP協(xié)議以webservice方式實現(xiàn)系統(tǒng)對接。依據認證請求的參數(shù)格式構造的XML字串或者XML文件實例化XmlDoc,通過soap協(xié)議向IAAA統(tǒng)一安全系統(tǒng)發(fā)送認證請求包,認證系統(tǒng)將會返回一個結構如下圖所示的xml字串,通過提取字串的相關信息可以得到認證結果和用戶的基本信息,具體如圖7所示。
四 結束語
北京大學講座網已基本達到預期的設計目標,目前已經為全校師生和社會服務,其訪問量排名已達到91262,從開通至今已擁有近十萬用戶,用戶遍及中國大部分省市以及美國歐洲等國家。(2009年12月21日 CNZZ統(tǒng)計數(shù)據)。目前我們正在完善統(tǒng)計分析功能和講座視頻分類方式。如何建立訪問者模型,并通過模型分析與預測用戶所需要的和可能需要的資源類型,符合該類型的資源如何組織、以何種方式呈現(xiàn)給用戶使之達到良好的用戶體驗。“讓人們最便捷地獲取信息,找到所求”是我們努力的方向。
參考文獻
[1] Apple Inc.Podcast Producer Workflow Tutorial[EB/OL].
[2] Doc Searls.DIY Radio With Podcasting[EB/OL].
[3] Apple Inc.iTunes U[Z/OL].
[4] David Flanagan.The Ruby Programming Language[J].
USA:O’Reilly Media, 2009.
[5] 張炳林,楊改學.淺析播客(Podcast)及其在教育中應用的思考[J].現(xiàn)代教育技術,2007,(12).
[6] 徐晶晶,黎加厚.Podcasting 在教學中的應用研究[J]. Distance Education Journal,2007,(6).
[7] 袁軍,胡正榮.面向21世紀的傳播學研究[M].北京:北京廣播學院出版社,2000.
[8] 廖衛(wèi),民趙民.互聯(lián)網媒體與網絡新聞業(yè)務[M].上海:復旦大學出版社,2001.
[9] (美)斯蒂文•小約翰,陳德民葉曉輝譯.傳播理論[M].北京:中國社會科學出版社,1999.
[10] 明安香.信息高速公路與大眾傳播[M].北京:華夏出版社,1999.
[11] 孫寧.掌握非線性編輯的素質要求[J].中國電化教育,2000.