
- 2019年7月10日-12日,上海攬境展覽主辦的2019年藍(lán)鯨國際標(biāo)簽展、包裝展...[詳情]
2019年藍(lán)鯨標(biāo)簽展_藍(lán)鯨軟包裝展_藍(lán)鯨


- 今日排行
- 本周排行
- 本月排行

- 膠印油墨

- 膠印材料
- 絲印材料
“研制漢字信息處理工程”(“748”工程)
2009-09-17 16:34 來源:中華印刷包裝網(wǎng) 責(zé)編:涂運(yùn)
漢字是中華民族智慧的偉大創(chuàng)造,它一字一義,直觀簡(jiǎn)明,語法簡(jiǎn)單,詞序排序規(guī)則,富于想象和聯(lián)想,聯(lián)合國各國文字的文件中最薄的總是中文。但是,漢字是一種方塊字,結(jié)構(gòu)復(fù)雜、筆畫多、字?jǐn)?shù)多、字體多、一字一音,書寫和讀音都比較困難。 《康熙字典》收入的漢字多達(dá)47000多個(gè),現(xiàn)在常用的也有6700多個(gè),這么多的字要認(rèn)、要記、要用,對(duì)于一般老百姓來說確實(shí)是一件很困難的事。
20世紀(jì)中葉, 電子計(jì)算機(jī)技術(shù)在世界范圍內(nèi)迅速發(fā)展, 極大地推動(dòng)世界各國社會(huì)經(jīng)濟(jì)文化的進(jìn)步,人類進(jìn)入了信息化時(shí)代。用計(jì)算機(jī)處理信息,包括數(shù)據(jù)、文字、圖形、語言等等,但基本的是文字信息處理。西方國家采用拼音文字,一般字母只有幾十個(gè)(英文為26個(gè)) ,字形簡(jiǎn)單,信息量較少,容易實(shí)現(xiàn)對(duì)文字信息的處理。而我國漢字字?jǐn)?shù)多,印刷用的漢字字體也多,有宋體、黑體、楷體、隸書體等10余種,還有10余種不同字號(hào),印刷用的漢字字模數(shù)量超過65萬個(gè),其對(duì)應(yīng)的存儲(chǔ)量超過200億字節(jié),比西文信息存儲(chǔ)量高出上百倍。要使系統(tǒng)軟件具有漢字處理和西文處理互相兼容的能力,許多人都認(rèn)為是一道難以逾越的障礙,一個(gè)世界性公認(rèn)的難題。
1975年,北京大學(xué)王選等一批年輕的學(xué)者立志攻克這個(gè)世界性難題。那時(shí)王選38歲,北大數(shù)學(xué)系畢業(yè),在北大無線電系任助教。他們接受了國家計(jì)委和電子部安排的“漢字信息處理技術(shù)”國家重點(diǎn)研究課題中的漢字精密照排項(xiàng)目任務(wù)。這個(gè)課題因在1974年8月立項(xiàng),因此被稱為“748工程” 。
王選反復(fù)地研究漢字字形的特點(diǎn)和規(guī)律,他發(fā)現(xiàn)漢字雖然字形繁多,但基本筆畫還是很有規(guī)律的,如橫、豎、折等是由基本直線和起筆、收筆及轉(zhuǎn)折等筆鋒所組成,這種規(guī)則筆畫占漢字筆畫總數(shù)一半以上。這種規(guī)則筆畫以宋體為例,可用4~5個(gè)字節(jié)表示,這樣對(duì)提高壓縮倍數(shù)起了重要作用。對(duì)不規(guī)則筆畫,如撇、捺、點(diǎn)等雖然不規(guī)則,但也有一定的曲線變化,也有規(guī)律可循,可以用一連串折線逼近其輪廓曲線。王選一連幾個(gè)月趴在桌子上用放大鏡分析漢字字形的規(guī)律,進(jìn)行艱苦復(fù)雜的統(tǒng)計(jì)和比較,精確地計(jì)算不同筆畫的曲率變化,再分類合并,用參數(shù)描述橫、豎、折等規(guī)律筆畫的長(zhǎng)、寬、傾斜度及變化多端的各種筆鋒,用輪廓描述點(diǎn)、撇、捺等不規(guī)則筆畫,這樣使?jié)h字字形信息量下降數(shù)百倍。同時(shí),他還研究出一整套把折線輪廓復(fù)原成點(diǎn)陣的快速算法和使文字變倍失真盡可能小的變倍算法。高倍率漢字信息壓縮技術(shù),高速度還原技術(shù)和不失真的文字變倍技術(shù)是漢字激光照排技術(shù)的核心。這項(xiàng)技術(shù)的突破就打開了用計(jì)算機(jī)進(jìn)行漢字信息處理的大門,表現(xiàn)了中國人的聰明和智慧。

- 關(guān)于我們|聯(lián)系方式|誠聘英才|幫助中心|意見反饋|版權(quán)聲明|媒體秀|渠道代理
- 滬ICP備18018458號(hào)-3法律支持:上海市富蘭德林律師事務(wù)所
- Copyright © 2019上海印搜文化傳媒股份有限公司 電話:18816622098