嘿咻嘿咻免费无码专区在线观看,亚洲AV无码专区一区二区天堂,无码专区—VA亚洲V天堂,日本又硬又爽又色的视频在线观看
歡迎您來(lái)到浙江省機(jī)械工業(yè)聯(lián)合會(huì)網(wǎng)站
當(dāng)前位置:
質(zhì)量標(biāo)準(zhǔn) >> 標(biāo)準(zhǔn)數(shù)字化……...
×

標(biāo)準(zhǔn)數(shù)字化……

2023-12-05 15:54閱讀數(shù):330

一、標(biāo)準(zhǔn)數(shù)字化的概念。文字識(shí)別,又稱為光學(xué)字符識(shí)別(英文名:Optical Character Recognition,簡(jiǎn)稱OCR) , 其工作原理為通過(guò)電子設(shè)備(例如掃描儀或數(shù)碼相機(jī)等光學(xué)輸入設(shè)備)獲取紙張上的文字圖片信息,利用各種模式識(shí)別算法分析文字形態(tài)特征,判斷出漢字的標(biāo)準(zhǔn)編碼,并按通用格式存儲(chǔ)在文本文件中。由此可以看出, OCR是讓計(jì)算機(jī)認(rèn)字,實(shí)現(xiàn)文字自動(dòng)輸入。是一種快捷、省力、高效的文字輸入方法。針對(duì)標(biāo)準(zhǔn)文本加工的現(xiàn)狀與需求, 將OCR技術(shù)運(yùn)用到標(biāo)準(zhǔn)文本加工領(lǐng)域,已經(jīng)成為標(biāo)準(zhǔn)加工與標(biāo)準(zhǔn)信息服務(wù)的趨勢(shì)。

標(biāo)準(zhǔn)數(shù)字化是從研究、挖掘標(biāo)準(zhǔn)全文的潛在價(jià)值出發(fā),采用計(jì)算機(jī)技術(shù),將常見(jiàn)的語(yǔ)言文字(或圖形符號(hào))轉(zhuǎn)化為能被計(jì)算機(jī)識(shí)別的數(shù)字符號(hào),從而制成標(biāo)準(zhǔn)題錄數(shù)據(jù)庫(kù)和標(biāo)準(zhǔn)全文數(shù)據(jù)庫(kù),用以揭示標(biāo)準(zhǔn)文獻(xiàn)信息資源的一項(xiàng)系統(tǒng)工作。

二、標(biāo)準(zhǔn)起草應(yīng)注意的“線”(一)擴(kuò)大標(biāo)準(zhǔn)檢索的范圍、豐富檢索內(nèi)容。傳統(tǒng)標(biāo)準(zhǔn)信息檢索的方法和手段具有很大的局限性,尚處于初級(jí)搜索檢索階段,主要表現(xiàn)在:標(biāo)準(zhǔn)全文檢索缺失,仍停留在標(biāo)準(zhǔn)題錄的檢索。標(biāo)準(zhǔn)題錄只是標(biāo)準(zhǔn)全文的目錄,其承載的信息有限,而標(biāo)準(zhǔn)全文才是標(biāo)準(zhǔn)的主體,才是標(biāo)準(zhǔn)信息的主要承載者。標(biāo)準(zhǔn)全文檢索的缺失使標(biāo)準(zhǔn)服務(wù)效率無(wú)法實(shí)質(zhì)提升。檢索方式上僅停留在簡(jiǎn)單的分類檢索。如國(guó)家標(biāo)準(zhǔn)、國(guó)外標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)、地方標(biāo)準(zhǔn)和標(biāo)準(zhǔn)圖書等各大類的檢索,缺少二次擴(kuò)展檢索。依據(jù)對(duì)標(biāo)準(zhǔn)數(shù)字化轉(zhuǎn)化成果,配合開(kāi)發(fā)標(biāo)準(zhǔn)相應(yīng)的標(biāo)準(zhǔn)檢索系統(tǒng),將擴(kuò)大標(biāo)準(zhǔn)檢索的范圍、豐富檢索內(nèi)容。

借助新的檢索手段,可以實(shí)現(xiàn)檢索智能化,可以對(duì)標(biāo)準(zhǔn)信息內(nèi)容直接抽取。例如可在標(biāo)準(zhǔn)的前言、引言、范圍、規(guī)范性引用文件、術(shù)語(yǔ)等限定范圍內(nèi)進(jìn)行關(guān)鍵詞檢索和結(jié)果數(shù)據(jù)抽取,以及對(duì)標(biāo)準(zhǔn)文本中的圖形和表格進(jìn)行檢索和結(jié)果數(shù)據(jù)抽取,實(shí)現(xiàn)了用戶對(duì)所需信息的智能提供,實(shí)現(xiàn)了傳統(tǒng)的信息檢索向高精度檢索、文本挖掘、知識(shí)發(fā)現(xiàn)等方向轉(zhuǎn)變。(二)提高標(biāo)準(zhǔn)加工的效率、保障標(biāo)準(zhǔn)數(shù)據(jù)的準(zhǔn)確性。目前,標(biāo)準(zhǔn)加工錄入的字段中,標(biāo)準(zhǔn)的英文名稱、適用范圍、起草單位、批準(zhǔn)單位、出版單位、提出單位、歸口單位等字段均為手工錄入。由于傳統(tǒng)的數(shù)據(jù)加工模式是手工錄入,維護(hù)的字段又多,因此標(biāo)準(zhǔn)加工的效率較低:又因標(biāo)準(zhǔn)加工量大、人員少,未能實(shí)現(xiàn)數(shù)據(jù)校對(duì)后入庫(kù),因此,數(shù)據(jù)錄入的準(zhǔn)確性得不到保障。(三)為標(biāo)準(zhǔn)研究提供扎實(shí)的基礎(chǔ)。運(yùn)用PDF標(biāo)準(zhǔn)數(shù)字化轉(zhuǎn)化成果, 可以避免以上出現(xiàn)的準(zhǔn)確性問(wèn)題。原來(lái)這些英文名稱、適用范圍、起草單位、批準(zhǔn)單位、出版單位、提出單位、歸口單位等需手工打字著錄的字段可以通過(guò)復(fù)制、粘貼完成,提高標(biāo)準(zhǔn)加工的效率,從而保障標(biāo)準(zhǔn)數(shù)據(jù)的及時(shí)性和準(zhǔn)確性。通過(guò)對(duì)標(biāo)準(zhǔn)文本數(shù)字化的轉(zhuǎn)化,可對(duì)標(biāo)準(zhǔn)信息資源的深層次加工,充分挖掘標(biāo)準(zhǔn)文獻(xiàn)資源內(nèi)在附加值。借助標(biāo)準(zhǔn)文本數(shù)字化轉(zhuǎn)化的成果,可以進(jìn)行標(biāo)準(zhǔn)立項(xiàng)前的查新;借助標(biāo)準(zhǔn)文本數(shù)字化轉(zhuǎn)化的成果,可以輕松、高效的進(jìn)行標(biāo)準(zhǔn)之間技術(shù)指標(biāo)的比對(duì);借助標(biāo)準(zhǔn)文本數(shù)字化轉(zhuǎn)化的成果,可以通過(guò)具體指標(biāo)的查詢,快速精確的對(duì)標(biāo)準(zhǔn)進(jìn)行定位;借助標(biāo)準(zhǔn)文本數(shù)字化轉(zhuǎn)化的成果,可以對(duì)標(biāo)準(zhǔn)中強(qiáng)制性條款、關(guān)鍵性指標(biāo)進(jìn)行分析與研究。標(biāo)準(zhǔn)數(shù)字化建設(shè)將為標(biāo)準(zhǔn)研究的開(kāi)展提供堅(jiān)實(shí)的基礎(chǔ)。

轉(zhuǎn)自論文《標(biāo)準(zhǔn)數(shù)字化的初探》,作者:胡甌靜,江蘇省標(biāo)準(zhǔn)化研究院,


——來(lái)源:學(xué)習(xí)標(biāo)準(zhǔn)化
登錄|注冊(cè)
嘿咻嘿咻免费无码专区在线观看,亚洲AV无码专区一区二区天堂,无码专区—VA亚洲V天堂,日本又硬又爽又色的视频在线观看