<meter id="pryje"><nav id="pryje"><delect id="pryje"></delect></nav></meter>
          <label id="pryje"></label>

          關(guān) 閉

          新聞中心

          EEPW首頁(yè) > 工控自動(dòng)化 > 設(shè)計(jì)應(yīng)用 > 基于模板的對(duì)幾種特殊結(jié)構(gòu)句子的語(yǔ)句改寫

          基于模板的對(duì)幾種特殊結(jié)構(gòu)句子的語(yǔ)句改寫

          作者: 時(shí)間:2009-05-07 來(lái)源:網(wǎng)絡(luò) 收藏

          Np+V+著+N
          →(有)+N+V+在+Np
          在此,Np表示句首方處所結(jié)構(gòu);V表示動(dòng)詞或動(dòng)詞短語(yǔ);N表示句末名詞性結(jié)構(gòu)。
          在原句式中,“掛”和“畫”是動(dòng)作和受事關(guān)系,“墻上”表示存在的處所;在變換式中,“掛”和“畫”仍是動(dòng)作和受事的關(guān)系,“墻上”仍表示“畫”的存在的處所。三者在共現(xiàn)詞之間的語(yǔ)義關(guān)系上保持不變。
          通過(guò)對(duì)存現(xiàn)句的句子結(jié)構(gòu)分析得出各種句法結(jié)構(gòu)框架,進(jìn)一步進(jìn)行抽象化,就得到了改寫。分別以s,f,t表示處所、方位和時(shí)間的品詞標(biāo)記,則每種結(jié)構(gòu)都會(huì)有(s)處所詞,(f)方位詞,(t)時(shí)間詞。將其分離出來(lái),作為該類的關(guān)鍵詞結(jié)構(gòu)。對(duì)于有介詞的句式,將介詞保留或是變換成另一種形式。合并名詞短語(yǔ),形容詞短語(yǔ)等非關(guān)鍵成分,就得到了如下的改寫

          其他幾種句式比如倒裝句、名詞謂語(yǔ)句、雙重否定句、反問(wèn)句、特指問(wèn)句、選擇問(wèn)句、“把”字句、“被”字句、“比”字句等的改寫模板的抽取過(guò)程與上述存現(xiàn)句的類似。


          2 改寫的處理過(guò)程
          模板匹配是基于模板方法的改寫系統(tǒng)的關(guān)鍵,基本思想是實(shí)現(xiàn)一個(gè)具有少數(shù)關(guān)鍵詞常項(xiàng)、任意多個(gè)變項(xiàng)的模板匹配算法,把原語(yǔ)句中的任意符號(hào)串結(jié)構(gòu)自動(dòng)替換成目標(biāo)語(yǔ)句中的符號(hào)串結(jié)構(gòu)。在具有關(guān)鍵項(xiàng)、約束項(xiàng)、任意變項(xiàng)的模板匹配算法的基礎(chǔ)上,可以利用按照一定的層次結(jié)構(gòu)組織存貯的模板,實(shí)現(xiàn)從原語(yǔ)句到目標(biāo)語(yǔ)句的自動(dòng)改寫。在此關(guān)鍵項(xiàng)是指抽出的所有模板共通的關(guān)鍵詞,而約束項(xiàng)是指所有抽出模板中除關(guān)鍵項(xiàng)之外的關(guān)鍵詞。在進(jìn)行語(yǔ)句改寫時(shí)對(duì)將要進(jìn)行改寫的語(yǔ)句抽出其結(jié)構(gòu)框架,計(jì)算它與改寫模板的相似度以決定與之相匹配的改寫模板,計(jì)算式如式(1),式(2)所示。
          關(guān)鍵項(xiàng)相似度和約束項(xiàng)相似度計(jì)算:

          則待改寫句與模板的相似度計(jì)算:

          式中:SKW為待改寫句與模板對(duì)應(yīng)的關(guān)鍵項(xiàng)個(gè)數(shù);RW為待改寫句與模板對(duì)應(yīng)的約束項(xiàng)個(gè)數(shù);TKW為模板中所含關(guān)鍵項(xiàng)個(gè)數(shù);TRW為模板中所含約束項(xiàng)個(gè)數(shù);KWS為待改寫句與模板的關(guān)鍵項(xiàng)相似度;RWS為待改寫句與模板的約束項(xiàng)相似度;TemSim為待改寫句與模板的相似度;α,β是加權(quán)參數(shù)由預(yù)備試驗(yàn)獲得。通過(guò)式(1),式(2)的計(jì)算獲得待改寫句與模板的相似度值,滿足設(shè)定的相似度閾值的模板用于改寫。


          3 語(yǔ)句改寫實(shí)驗(yàn)及考察
          3.1 實(shí)驗(yàn)數(shù)據(jù)及結(jié)果
          實(shí)驗(yàn)使用了從中學(xué)課文中收集的約300個(gè)句子,模板庫(kù)中模板總數(shù)為196個(gè)。語(yǔ)句改寫的輸入內(nèi)容是使用分詞系統(tǒng)得到的分詞和詞性標(biāo)注過(guò)的句子。改寫結(jié)果的正誤判斷通過(guò)手工進(jìn)行。判斷的基準(zhǔn)分為改寫正確和改寫錯(cuò)誤。改寫正確:改寫句沒(méi)有錯(cuò)誤、表達(dá)意思不變或錯(cuò)誤較少及表達(dá)意思基本不變;改寫錯(cuò)誤:信息缺失、語(yǔ)序混亂及表達(dá)意思改變。
          采用評(píng)價(jià)函數(shù)對(duì)抽出模板及其語(yǔ)句改寫的效果進(jìn)行評(píng)價(jià),公式如下:

          式中:CPR為正確改寫率;TCR為模板覆蓋率;CPN為正確改寫數(shù)目;PST為改寫句子總數(shù);IST為輸入句子總數(shù)。由式(3)對(duì)實(shí)驗(yàn)結(jié)果評(píng)價(jià)得到在被改寫句中改寫正確率為74.71%,模板覆蓋率為66.34%。
          3.2 實(shí)驗(yàn)結(jié)果的考察
          在被改寫的語(yǔ)句中隨機(jī)抽取200句,其中錯(cuò)誤改寫句為49句。通過(guò)對(duì)改寫錯(cuò)誤句子進(jìn)行考察,獲得造成改寫誤差的不同原因。在改寫錯(cuò)誤中由于分詞和詞性標(biāo)注錯(cuò)誤而導(dǎo)致改寫的錯(cuò)誤約占19.23%,而由于待改寫句修飾成分過(guò)和多句子過(guò)長(zhǎng),則分詞后的詞匯信息單元過(guò)多,超出了模板所能描述的程度,出現(xiàn)的錯(cuò)誤改寫率占38.46%。模板匹配錯(cuò)誤而導(dǎo)致的改寫錯(cuò)誤有:模板抽出的錯(cuò)誤和相似度計(jì)算不夠精確而導(dǎo)致的錯(cuò)誤的匹配分別占15.38 9/6和26.93%。由此可見(jiàn)對(duì)于較長(zhǎng)的句子需要對(duì)抽出模板的方法進(jìn)一步探討,此外相似度計(jì)算也有進(jìn)一步改進(jìn)的必要。


          4 結(jié) 語(yǔ)
          通過(guò)考察句子的語(yǔ)法結(jié)構(gòu),抽出句子的結(jié)構(gòu)框架從而進(jìn)行了語(yǔ)句改寫模板的構(gòu)造。對(duì)待改寫句則通過(guò)計(jì)算改寫句與相應(yīng)模板的框架中包含的關(guān)鍵項(xiàng)和約束項(xiàng)的相似度進(jìn)行模板的匹配。通過(guò)對(duì)小規(guī)模數(shù)據(jù)進(jìn)行的實(shí)驗(yàn)及考察給出了針對(duì)幾種特殊結(jié)構(gòu)的句子的改寫效果。錯(cuò)誤分析指出了改寫方法及處理細(xì)節(jié)上存在的問(wèn)題,在今后的研究中計(jì)劃針對(duì)抽取模板的細(xì)化、相似度計(jì)算方法的改進(jìn)、擴(kuò)大對(duì)不同結(jié)構(gòu)語(yǔ)句的模板的抽取范圍和進(jìn)行較大規(guī)模數(shù)據(jù)的實(shí)驗(yàn)考察等方面進(jìn)行探討。


          上一頁(yè) 1 2 下一頁(yè)

          關(guān)鍵詞: 模板

          評(píng)論


          相關(guān)推薦

          技術(shù)專區(qū)

          關(guān)閉
          看屁屁www成人影院,亚洲人妻成人图片,亚洲精品成人午夜在线,日韩在线 欧美成人 (function(){ var bp = document.createElement('script'); var curProtocol = window.location.protocol.split(':')[0]; if (curProtocol === 'https') { bp.src = 'https://zz.bdstatic.com/linksubmit/push.js'; } else { bp.src = 'http://push.zhanzhang.baidu.com/push.js'; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();