国产综合久久久久-狠狠色噜噜狠狠狠狠av-国产女人乱人伦精品一区二区-亚洲a∨国产av综合av下载-爱做久久久久久

首頁 > 期刊 > 自然科學與工程技術 > 基礎科學 > 地球物理學 > 地球信息科學學報 > 基于BiLSTM-CRF的中文層級地址分詞 【正文】

基于BiLSTM-CRF的中文層級地址分詞

程博; 李衛紅; 童昊昕 華南師范大學地理科學學院; 廣州510631; 航天精一(廣東)信息科技有限公司; 廣州510665
  • 中文分詞
  • 地址標注
  • 中文層級地址分詞

摘要:中文地址分詞是中文地址標準化的基礎工作和地理編碼的重要手段,同時也是中文分詞和地理研究領域中關注的熱點問題之一。針對當前中文地址分詞方法缺乏地址層級切分和過多依賴詞典和特征的問題,本研究結合四詞位標注集和中文層級地址特點,構建針對中文層級地址分詞的地址標注體系,并提出融合雙向長短時記憶網絡和條件隨機場(BiLSTM-CRF)的中文層級地址分詞模型。該模型既考慮了BiLSTM模型能夠記憶上下文地址的特性,也保留了CRF算法可以通過轉移概率矩陣控制地址標注輸出的能力。針對該地址標注體系標注的訓練地址樣本,分別使用CRF、LSTM、BiLSTM與BiLSTM-CRF模型進行訓練對比。結果表明:①基于中文地址標注體系的模型分詞效果更佳,地址標注更為精細,符合實際地址分布情況;②BiLSTM-CRF模型精確度達到93.4%,高于CRF(90.4%)、LSTM(89.3%)和BiLSTM(91.2%),其整體地址分詞性能和各層級地址分詞效果相對于其他模型更突出;③各模型分詞性能與地址層級保持一致,即地址層級越高,分詞效果越好。本研究提出的中文地址標注體系和分詞模型為開展中文地址標準化工作提供了方法參考,同時也為進一步提升地理編碼技術的精準度提供了可能。

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

投稿咨詢 文秘咨詢

地球信息科學學報

  • 預計1-3個月 預計審稿周期
  • 1.68 影響因子
  • 科學 快捷分類
  • 月刊 出版周期

主管單位:中國科學院;主辦單位:中國科學院地理科學與資源研究所;中國地理學會

我們提供的服務

服務流程: 確定期刊 支付定金 完成服務 支付尾款 在線咨詢
主站蜘蛛池模板: 99久久久无码国产精品6| 人妻少妇av无码一区二区| 国产精品免费看久久久无码| 国产精品-区区久久久狼| 国精产品自偷自偷综合下载| 起碰免费公开97在线视频| 亚洲精品乱码久久久久久蜜桃| 中文字幕无码家庭乱欲| 欧美mv日韩mv国产网站app| 精品乱码久久久久久中文字幕| 97精品国产97久久久久久免费| 99热亚洲色精品国产88| 2020国产精品精品国产| 日韩人妻无码一区二区三区久久99| 久久不见久久见中文字幕免费| 艳妇臀荡乳欲伦交换在线播放| 丰满熟女人妻中文字幕免费| 亚洲精品成人网线在线播放va| 人妻少妇久久中文字幕| 亚洲精品毛片一区二区三区| 亂倫近親相姦中文字幕| 精品人妻av区乱码| 国产精品久久久久久久网| 纯爱无遮挡h肉动漫在线播放| 国产人妻人伦精品1国产盗摄| 国产精品一区二区含羞草| 国产午夜无码视频免费网站| 日日天干夜夜人人添| 国产成人精品视频ⅴa片软件竹菊| 国模雨珍浓密毛大尺度150p| 亚洲熟女一区二区三区| 琪琪电影午夜理论片八戒八戒| 午夜福利无码一区二区| 少妇特黄a一区二区三区| 国产人妻aⅴ色偷| 手机国产乱子伦精品视频| 丁香五月欧美成人| yy6080久久伦理一区二区| 国产内射老熟女aaaa| 麻豆精品国产精华精华液好用吗 | 亚洲欧美日韩综合一区在线|