- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第7章汉语词性自动标注技术 - 白话字台语文
台語文語料處理技術 第七章-漢語詞性自動標注技術 吳家慶 * * 漢語詞性自動標注技術 詞性標注的意義 原意:在給定句子中判定每個詞的語法範疇,確定其詞性 並加以標注。 更多層意義: 一、為更高層次的自然語言文本加工提供素材。 二、為語言學的研究,提供詳實的資訊。 三、從加工過的文本中獲取詞類及頻度的詞性標注知識。 漢語詞性自動標注技術 詞性標注的主要難點 漢語缺乏詞態變化 常用詞兼類嚴重 研究者的主觀意見 漢語詞性自動標注技術 認識詞類劃分的目的、標準等存在的分歧 詞類劃分目的--- 句法分析 理想詞類系統--- 基本符合語言事實 詞類劃分標準--- 依照語法功能 詞類劃分---目前基本上是根據詞的語法功能來劃分 處理兼類詞---脫離語法功能,加上意義標注。 主觀的限制為違背語言事實,故增加了詞性標注困難。 漢語詞性自動標注技術 信息處理用現代漢語詞類及標記集 出處: 山西大學於八零年代提出,希望能適用於計算機 處理,以便進行理解、分析詞語,並進行與其他 語言間之自動翻譯。 漢語詞性自動標注技術 信息處理用現代漢語詞類及標記集 內容: 一、詞與分類體系基本架構 (一)基本詞類共十七大類,大類下依需要設各中類及小類。 (見下頁) 漢語詞性自動標注技術 信息處理用現代漢語詞類及標記集 序號 大類 中類 中類 小類 1 名詞(N) 普通名詞(NG) 專有名詞(NP) 人名(NPF) 姓(NPFF) 名(NPSS) 地名(NPL) 組織名(NPU) 15 助詞(U) 結構助詞(US) 的(USDE) 地(USDI) 得(USDF) 所(USSU) 時態助詞(UT) 了(UTL) 著(UTZ) 過(UTG) 語氣助詞(UY) 用在句末(UYE) 同現語氣詞左部(UYL)
您可能关注的文档
- 等离子体材料改性纳米级处理装置定制的参数及价格.doc
- 登楼赋王粲.ppt
- 等面积递归分解的部分重叠局部直方图均衡 - 光学精密工程.pdf
- 低成本soc 平台mpeg -4 aac 解码器优化策略 - 中国工程科学.pdf
- 低高度角地基gps联合反演大气折射率廓线 - 气象科学.pdf
- 低功耗高速缓存无效缓存路访问混合过滤机制研究 - computer science.pdf
- 低磷胁迫下木豆品种间磷利用效率的差异及其机制 - 生态环境学报.doc
- 低价位、低耗能之网路家庭自动化系统.ppt
- 低渗气藏变形效应的处理方法和合理生产压差的选择倡 - 天然气工业.pdf
- 低渗砂岩储层岩石应力敛感实验与理论研究.pdf
文档评论(0)