发布网友 发布时间:2023-05-05 15:00
共1个回答
热心网友 时间:2023-11-15 21:56
拟订常用字表时,还统计了汉字在不同学科的分布和使用度。统计汉字在不同学科的分布,可以衡量某个字的使用分布是否均匀。如某个字在单一学科中使用频度较高,但在其他学科中却很少出现,这说明它的分布是不均匀的。与此相反,有的字不仅使用频率较高,而且能在多学科中出现,这说明它的分布是均匀的。选取分布均匀的字,可以避免选字的片面性。
我们以1985年3月北京航空学院计算机科学与工程系和中国文字改革委员会汉字处合作统计的《现代汉语用字频度表》作为统计汉字使用分布的资料。该资料有十科用字频度表:1.文体生活用字频度表;2.历史哲学用字频度表;3.*经济用字频度表;4.新闻报道用字频度表;5.文学艺术用字频度表;6.建筑运输用字频度表;7.农林牧渔用字频度表;8.轻工业用字频度表;9.重工业用字频度表;10.基础知识用字频度表。
使用度是将汉字的使用频率与该字在各个学科中的分布进行综合考虑的一种计算方法。计算汉字使用度的公式是:
上述公式的计算条件是假定各个分科的抽样量是均匀的。其中,Ni是K号字在第i类语料中的相对频率,NK是K号字在综合类里的相对频率,n是语料的分类数,DK是K号字的散布系数,SK是K号字的标准分布偏差,UK是K号字的使用度,FK是K号字的出现字次。我们在统计汉字的使用度时,对上述公式进行了调整,调整后的公式是:
其中,DIK和DEK都是我们采用的k号字的散布系数,LK是k号字的分布系数。
热心网友 时间:2023-11-15 21:56
拟订常用字表时,还统计了汉字在不同学科的分布和使用度。统计汉字在不同学科的分布,可以衡量某个字的使用分布是否均匀。如某个字在单一学科中使用频度较高,但在其他学科中却很少出现,这说明它的分布是不均匀的。与此相反,有的字不仅使用频率较高,而且能在多学科中出现,这说明它的分布是均匀的。选取分布均匀的字,可以避免选字的片面性。
我们以1985年3月北京航空学院计算机科学与工程系和中国文字改革委员会汉字处合作统计的《现代汉语用字频度表》作为统计汉字使用分布的资料。该资料有十科用字频度表:1.文体生活用字频度表;2.历史哲学用字频度表;3.*经济用字频度表;4.新闻报道用字频度表;5.文学艺术用字频度表;6.建筑运输用字频度表;7.农林牧渔用字频度表;8.轻工业用字频度表;9.重工业用字频度表;10.基础知识用字频度表。
使用度是将汉字的使用频率与该字在各个学科中的分布进行综合考虑的一种计算方法。计算汉字使用度的公式是:
上述公式的计算条件是假定各个分科的抽样量是均匀的。其中,Ni是K号字在第i类语料中的相对频率,NK是K号字在综合类里的相对频率,n是语料的分类数,DK是K号字的散布系数,SK是K号字的标准分布偏差,UK是K号字的使用度,FK是K号字的出现字次。我们在统计汉字的使用度时,对上述公式进行了调整,调整后的公式是:
其中,DIK和DEK都是我们采用的k号字的散布系数,LK是k号字的分布系数。