发布网友 发布时间:2022-04-23 01:45
共2个回答
热心网友 时间:2023-10-10 13:07
其实比较的并非是两个数,依然是四个数。这四个数分别是,A词库中的AND 非AND, B词库中的AND 和非AND的频数。此时比较的才是两个词库中AND的频率是否相同。热心网友 时间:2023-10-10 13:07
你把原始数据做个表格追问谢谢你的回答。原文中只是提供了这个标准频数。不过这个不是问题的关键。我的意思是,任意两个数据,比如,12345和45678之间能够直接进行卡方检验吗?eg.单词and在A 语料库中出现了12345次,在B语料库中出现了45678次,A语料库的大小为1,000,000词次,B语料库的大小为2,000,000词次。追答卡方检验比较的是两组率是不是存在不同。所以,你提到的单词的例子通过卡方检验可以比较单词在两个语料库中出现的频率。这个可以!如果只是两个数的话,“12345和45678之间能够直接进行卡方检验吗”是不可以的