java学到哪才可以检测两个文本的相似度?
发布网友
发布时间:2022-04-26 01:11
我来回答
共1个回答
热心网友
时间:2022-05-02 21:30
学到IO流可以比较文本了, 不过用IO比较文本比较麻烦, 而且效率低
如果要效率高的话, 就需要学
linux + thread + progress
这样子可以通过java调用linux命令
linux中有一个comm -12命令来实现比较两个文件的共同数据, 生成一个新文本。 拿到新文本的大小/旧文本的大小, 旧可以粗略计算出相似度, 而且效率极其高
如果文本有上百万行数据的话, 用IO可能要十几个小时才有结果, 但是linux命令只需要1分钟左右就可以出结果