发布网友 发布时间:2022-04-26 19:58
共1个回答
热心网友 时间:2023-10-26 12:55
【导读】大数据分析工具有很多,不过绝大多数是自己开发,或在某工具上进行二次开发。
大数据业务有很多环节,大致为:
1.
数据搜集:借助工具对研究对象进行数据采集,可以是人工采集——如街头调查、电话采访、现场统计……,也可以是软件采集——如网络爬虫、GPS轨迹、企业ERP历史数据。
2.
数据清洗:对采集到的数据按研究价值进行整理和归类,如:那些数据是无效数据,那的数据是被污染(被刻意篡改)将这些数据剔除,减少干扰。数据清洗的工具同样也有人工和软件,甚至同时使用。
3.
数据加工:对清洗后的数据按研究意图进行整理和归类,如价格(将出厂价、零售价、批发价、开票价、税率、促销价等价格信息进行归类)、品种(按颜色、行业规格、适用环境、质地等进行归类)、日期(将年龄、生日、期间起始日期、库龄等日期相关的归类)
4.
数据统计:对加工过的数据进行预测,发现数据规律。对加工过的数据进行人工抽样(小样本),借助简单的工具来发现一些规律,寻找一些蛛丝马迹,建立数学统计模型和分析算法。
5.
大数据分析:对原始数据(或加工过的数据),通过第4步建立的分析算法,进行“大数据”自动分析,分析过程中,还需要不断修正算法,可能重新回到上述第3步,将原算法推倒从重来。
大数据分析是一个系统工程,是对某种社会行为和自然现象(如购物、交易、人流、设备运转、舆情、气候等)进行分析,需要分析人员掌握很多综合知识,然后借助计算机的运算能力,帮助分析。
最后,回答本提问,大数据分析的工具有很多,手工算、算盘,excel,microsoft
PowerBI,python中的很多模块,mssql,mysql……那个顺手用那个,那个适合业务需要用那个,目前没有“最好”,也没有“行业惯例”,自己选择自己习惯的吧。综上所述,就是小编今天给大家整理发布的关于大数据分析的相关内容,希望可以帮助到大家。