问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

hive函数总结,收藏带走

发布网友 发布时间:2024-10-14 17:46

我来回答

1个回答

热心网友 时间:2024-11-05 19:27

小伙伴们好,工欲善其事必先利其器,hive作为我们与大数据打交道的工具,熟练使用其函数能让我们在后续的数据测试中得心应手。以下是hive函数总结:

目录如下:

1.数据准备

2、字符函数

3、聚合函数

4、数学函数

5、时间函数

6、窗口函数

7、条件函数

1 数据准备

首先,我们创建一张收集用户流量页面的SQL表,这里可以直接在mysql下创建:

预览:

ble data-draft-node="block" data-draft-type="table" data-size="normal" data-row-style="normal">

2 字符函数

这些函数主要用于字符操作,包括拼接、截取、去空格等。

枚举:concat、concat_ws、substring、trim、lpad、rpad、split、find_in_set

2.1 concat

用于拼接字符。

用法:concat(col)

2.2 concat_ws

拼接字符且可以进行分隔。

用法:concat_ws(col, delimiter)

2.3 substring

用于截取字符串。

用法:substring(col, start, length)

2.4 trim

去掉字符串两边的空格。

用法:trim(col)

2.5 repeat

复制函数,用于复制字符串。

用法:repeat(string str, int n)

2.6 lpad

填充函数,默认从左开始补充字符。

用法:lpad(string str, int len, string pad)

2.7 rpad

右补充函数,默认从右开始补充字符。

用法:rpad(string str, int len, string pad)

2.8 split

分割函数,将字符串分割成多个部分,返回一个列表。

用法:split(string str, stringpat)

2.9 find_in_set

查找函数,返回首次出现该字符的位置。

用法:find_in_set(string str, string strList)

3 聚合函数

用于对数据进行汇总、相加、平均、最大值、最小值等操作。

枚举:count、sum、avg、min、max、collect_list、collect_set

3.1 count

汇总,若使用distinct则是去重后再汇总。

用法:count(*) 或 count(distint col)

3.2 sum

相加,若使用distinct则是去重后再汇总。

用法:sum(*) 或 sum(distint col)

3.3 avg

平均值,若使用distinct则是去重后在求平均值。

用法:avg(*) 或 avg(distint col)

3.4 collect_list

将字段组装成一个list,没有去重。

用法:collect_list(col)

3.4 collect_set

将字段组装成一个list,去重。

用法:collect_set(col)

4 数学函数

对数据进行球方差、标准偏差、样本标准层等操作。

枚举:variance、stddev_pop、stddev_samp

5 时间函数

用于时间获取、格式化、计算时间差等操作。

枚举:unix_timestamp、FROM_UNIXTIME、to_date、weekofyear、datediff、date_add、date_sub

5.1 unix_timestamp

获取当前时间戳。

用法:unix_timestamp()

5.2 FROM_UNIXTIME

将时间戳转换为日期格式。

用法:FROM_UNIXTIME()

5.3 to_date

格式化日期。

用法:to_date()

5.4 weekofyear

返回当前周。

用法:weekofyear()

5.5 datediff

计算两个日期的天数差。

用法:datediff()

5.6 date_add

日期增加。

用法:date_add()

5.7 date_sub

日期减少。

用法:date_sub()

6 窗口函数

常用于对现有数据进行排名。

枚举:row_number、RANK、DENSE_RANK

输出:

ble data-draft-node="block" data-draft-type="table" data-size="normal" data-row-style="normal">

7 条件函数

用于处理null值。

枚举:case

这些函数和操作在hive中非常实用,掌握它们能让我们在数据处理和分析中更加得心应手。希望这个总结能帮助到大家!
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
时光公主高性价比氪金项目一览介绍_时光公主高性价比氪金项目一览是什么... 时光公主氪金买什么好介绍_时光公主氪金买什么好是什么 时光公主氪金买什么好 氪金钻石消费攻略 ch61u可以用gtx960显卡吗? 为什么路由器和机顶盒变成黄色网络连接不上 索尼WH-1000XM3耳机怎么通过蓝牙连接 索尼WH-1000XM3蓝牙连接手机教程... 葫芦岛市行政执法投诉办法第一章 总则 葫芦岛市价格调节基金管理办法第一章 总则 葫芦岛市政府信息公开暂行规定第一章 总则 葫芦岛市人民政府制发规范性文件规定第一章总则 往花都区狮岭镇寄信件地址怎么填 芒果椰奶冻(芒果椰奶冻的做法是什么) ...科学发展安全发展促进安全生产形势持续稳定好转的实施意见重点任务... ...科学发展安全发展促进安全生产形势持续稳定好转的实施意见保障措施... 舍甫琴科和克洛泽哪个更厉害 档案被填错了如何找有关部门修改 电脑DVD光驱(不带刻录)与家用DVD有什么区别? 肯定句与否定句的区别的标志是句子中是否有否定词对还是错 为什么牛肉能吃三分熟,而猪肉不能 惠普8470p(C5Q20PA)参数能用XP系统吗 HP 8470p 在win7 64位系统下怎么共享网络。 现在是用网线上网的,网上的... 8470p笔记本,预装win7 Pro 64bit系统。安装正版office软件后,无法... 诺欧NEOMA高等商学院免联考介绍 高考志愿填报 我们华学堂不一样 请问图中的篆字是什么 这个篆字是什么? NetBeans用哪个版本最好 netbeans6.5如何打包成jar netbeans6.5 web开发设计器 NetBeans6.5菜单字体修改 hive内置函数(二):数值处理和字符串处理函数 请问港澳通行证怎样续签??我是今年6月办得通行证,每隔三个月去一次... 办港澳通行证,不是个人自由行,3个月签一次的,一定要签一次香港和一次澳... 我的港澳通行证是今年3月15签发的,如果明年4月1号去香港会过期吗?是三... 哪个真人CS装备厂家生产的发烟装置比较好用? 说说超薄笔记本电脑哪个品牌质量好些呢? 东经120度0度所在的海峡或运河是什么? 茶具如何抽水 茶具的抽水怎么使用 茶具如何自动加水 抽水茶具如何加水 我手机没有装sd卡进QQ就显示sd卡不可用不能看图片也进不了游戏,注我... 世豹航模低温锂电池的价格为什么比普通锂电池贵了这么多? 上市公市roe是什么 印度没有厕所是真的吗 印度人为什么不建厕所 为什么印度女性没有厕所 ipad上有什麽好用的看漫画的app呀? ...得了恶性喷门癌,请叔叔阿姨怎么才能使我爸爸的寿命延长?_百度... 作为写推理小说的新手投哪个网站好 本人173三围907284,体重60kg.请问我身材标准吗?是有型的那种吗。具体...