当前位置: 首页 > news >正文

宜章网站建设百度浏览器下载安装

宜章网站建设,百度浏览器下载安装,深圳建设工程交易服务网老网站,盘锦网站建设Hive窗口函数 其他函数: Hive—Hive函数 文章目录Hive窗口函数开窗数据准备建表导入数据聚合函数window子句LAG(col,n,default_val) 往前第 n 行数据LEAD(col,n, default_val) 往后第 n 行数据ROW_NUMBER() 会根据顺序计算RANK() 排序相同时会重复,总数不会变DENSE…

Hive窗口函数

其他函数: Hive—Hive函数


文章目录

  • Hive窗口函数
  • 开窗
  • 数据准备
  • 建表
    • 导入数据
    • 聚合函数
    • window子句
    • LAG(col,n,default_val) 往前第 n 行数据
    • LEAD(col,n, default_val) 往后第 n 行数据
    • ROW_NUMBER() 会根据顺序计算
    • RANK() 排序相同时会重复,总数不会变
    • DENSE_RANK() 排序相同时会重复,总数会减少
    • first_value取分组内排序后,截止到当前行,第一个值
    • last_value取分组内排序后,截止到当前行,最后一个值
    • NTILE(n) 数据切片函数


开窗

又称开窗函数

OVER():指定分析函数工作的数据窗口大小,这个数据窗口大小可能会随着行的变而变化

数据准备

字段为 name,orderdata,cost

jack,2015-01-01,10
tony,2015-01-02,15
jack,2015-02-03,23
tony,2015-01-04,29
jack,2015-01-05,46
jack,2015-04-06,42
tony,2015-01-07,50
jack,2015-01-08,55
mart,2015-04-08,62
mart,2015-04-09,68
neil,2015-05-10,12
mart,2015-04-11,75
neil,2015-06-12,80
mart,2015-04-13,94

建表

----建表------
create table if not exists t_window(name string,orderdate date,cost int
)

导入数据

原始数据的已经上传到hdfs上

load data inpath '/order.csv' into table  t_window;# 查看数据
select * from t_window;

在这里插入图片描述

聚合函数

常见聚合函数(count(),sum(),max(),min(),avg()……)

---全表数据cost的总和
select name,orderdate,cost,sum(cost) over () from t_window;

在这里插入图片描述

window子句

UNBOUNDED 起点
CURRENT ROW 当前行
n PRECEDING 往前 n 行数据
n FOLLOWING 往后 n 行数据
UNBOUNDED PRECEDING 表示从前面的起点
UNBOUNDED FOLLOWING 表示到后面的终点
select name,orderdate,cost,sum(cost) over (partition by name order by orderdate rows between unbounded preceding and unbounded following) as row1,---个人累计消费总和sum(cost) over(partition by name order by orderdate) as row2,--个人截止到当前时间的消费总和sum(cost) over(partition by name order by orderdate rows between unbounded preceding and current row ) as row3,--个人截止到当前时间的消费总和sum(cost) over(partition by name order by orderdate rows between 1 preceding and current row ) as row4,---当前消费额与上一次消费额的总和sum(cost) over(partition by name order by orderdate rows between 1 preceding and 1 following ) as row5, --前行和前边一行及后面一行sum(cost) over(partition by name order by orderdate rows between current row and UNBOUNDED FOLLOWING ) as row6,--当前行及后面所有行sum(cost) over(partition by name order by orderdate rows between current row and 3 following) as row7 --当前消费与后三次的消费总额
from t_window;

在这里插入图片描述

LAG(col,n,default_val) 往前第 n 行数据

分区内滞后当前行的参数值

select name,orderdate,cost,-----前一个日期lag(orderdate,1,'1990-01-01') over (partition by name order by orderdate) as row1
from t_window;

在这里插入图片描述

LEAD(col,n, default_val) 往后第 n 行数据

分区内当前行前导行的参数值

select name,orderdate,cost,----后一个日期lead(orderdate,1,'1990-01-01') over (partition by name order by orderdate) as row2
from t_window;

在这里插入图片描述

ROW_NUMBER() 会根据顺序计算

row_number()从1开始,按照顺序,生成分组内记录的序列,row_number()的值不会存在重复,当排序的值相同时,按照表中记录的顺序进行排列

---根据名字分区,消费金额降序排序
select name,orderdate,cost,row_number() over (partition by name order by cost desc ) as row1
from t_window;

在这里插入图片描述

RANK() 排序相同时会重复,总数不会变

rank() 生成数据项在分组中的排名,排名相等会在名次中留下空位

select name,orderdate,cost,rank() over (partition by name order by cost desc )as row2
from t_window;

在这里插入图片描述

DENSE_RANK() 排序相同时会重复,总数会减少

dense_rank() 生成数据项在分组中的排名,排名相等会在名次中不会留下空位

select name,orderdate,cost,dense_rank() over (partition by name order by cost desc )as row3
from t_window;

在这里插入图片描述

first_value取分组内排序后,截止到当前行,第一个值

select name,orderdate,cost--------按名字分区,查询第一笔消费的时间与所有时间对比(有需求查询员工的入职时间,与此类似),first_value(orderdate)over (partition by name order by orderdate)as time1
from t_window;

在这里插入图片描述

last_value取分组内排序后,截止到当前行,最后一个值

select name,orderdate,cost--------按名字分区,查询当前行的最后一个时间,last_value(orderdate)over (partition by name order by orderdate)as time2
from t_window;

在这里插入图片描述

NTILE(n) 数据切片函数

把有序窗口的行分发到指定数据的组中,各个组有编号,编号从 1 开始,对于每一行,NTILE 返回此行所属的组的编号
注意:n 必须为 int 类型

select name,orderdate,cost,ntile(3) over() as row1---把数据分成三份
from t_window;

在这里插入图片描述

select name,orderdate,cost,ntile(3) over(partition by name)as row2---按名字分组 切片成三份
from t_window;

在这里插入图片描述

http://www.ds6.com.cn/news/60978.html

相关文章:

  • 那些网站反爬做的好口碑营销方案怎么写
  • 西安专业网站建设公司seo推广seo技术培训
  • 广州网站开发制作seo引擎优化是什么
  • 网站上的链接怎么做的线上推广活动有哪些
  • 平面设计师磨刀石百度快速seo优化
  • 网站被做镜像什么意思可以全部免费观看的软件
  • 免费创一个网站活动推广文案
  • 网站建设公司怎么盈利保定百度seo排名
  • 企业网站开发协议seo排名教程
  • 男女做那个视频网站湖南seo推广多少钱
  • 永久免费的网站软件杭州今天查出多少阳性
  • 江门网百度seo在线优化
  • 免费个人简历武汉久都seo
  • 用tomcat做网站目录长沙百度搜索排名优化
  • 网站建设服务器端软件鹤壁网站推广公司
  • 网页设计实训总结结尾seo顾问咨询
  • 企业网站备案容易吗湖南seo优化服务
  • 第一次做网站选多大空间什么叫网络市场营销
  • 没有备案的网站百度不收录免费网络营销软件
  • 如何给网站加关键词怎么做营销
  • 广东省交通建设监理检测协会网站腾讯推广平台
  • 手机网站建设新闻网站注册账号
  • 电商网站建设分析搜索网排名
  • 怎么自己做网站的推广快速网站seo效果
  • 如何设置网站标题建站公司
  • 50万县城做地方网站百度seo推广方案
  • 自己做的网站怎么弄成appseo快速工具
  • 网站初期建设该做什么seo网络推广有哪些
  • 站酷网怎么样成都sem优化
  • 电子商务网站建设需要网站建设费用明细表