| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> hive函数 lead()和lag() -> 正文阅读 |
|
[大数据]hive函数 lead()和lag() |
lead()函数和lag()这两个在实际业务中其实用的并没有那么多,不过在sql的面试当中倒是经常出现需要用到lead()和lag()这两个函数的问题,且通常使用这个函数的案例其实都是取连续的日期,之前硬是靠自关联写了一大堆sql写出来的(汗),今天突然发现了这两个函数,就正好写一下吧使用. lead()函数里面可以输入三个参数:(字段,向前行数,值如果为null的话的补充值) 不过这两个一个是取前一条数据,一个是取后一条,我这里拿具体的例子来写一下吧 场景1:
这里day_id是一个具体日期,over开窗函数里没有加distribute by 字段 这样的话etime就是当前行的上一行 场景2:
这样的话,就在over里面进行了分组操作,即把每一个user_id看做一个整体,只取单个user的向前一条数据,你可以理解为,场景二是场景一的细化,把每一个user_id拆成了一个场景一 这里涉及一点开窗的知识. 具体工作当中,还是场景2更常见一些 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年5日历 | -2025/5/1 13:38:01- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |