IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> MaxCompute 与 AnalyticDB MySQL 数据处理与转换 -> 正文阅读

[大数据]MaxCompute 与 AnalyticDB MySQL 数据处理与转换

AnalyticDB MySQL (简称ads)与 MaxCompute(简称odps) 进行数据转换时,个别语法有差别,记录下来,方便备查。

1、行转列函数

odps 中行转列函数 wm_concat,将列信息转成行显示,可指定分隔符
语法格式
wm_concat(separator, string) ,其中separator为分隔符,支持字符串去重,即distinct.

select wm_concat('|',sku_id)
from t_business_order_odps
where
create_time >= '2022-09-30 00:00:00';

ads 中行转列函数 group_concat,即将列信息转成行显示,默认逗号分隔。如在mysql中查询表的所有列名。

select group_concat(COLUMN_NAME)
from information_schema.COLUMNS
where
TABLE_NAME = 't_business_order';
2、判空函数

odps 中判空函数 coalesce ,如若无运费,则显示为0。

select coalesce(freight_amount,0)
from t_business_order_odps
where
create_time >= '2022-09-30 00:00:00';

odps 中判断函数 decode ,如若无运费,则显示为0。
语法格式
decode(expression, search, result[, search, result]…[, default])
表示:三元运算符,即实现IF-THEN-ELSE分支选择的功能

select decode(order_amount,freight_amount,0)
from t_business_order_odps
where
create_time >= '2022-09-30 00:00:00';

ads 中判空函数 ifnull,如若无运费,则显示为0。

select ifnull(freight_amount,0)
from t_business_order
where
create_time >= '2022-09-30 00:00:00';
3、时间函数

odps 中 时间字段类型为 datetime,获取当前时间函数getdate()

select coalesce(freight_amount,0),getdate() as etl_time
from t_business_order_odps
where
create_time >= '2022-09-30 00:00:00';

ads 中时间字段类型为 timestamp,获取当前时间函数now()

select ifnull(freight_amount,0),now() as etl_time
from t_business_order
where
create_time >= '2022-09-30 00:00:00';
4、建表语句

odps 中 字符串字段类型为 string,时间字段类型为 datetime

CREATE TABLE t_business_order_odps (
	prov_name string COMMENT '省名称',
	city_name string COMMENT '地市名',
	cty_name string COMMENT '区县名称',
	order_no string COMMENT '订单号',
	order_amount bigint COMMENT '运费',
	freight bigint COMMENT '运费',
	insert_month bigint COMMENT '插入月份',
	created_time datetime COMMENT '创建时间'
)
COMMENT '业务订单主表;

ads 中字符串字段类型为 varchar,时间字段类型为 timestamp

CREATE TABLE t_business_orde (
	prov_name varchar COMMENT '省名称',
	city_name varchar COMMENT '地市名',
	cty_name varchar COMMENT '区县名称',
	order_no varchar COMMENT '订单号',
	order_amount bigint COMMENT '运费',
	freight bigint COMMENT '运费',
	insert_month bigint COMMENT '插入月份',
	created_time timestamp COMMENT '创建时间'
)
PARTITION BY HASH KEY (order_no) PARTITION NUM 128
TABLEGROUP ads_sc_rpt
OPTIONS (UPDATETYPE='batch')
COMMENT '业务订单主表';

知识梳理
OPTIONS 类型有两种
1)batch 批量表,即数据批量入库,适用于从odps同步到ads;
2)realtime 实时表,即数据单条入库,适用于日志等信息单条入库。

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-10-08 20:48:45  更:2022-10-08 20:51:49 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年5日历 -2025/5/1 23:01:04-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码