| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> hadoopsparkscala大数据分布式系统汇总 -> 正文阅读 |
|
[大数据]hadoopsparkscala大数据分布式系统汇总 |
20210724 => 等号 箭头相当于 函数的冒号 偏移量可以理解为索引
配置高可用 (HA)
集群模式和客户端模式的区别? yarn 属于hadoop driver 和 executor 是和计算相关的组件 driver 通过 application master 和master 交互 executor 是进程 有向无环图:依赖关系 A 用到了B 表示 A依赖于B driver 和 executor 都是进程 https://www.zhihu.com/question/62807679/answer/548195113 class 是类 网络中不能传对象,但是可以把对象序列化 普通的java类不能序列化必须 extends(扩展) serializible (抽象接口) scala var 和 val 的区别 RDD 最小的计算单元 数据结构:组织和存储数据的结构 字节流和字符流不同 bufferedinputstream 缓存流 批处理 一行一行读 是字符流 而不是字节流 bufferdreader 是字符流
utf8或者其他编码模式 所需的字节数不一样 各种new 只是设计的功能模块
弹性就是可变的 不是固定的 分片 等于 分区 option 可有可没有 driver 做调度 scala中var 和val的区别 从文件中构建RDD是一行一行读取 是字符 类型为string scala 类型推断
分布式存储系统路径 HDFS
真正用的是具体执行的类 ctrl+H taskscheduleimpl 035 035.尚硅谷_SparkCore - 核心编程 - RDD - 集合数据源 - 分区的设定 0 until numslice 左闭右开 i=> xxx 对i进行右边的操作 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年4日历 | -2025/4/30 17:59:23- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |