更新时间:2025-03-12 17:57:57
封面
版权页
内容提要
大数据专业系列图书 专家委员会
序
前言
第1章 开启ETL之旅
任务1.1 认识ETL
1.1.1 了解ETL
1.1.2 选择ETL工具
任务1.2 配置Kettle运行环境
1.2.1 安装JDK
1.2.2 安装MySQL数据库
1.2.3 配置Kettle
任务1.3 熟悉Kettle基本操作
1.3.1 认识Kettle界面
1.3.2 新建转换与任务
1.3.3 运行与查看结果面板
小结
课后习题
第2章 源数据获取
任务2.1 创建数据库连接
2.1.1 建立数据库连接
2.1.2 设置参数
2.1.3 测试和浏览数据库连接结果
2.1.4 建立/停止共享数据库连接
任务2.2 表输入
2.2.1 建立表输入转换工程
2.2.2 设置参数
2.2.3 预览结果数据
任务2.3 CSV文件输入
2.3.1 建立CSV文件输入转换工程
2.3.2 设置参数
2.3.3 预览结果数据
任务2.4 Excel输入
2.4.1 建立Excel输入转换工程
2.4.2 设置参数
2.4.3 预览结果数据
任务2.5 生成记录
2.5.1 建立生成记录转换工程
2.5.2 设置参数
2.5.3 预览结果数据
任务2.6 生成随机数
2.6.1 建立生成随机数转换工程
2.6.2 设置参数
2.6.3 预览结果数据
任务2.7 获取系统信息
2.7.1 建立获取系统信息转换工程
2.7.2 设置参数
2.7.3 预览结果数据
第3章 记录处理
任务3.1 排序记录
3.1.1 建立排序记录转换工程
3.1.2 设置参数
3.1.3 预览结果数据
任务3.2 去除重复记录
3.2.1 建立去除重复记录转换工程
3.2.2 设置参数
3.2.3 预览结果数据
任务3.3 替换NULL值
3.3.1 建立替换NULL值转换工程
3.3.2 设置参数
3.3.3 预览结果数据
任务3.4 过滤记录
3.4.1 建立过滤记录转换工程
3.4.2 设置参数
3.4.3 预览结果数据
任务3.5 值映射
3.5.1 建立值映射转换工程
3.5.2 设置参数
3.5.3 预览结果数据
任务3.6 字符串替换
3.6.1 建立字符串替换转换工程
3.6.2 设置参数
3.6.3 预览结果数据
任务3.7 字符串操作
3.7.1 建立字符串操作转换工程
3.7.2 设置参数
3.7.3 预览结果数据
任务3.8 分组
3.8.1 建立分组转换工程
3.8.2 设置参数
3.8.3 预览结果数据
第4章 字段处理
任务4.1 字段选择
4.1.1 建立字段选择转换工程
4.1.2 设置参数
4.1.3 预览结果数据
任务4.2 增加常量
4.2.1 建立增加常量转换工程
4.2.2 设置参数
4.2.3 预览结果数据
任务4.3 将字段值设置为常量
4.3.1 建立将字段值设置为常量转换工程
4.3.2 设置参数
4.3.3 预览结果数据