1、DataGen SQL 连接器
FLinkSQL中可以使用内置的DataGen SQL 连接器来生成测试数据
官网链接:DataGen SQL 连接器
2、随机数数据生成器
随机数数据生成器支持随机生成 char、varchar、binary、varbinary、string 类型的数据
它是一个无界流的数据生成器
-- TODO 随机数数据生成器 创建source表 drop table random_datagen_source_table; CREATE TABLE random_datagen_source_table ( user_name string, user_id int ) WITH ( 'connector' = 'datagen', 'rows-per-second'='1', -- 指定生成速率:每秒生成的行数(默认值:10000) -- TODO 对表中的每个字段,进行配置 -- 生成随机整数 'fields.user_id.kind'='random', -- 指定 数据生成器类型:random 随机数 'fields.user_id.min'='1', -- 指定 随机数的最小值 'fields.user_id.max'='1000', -- 指定 随机数的最大值 -- 生成随机字符串(字段类型为string时,可以指定string长度) 'fields.user_name.kind'='random', -- 指定 数据生成器类型:random 随机数 'fields.user_name.length'='3' -- 指定 随机生成字符串的长度 ); -- 流式SQL select * from random_datagen_source_table;
运行结果:
3、序列生成器
序列数据生成器,可以根据指定的起始值和结束值生成连续的整数数据
当序列数字达到结束值,读取结束,所以它是有界的生成器
-- TODO 序列数据生成器 创建source表 drop table sequence_datagen_source_table; CREATE TABLE sequence_datagen_source_table ( user_id int ) WITH ( 'connector' = 'datagen', 'rows-per-second'='1', -- 指定生成速率:每秒生成的行数(默认值:10000) -- TODO 对表中的每个字段,进行配置 'fields.user_id.kind'='sequence', -- 指定 数据生成器类型:sequence 序列 'fields.user_id.start'='1', -- 指定 序列的起始值 'fields.user_id.end'='120' -- 指定 序列的结束值 ); -- 批式SQL select * from sequence_datagen_source_table;
运行结果:
猜你喜欢
- 4小时前OpenWRT搭建个人web站点并结合内网穿透实现公网远程访问
- 4小时前ImageNet Classification with Deep Convolutional 论文笔记
- 4小时前防火墙部署安全区域
- 4小时前[Flink] Flink On Yarn(yarn-session.sh)启动错误
- 4小时前kafka基础知识总结
- 4小时前Flink SQL
- 4小时前打败一切NeRF! 3D Gaussian Splatting 的 简单入门知识
- 4小时前【HarmonyOS】深入了解 ArkUI 的动画交互以提高用户体验
- 2小时前手机掉厕所怎么办(手机掉蹲厕里了应该怎么处理)
- 1小时前小考成绩怎么查(小考成绩怎么查2024山西)
网友评论
- 搜索
- 最新文章
- 热门文章