这里写自定义目录标题
- 问题1:
- 测试
- MySQL 数据信息
- HIVE数据信息
- hive中用 parquet(orc) 列式文件格式存储
- 解决方法
- 问题2:
- 解决方法
问题1:
用公司的大数据平台(DataX)导数,已经开发上线一个多月的一批报表,突然有同事说有个报表数据不准。出在时间字段上。
分析:
1、先看了原数据MySQL字段类型为datetime,目标字段为timestamp类型;
2、经发现所有时间的差距都是8小时,怀疑是因为时区转换的原因;
3、对比其他表,看看是大范围现象还是特殊情况,发现其他的同样情况字段的一样没有问题,也有改变为string字段类型的也没有问题;
测试
MySQL 数据信息
MySQL表名:test
MySQL字段类型如下:
field_name type id int name varchar creat_day_time datetime create_day date create_time time create_time_stamp timestamp -----测试数据如下 id name create_day_time create_day create_time create_time_stamp 1 xiaoming 2023-04-10 14:20:42 2023-04-10 14:20:42 2023-04-10 14:20:42 2 xiaohong 2023-04-21 14:21:02 2023-04-21 14:21:02 2023-04-21 14:21:02
HIVE数据信息
hive中用 text 文件格式存储
hive 表名:test_text
field_name type id int name string creat_day_time string create_day string create_time string create_time_stamp string -----hive 表中的数据: id name create_day_time create_day create_time create_time_stamp 1 xiaoming 2023-04-10 14:20:42 2023-04-10 14:20:42 2023-04-10 14:20:42 2 xiaohong 2023-04-21 14:21:02 2023-04-21 14:21:02 2023-04-21 14:21:02
与mysql表里面数据一致;
hive中用 parquet(orc) 列式文件格式存储
hive表名:test_parquet
导入hive命令:
field_name type id int name string creat_day_time string create_day string create_time string create_time_stamp string -----hive 表中的数据: id name create_day_time create_day create_time create_time_stamp 1 xiaoming 1681107642000 1681056000000 22842000 1681107642000 2 xiaohong 1682058062000 1682006400000 22862000 1682058062000
结论:
1、sqoop(DataX) 导 mysql 到 hive以text文件格式存储时,mysql时间类型:datetime,date,time,timestamp 会被转成 hive 的 string 类型,值保存格式化后的时间字符串
2、sqoop(DataX) 导 mysql 到 hive以parquet(orc)l列式文件格式存储时,mysql时间类型:datetime,date,time,timestamp 会被转成 hive的相应类型,值保存时间戳
解决方法
hive表存储格式为:行式存储(text)格式,hive表相应字段(mysql里面datetime字段)设置为string类型;
问题2:
mysql表中字段类型是tinyint(1),同步到hive中,也会显示出布尔类型,就是true和false。
官网解释如下:
Mysql中存在tinyint(1)时,在数据导入到HDFS时,该字段默认会被转化为boolean数据类型,导致数据内容丢失(都变为NULL)。
解决方法
1、可以在mysql中在建立一张表,将新建立的表修改为int类型,之后在进行同步。
2、修改sqoop的同步脚本。
解决方案:
在–connect参数后的jdbc连接上添加参数:tinyInt1isBit=false
注意:
若有多个参数,需要使用双引号将整个参数值括起来
如:–connect " jdbc:mysql://ip:3306/db?serverTimezone=Asia/Shanghai&tinyInt1isBit=false "
猜你喜欢
- 11天前(瑞士大酒店-自助餐怎么样)瑞意心旅,以食为先 瑞士酒店开启全新"瑞士早餐计划"
- 11天前(甘州区文化旅游局)2025甘津文旅资源对接推介会在兰州举办
- 11天前(云南南博会展馆)旅居云南馆亮相第9届南博会
- 11天前(“清透会呼吸”轻松拿捏春日出游氛围感)“清透会呼吸”轻松拿捏春日出游氛围感
- 11天前(苏梅岛普吉岛哪个好玩)苏梅岛金普顿基塔蕾度假酒店推出家庭度假套餐
- 11天前(天津四季酒店开业时间)天津四季酒店邀你开启灿烂暑假
- 11天前(福州“一县一桌菜”“两马乡宴”品鉴会圆满举办,马尾美食共叙血脉亲情)福州“一县一桌菜”“两马乡宴”品鉴会圆满举办,马尾美食共叙血脉亲情
- 11天前(冬日生活还没安排?上抖音一键打包北方花式过冬精彩)冬日生活还没安排?上抖音一键打包北方花式过冬精彩
- 11天前(芜宣机场国际航班)新华丝路:芜宣机场开通至越南首都河内的国际货运航线
- 11天前(第三届“堡里有年味·回村过大年”民俗花灯会活动)第三届“堡里有年味·回村过大年”民俗花灯会活动
网友评论
- 搜索
- 最新文章
- (2020广州车展哈弗)你的猛龙 独一无二 哈弗猛龙广州车展闪耀登场
- (哈弗新能源suv2019款)智能科技颠覆出行体验 哈弗重塑新能源越野SUV价值认知
- (2021款全新哈弗h5自动四驱报价)新哈弗H5再赴保障之旅,无惧冰雪护航哈弗全民电四驱挑战赛
- (海南航空现况怎样)用一场直播找到市场扩张新渠道,海南航空做对了什么?
- (visa jcb 日本)优惠面面俱到 JCB信用卡邀您畅玩日本冰雪季
- (第三届“堡里有年味·回村过大年”民俗花灯会活动)第三届“堡里有年味·回村过大年”民俗花灯会活动
- (展示非遗魅力 长安启源助力铜梁龙舞出征)展示非遗魅力 长安启源助力铜梁龙舞出征
- (阿斯塔纳航空公司)阿斯塔纳航空机队飞机数量增至50架
- (北京香港航班动态查询)香港快运航空北京大兴新航线今日首航
- (我在港航“呵护”飞机 每一次安全着陆就是最好的荣誉)我在港航“呵护”飞机 每一次安全着陆就是最好的荣誉
- 热门文章