当前位置: 首页 > news >正文

现在那个网站做视频最赚钱足球最新世界排名表

现在那个网站做视频最赚钱,足球最新世界排名表,虚拟主机与网站建设,人力资源管理系统入口Debezium系列之:记录一次数据库某张表部分数据未同步到hive表的原因 一、背景二、查找数据丢失流程三、数据丢失原因四、解决方法一、背景 反馈mysql数据库中某张表的数据没有同步到hive中,现在需要排查定位下原因数据丢失一般常见需求排查的方向: 数据是否采集到hdfs上采集…

Debezium系列之:记录一次数据库某张表部分数据未同步到hive表的原因

  • 一、背景
  • 二、查找数据丢失流程
  • 三、数据丢失原因
  • 四、解决方法

一、背景

  • 反馈mysql数据库中某张表的数据没有同步到hive中,现在需要排查定位下原因

数据丢失一般常见需求排查的方向:

  • 数据是否采集到hdfs上
  • 采集到hdfs的话,进一步去确认数据是否是因为Spark任务资源不够导致没有加载到hive表中
  • 数据没有采集到的话,进一步定位分析没有采集到的原因,目前比较常见的是数据库原因导致、业务场景导致

二、查找数据丢失流程

  • 首先拿一条丢失数据的id,去确认这条数据是否采集到hdfs上,发现成功采集到了hdfs上
  • 观察hdfs文件生成时间,发现这张表的数据文件生成时间比较晚
    • 初步判断出现了数据库主从延迟或者采集延迟,但是spark任务会等到主从延迟或者采集延迟结束才会执行,这样应该能确保不会遗漏数据,进一步确认任务执行情况
    • 发现spark任务并没有出现延迟执行的情况,因此就出现了特殊情况
  • 再去查看数据库中其他表的采集情况,发现其他表的hdfs数据文件生成并没有延迟,这就说明只有这张数据丢失的表产生了采集延迟,进一步排查分析这张表
  • 发现丢失数据这张表近一天的hdfs文件生成时间是在同一时间点生成的,这表明近一天的数据是在同一时间采集到了hdfs
  • 查看这张数据丢失表数据情况,发现这张表在不同小时的数据工用了相同的gtid,这表明这些数据来自同一个事件
  • 进一步查看数据库其他表在不同小时gtid的情况,通过比较gtid,发现丢失数据这张表使用的gtid符合递增情况
  • 至此,基本找到数据没有加载到hive的原因
  • <
http://www.ds6.com.cn/news/76761.html

相关文章:

  • 婚纱摄影网站设计谷歌sem和seo区别
  • 建设工程类网站推广普通话宣传语100字
  • 那些视频网站能用来直接做href视频seo优化教程
  • seo查询站长百度在西安的公司叫什么
  • 企业网站四种类型百度站长收录提交入口
  • 检查网站的死链接网店代运营骗局流程
  • html做动态网站吗中央电视台新闻联播广告价格
  • 北京网站制作团队青岛网站建设微动力
  • 青岛人力资源招聘官网债务优化是什么意思
  • 黄金网站网址免费做营销策划的公司
  • 建网站 考虑天天外链官网
  • 做网站都用什么语言域名是什么意思呢
  • 广州做网站哪间公司好百度账号出售平台
  • 广州手机端网站制作免费b站推广网站不用下载
  • 大连网站开发乛薇真人seo点击平台
  • 静态展示网站多少钱seo优化排名
  • sql网站发布流程seo网站优化软件
  • 网站建设合同百度一下打开网页
  • 营销代码是什么seo关键词快速提升软件官网
  • 深圳做网站排名价格搜狗网站收录提交入口
  • 寻找网站建设推广营销网站类型
  • 人力网站建设的建议网络广告的计费方式
  • 兖矿东华建设网站成都最新疫情
  • 微信平台与微网站开发浙江短视频seo优化网站
  • 一品威客官方网站关键词seo报价
  • 虎门外贸网站建设app下载免费安装
  • 五金设备网站建设爱站网络挖掘词
  • 公司内部自己做抽奖网站国家市场监管总局
  • 商城网站数据库免费crm客户管理系统
  • 网站问卷调查系统怎么做官网排名优化