知识源于积累,登峰造极源于自律
官方文档:https://clickhouse.yandex/docs/zh/data_types/
固定长度的整型,包括有符号整型或无符号整型。
整型范围(-2n-1~2n-1-1):
Int8 - [-128 : 127]
Int16 - [-32768 : 32767]
Int32 - [-2147483648 : 2147483647]
Int64 - [-9223372036854775808 : 9223372036854775807]
more >> ClickHouse 是俄罗斯的Yandex于2016年开源的列式存储数据库(DBMS),使用C++语言编写,主要用于在线分析处理查询(OLAP),能够使用SQL查询实时生成分析数据报告。
官方文档:https://clickhouse.yandex/docs/zh/data_types/
more >>1 | #!/bin/bash |
事实表作为数据仓库维度建模的核心,紧紧围绕着业务过程来设计。其包含与该业务过程有关的维度引用(维度表外键)以及该业务过程的度量(通常是可累加的数字类型字段)。
事实表通常比较“细长”,即列较少,但行较多,且行的增速快。
事实表有三种类型:分别是事务事实表、周期快照事实表和累积快照事实表,每种事实表都具有不同的特点和适用场景,下面逐个介绍。
more >> 如果把数据看作图书馆里的书,我们希望看到它们在书架上分门别类地放置;如果把数据看作城市的建筑,我们希望城市规划布局合理;如果把数据看作电脑文件和文件夹,我们希望按照自己的习惯有很好的文件夹组织方式,而不是糟糕混乱的桌面,经常为找一个文件而不知所措。
数据模型就是数据组织和存储方法,它强调从业务、数据存取和使用角度合理存储数据。只有将数据有序的组织和存储起来之后,数据才能得到高性能、低成本、高效率、高质量的使用。
高性能:良好的数据模型能够帮助我们快速查询所需要的数据。
低成本:良好的数据模型能减少重复计算,实现计算结果的复用,降低计算成本。
高效率:良好的数据模型能极大的改善用户使用数据的体验,提高使用数据的效率。
高质量:良好的数据模型能改善数据统计口径的混乱,减少计算错误的可能性。
more >>摘要:20年7月,Flink 1.11 新版发布,在生态及易用性上有大幅提升,其中 Table & SQL 开始支持 Change Data Capture(CDC)。CDC 被广泛使用在复制数据、更新缓存、微服务间同步数据、审计日志等场景,本文由社区由曾庆东同学分享,主要介绍 Flink SQL CDC 在生产环境的落地实践以及总结的实战经验
Tips:点击下方链接可查看社区直播的 Flink SQL CDC 相关视频~
https://flink-learning.org.cn/developers/flink-training-course3/
注意: 建表一定是数据集,对数据集进行建表即用df. 而执行SQL是spark.sql()
在老的版本中,SparkSQL提供两种SQL查询起始点:一个叫SQLContext,用于Spark自己提供的SQL查询;一个叫HiveContext,用于连接Hive的查询。
现在是使用的是SparkSession了.实际上就是将两个结合了.所以你很方便的去查寻一个json文件,也可以查询一个hive数据.统一的数据入口
SparkSession是Spark最新的SQL查询起始点,实质上是SQLContext和HiveContext的组合,所以在SQLContex和HiveContext上可用的API在SparkSession上同样是可以使用的。SparkSession内部封装了sparkContext,所以计算实际上是由sparkContext完成的。
在Spark SQL中SparkSession是创建DataFrame和执行SQL的入口
Spark SQL是Spark用来处理结构化数据的一个模块,它提供了2个编程抽象:DataFrame和DataSet,并且作为分布式SQL查询引擎的作用。
我们已经学习了Hive,它是将Hive SQL转换成MapReduce然后提交到集群上执行,大大简化了编写MapReduc的程序的复杂性,由于MapReduce这种计算模型执行效率比较慢。所有Spark SQL的应运而生,它是将Spark SQL转换成SparkCore来运行,然后提交到集群执行,执行效率非常快!
Spark SQL其实和hive替代MapReduce一样的.
more >>标签列表:
缺失模块。
1、请确保node版本大于6.2
2、在博客根目录(注意不是yilia-plus根目录)执行以下命令:
npm i hexo-generator-json-content --save
3、在根目录_config.yml里添加配置:
jsonContent: meta: false pages: false posts: title: true date: true path: true text: false raw: false content: false slug: false updated: false comments: false link: false permalink: false excerpt: false categories: false tags: true
2022-03-29
2022-03-29
#html+css
2022-03-29
#html+css
2022-03-29
#html+css
2022-03-29
#html+css
2022-03-25
#工具
2022-03-23
#工具
2022-03-23
#工具
2022-03-23
#数仓建模
2022-03-16
#hive#pgsql#Hologres
2022-03-10
#spark#SparkStreaming
2022-03-10
#spark
2022-03-09
#flink
2022-02-28
#hive
2022-02-28
#hive
2022-02-20
#Flink
2022-02-19
#Flink
2022-02-19
#Flink
2022-02-19
#Flink
2022-02-19
#Flink
2022-02-19
#Flink
2022-02-17
#Flink
2022-02-17
#Flink
2022-02-17
#Flink
2022-02-17
#Flink
2022-02-17
#Kafka
2022-02-16
#Flink#clickhouse
2022-02-16
#clickhouse
2022-02-16
#clickhouse
2022-02-16
#clickhouse
2022-02-16
#clickhouse
2022-02-16
#shell
2022-02-16
#数据仓库
2022-02-16
#数据仓库
2022-02-15
#Flink
2022-02-15
#轻松一刻
2022-02-15
#spark#spark SQL
2022-02-15
#spark#spark SQL
2022-02-15
#Kafka
2022-02-15
#Kafka
2022-02-15
#Kafka
2022-02-15
#Flink
2022-02-15
#Flink
2022-02-15
#Flink
2022-02-14
#Flink
2022-02-14
#Flink
2022-02-14
#Flink
2022-02-14
#Flink
2022-02-14
#Flink
2022-02-14
#Flink
2022-02-14
#Flink
2022-02-14
#Flink
2022-02-14
#Flink
2022-02-14
#Flink
2022-02-14
#Flink
2022-02-14
#Flink
2022-02-14
#Flink
2022-02-12
#hadoop#yarn
2022-02-11
#Flink
2022-02-11
#Flink
2022-02-11
#Flink
2022-02-11
#Flink
2022-02-11
#Flink
2022-02-11
#Flink
2022-02-10
#Flink
2022-02-10
#Flink
2022-02-10
#kafka
2022-02-10
#hadoop#机架感知
2022-02-10
#Flink
2022-02-07
#Flink
2022-02-07
#Java#Mybatis
2022-02-07
#Java#Mybatis
2022-02-07
#Java#Mybatis
2022-02-07
#Flink
2022-01-31
#动态
2022-01-31
#Flink
2022-01-28
#轻松一刻
2022-01-28
#动态
2022-01-22
#streamx
2022-01-22
#streamx
2022-01-20
#Flink
2022-01-19
#Flink
2022-01-19
#spark
2022-01-19
#spark
2022-01-19
#spark
2022-01-18
#hive
2022-01-18
#hive
2022-01-18
#hive
2022-01-18
#zookeeper
2022-01-18
#动态
2022-01-17
#Hadoop#Hadoop企业级优化
2022-01-16
#Hadoop#Hadoop企业级优化
2022-01-16
#Hadoop#Yarn
2022-01-16
#Hadoop#hadoop压缩
2022-01-16
#Hadoop#hadoop计数器应用#hadoop数据清洗
2022-01-15
#Hadoop#mapJoin#ReduceJoin
2022-01-14
#Hadoop#mapreduce#InputFormat
2022-01-14
#Hadoop#MapReduce#MapTask
2022-01-14
2022-01-14
#纪念册
2022-01-14
#Hadoop#Yarn#Yarn HA
2022-01-14
#Hadoop#HDFS#HDFS HA
2022-01-13
2022-01-13
2022-01-12
#Hadoop#mapreduce#shuffle
2022-01-12
#MapReduce#hadoop
2022-01-12
#Hadoop#HDFS#Namenode#DataNode#SecondaryNameNode
2022-01-12
#Hadoop
2022-01-11
#Linux
2022-01-08
#博客目录索引
2021-12-31
#动态