网站首页
网站导航
Ctrl+D收藏
搜索
|
会员
商学院
领导力
企业家
供应链
消费者
营销品牌
知识管理
人力资源
财务管理
战略管理
研发管理
流程管理
商业模式
创业路上
人在职场
你所在的位置:
企业管理
/
大数据
/
综合
ClickHouse开发与使用规范大全
ClickHouse作为一款开源列式数据库管理系统(DBMS)近年来备受关注,主要用于数据分析(OLAP)领域。作者根据以往经验和遇到的问题,总结出一些基本的开发和使用规范,以供使用者参考。
ClickHouse、Doris、 Impala等MPP架构详解
本文分为三部分讲解,第一部分详解MPP架构,第二部分剖析MPP架构与批处理架构的异同点,第三部分是采用MPP架构的OLAP引擎介绍。
基于CLICKHOUSE的数据仓库分层规范
数据仓库我们一般分为接入层、明细层、实体层、主题层、应用层。各层存储的数据粒度不同。
数据湖与湖仓一体架构实践
数据湖是为了应对数据仓库的局限性而开发的。虽然数据仓库为企业提供高性能和可扩展的分析,但它们昂贵、专有,不能处理大多数公司正在寻求解决的现代用例场景。
大数据技术名词解释
常见大数据技术名词解释
如何设计企业级数据埋点采集方案
埋点设计文档面向开发的埋点需求说明书,目的是让开发理解需要在什么情况下做哪些埋点采集,以及具体需要的属性参数类型、取值,确保采集的准确性和完善性。
大型企业如何实现MySQL到Redis的同步
本文将重点讨论在超大规模系统中缓存会面临什么样的问题,以及应该使用什么样的策略来更新缓存。
详解大数据批流处理中的两大架构
随着应用需求的不断发展,数据处理系统的能力也亟待提高。其中最为迫切的,便是如何利用云边协同计算平台的环境优势,实现高效的批流融合处理系统,从而低延迟、高吞吐地对全量历史数据与实时的
商品知识图谱的构建思路
把知识进行表征常用两种方式:一是知识图谱,通过图的方式表达知识的结构;二是向量,把知识用有限维的向量来表达。
微信ClickHouse实时数仓的最佳实践
为了满足业务数据分析的需求,微信WeOLAP团队联手腾讯云,共建千台规模、数据PB级、批流一体的ClickHouse数据仓库,实现了10倍以上的性能提升。本文将由浅入深,为大家揭晓微信在ClickHouse实时
Python结合RFM模型实现用户分层
通过分析发现原来几个重要的客户被竞争对手挖走了,而这几个用户对平台贡献了80%的销售额。之前对所有用户采用一样的运营策略,为了解决这个问题,需要对用户进行分类,了解当前用户分层情况,进行精
企业微信万亿级日志检索系统
虽然现网保留7天最新日志,但是由于某些模块请求量大或日志打印不合理,我们也会限制一个小时日志打印量,超过阈值后不再保存
ETL开发规范
数据抽取:从数据源获取所需数据的过程。数据抽取过程会过滤掉目标数据集中不需要的源数据字段或数据记录。
Flink+Clickhouse在广投集团实时数仓的最佳实践
集团财务共享中心的财务人员在核对财务凭证数据时经常需要跨多个系统查询且每个系统使用方式不一,同时因为系统累计数据庞大,制单和查询操作经常出现卡顿,工作效率非常低。
基于 Flink + ClickHouse 打造轻量级点击流实时数仓
Flink和ClickHouse分别是实时计算和(近实时)OLAP领域的翘楚,也是近些年非常火爆的开源框架,很多大厂都在将两者结合使用来构建各种用途的实时平台,效果很好
相关主题
可视化
机器学习
Hadoop
消息队列
Spark
综合
大家在关注
ClickHouse开发与使用规范大全
ClickHouse、Doris、 Impala等MPP架构详解
基于CLICKHOUSE的数据仓库分层规范
数据湖与湖仓一体架构实践
大数据技术名词解释
如何设计企业级数据埋点采集方案
大型企业如何实现MySQL到Redis的同步
详解大数据批流处理中的两大架构
商品知识图谱的构建思路
微信ClickHouse实时数仓的最佳实践
我们的推荐
阿里/网易/美团/58用户画像中的ID体系建设
用户画像技术及方法论
菜鸟实时数仓技术架构演进
阿里的大数据建设方法论
OPPO数据中台之基石:基于Flink SQL构建实时数仓
6亿用户音乐场景下的AI思考
大数据流处理平台的技术选型参考
全球大数据领域顶级开源工具汇总
今日头条算法推荐原理
从零搭建推荐体系
最新的干货
地图
本站
我们
服务
版权
联系
回馈
博客