传智播客和黑马程序员视频库_技术文章_大数据_最热_第2页

【云计算大数据】Spark数据倾斜解决方案
在执行shuffle操作的时候，是按照key，来进行values的数据的输出、拉取和聚合的。
大数据
浏览56281人
2019-05-21
【云计算大数据】搜索引擎选择： Elasticsearch与Solr
lasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。它可以用于全文搜索，结构化搜索以及分析，当然你也可以将这三者进行组合。Elasticsearch是一个建立在全文搜索引擎 Apache Lucene™ 基础上的搜索引擎，可以说Lucene是当今最先进，最高效的全功能开源搜索引擎框架。
大数据
浏览46099人
2019-05-21
云计算大数据教程概率图模型介绍
概率图模型是在概率模型的基础上，使用了基于图的方法来表示概率分布，是一种通用化的不确定性知识表示和处理方法，在人工智能、机器学习和计算机视觉等领域有广阔的应用前景。
大数据
浏览40547人
2019-10-30
云计算大数据教程数据仓库的基本架构
数据仓库的目的是构建面向分析的集成化数据环境，为企业提供决策支持（Decision Support）。其实数据仓库本身并不“生产”任何数据，同时自身也不需要“消费”任何的数据，数据来源于外部，并且开放给外部应用，这也是为什么叫“仓库”，而不叫“工厂”的原因。因此数据仓库的基本架构主要包含的是数据流入流出的过程，可以分为三层——源数据、数据仓库、数据应用

大数据
浏览38375人
2019-10-30
MapReduce开发运行的精简原理
相信关于Hadoop中MapReduce的相关文章会很多，这里只简单介绍一下MapReduce的相关知识。
大数据
浏览28379人
2019-09-18
云计算大数据教程埋点的介绍及用途
数据埋点是数据采集的一种重要方式，主要用来记录和收集终端用户的操作行为，其基本原理是在App/H5/PC等终端部署采集的SDK代码，当用户的行为满足某种条件的时候，比如进入某个页面、点击某个按钮等，会自动触发记录和存储，然后这些数据会被收集并被传输到终端提供商，或者是通过后端采集用户使用服务过程中的请求数据。
大数据
浏览28055人
2019-10-30
ClickHouse
ClickHouse是一个面向联机分析处理(OLAP)的开源的面向列式存储的DBMS，简称CK, 与Hadoop, Spark相比，ClickHouse很轻量级,由俄罗斯第一大搜索引擎Yandex于2016年6月发布, 开发语言为C++
大数据
浏览24310人
2019-09-19
Kafka的常用API
需要用到的类：KafkaProducer：需要创建一个生产者对象，用来发送数据ProducerConfig：获取所需的一系列配置参数ProducerRecord：每条数据都要封装成一个ProducerRecord对象

大数据
浏览20411人
2019-09-18

获取更多相关资源点击咨询

热门课程推荐

上一页 123 4 下一页共 4 页跳转页确定

传智教育、黑马程序员免费视频教程、公开课资源下载平台 http://yun.itheima.com

苏ICP备16007882号-1 苏公网安备32132202000574号