传智播客和黑马程序员视频库_技术文章_大数据_最新_第2页

大数据算法--求TopN热搜关键词
搜索引擎的热门搜索排行榜功能你用过吗？你知道这个功能是如何实现的吗？实际上，它的实现并不复杂。搜索引擎每天会接收大量的用户搜索请求，它会把这些用户输入的搜索关键词记录下来，然后再离线地统计分析，得到最热门的 Top 10 搜索关键词。
大数据
浏览6773人
2019-10-30
云计算大数据教程Flink进阶之CEP(复杂事件处理)
Flink CEP是在flink之上实现的复杂事件处理（CEP）库，它允许我们在事件流中检测事件的模式，让我们有机会掌握数据中重要的事项。
大数据
浏览9444人
2019-10-30
Apache Flume timestamp和host拦截器使用
拦截器是简单的插件式组件，设置在source和channel之间。source接收到的时间，在写入channel之前，拦截器都可以进行转换或者删除这些事件。每个拦截器只处理同一个source接收到的事件。可以自定义拦截器

大数据
浏览8796人
2019-09-19
CentOS离线安装
CDH (Cloudera's Distribution, including Apache Hadoop)，是Hadoop众多分支中的一种，由Cloudera维护，基于稳定版本的Apache Hadoop构建，并集成了很多补丁，可直接用于生产环境。是商业版本的Hadoop。
大数据
浏览13624人
2019-09-19
ClickHouse
ClickHouse是一个面向联机分析处理(OLAP)的开源的面向列式存储的DBMS，简称CK, 与Hadoop, Spark相比，ClickHouse很轻量级,由俄罗斯第一大搜索引擎Yandex于2016年6月发布, 开发语言为C++
大数据
浏览23646人
2019-09-19
为什么要对Flume日志收集系统进行分层设计
基于Flume设计实现分层日志收集系统，到底有什么好处呢？我们可以先看一下，如果不分层，会带来哪些问题

大数据
浏览6416人
2019-09-19
SparkMllib如何解决回归问题？
我们都参加过高考，据统计，高考的物理成绩确实与数学成绩有一定关系，但除此之外，还存在很多影响物理成绩的因素，例如：是否喜欢物理，用在物理上的时间等。而当我们主要考虑数学成绩对物理的影响时，就是要考察这两者之间的相关关系。
大数据
浏览6954人
2019-09-19
SparkMllib关于数值型特征的基本处理实践
在SparkMllib中主要分为特征抽取、特征转化、特征选择，特别是在特征转化方面是从一个DataFrame转化为另外一个DataFrame，在数值型数据处理的时候我们对机器学习数据集中的样本和特征部分进行单独的处理，这里就涉及对样本的正则化操作和数值型特征的归一化和标准化的方法，今天就带大家理解这一部分的思考和认识。
大数据
浏览8962人
2019-09-19

获取更多相关资源点击咨询

热门课程推荐

上一页 123 4 下一页共 4 页跳转页确定

传智教育、黑马程序员免费视频教程、公开课资源下载平台 http://yun.itheima.com

苏ICP备16007882号-1 苏公网安备32132202000574号