传智播客和黑马程序员视频库_技术文章_大数据_最热_第3页

CentOS离线安装
CDH (Cloudera's Distribution, including Apache Hadoop)，是Hadoop众多分支中的一种，由Cloudera维护，基于稳定版本的Apache Hadoop构建，并集成了很多补丁，可直接用于生产环境。是商业版本的Hadoop。
大数据
浏览13324人
2019-09-19
kafka自定义拦截器
Producer拦截器(interceptor)是在Kafka 0.10版本被引入的，主要用于实现clients端的定制化控制逻辑。
大数据
浏览12606人
2019-09-19
云计算大数据教程Flink进阶之CEP(复杂事件处理)
Flink CEP是在flink之上实现的复杂事件处理（CEP）库，它允许我们在事件流中检测事件的模式，让我们有机会掌握数据中重要的事项。
大数据
浏览9094人
2019-10-30
SparkMllib关于数值型特征的基本处理实践
在SparkMllib中主要分为特征抽取、特征转化、特征选择，特别是在特征转化方面是从一个DataFrame转化为另外一个DataFrame，在数值型数据处理的时候我们对机器学习数据集中的样本和特征部分进行单独的处理，这里就涉及对样本的正则化操作和数值型特征的归一化和标准化的方法，今天就带大家理解这一部分的思考和认识。
大数据
浏览8534人
2019-09-19
Apache Flume timestamp和host拦截器使用
拦截器是简单的插件式组件，设置在source和channel之间。source接收到的时间，在写入channel之前，拦截器都可以进行转换或者删除这些事件。每个拦截器只处理同一个source接收到的事件。可以自定义拦截器

大数据
浏览8513人
2019-09-19
正则化
正则化是广泛应用于机器学习和深度学习中的技术，它可以改善过拟合，降低结构风险，提高模型的泛化能力，有必要深入理解正则化技术。
大数据
浏览7260人
2019-09-18
SparkMllib如何解决回归问题？
我们都参加过高考，据统计，高考的物理成绩确实与数学成绩有一定关系，但除此之外，还存在很多影响物理成绩的因素，例如：是否喜欢物理，用在物理上的时间等。而当我们主要考虑数学成绩对物理的影响时，就是要考察这两者之间的相关关系。
大数据
浏览6661人
2019-09-19
大数据算法--求TopN热搜关键词
搜索引擎的热门搜索排行榜功能你用过吗？你知道这个功能是如何实现的吗？实际上，它的实现并不复杂。搜索引擎每天会接收大量的用户搜索请求，它会把这些用户输入的搜索关键词记录下来，然后再离线地统计分析，得到最热门的 Top 10 搜索关键词。
大数据
浏览6364人
2019-10-30

获取更多相关资源点击咨询

热门课程推荐

上一页 1 234 下一页共 4 页跳转页确定

传智教育、黑马程序员免费视频教程、公开课资源下载平台 http://yun.itheima.com

苏ICP备16007882号-1 苏公网安备32132202000574号