基于Hadoop的海量日志处理系统的设计与实现

[复制链接]
查看: 253|回复: 0

2万

主题

3万

帖子

7万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
72282
发表于 2022-5-18 20:49:15 | 显示全部楼层 |阅读模式
目:


雅宝题库答案
****此区域为收费内容****    需支付 1 知识币后可查看,1币=0.01元查看答案


雅宝题库解析:
当今世界已经是互联网的世界,无论是像美英日这样的发达国家还是像中国印度这样的发展中国家,互联网的发展越来越快、普及程度愈来愈高。在这样一个高速发展的互联网世界里,信息量也是呈爆炸似的增长,传统的数据库和计算机系统已经不能在人类所能忍受的时间内得到我们想要的数据,因此分布式计算也就运用而生了。本文正是基于此构建一个可以存储和处理海量日志的数据处理系统,并对日志进行初步的处理,以提供给上层的web应用和数据挖掘之用。本文是建立在由Apache开发的开源的Hadoop分布式系统基础之上。由于对日志的处理任务有:日志下载和上传HDFS任务、日志转码任务、日志过滤任务、中文分词任务、多模式匹配任务、关联分析任务、数据统计任务等,这其中的任务有些可能是一个Job就能完成,但有些任务是由互相关联的一组Job才能完成,因此必须设计出一个任务调度系统来灵活、动态的调度这些任务。该任务调度系统可以将各个任务像插件一样即插即用,动态的关闭和启动某个指定个任务,并且可以对这些任务进行监控和管理。任务之间的运行关系分为并行和依赖两种关系,该系统可以灵活的处理这两种关系进而满足用户多变的需求。





上一篇:车险理赔协同作业系统的设计和实现
下一篇:固定资产投资项目管理信息系统的设计与实现
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精彩课程推荐
|网站地图|网站地图