Scalable ¡data ¡store ¡and ¡analy/cs ¡pla1orm ¡for ¡monitoring ¡WLCG, ¡ ¡ ¡a ¡distributed ¡data-‑intensive ¡scien/fic ¡infrastructure ¡ ¡
Uthay ¡Suthakar ¡
Brunel ¡University ¡ eepguus@brunel.ac.uk ¡
Scalable data store and analy/cs pla1orm for monitoring - - PowerPoint PPT Presentation
Scalable data store and analy/cs pla1orm for monitoring WLCG, a distributed data-intensive scien/fic infrastructure Uthay Suthakar Brunel University
Uthay ¡Suthakar ¡
Brunel ¡University ¡ eepguus@brunel.ac.uk ¡
¡ But ¡ ¡
analy/cs. ¡
Batch ¡Layer ¡
Stores ¡constantly ¡growing ¡
Real-‑Time ¡Processing ¡ Layer ¡
Perform ¡analy/cs ¡on ¡fresh ¡
Serving ¡Layer ¡
Stores ¡the ¡batch ¡ processed ¡views ¡for ¡ interac/ve ¡querying. ¡
Three ¡layers ¡architecture: ¡ ¡
processing ¡on ¡Big ¡Data ¡and ¡ producing ¡queryable ¡views. ¡
query ¡(ideally ¡from ¡views ¡ generated ¡by ¡the ¡batch ¡layer). ¡
views ¡based ¡on ¡incremental ¡
¡-‑ ¡Schema: ¡Protocol ¡Buffers ¡& ¡Apache ¡Avro ¡ ¡-‑ ¡Schema-‑less: ¡JSON,BSON, ¡etc.. ¡
(Cloud ¡Service). ¡
based ¡on ¡shards ¡and ¡HTTP ¡PUT ¡ transac/on). ¡
configured ¡as ¡shards ¡(throughput ¡ capacity). ¡
for ¡load ¡balancing, ¡coordina/on ¡and ¡ error ¡handling. ¡ ¡
¡ ¡ ¡ ¡ ¡ ¡aggregate, ¡join, ¡and ¡so ¡on… ¡
Map, ¡Reduce, ¡Join, ¡Filter, ¡GroupBy, ¡Sort, ¡LeiOuterJoin, ¡ RightOuterJoin, ¡Count, ¡Union, ¡Cross, ¡etc..). ¡
in ¡memory. ¡
¡Separate ¡technologies ¡== ¡Complex ¡to ¡manage ¡and ¡