SLIDE 1
n the infrastructure of ussian cademy of ciences eading to the ata ntensive cience
ev hchur Science Centre in Chernogolovka
SLIDE 2
ays of development ata ntensive cience for … ig ata – myth and reality realization of in research institutes
SLIDE 3 1) Network ChANT (Chernogolovka Academic Network); 2) -library; 3) server with Open software; 4) luster WALL; 5) luster Manticore; 6) loud «Тучка»; 7) ideo conferencing system VideoGrid; 8)
- nitoring and management.
- f SCC RAS
SLIDE 4
endency of development
ata ntensive cience ig ata – testbed for development, new technologies implementation, … tlas – rid, … ederal ax gency istributed ardware & entralized oftware with the goal - ig ata on the working table
SLIDE 5 ery Big Data =
- lume – very big data volume;
elocity – big speed of data processing; ariety – big diversity of data; eracity – data veracity.
SLIDE 6
ig ata – myth and reality - 1 analysis – 29 RF analysis – Institutes in Physics, analysis – leading , USA and EU analysis – National Research , USA and EU analysis – Intl
SLIDE 7 ig ata – myth and reality – 2 (RF) – only ½ have data nteresting data - Mainly sociology.
Institutes - , astrophysics, space research, meteorology
SLIDE 8 ig ata – myth and reality – 3 (West) Universities – : genome, brain, geodynamics, space research – local resources, no open access data public relation, small amount
– only for the members of collaborations
SLIDE 9
cientific ournals – myth and reality – 4 RF journals – full texts (Письма в ЖЭТФ, УФН, Труды МИАН, ПМТФ, Проблемы передачи информации, Математические заметки, ЖЭТФ) Intl Journals – all volumes (Philosophical Transactions, Nature, Physical Review, Chemical Reviews, Science, …) – not open access – all and open
SLIDE 10 What one can gain from ig ata?
- Извлечение смысла из больших данных
( ata ntensive cience)\ project ( ) project (
SLIDE 11
Problems and features? - 1 ata store and transmit – ig ata olume ( #1) ata processing – ig peed ( #2) isualization – ig esolution ( #2) ard are requirements! and ig ata
SLIDE 12 Problems and features? - 2 ata rocessing – data diversity, unformated data, diversity of representations, text on many human languages ( #3) ata eracity – data reliability ( #4)
are requirements! and ig ata
SLIDE 13
- 1) ommunication channels;
- 2) elecommunication centers – connection with
the networks inside RF;
- 3) elecommunication centers – connection with
the networks inside RF;
for ata torage;
for ata rocessing;
for ata ransmission;
for ccess.
– echnical iew
SLIDE 14
- 1) ata xchange within esearch ollaborations;
- 2) istributed cientific onferences and
- rkshops;
- 3) esearch in omputer ciences;
- 4) ) toring, rocessing, ransmitting and
ccessing ig ata for
– unctions
SLIDE 15
- 1) etwork olicy for esearch ollaborations;
- 2) etwork olicy for nternetwork xchange;
- 3) estbed for cientific xperiments and for merging
echnologies
– eatures
SLIDE 16
- 1) использовании имеющейся ИКТ инфраструктуры
учреждений ФАНО для проведения фундаментальных исследований в области Больших данных;
- 2) разработки программы научных исследований в
области Больших данных для ее выполнения силами научных коллективов учреждений ФАНО;
- 3) разработки программы мероприятий по внедрению
сервисов работы с Большими данными.
- 4) наипервейшего решения требует проблема
бюджетного финансирования магистральных каналов.
SLIDE 17 ути решения (конкурсы, субсидии, …)
- аспределенная аппаратная часть е-инфраструктуры
- ентрализованные программные интегрирующие системы
- пециализированные системы обработки Больших Данных
- ружественный интерфейс пользователя
SLIDE 18
ути решения итата из закона о связи:
“ ехнологические сети связи предназначены для обеспечения производственной деятельности организаций, управления технологическими процессами в производстве.”