Repozytorium otwartych danych wysokiej wartości z obserwacji Ziemi i kosmosu

Metadane

Metadane w procesie projektu openSPACE

W CBK PAN trwa realizacja projektu Polski Cyfrowej pod nazwą „openSPACE – repozytorium otwartych danych wysokiej wartości z obserwacji Ziemi i kosmosu” , dzięki któremu gromadzone na przestrzeni lat cenne i unikatowe informacje dotyczące badań m.in. przestrzeni międzyplanetarnej, wokółziemskiej i Ziemi zostaną odpowiednio zdigitalizowane, tj. zarchiwizowane w określony, uporządkowany i specjalistyczny sposób. Selekcja danych, ich oznaczanie, poprawianie jakości, a tym samym przygotowanie ich do udostępnienia w Internecie w odpowiednich formatach obecnie przebiega zgodnie z planem i postępuje adekwatnie do zakładanych etapów. Niezbędną częścią selekcji specjalistycznych i unikalnych danych CBK PAN będzie ich opis wystandaryzowanymi metadanymi.

Metadane w każdym procesie opisu danych, to najprościej rzecz ujmując „dane o danych”, czyli tak przygotowana informacja na temat zasobu danych, aby była możliwa do wykorzystania jej w celu identyfikacji, opisu, zarządzania i udostępniania wyżej wymienionego zasobu. Modele metadanych można podzielić na opisowe (opisujące zawartość merytoryczną zasobu i umożliwiające jej wyszukiwanie), administracyjne (na temat zarządzania i administrowania zasobem) i strukturalne (opisujące relacje pomiędzy poszczególnymi obiektami cyfrowymi). Punktem wyjścia do tworzenia metadanych mogą być następujące podstawy: czego dotyczy zasób danych, jak można wykorzystać określony zasób, gdzie i czy można znaleźć więcej informacji na temat zasobu (np. odnośnik do  strony internetowej albo dokumentacji opisującej zasób), w jaki sposób dołączyć informację o jakości danych.

Warto natomiast zaznaczyć, że istnieje kilka ogólnych standardów i specyfikacji słowników służących do wprowadzenia metadanych do zasobów (Dublin Core do publikowanych materiałów czy SKOS do zbiorów pojęć, etc.), jednak nie funkcjonuje jeden uniwersalny standard, który pasowałby do wszystkich rodzajów zbioru danych i do wszystkich rodzajów instytucji je przechowujących. Do tego niezbędne jest zapoznanie się ze słownikami wykorzystującymi tezaurusy, taksonomię i standaryzowane listy pojęć do przyporządkowywania wartości właściwościom metadanych.

Zatem przygotowanie do digitalizacji ogromnego zasobu danych CBK PAN wymaga detalicznego i analitycznego podejścia do zadania, które oprócz wymaganej dokładności, jest też złożone.

Projekt „openSPACE – repozytorium otwartych danych wysokiej wartości z obserwacji Ziemi i kosmosu” jest realizowany w ramach Programu Operacyjnego Polska Cyfrowa na lata 2014-2020, w Osi Priorytetowej nr 2 „E-administracja i otwarty rząd”; Działaniu nr 2.3 „Cyfrowa dostępność i użyteczność informacji sektora publicznego”; Poddziałaniu nr 2.3.1 „Cyfrowe udostępnienie informacji sektora publicznego ze źródeł administracyjnych i zasobów nauki” (typ II projektu: cyfrowe udostępnienie zasobów nauki).

Skip to content