Najpopularniejsza definicja danych mówi, że danymi (ang. data) jest wszystko to, co jest lub może być przetwarzane umysłowo lub komputerowo. Owa "przetwarzalność", czyli możliwość dalszego wykorzystywania danych jest cechą, bez której dane nie mogłyby w ogóle istnieć.
Ze względu na rodzaj treści, wielkość zbiorów, ich prawne oznaczenie oraz sposób ich udostępniania można przeprowadzić kilka podstawowych podziałów danych, z których wyłonią się te najczęściej dziś spotykane: otwarte dane, dane publiczne, czy też tzw. Big Data.
Uściślając, danymi mogą być słowa opisujące cechy dowolnej rzeczy lub zjawiska, liczby stwierdzające ich parametry lub ilość, obrazy będące ich przedstawieniem, wykresy ilustrujące zależności między nimi, nagrania dźwiękowe i filmowe, itp. To samo zjawisko może zostać przedstawione za pomocą różnego rodzaju danych, które opisane, prezentowane i interpretowane w określony sposób i w określonym kontekście, będą stanowiły informację na temat rzeczy lub zjawiska, którego dotyczą.
Bazy danych
Dane dotyczące wielu (często podobnych) obiektów o różnych parametrach przechowywane są w zbiorach, które nazywa się bazami danych. Dają one możliwość przechowywania danych w postaci trwałej, a dzięki archiwizacji i zastosowaniu kolejnych wersji (nowych kopii tego samego pliku dokonanych po kolejnych zmianach) pozwalają na odzyskiwanie danych w wypadku błędów pracy systemu lub niewłaściwej ich ochrony.
Bazy danych wykorzystuje się między innymi w procesie zarządzania informacjami, przy katalogowaniu produktów w sklepach lub podczas przedwyborczych badań opinii publicznej.
Big Data
To właśnie z tym zjawiskiem związany jest termin Big Data, który dotyczy wszelkich aspektów związanych z analizą dużych, różnorodnych, szybko zmieniających się zbiorów danych. Big Data zrewolucjonizowało przemysł i branżę teleinformatyczną dzięki rozwiązaniom realizowanym w ramach tzw. idei 4V: volume (ilość danych), variety (różnorodność), velocity (duża zmienność danych analizowanych na bieżąco) i value (wartość danych).
Baza danych wyszukiwarki Google, w której znajduje się indeks stron internetowych z całego świata zajmuje ponad sto milionów gigabajtów – ten rozmiar tłumaczy dlaczego używamy zwrotu “big data” i dokładnie ilustruje pierwszą z cech: volume.
Po wpisaniu zapytania przez użytkownika, potężne maszyny liczące Google przeszukują bazę danych w celu wskazania najbardziej trafnych wyników: silnik wyszukiwarki bierze pod uwagę różnego rodzaju dane: obrazy, pliki tekstowe, liczby, mapy, filmy, etc. – to właśnie oznacza wspomnianą różnorodność (variety).
Wszystko dzieje się na bieżąco. Co więcej, komputery odpowiedzialne za indeksowanie nonstop modyfikują i uzupełniają istniejącą bazę; do tego jeszcze skrypt wyszukiwarki, zanim wyświetli wyniki, bierze pod uwagę lokalizację użytkownika i jego wcześniejsze zapytania – dlatego wpisanie tego samego zapytania przez dwóch użytkowników w różnych częściach świata, tego samego dnia, ale o innych godzinach może dać zupełnie inne rezultaty. To pokazuje, jak dużą wartość (value) mają duże zbiory danych zarówno dla społeczeństwa, jak i dla biznesu: użytkownicy mogą liczyć na dopasowanie i pracę z danymi w sposób, który jest dla nich użyteczny i pozwala szybciej i lepiej realizować życiowe strategie; przedsiębiorcy natomiast otrzymują lepsze dopasowanie komunikacji i oferty do preferencji użytkownika.
Do czego to może służyć?
Aby uporządkować informacje o procesach związanych z danymi, należy wyróżnić następujące etapy pracy: ustalanie kategorii danych (np. dane tekstowe, dane liczbowe, etc.), tworzenie tabeli i systemów wprowadzania lub automatycznego zbierania danych, gromadzenie danych, katalogowanie i archiwizowanie danych, selekcjonowanie, przetwarzanie i analizowanie danych, dystrybuowanie i publikowanie danych.
Czas na Warszawę
Dane, udostępnione w sposób przejrzysty i wygodny, stają się surowym materiałem pozwalającym tworzyć ekonomiczną i społeczną wartość dodaną…
Źródło: Technologie.org.pl