Matarialy CyfAnDanych, Cyfrowa Analiza Danych

[ Pobierz całość w formacie PDF ]
Pojęcia pierwotne
Dane (ang. data, od łac. datum = to, co jest dane, l.mn data) – wszystko to
co jest lub może być przetwarzane umysłowo lub komputerowo
(maszynowo)
Dane przetwarzane przez komputer mają postać symboli - liczb, znaków,
obrazów itp.
Dane wchodzą w skład informacji (symbolom nadane jest znaczenie, np.
wielkość fiz.) które z kolei składają się na wiedzę
Wiedza
Informacja
Dane
Zbiór danych – zbiór pobranych z pewnego środowiska lub procesu.
Najprostszy przypadek zbioru danych – dysponujemy kolekcją m
obiektów, przy czym dla każdego z nich dysponujemy n pomiarami.
Reprezentacja – macierz o wymiarach m
x
n.
Przykład: spis pacjentów
zmienne, cechy, atrybuty, pola n
Analiza danych Poszukiwanie relacji w zbiorze danych
Zbiór danych uzyskany wskutek przeprowadzonego eksperymentu – niewielka
liczba elementów lub prosta struktura zbioru - „klasyczne” metody analizy
danych - analiza statystyczna.
Zbiór danych uzyskany z przeprowadzonych obserwacji – bardzo duża liczba
Zbiór danych uzyskany z przeprowadzonych obserwacji – bardzo duża liczba
elementów, skomplikowana struktura zbioru - eksploracja danych (ang. data
mining) – metody statystyczne są na ogół niewystarczające
Cele analizy danych:
1. Eksploracyjna analiza danych, wizualizacja danych – brak jakichkolwiek
założeń, na temat tego czego szukamy – techniki interaktywne i wizualne
(wykresy)
Efektywne dla stosunkowo niewielkich, niskowymiarowych (2-4) zbiorów
danych – np. techniki rzutowania
2. Modelowanie opisowe – model opisowy służy charakteryzacji wszystkich
danych (a przez to procesu) – np. estymacja rozkładu prawdopodobieństwa
danych, analiza skupień (dzielenie wielowymiarowej przestrzeni na grupy),
tworzenie modeli opisujących związki między rekordami
Segmentacja – np. stosowana powszechnie w badaniach marketingowych do
dzielenia osób na jednorodne grupy na podstawie rodzaju dokonywanych
zakupów i danych demograficznych,
Grupowanie danych – np. analiza długoterminowych zmian klimatycznych -
3. Modelowanie przewidujące (predykcyjne) – zbudowanie modelu na
podstawie którego można będzie przewidzieć (niekoniecznie w czasie) wartość
jednej zmiennej na podstawie znanych wartości innych zmiennych
Przykłady
System śledzący cechy charakterystyczne wszystkich numerów tel. W USA w
celu sprawdzenia, czy jest to telefon w firmie, czy też prywatny.
System do klasyfikowania obiektów astronomicznych na podstawie cyfrowych
zdjęć nieba
[ Pobierz całość w formacie PDF ]

  • zanotowane.pl
  • doc.pisz.pl
  • pdf.pisz.pl
  • mement.xlx.pl