План

Вступ

Якісний аналіз даних

Висновки

Вступ

На сьогоднішній день дані, ЕОМ і користувач складають ту тріаду, що лежить в основі аналізу даних. Аналіз даних — це сукупність методів і засобів отримання з певним чином організованих даних інформації для прийняття рішень [3]. Оптимальні принципи аналізу даних черпаються з математичної статистики (головним чином теорії статистичних рішень, теорії оцінок і теорії ігор).

У вітчизняній літературі «аналіз даних» часто синонімічний терміну «прикладна статистика» [3], що підкреслює практичну спрямованість відповідних методів обробки даних.

У нашому випадку будемо віддавати перевагу терміну «аналіз даних», оскільки основна увага буде надалі зосереджена не на статистичних методах, а на особливостях їх використання. Застосування формальних методів аналізу даних (або прикладної статистики) не дає належного результату, якщо не розібратися з тим, як і які дані можна і потрібно вводити в обробку, для чого потрібен результат і що з ним можна, а чого не можна робити.

Роль ЕОМ у процесі аналізу даних характеризується двома аспектами: вона служить інструментом для швидкого рахунку й акумулятором знань, тому що машинні програми дають можливість використовувати знання й уміння інших людей. Тому використання ЕОМ — це фактично використання накопиченого досвіду фахівців з аналізу даних, помноженого на швидкість виконання рутинної роботи.

Останньою складовою названої тріади є користувачі, під якими мають на увазі усіх тих, хто використовує ЕОМ для вирішення своїх прикладних задач. Клас користувачів дуже неоднорідний. Більшість його складають так звані «наївні» користувачі, що не мають навичок програмування. Але «наївність» в інформатиці, аналізі даних, обчислювальній статистиці (тобто в областях їх некомпетентності) аж ніяк не означає відсутності в такого користувача знань в інших областях, і він, як правило, є професіоналом у своїй предметній області (економіці, фізиці, медицині, соціології і т. п.) і має глибокі знання про природу тих даних, які він хоче опрацьовувати [3].

До появи ЕОМ дані оброблялися переважно вручну або з застосуванням простих механічних пристроїв. Спеціаліст-статистик був єдиним у трьох особах — вія був і тим, хто ставить задачу, і методологом її вирішення, і технічним виконавцем. З появою і розвитком ЕОМ функції розділилися: математик-програміст створював програми, а збирав дані і ставив завдання щодо обробки фахівець предметної області. Він же в тісному контакті з математиком інтерпретував результати обробки.

Проте останнім часом виникає інша типова ситуація, коли швидко зростає парк персональних ЕОМ і, відповідно; число користувачів, а кількість фахівців зростає досить повільно. В зв'язку з цим, при побудові інформаційних технологій, знання користувачем методів і прийомів аналізу даних є надзвичайно важливим.

На даний час існує не так багато відмінних один від одного і стійко працюючих на реальних даних математичних методів. Назвемо умовно такі методи базовими, їх описи можна знайти в літературі з математичної статистики [1, 2, 3, 6, 8, 12]. Є також методи, аналогічні базовим, що дають приблизно такі ж результати в більшості практичних ситуацій і відрізняються від них у деталях, та методи для «витончених» і «ідеальних» даних, що звичайно не можуть застосовуватися на практиці через відсутність необхідних умов, але дозволяють фахівцю з аналізу даних оцінювати шляхом зіставлення структуру вихідних даних. На жаль, дві останні групи переважають над двома першими (рис. 3.1).

Якщо глибше вникнути в причини виникнення цієї ситуації, то неважко переконатися, що вона викликана неоднаковим підходом до процесу обробки даних і споконвічного розуміння «даних». Для математики дані — це, насамперед, деяка математична абстракція — не величина сили вітру, а дійсне число, не опис знайдених в експедиції зразків гірських порід, а вибірка з якоїсь генеральної сукупності за певним законом розподілу. Але будь-яка абстрактна модель побудована на системі чітких і однозначних понять, принципів, аксіом, що забезпечують завбачення поведінки моделей, однозначність висновків і наслідків, одержання строгих результатів, але лише в рамках цієї формальної системи.

Проте, як тільки мова заходить про реальні дані користувача, а не про абстрактні дані математика, що явно укладаються в прийняту модель, виникає маса питань, найголовніше з яких — чи відповідають засади, покладені в основу моделі, реальній ситуації.

Математика це питання не хвилює, оскільки воно виходить за рамки його традиційної області діяльності. У користувача, особливо початківця, таке питання не виникає в силу глибокої віри в досконалість машини і надійність розроблених для неї програм. Задають його лише стурбовані фахівці, що постійно стикаються з необхідністю обробки саме реальних, а не ідеальних даних.

Останнім часом підвалини класичної статистики систематично розхитуються через те, що багато дослідників вважають цілий ряд її аксіом і засад неадекватними реальності [3]. З іншого боку, багато існуючих формальних методів, хоча і грунтуються на перевірених моделях, але мають обмежене застосування через те, що реальні дані, які відповідають цим моделям, зустрічаються не досить часто.

Очевидно, сьогодні можна говорити про новий етап розвитку прикладних статистичних методів, направлених на дослідження природи опрацьовуваних даних із позицій визначення їхньої реальності і системності [17]. Реальність передбачає використання передумов і порівняння результатів, завжди орієнтуючись на єдиний критерій істинності. Системність припускає всебічний (і, як правило, багатократний) розгляд не тільки самих реальних даних, але і неформальних знань фахівця предметної області і фахівця з аналізу даних, врахування зовнішніх чинників і зв'язків об'єкта досліджень і т. д. Таким чином, у даний час починаються спроби ліквідувати розрив між даними формальними і даними реальними за допомогою наведення додаткових зв'язків між дійсністю і формалізмом машинної обробки.

Характеристики работы

Реферат

Количество страниц: 15

Бесплатная работа

Закрыть

Качественный анализ данных

Заказать данную работу можно двумя способами:

  • Позвонить: (097) 844–69–22
  • Заполнить форму заказа:
Не заполнены все поля!
Обязательные поля к заполнению «имя» и одно из полей «телефон» или «email»

Чтобы у вас была возможность удостовериться в наличии вибраной работы, и частично ознакомиться с ее содержанием,ми можем за желанием отправить часть работы бесплатно. Все работы выполнены в формате Word согласно всех всех требований относительно оформления работ.