У курсі "Алгоритми роботи з великими масивами даних" будуть розглянуті статистичні методи роботи з великими даними, такі як множинний кореляційний і регресійний аналіз, а також прикладні їх аспекти, а також низка інших. Зокрема, методи зниження розмірності багатовимірного простору дозволяють без істотної втрати інформації перейти від початкової системи великого числа спостережуваних взаємопов'язаних факторів до системи істотно меншого числа прихованих (неспостережуваних) факторів, що визначають варіацію початкових ознак. Методи компонентного та факторного аналізу, з використанням яких можна виявляти об'єктивно існуючі, але безпосередньо не спостережувані закономірності за допомогою головних компонент або факторів. Методи багатовимірної класифікації призначені для поділу сукупностей об'єктів (що характеризуються великою кількістю ознак) на класи, в кожен з яких повинні входити об'єкти, в певному сенсі однорідні або близькі. Таку класифікацію на підставі статистичних даних про значеннях ознак на об'єктах можна провести методами кластерного і дискримінантного аналізу.
Розвиток обчислювальної техніки і програмного забезпечення сприяє широкому впровадженню методів багатовимірного статистичного аналізу в практику. Пакети прикладних програм зі зручним для користувача інтерфейсом (ми використовуємо програму R) знімають труднощі в застосуванні зазначених методів, які полягають в складності математичного апарату, що спирається на лінійну алгебру, теорію ймовірностей і математичну статистику, і громіздкість обчислень.
Код та найменування спеціальності:
122 Комп’ютерні науки
Рівень вищої освіти: Перший (бакалаврський)
Форма навчання:
Денна
- Teacher: Анатолій Володимирович Нікітін