Описание:Данный курс посвящен статистическим и графическим методам анализа данных с использованием пакетов прикладных программ для персональных компьютеров и рассчитан для студентов второго курса (четвертый семестр)биологического факультета МГУ. Усвоению материала, излагаемого в данном разделе курса, способствует большое число примеров из различных областей биологии. Большое внимание в курсе уделяется, образно говоря, подводным рифам статистических методов анализа данных, с которыми часто сталкивается исследователь. Отличительная особенность курса – широкое использование пакетов прикладных компьютерных программ при анализе экспериментальных данных. Такой подход позволяет опустить изложение утомительных вычислительных процедур и сосредоточить все внимание на главном – применении методов анализа данных и интерпретации результатов. Предполагается, что на практических занятиях при анализе экспериментальных данных в конкретных областях биологии студенты будут использовать персональные компьютеры. При этом студенты обучаются работе с очень популярным в настоящее время пакетом прикладных компьютерных программ анализа данных STATISTICA. Студенты также обучаются самостоятельному составлению компьютерных программ для анализа данных. Конечная цель курса – освоение студентами теоретических подходов и практических методов анализа биологических данных, применяемых в современной мировой науке. СОДЕРЖАНИЕ КУРСА. Основные понятия теории вероятностей. Пространство элементарных исходов и случайные события; операции над событиями; вероятности событий и их свойства; условная вероятность и независимость событий; теорема Бернулли; формула полной вероятности и формула Байеса; Формула Бернулли; случайные величины и функция распределения вероятностей; дискретные случайные величины; непрерывные случайные величины и функция плотности вероятностей; характеристики распределения случайной величины: математическое ожидание, дисперсия, медиана, мода и др.; примеры распределений случайных величин: распределение Бернулли, биномиальное распределение, распределение Пуассона, непрерывное и дискретное равномерные распределения, нормальное и логнормальное распределения; центральная предельная теорема; распределения, связанные с нормальным: распределение хи-квадрат, распределение Стьюдента и распределение Фишера. Характеристики распределения случайных величин: математическое ожидание, дисперсия, среднее квадратическое отклонение, коэффициент вариации, момент порядка ν, центральный момент порядка ν, коэффициент асимметрии, коэффициент эксцесса, медиана, мода, первая и третья квартили, интерквартильный размах, квантиль порядка p. Неравенство Чебышева. Статистические таблицы; многомерные случайные величины и их распределения; условные распределения и независимость случайных величин; коэффициент корреляции; двумерное нормальное распределение. Статистические данные. Понятие случайной выборки; примеры реальных биологических экспериментов; многомерные статистические данные: матрица экспериментальных данных, переменные и наблюдения, количественные, номинальные и ранговые переменные. Дескриптивные и графические методы анализа данных. Гистограмма; эмпирическая функция распределения; полигон частот; таблица частот; двумерные диаграммы рассеяния; множественные двумерные диаграммы рассеяния; трехмерные диаграммы рассеяния; множественные трехмерные диаграммы рассеяния; столбчатые диаграммы; секторные диаграммы; составные линейные диаграммы; звездные графики; лучевые графики; оконные графики; разведочный анализ данных. Статистическое оценивание. Понятие статистической оценки; свойства оценок: несмещенность, состоятельность, эффективность; метод максимального правдоподобия; точечное оценивание характеристик распределения (эмпирическая частота, выборочное среднее, выборочная дисперсия, выборочное среднеквадратическое отклонение, выборочный коэффициент вариации, выборочный коэффициент асимметрии, выборочный коэффициент эксцесса, выборочная медиана, выборочные квартили и интерквартильный размах, выборочная мода, выборочные квантили, выборочный коэффициент корреляции); интервальное оценивание; доверительный интервал для неизвестной вероятности; доверительные интервалы для математического ожидания и дисперсии нормального распределения; доверительный интервал для коэффициента корреляции. Статистическая проверка гипотез. Логика проверки статистических гипотез; ошибки первого и второго рода, уровень значимости и мощность критерия; одновыборочные и двухвыборочные t–критерий и F–критерий; сравнение параметров двух биномиальных и двух пуассоновских распределений; проверка значимости отличия от нуля коэффициента корреляции; критерии согласия (хи–квадрат критерий, одновыборочный критерий Колмогорова–Смирнова); непараметрические критерии: критерий Манна—Уитни для проверки гипотезы об отсутствии сдвига; критерий однородности – двухвыборочный критерий Колмогорова–Смирнова; критерий Спирмена для проверки гипотезы о независимости признаков. Методы многомерного статистического анализа. Классификация методов многомерного статистического анализа; методы анализа связи между двумя системами переменных: корреляционный анализ, регрессионный анализ, дисперсионный анализ и дискриминантный анализ; методы анализа структуры многомерных данных: кластерный анализ, факторный анализ и анализ главных компонент. Исследование зависимостей. Линейный регрессионный анализ; множественная линейная регрессия; метод наименьших квадратов; доверительные интервалы и проверка гипотез в линейном регрессионном анализе; множественный и частный коэффициенты корреляции;