Хотелось бы освоить ковариационный анализ и в связи с этим возник следующий вопрос. Насколько я себе представляю (вполне, может быть, что неверно) ковариационный анализ предназначен для учета (или контроля) случайной изменчивости со стороны тех факторов, которые не учитываются в обычном дисперсионном анализе (не суть важно одно- или многофакторном). В ковариационном анализе в дополнение к категориальным предикторным переменным (факторам), при наличии только одной непрерывной переменной отклика (зависимая переменная), вводятся (одна или больше) т.н. ковариаты (непрерывные предикторные переменные), в отношении которых делаются допущения (предположения) о том, что эти ковариаты обуславливают некоторую долю вариации зависимой переменной (наряду с факторами). Т.е. это своего рода гибрид дисперсионного и регрессионного анализа. Опять же, насколько я себе представляю, влияние со стороны ковариат есть лишь в случае когда между зависимой переменной и ковариатой (ковариатами) существует корреляционная связь. Допустим изучалось влияние облучения в двух разных дозах (скажем 1 и 3 Гр) на активность альфа-амилазы в сыворотке крови крыс (однофакторный anova). Как видно из результатов этого анализа STATISTICA 8) влияние фактора разных доз облучения незначимо. Введем в этот анализ ковариату - массу крыс - и проведем ковариационный анализ. Как видно из его результатов, влияние фактора доз облучения по-прежнему не значимо. А вот как интерпретировать результаты по ковариате (масса животных), я не знаю (предположу - на основе значений F и р, что ее влияние также не значимо). Отдельно проведенный корреляционный анализ (активность амилазы и масса животных) для зависимой переменной и ковариаты показал отсутствие связи между ними. Результаты для фактора разных доз в присутствии ковариаты практически не изменились (сравнительно с ее отсутствием). Другой гипотетический пример. Допустим изучалось влияние фактора двух разных возрастных категорий (скажем, 20-40 и 50-70 лет) на массу тела людей. Как видно из результатов, влияние фактора возраста на массу тела незначимо. Введем ковариату - рост. Влияние ковариаты (рост) значимо. Влияние возраста по-прежнему не значимо, но результаты для него существенно изменились. Между весом и ростом обнаружена корреляция (r=0,98). Т.е., насколько я понимаю касательно данного примера, рост людей в основном и определяет их вес, а не возраст. Соблюдаемость допущений и ограничений не проверял (насколько мне известнтно, для ANCOVA их больше, чем для ANOVA). Насколько верны мои рассуждения и трактовки результатов касательно ковариат? В смысле здесь (в ANCOVA) тоже только говорят о значимости или не значимости влияния ковариат (как в ANOVA по фактору(ам))? Спасибо!
Картинки:
One_way_ANOVA.jpg — (45.81)
ANCOVA.jpg — (107.42)
ANCOVA_2.jpg — (80.02)
ANCOVA_3.jpg — (59.27)
ANCOVA_4.jpg — (48)
One_way_ANOVA___2.jpg — (36.93)
One_way_ANOVA___2.jpg — (36.93)
ANCOVA_2_2.jpg — (76.65)
ANCOVA___3_2.jpg — (42.55)
Guest, 18.06.2012 12:53
Blaid, я не по вопросу отвечаю. НО! Посмотрите в сторону SAS, если вы этого не сделали раньше. Это дружеский совет. (Можно пойти к R.)
Blaid, 18.06.2012 13:29
Спасибо! Но не совсем понял Ваш ответ (если не понял вовсе - пожалуйста, поясните). Вы про что? Про то, что SAS или R (или и то, и другое) лучше чем STATISTICA? Очень может быть, не буду даже с этим спорить. А SAS или R сами по себе что-ли интерпретируют результаты? Помимо "голых" цифр (на основе которых и делают выводы) выдают еще что-то? Прямо расписывают результат, что вот это так-то (значимо - не значимо) и потому то? Собственного участия после машинного расчета уже больше не нужно? Сомневаюсь, хотя с данными программами не работал. Но каких-либо предубеждений против этих пакетов не имею, готов (и даже хотелось бы) работать и с ними. Так сложилось, что для машинного анализа первоначально (не считая Excel) стал использовать STATISTICA, вот и юзаю её чаще других...
Guest, 18.06.2012 13:53
да, я про переход на SAS. С вашим комментарием согласен. Из своего мизерного опыта с SAS делаю вывод о том, что легче (правда, в сравнении с R) в сети легче найти статьи/комментарии к output и сами коды + сильна теор. база хелпа = (почти) легко освоить. Извините за оффтоп (в своё время мне не подсказали).
Den-N, 18.06.2012 15:57
Посмотрите эту тему: http://forum.disser.ru/index.php?showtopic...%ED%E0%EB%E8%E7 Несмотря на название она почти целиком посвящена анкове - начиная с сообщения #18. В целом, полезно прочитать всю эту ветку и сообщения всех участников, кроме Green. Обратите внимание на мои сообщения #60 и #70. В первом из них выкладывал программу для спрямления нелинейных зависимостей с помощью преобразования Бокса-Кокса (она бесплатная, но сейчас недоступна на сайте её автора), что важно для анковы. Во втором - полностью рассчитанный пример из специализированной книги по ков. анализу, рассчитанный практически вручную. Результаты можно сравнивать как с результатами Statistica, так и с результатами SAS, выкладки из которой приведены в самой книге.
Blaid, 20.06.2012 20:35
Den-N! Большое спасибо! Весьма познавательный материал по методологии ANCOVA. Что называется для закрепления рассчитал свой (придуманный) пример в соответствии с Вашей методологией (делал по Вашему образцу, так что извините за плагиат; и там не все так подробно расписано, как у Вас) - просьба "сильно не бить" за данное "произведение". Хотя определенные вопросы остались. Насколько я понял "пример из Вашего примера": типы конфет - эт фактор ( с шестью градациями), скорость растворения конфет во рту - зависимая переменная, скорость растворения стандарта -ковариата. Результаты свидетельствуют о том, что в данном примере влияние как фактора, так и ковариаты статистически значимо. Извините, что продолжаю настаивать и "тупить", но как же все таки это понимать (интересует шире - как вообще понимать и интерпретировать результаты ANCOVA)? Значимость влияния фактора понятно - не все типы конфет растворяются за одно и то же время, что уже обусловлено их индивидуальными свойствами. А ковариата (стандартные конфеты)? Насколько я понимаю, она отражает индивидуальные свойства уже людей (не все одинаково рассасывают конфеты) - для данного примера скорость рассасывания определяется не только особенностями разных типов конфет, но и нидивидуальными особенностями людей (поскольку значимым оказалось влияние как фактора, так и ковариаты). Честно говоря такая трактовка мне более понятна (с таких позиций я комментировал результат и собственного примера). Вовсе не настаиваю на том, что она верна... Спасибо!
Saxon Mullins 123VEGA says she once had PRAGMATIC PLAY romantic dreams of what her 'first time' would ICONIC GAMING be like. In none was หวยปิงปอง she paralysed by fear in a Sydney ปั่นสล็อต alleyway, aged 18, with a 123GOAL man she had met only minutes earlier. Ms 88KTC Mullins has always maintained FC SLOT this incident - in 2013 - was rape. It spurred AMB CASINO her to push for legal 11HILO reform in Australia, after a long court battle ended with a judge finding the man involved did not realise she hadn't consented to sex.
Это — лёгкая версия форума. Чтобы попасть на полную, щелкните здесь.