WWW.PDF.KNIGI-X.RU
БЕСПЛАТНАЯ  ИНТЕРНЕТ  БИБЛИОТЕКА - Разные материалы
 

«Линейная регрессия Линейная регрессия Анна Лауринавичюте лаборатория нейролингвистики НИУ ВШЭ 25 декабря 2014 Линейная регрессия О чём я ...»

Линейная регрессия

Линейная регрессия

Анна Лауринавичюте

лаборатория нейролингвистики НИУ ВШЭ

25 декабря 2014

Линейная регрессия

О чём я расскажу?

Краткое напоминание о том, что такое линейные модели

Mixed-eects модели и почему они нам нужны

Пример анализа данных

Линейная регрессия

Терминология

Зависимая переменная – то, что мы измеряем в

эксперименте: скорость реакции, правильность ответа и

т.д.

Линейная регрессия

Терминология

Зависимая переменная – то, что мы измеряем в эксперименте: скорость реакции, правильность ответа и т.д.

Предиктор (predictor) – переменная в фокусе нашего интереса. Наша главная задача – узнать, имеет ли она какое-то отношение к зависимой переменной. Может ли изменение предиктора привести к изменению в зависимой переменной?

Линейная регрессия Что такое линейные модели?

Линейные модели. Напоминание y = 5 + 2x y=5+2x slope intercept x Intercept – свободный коэффициент; то, чему равна зависимая переменная, если предиктор равен нулю Линейная регрессия Что такое линейные модели?

Линейные модели. Напоминание y = 5 + 2x y=5+2x slope intercept x Intercept – свободный коэффициент; то, чему равна зависимая переменная, если предиктор равен нулю Slope – угол наклона прямой; показывает, насколько изменяется зависимая переменная при изменении предиктора Линейная регрессия Что такое линейные модели?

Линейная модель RT log(freq + 1) линейная модель предоставляет лучшую линию, которую можно провести через данные Линейная регрессия Что такое линейные модели?



Линейная модель RT log(freq + 1) линейная модель предоставляет лучшую линию, которую можно провести через данные у лучшей модели минимальные residuals Линейная регрессия Что такое линейныемодели?

Один предиктор

–  –  –

Добавление предикторов увеличивет количество измерений в модели Линейная регрессия Что такое линейные модели?

Факторы и их кодирование

–  –  –

Первым уровнем обычо считается intercept.

Коэффициенты остальных уровней отвечают за разницу с первым уровнем.

Линейная регрессия Что такое линейные модели?

–  –  –

Требования к линейным моделям линейная зависимость зависимой переменной от предиктора Линейная регрессия Что такое линейные модели?

Требования к линейным моделям линейная зависимость зависимой переменной от предиктора нормальное распределение residuals Линейная регрессия Что такое линейные модели?

Требования к линейным моделям линейная зависимость зависимой переменной от предиктора нормальное распределение residuals равномерная дисперсия residuals Линейная регрессия Что такое линейные модели?

Требования к линейным моделям линейная зависимость зависимой переменной от предиктора нормальное распределение residuals равномерная дисперсия residuals независимость residuals Линейная регрессия Что такое линейные модели?

Нормальное распределение. Q-Q plot

–  –  –

Q-Q plot – самый простой способ проверить распределение residuals. Сравнивает распределение имеющихся данных со стандартным нормальным распределением. Если распределения совпадают, график близок к прямой y = x Линейная регрессия Что такое линейные модели?

Если не нормальное? Box-Cox transformation!

95%

–  –  –



– степень, в которую рекомендуется возвести данные, чтобы они были распределены максимально "нормально"(не гарантирует нормальности распределения, её нужно всегда проверять). Если = 0, используется log трансформация.

Линейная регрессия Mixed-eects модели

–  –  –

Наши данные нельзя назвать независимыми, а значит, их нельзя моделировать обычной линейной регрессией (нарушается требование независимости residuals).

Линейная регрессия Mixed-eects модели Каковы источники зависимости внутри данных?

Источники кластеризации данных:

испытуемые экспериментальные айтемы Всё зависит от дизайна эксперимента. Зависимости появляются, когда испытуемый видит много экспериментальных айтемов, и когда каждый айтем виден больше чем одному испытуемому.

Линейная регрессия Mixed-eects модели Mixed-eects модели Mixed-eects модели позволяют интегрировать источники не-независимости в линейную модель и жить с ними счастливо.

Линейная регрессия Mixed-eects модели Mixed-eects модели vs ANOVA

–  –  –

Недостатки:

Линейная регрессия Mixed-eects модели Mixed-eects модели vs ANOVA

Достоинства:

одновременное обобщение по разным популяциям (по айтемам и по испытуемым) возможность использования непрерывных предикторов (возраст испытуемого, частотность и длина слов и т.д.)

Недостатки:

Линейная регрессия Mixed-eects модели Mixed-eects модели vs ANOVA

Достоинства:

одновременное обобщение по разным популяциям (по айтемам и по испытуемым) возможность использования непрерывных предикторов (возраст испытуемого, частотность и длина слов и т.д.) возможность использования категориальных зависимых переменных (правильность ответа, вариант ответа из n возможных и т.д.)

Недостатки:

Линейная регрессия Mixed-eects модели Mixed-eects модели vs ANOVA

Достоинства:

одновременное обобщение по разным популяциям (по айтемам и по испытуемым) возможность использования непрерывных предикторов (возраст испытуемого, частотность и длина слов и т.д.) возможность использования категориальных зависимых переменных (правильность ответа, вариант ответа из n возможных и т.д.) хорошо справляется с несбалансированными данными

Недостатки:

Линейная регрессия Mixed-eects модели

Mixed-eects модели vs ANOVA

Достоинства:

одновременное обобщение по разным популяциям (по айтемам и по испытуемым) возможность использования непрерывных предикторов (возраст испытуемого, частотность и длина слов и т.д.) возможность использования категориальных зависимых переменных (правильность ответа, вариант ответа из n возможных и т.д.) хорошо справляется с несбалансированными данными

Недостатки:

Не обязательно даст вам ответ (noncovergence) Линейная регрессия Mixed-eects модели

Например

Эксперимент на скорость времени реакции, в нём всего один предиктор – фактор с двумя уровнями: А (попроще, реакция должна быть быстрой) и В (посложнее, реакция должна быть медленнее на 50 мс). И обычный дизайн лингвистического эксперимента – within subjects, within items.

Линейная регрессия Mixed-eects модели

Random intercept

Random intercept неформально отвечает за то, что позволяет источнику кластеризаиции данных отличаться от среднего на фиксированную величину. Например, испытуемый N всегда отвечает на 300 мс медленее или экспериментальный айтем I всегда обрабатывается на 100 мс быстрее.

Линейная регрессия Mixed-eects модели

Не всё так просто

Если человек читает медленно и внимательно, он будет чувствителен к экспериментальному условию, а если он читает быстро, он менее внимателен и не чувствителен к экспериментальному условию. Т.е. он не только всегда читает быстрее, но и игнорирует экспериментальные манипуляции, и не будет в сложном условии В медленнее, чем в условии А.

Для того, чтобы учесть такую возможность, мы вводим поправку не только на отдельных испытуемых (random intercept for subjects), но и на взаимодействие испытуемых c экспериментальными условиями (random slope for subjects).

Линейная регрессия Mixed-eects модели

–  –  –

То же верно и для экспериментальных айтемов: возможно, что один айтем будет сложнее других и будет читаться одинаково медленнее (допустим, на 30 мс) и в условии А, и в условии В (random intercept for items). Но возможно также, что в условии В внутри только этого айтема испытуемым станет ещё сложнее, и оно будет обрабатываться ещё медленнее. Random slope for items позволяет это учесть.

Линейная регрессия Mixed-eects модели

–  –  –

Random slope неформально отвечает за то, что позволяет учитывать взаимодействие между источником кластеризации данных и экспериментальными условиями.

Линейная регрессия Mixed-eects модели

–  –  –

Всегда включайте в модель максимально возможные (в данном экспериментальном дизайне) random eects:

random intercept для испытуемых и экспериментальных айтемов (если каждый испытуемый видит больше одного айтема и каждый айтем виден нескольким испытуемым) Линейная регрессия Mixed-eects модели

Rule of thumb

Всегда включайте в модель максимально возможные (в данном экспериментальном дизайне) random eects:

random intercept для испытуемых и экспериментальных айтемов (если каждый испытуемый видит больше одного айтема и каждый айтем виден нескольким испытуемым) random slope для испытуемых и экспериментальных айтемов по всем экспериментальным условиям, которые изменяются внутри айтемов и испытуемых (т.е. если каждый айтем существует в нескольких условиях и если каждый испытуемый на протяжении эксперимента видит разные условия) Линейная регрессия Mixed-eects модели

Пример. Модель №1

Предположим, в нашем исследовании есть одно экспериментальное условие (фактор) с двумя уровнями.

Каждый испытуемый встречает оба уровня фактора (within subjects design), но каждый экспериментальный айтем может существовать либо в одном уровне, либо во втором, но не в обоих (between items design).

Модель №1: Зависимая переменная ~ Предиктор (Читать:

зависимая переменная зависит от предиктора) Линейная регрессия Mixed-eects модели Пример. Модель №2 Модель №2: Зависимая переменная ~ Предиктор + random intercept по испытуемым Линейная регрессия Mixed-eects модели Пример. Модель №3 Модель №3: Зависимая переменная ~ Предиктор + random intercept по испытуемым + random slope по испытуемым Линейная регрессия Mixed-eects модели Пример. Модель №4 Модель №4: Зависимая переменная ~ Предиктор + random intercept по испытуемым + random slope по испытуемым + random intercept по айтемам И это максимально возможная для данного экспериментального дизайна структура random eects.

Почему не добавить random slope по айтемам?

Линейная регрессия Mixed-eects модели Что почитать?




Похожие работы:

«Муниципальное автономное учреждение дополнительного образования Городской Дворец творчества детей и молодежи «Одаренность и технологии» Рассмотрена и допущена к реализации УТВЕРЖДАЮ решением Экспертно-методического совета Директор МАУ ДО Протокол № 1 от 11 сентября 2014 г. Городской Дворец творчества детей и молодежи Председатель _О.А.Коно...»

«Геоспациализм: онтологическая динамика СОЦИОЛОГИЧЕСКОЕ ОБОЗРЕНИЕ. Т. 10. № 3. 2011 21 пространственных образов Дмитрий Замятин* Аннотация. В статье предлагается и исследуется новое для социальных наук методологическое понятие — геоспациализм. Обосновывается введение данного понятия исходя из закономерностей разв...»

«Глава 6. ЭНЕРГЕТИЧЕСКИЕ ПОКАЗАТЕЛИ ВЫПРЯМИТЕЛЕЙ ТОКА, КАЧЕСТВО ВЫПРЯМЛЕННОГО НАПРЯЖЕНИЯ И ПУТИ ИХ УЛУЧШЕНИЯ Энергетические показатели выпрямителей – это коэффициент полезного действия (КПД), коэффициент мощности и cos. Качество в...»

«Министерство образования Республики Мордовия Мордовский республиканский институт образования Развиваем талант читателя Сборник заданий по литературе для 7 класса Саранск 2006 ББК 74.261.8 Р 17 Развиваем талант читателя: С...»

«Интернет-журнал «НАУКОВЕДЕНИЕ» Институт Государственного управления, права и инновационных технологий (ИГУПИТ) Выпуск 1, январь – февраль 2014 Опубликовать статью в журнале http://publ.naukovedenie.ru Связаться с редакцией: publishing@nau...»

«УДК 631.52 Л. М. Осипова1, Л. Ю. Качур1, Г. А. Кудина2 ВНУТРИВИДОВАЯ ГИБРИДИЗАЦИЯ В СЕЛЕКЦИИ ТОМАТОВ Донецкий национальный университет; 83050, г. Донецк, ул. Щорса, 46 e-mail: botany@dongu.donetsk.ua Донецкий ботанический сад НАН Украины; 83...»

«УДК 657:657.371.1 Н.В. Авдеева, В.И.Щербакова ПОРЯДОК ОТРАЖЕНИЯ ИНВЕНТАРИЗАЦИОННЫХ РАЗНИЦ В БУХГАЛТЕРСКОМ И НАЛОГОВОМ УЧЕТЕ При осуществлении хозяйственной деятельности организаций возникает необходимость периодической проверки фактического наличия имущества, сопоставления фактического наличия имущества с...»

«Бутылочное пиво Bottled beer БЕЛЬГИЙСКОЕ ПИВО Belgian beer Мы собрали для вас одну из лучших коллекций бельгийского пива в мире. У нас вы найдете редчайшие трапписты, уникальные эли и знаменитые брюссельские гезы и ламбики. Более 150 бережно отобранных сортов, безу...»

«Лекция Д. И. Нагирнера Реликтовый фон и его искажения Cosmic microwave background radiation (сокращенно CMB, CMBR, CBR) по-английски, или реликтовое излучение (РИ) по-русски (термин введен И. С. Шкловским), является одним из основных свидетельств справедливости теории горячей Вселенной и поэтому занимает выдающееся место в современной косм...»







 
2017 www.pdf.knigi-x.ru - «Бесплатная электронная библиотека - разные матриалы»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.