РЕГРЕССИОННЫЙ АНАЛИЗ этапы | АНАЛИЗ ДАННЫХ #17

Описание к видео РЕГРЕССИОННЫЙ АНАЛИЗ этапы | АНАЛИЗ ДАННЫХ #17

Регрессионный анализ и его этапы. Каковы этапы регрессионного анализа? #регрессионный анализ

Этап 1. Выбор факторов и отклика регрессионного анализа
Осуществляется на основании представлений о природе исследуемой проблемы, интуиции специалиста или опыта аналогичных исследований.
Этап 2. Поиск мультиколлинеарных факторов регрессионного анализа
Факторы называются мультиколлинеарными, если между ними наблюдается достаточно сильная корреляционная связь. Эта проблема затрудняет ранжирование факторов по степени влияния на отклик.
Рекомендуется удалить из модели мультиколлинеарные факторы, если это не принципиально для решения поставленной задачи.
Этап 3. Изучение относительной важности мультиколлинеарных факторов регрессионного анализа
Относительную силу влияния факторов на отклик показывают стандартизированные коэффициенты регрессии (Beta). Из двух мультиколлинеарных факторов из анализа исключается тот, у которого Beta меньше.
Этап 4. Анализ остатков регрессионного анализа
Остатки представляют собой разности фактических значений отклика и значений, предсказанных по уравнению регрессии для одних и тех же факторов.
Этап 5. Анализ регрессионного уравнения и удаление факторов, не влияющих на отклик регрессионного анализа
Факторы, у которых p больше 0,05, могут быть исключены из анализа, т.е. они несущественно влияют на отклик. После любого исключения весь предшествующий алгоритм анализа нужно повторить.
Если факторов с уровнем значимости более 0,05 несколько, сначала удаляется тот, у которого уровень значимости больше других. Анализ повторяется сначала и только после этого рассматривается следующий фактор с p больше 0,05.
Этап 6. Оценка приемлемости модели в целом регрессионного анализа
По таблице дисперсионного анализа (ANOVA) p = 0,000…меньше 0,05, значит ошибка прогноза по построенной модели будет меньше, чем при «наивном» прогнозе, т.е. модель можно считать приемлемой.
Этап 7. Анализ R2 регрессионного анализа
R2 – коэффициент детерминации, показывает долю изменяемости отклика, происходящую под одновременным воздействием всех включенных в модель факторов. Чем больше R2, тем выше качество модели. Небольшое значение R2 может указывать на неадекватный подбор факторов и говорит о нецелесообразности построения прогнозов по такой модели.
скорректированный R2.
Этап 8. Построение прогноза регрессионного анализа
Для построения прогноза необходимо ввести прогнозные значения факторов, влияние которых на отклик установлено.
Необходимо помнить, что прогноз тем точнее, чем ближе прогнозные значения факторов будут к их средним.

Термин регрессия в статистике впервые был использован Френсисом Гальтоном (1886) в связи с исследованием вопросов наследования физических характеристик человека. В качестве одной из характеристик был взят рост человека; при этом было обнаружено, что в целом сыновья высоких отцов, что не удивительно, оказались более высокими, чем сыновья отцов с низким ростом. Более интересным было то, что разброс в росте сыновей был меньшим, чем разброс в росте отцов. Так проявлялась тенденция возвращения роста сыновей к среднему (regression to mediocrity), то есть «регресс». Этот факт был продемонстрирован вычислением среднего роста сыновей отцов, рост которых равен 56 дюймам, вычислением среднего роста сыновей отцов, рост которых равен 58 дюймам, и т. д. После этого результаты были изображены на плоскости, по оси ординат которой откладывались значения среднего роста сыновей, а по оси абсцисс — значения среднего роста отцов. Точки (приближённо) легли на прямую с положительным углом наклона меньше 45°; важно, что регрессия была линейной.

Цели регрессионного анализа
Определение степени детерминированности вариации критериальной (зависимой) переменной предикторами (независимыми переменными)
Предсказание значения зависимой переменной с помощью независимой(-ых)
Определение вклада отдельных независимых переменных в вариацию зависимой
Регрессионный анализ нельзя использовать для определения наличия связи между переменными, поскольку наличие такой связи и есть предпосылка для применения анализа.

Регрессионный анализ – статистический метод, с помощью которого можно построить модель с одной зависимой переменной (откликом) и одной или несколькими независимыми переменными (факторами).
Регрессионный анализ позволяет:
1) Выявить, какие из факторов действуют на отклик, а какие – нет.
2) Ранжировать факторы по степени влияния на отклик.
3) Спрогнозировать значение отклика при определенных значениях факторов.
Для обеспечения приемлемой точности модели минимальный объем выборки не должен быть меньше величины «число факторов, умножить на 10».
Приведем примеры постановок задач для регрессионного анализа.
Определить, какие факторы влияют на расход электроэнергии на предприятии, и построить прогноз расходов электроэнергии на ближайший квартал.
Планируется строительство нового торгового центра.

Комментарии

Информация по комментариям в разработке