> I don't think so. My humble understanding is that we want to get a predictor, but we need to make sure it is better than a coin toss.
Есть General Linear Model, где невязка (residuals) дб обязательно гауссовой, это условие метода. Он математически довольно прост, довольно прост и вычислительно, и за него хватаются первым делом потому, что он есть всегда и везде, разумный API в Питоне, R, ..., во многих случаюх реально работает, etc
А есть Generalized Linear Model (иногда обозначают как GLiM) где невязка (residuals) может быть любой из целого семейства экспоненциальных распределений (само экспоненциальное, Гамма-распределение, хи-квадрат, распределение Фишера, ...). Заметно тяжелее вычислительно, менее известен и менее используется, но самое главное - требуется предметное знание позволяющее выбрать как именно описывать residuals. Т.е. из знания домейна требуется обосновать выбор распределения.
Люди просто гораздо чаще себе (и другим) говорят, что нифига я про шум не знаю, и пусть он будет гауссов. И, как ни удивительно, зачастую это работает
They don't talk about ENSO, solar cycles, etc using those names, but I am not sure your worry is justified - the study of long range and short range correlations is written all over the paper.
так они сравнивали 30-летнее осреднение с 1-летним. 30-летнее осреднение должно замыть информацию о ENSO (периоды года этак в 4), а также 11-летние солнечные циклы.
я понимаю, что статья прошла ревью, но мне она не нравится, неправильно сделано, кмк
no subject
Есть General Linear Model, где невязка (residuals) дб обязательно гауссовой, это условие метода. Он математически довольно прост, довольно прост и вычислительно, и за него хватаются первым делом потому, что он есть всегда и везде, разумный API в Питоне, R, ..., во многих случаюх реально работает, etc
А есть Generalized Linear Model (иногда обозначают как GLiM) где невязка (residuals) может быть любой из целого семейства экспоненциальных распределений (само экспоненциальное, Гамма-распределение, хи-квадрат, распределение Фишера, ...). Заметно тяжелее вычислительно, менее известен и менее используется, но самое главное - требуется предметное знание позволяющее выбрать как именно описывать residuals. Т.е. из знания домейна требуется обосновать выбор распределения.
Люди просто гораздо чаще себе (и другим) говорят, что нифига я про шум не знаю, и пусть он будет гауссов. И, как ни удивительно, зачастую это работает
They don't talk about ENSO, solar cycles, etc using those names, but I am not sure your worry is justified - the study of long range and short range correlations is written all over the paper.
так они сравнивали 30-летнее осреднение с 1-летним. 30-летнее осреднение должно замыть информацию о ENSO (периоды года этак в 4), а также 11-летние солнечные циклы.
я понимаю, что статья прошла ревью, но мне она не нравится, неправильно сделано, кмк