juan_gandhi: (Default)
Juan-Carlos Gandhi ([personal profile] juan_gandhi) wrote2020-01-04 04:51 pm
Entry tags:

не в моей компетенции, конечно

Но я наслаждаюсь аргументами противников теории ГП. Красиво гонят, такое ощущение, что это какая-то умственная паника.

Типа почему никакого ГП нету вообще:

- да последние пять лет самые холодные за наблюдаемую историю вообще;

- у нас на Магадане морозы надоели уже, пусть уже потеплее будет;

- в 1500-м 97% ученых считали, что Земля неподвижна, а кто был не согласен, того на костре сжигали;

- на Марсе тоже ледники тают;

- всех интересует только температура на поверхности, а что творится на высоте 10км, никого не интересует;

- при динозаврах вообще стояла жарища;

- инерция поведения океана: вода, что сейчас выходит к поверхности на Бермудах (и дальше идет в качестве Гольфстрима), шла от Антарктиды, вдоль Южной Америки, примерно тысячу лет;

- Грета Тунберг в школу давно не ходила;

- Индии и Китаю вообще пофиг какая температура стоит, им первым делом надо народ накормить;

- так нам в Калифорнии чего конкретно ожидать-то, засухи или наводнений? А то каждый год новости;

- кто-нибудь вообще изучал вопрос изменения поведения Солнца за последние 50-100 лет?
pappadeux: (Default)

[personal profile] pappadeux 2020-02-05 07:48 pm (UTC)(link)
> We start with the assertion that you can always explain away anything as white noise.

Нет, это предположение, и оно требует определенного обоснования. Т.е. с него обычно стартуют, посколько подавляющая часть нашей статистической машинерии основана на гауссиане, с ней легко и приятно иметь дело, софт.пакеты, GLM и пр. Но зачастую это просто вопрос удобства, привычки, опеределенной лени мышления

Если из первых принципов (из физики процессов) известно, что гаусс плохо применим - его и не надо применять.

> You improve the model by modifying the function - adding new terms, removing others, etc. The residuals will follow normal distribution for some other p. If this p is lower than the previous step, we accept the model. If the same, use the model with fewer variables.

речь идет об относительной пригодности моделей, тут наверно метода применима с оговорками выше

> That's right. They are not modelling ENSO, solar, etc. They are just establishing a difference in temperature. This is like comparing two sets of observations and determining whether they are different, and if they are, what's the difference, and what's the confidence interval of the difference.

авторы же статьи выдают некую цифру как абсолютную ошибку, 0.5Ц

и вот тут у меня возникают вопросы...

[personal profile] sassa_nf 2020-02-05 09:04 pm (UTC)(link)
"это просто вопрос удобства"

I don't think so. My humble understanding is that we want to get a predictor, but we need to make sure it is better than a coin toss.


"авторы же статьи выдают некую цифру как абсолютную ошибку, 0.5Ц"

Yes. I can't comment, because I can only assume they and the reviewers understand the matter better than me.

They don't talk about ENSO, solar cycles, etc using those names, but I am not sure your worry is justified - the study of long range and short range correlations is written all over the paper.

"Even though the data model produced Gaussian‐distributed data and the observed anomalies are not perfectly Gaussian, the empirical error bars which we can determine up to N≈500 agree well with the ARFIMA model results. This suggests that the Gaussian model works sufficiently well to take the extrapolation to the 30 year error bars seriously."


"Although the physical consequences of increasing greenhouse gas concentrations are undebatable, this work shows that a quantitative assessment of climate change from observed data is still challenging"
pappadeux: (Default)

[personal profile] pappadeux 2020-02-06 04:04 am (UTC)(link)
> I don't think so. My humble understanding is that we want to get a predictor, but we need to make sure it is better than a coin toss.

Есть General Linear Model, где невязка (residuals) дб обязательно гауссовой, это условие метода. Он математически довольно прост, довольно прост и вычислительно, и за него хватаются первым делом потому, что он есть всегда и везде, разумный API в Питоне, R, ..., во многих случаюх реально работает, etc

А есть Generalized Linear Model (иногда обозначают как GLiM) где невязка (residuals) может быть любой из целого семейства экспоненциальных распределений (само экспоненциальное, Гамма-распределение, хи-квадрат, распределение Фишера, ...). Заметно тяжелее вычислительно, менее известен и менее используется, но самое главное - требуется предметное знание позволяющее выбрать как именно описывать residuals. Т.е. из знания домейна требуется обосновать выбор распределения.

Люди просто гораздо чаще себе (и другим) говорят, что нифига я про шум не знаю, и пусть он будет гауссов. И, как ни удивительно, зачастую это работает

They don't talk about ENSO, solar cycles, etc using those names, but I am not sure your worry is justified - the study of long range and short range correlations is written all over the paper.

так они сравнивали 30-летнее осреднение с 1-летним. 30-летнее осреднение должно замыть информацию о ENSO (периоды года этак в 4), а также 11-летние солнечные циклы.

я понимаю, что статья прошла ревью, но мне она не нравится, неправильно сделано, кмк

[personal profile] sassa_nf 2020-02-06 08:07 am (UTC)(link)
I think I agree with you on all points here.

Dobson's book does talk about modeling with distributions of various exponential families, and the modeling software we used did test different things using a variety of distributions, not just normal.

The small niggle is that you can test whether the residuals are normally distributed, then test if they are Fischer, and end up with p values 0.1 and 0.01. Fischer looks better, but normal is also ok. (In this contrived result)

Also, to my mind, autocorrelations affect the number of degrees of freedom. But if the test holds for a large range of degrees of freedom, it may not matter.