juan_gandhi: (Default)
[personal profile] juan_gandhi
 https://en.wikipedia.org/wiki/James%E2%80%93Stein_estimator

Кароч, вот есть у нас нормальное распределение, сигма единица, среднее неизвестно. Делаем одно измерение, получаем точку x.

Как мы оценим среднее по этой точке? Да ее и взять, какие еще варианты. Ну или двумерное пространство, берем какую-нибудь точку, это и будет оценка.

А вот теперь трехмерное пространство. И тут точка x не годится! Советуют брать точку x-x/|x|. Сдвинуть надо. В случае n-мерного пространства берите x - (n-2)*x/|x|.

Вот что за бред, да? Одновременно оцениваем количеств мух в столовке номер шесть, среднюю оценку по философии Возрождения в Тюбингенском университете, и возраст судьи в штате Гаваи. После чего СДВИГАЕМ.

Такие дела. Противоречит массе интуитивных идей - однородности пространства, например.

Интересно, в физике это применимо?

Date: 2020-09-16 09:24 pm (UTC)
perdakot: (Default)
From: [personal profile] perdakot
Одновременно оцениваем количеств мух в столовке номер шесть, среднюю оценку по философии Возрождения в Тюбингенском университете, и возраст судьи в штате Гаваи. После чего СДВИГАЕМ.

Это потому что возраст судьи зависит от мух в столовке.
(reply from suspended user) (Show 1 comment)

Date: 2020-09-17 01:42 am (UTC)
skittishfox: (Default)
From: [personal profile] skittishfox
Это в основном в физике и применяется, так как, если вы заметили, в сдвиге явно задаётся значение дисперсии, которое считается а) известным и б) равным для всех величин. В прикладной статистике такие условия практически никогда не выполняются.

В физике же это явно присутствует в signal processing, когда значения сигмы ясны из характеристик канала, поэтому сглаживание помогает, и в теорфизике, которую я знаю плохо и по которой сказать ничего не могу. Фактически, вы пользуетесь тем фактом, что у вас есть псевдослучайная выборка из распределения с известным параметром, и именно благодаря знанию этого параметра вы можете выжать дополнительную информацию.

В вашем примере никакй однородности пространства нет, так как вы явно задвигаете, что все ваши переменные заведомо (а не эмпирически - это важно!) имеют нулевую корреляцию и одинаковую сигму. Заведомо нулевые корреляции можно получить или в хитром процессе, или в теорфизических выкладках - на практике у вас этого знания нет, из-за чего эстиматор и ломается в реальном мире.

Date: 2020-09-17 01:55 am (UTC)
math_mommy: (Default)
From: [personal profile] math_mommy
С возрастанием размерности на все большей части области определения значение плотности вероятности существенно меньше среднего.
Скажем, в одномерном случае вероятность того, что случайное значение отклонилось от среднего меньше, чем на единицу, около 68%. То есть больше половины. Практически все остальное будет не дальше, чем 3 сигмы. Смотрим на картинку и сравниваем расстояния, а так же площади областей под интегралами. А в двухмерном случае мы интегрируем не по отрезку, а по квадрату вокруг среднего, со стороной 2. Соответсвующее остальное теперь будет размазано по бОльшему квадрату со стороной 6. (Насколько оно остальное - еще посчитать нужно.) То есть место, где достигается это среднее, с возрастанием размерности снижается по объему (объем здесь в обобщеном смысле) к остальному.
Мне интересно - а в статистистическом софте это где-нибудь имплементировано?

Date: 2020-09-17 02:27 am (UTC)
alexanderr: (Default)
From: [personal profile] alexanderr

с физикой тут крупнейшие нелады с самого начала.

даже не вникая в вопрос, ставим двойку или даже кол.

х имеет свою размерность, а х/|x| это безразмерное число.
вычислять x-x/|x|это все равно, что складывать километры и килограммы

Date: 2020-09-17 06:36 am (UTC)
gonchar: (Default)
From: [personal profile] gonchar
Не знал про такую штуку.
Кажется странной, очень.

А Вы проверяли все рассуждения сами? Начиная с посылок. Может, там в неявном виде что-то засунуто?

Мне самому трудно - трудоёмко. Всё-таки в нормальной математике я не практиковался лет 30, надо будет всё себе разжёвывать.

Date: 2020-09-17 09:25 am (UTC)
e2pii1: (Default)
From: [personal profile] e2pii1
Интересный эффект. В английской вики есть про него.

Date: 2020-09-17 09:57 am (UTC)
norian: (Default)
From: [personal profile] norian
статистика вообще неприменима к одной точке, ей нужны большие множества для построения моделей


Date: 2020-09-17 07:12 pm (UTC)
From: [personal profile] caztd
Природа таки тяготеет к нулю, да.
Если измерение x не превышает уровня шума, то скорее всего вы померили шум.

Profile

juan_gandhi: (Default)
Juan-Carlos Gandhi

May 2025

S M T W T F S
    1 2 3
456 7 8 9 10
11 121314151617
18192021222324
25262728293031

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated May. 16th, 2025 02:25 am
Powered by Dreamwidth Studios