Оригиналът е на Tivadar Danka, Levi. Даниел Десподов преди 3

...
Оригиналът е на Tivadar Danka, Levi. Даниел Десподов преди 3
Коментари Харесай

Ето кога започва да работи законът за големите числа

Оригиналът е на Tivadar Danka, Levi.

Даниел Десподов преди 3 минути 8 Сподели

Най-четени

ТелефониДаниел Десподов - 15:39 | 03.10.2023

Излезе описът със 120 смарт телефона на Xiaomi, Redmi и Poco, които ще получат MIUI 15

ТелефониСветослав Димитров - 10:58 | 04.10.2023

Мъж открадна 3000 литра гориво посредством Bluetooth на смарт телефона

IT НовиниДаниел Десподов - 9:42 | 03.10.2023

Митичният основател на биткойна Сатоши Накамото разгласява първия си пост за миналите 5 години

Даниел Десподовhttps://www.kaldata.com/Новинар. Увличам се от модерни технологии, осведомителна сигурност, спорт, просвета и изкуствен интелект.

Големите цифри!= огромни цифри

Числото 100 огромно ли е? Това зависи от обстановката. Дали го съпоставяме с 0,001, или със 100 000? Подобно на доста други неща в живота, понятието „ огромно “ е релативно.

В тази публикация ще разбираем какъв брой огромно би трябвало да бъде „ огромното “ и ще потвърдим, че евентуално грешите по отношение на закона за огромните цифри.

Законът за огромните цифри (ЗГЧ)

Нека създадем опит: ще хвърляме зарче, както правехме в часовете по запознаване с вероятността. Ще продължим да вършим хиляди хвърляния, като всякога ще изчисляваме междинната стойност.

(Не забравяйте, че междинната предстояща стойност на хвърлянето на зар е (1+2+3+4+5+6)/6 = 3,5).

Ето графиката на първите 10 хвърляния.

Червеното е предстоящата междинна стойност, а жълтото – междинната стойност на извадката

Първо хвърлихме 5, по-късно 1 и по този начин нататък.

Сега дано да проверим какво ще се случи, в случай че увеличим броя на опитите до 100 и до 1000:

Колкото „ по-голямо “ става цифрата, толкоз повече междинните стойности на извадката се приближават до същинската предстояща стойност. Законът за огромните цифри споделя тъкмо това: междинното значение на извадката се приближава до предстоящото приблизително значение.

По-конкретно, съществуват две версии на закона за огромните цифри: слаба и мощна.

Слабият закон постулира следното.

С други думи, вероятността междинната стойност на извадката X̅ₙ да се намира („ да излиза “) на каквото и да е разстояние от предстоящата стойност μ клони към нула с увеличението на броя на размерите на извадките (n). („ Каквото и да е разстояние “ значи отклоняване, по-голямо от която и да е авансово закрепена стойност). По-долу ще обсъдим това по-подробно.

Изглежда, че n = 1000 е задоволително „ огромно “ за опита със зарчето. Но какво да кажем за другите обстановки?

Нека разгледаме различен образец! Ето този лотариен билет от Тексас с полета за заличаване.

В формалната уеб страница се споделя следното:

Печалбите възлизат на 829 милиона $! Печалбите стартират от 150 $! Шанс да спечелите $20 000 000 Билетът коства единствено $100!

Звучи ужасно, само че ние познаваме математиката задоволително добре, с цел да не се заблуждаваме от тези цифри. Ако се разровим, можем да намерим вероятността за облага. Ето една таблица на облагите от формалния уеб уебсайт:

Размерът на облагите, приблизителният брой на печелившите, приблизителният коефициент

Знаейки това, можем елементарно да изчислим възможностите и предстоящите стойности:

шансът да спечелим нещо е 26,34%, а предстоящата облага е $75,28958 на билет. (Без да включваме таксата за присъединяване от $100.)

Изглежда, че не си коства да се купува билет за $100, тъй като предстоящата стойност е единствено към $75,3. Дали?

Сега дано създадем опит, сходен на опита със зарчето. (Хипотетично) купуваме от ден на ден и повече билети, като в същото време изчисляваме междинната облага. Колкото повече билети купуваме, толкоз повече ще се доближаваме до предстоящата стойност (около 75 долара).

С първите 10 билета нямахме огромен шанс.

Но дано купим още деветдесет! Със стоте билета сме по-близо до предстоящото, само че в дълготраен проект се нуждаем от гладка графика, близка до алената линия.

Нека създадем по-голяма стъпка: да увеличим n до 10000.

Сега имаме плавна линия, само че тя напълно не е това, което чакахме! Тя е към $67, а не предстоящата стойност.

Да продължим. При един милион билета още веднъж се случва нещо необичайно: започваме да имаме шанс и облагите са над междинните. Само че в този момент сме още по-далеч!

Изглежда, че 1000000 към момента не е „ огромно “ число!

Да продължим напред! При 10 милиона билета получаваме доста огромни облаги, които покачват междинната стойност, само че резултатът става все по-малък и по-малък. Бавно, само че несъмнено се приближаваме до предстоящата стойност.

Сега най-сетне имаме предстоящата плавна линия наоколо до същинската междинна стойност.

В първия опит успяхме да демонстрираме закона за огромните цифри с хиляда хвърляния, само че във втория опит даже един милион опита са незадоволителни.

Големите цифри!= огромни цифри.

И по този начин, по какъв начин можем да разбираем странностите, които се появиха във втория опит?

Дисперсия и скорост на сходимост

Нека разгледаме по-отблизо слабия закон за огромните цифри!

По създание вероятността P(|X̅ₙ – μ| > ε) е мярка за дистанцията сред междинната стойност на извадката и същинската междинна стойност (т.е. предстоящата стойност), само че във вероятностен смисъл.

Разстоянието от междинната стойност на извадката (жълто) до същинската междинна стойност (червено)

Колкото по-малко е ε, толкоз по-голямо е вероятностното разстояние. В математически тип е правилно следното:

Слабият закон за огромните цифри гласи:

Това значи, че вероятностното разстояние става малко, тъкмо както искахме да бъде.

Грубо казано, това значи, че междинната стойност на извадката е равна на същинската междинна стойност плюс систематизиране, което става все по-концентрирано в региона на нулата. С други думи, имаме:

(D)= значи, че стойностите вдясно и вляво от този знак за тъждество са отмерено разпределени

асимптотично уголемение в смисъл на систематизиране. Терминът o(1) значи систематизиране, което с повишаването на n става все по-концентрирано в региона на нулата. Може би сте осведомени с означението на огромно и малко „ О “; това е същото, само че при вероятностните разпределения.

Слабият закон за огромните цифри и асимптотичното уголемение изясняват ли това, което се случва с нашите лотарийни билети; т.е. за какво се нуждаем от 10 милиона извадки, с цел да се доближим задоволително до същинската междинна стойност?

Краткият и сложен отговор е: не.

Нуждаем се от по-голямо асимптотично уголемение. Нашият инструмент за това ще бъде централната гранична теорема – един от най-известните резултати в теорията на вероятностите, който формализира разбирането за това за какво междинните стойности на извадките наподобяват на Гаусови разпределения.

Централната гранична теорема

Нека да се потопим в тематиката и да преминем непосредствено към централната гранична теорема (Central Limit Theorem – CLT). Тя гласи, че от позиция на разпределението, мащабирано с √n, центрираните междинни стойности на извадките се приближават до общоприетото обикновено систематизиране. (Терминът „ центрирани “ значи, че изваждаме предстоящата стойност).

Трябва да се подчертае, че тази конвергенция е вярна в тази ситуация на разпределенията. Това е просто различен метод да се каже, че кумулативните функционалности на систематизиране са точково сходящи. (Да, знам, сходимостта в теорията на вероятностите е много объркваща тема).

Нека да обърнем това: за асимптотичното уголемение законът за огромните цифри и централната гранична теорема допускат, че

т.е. междинната стойност на извадката е равна на сумата от: 1) предстоящата стойност на μ, 2) мащабираното обикновено систематизиране и 3) разпределението, което клони към нулата по-бързо от 1/√n.

Това значи, че за нашето асимптотично уголемение имаме

Това към този момент може да бъде записано в опростена форма посредством съчетание на константите в естественото систематизиране. По-конкретно получаваме

и това значи, че нашето асимптотично уголемение има типа

С други думи, когато n е огромно, междинната стойност на извадката се приближава до естественото систематизиране с дисперсия σ²/n. Колкото по-голямо е n, толкоз по-малка е дисперсията; колкото по-малка е дисперсията, толкоз повече естественото систематизиране е съсредоточено покрай предстоящата стойност на μ.

И това дава отговор на въпроса ни: кое би трябвало да е злокобното число в закона за огромните цифри? То зависи от дисперсията на нашето систематизиране!

От нашето асимптотично уголемение можем да разберем, че в случай че дисперсията е 10 пъти по-голяма, ни трябват към 10 пъти повече извадки, с цел да бъде междинната стойност толкоз близка до първичната междинна стойност. Това се дължи на члена σ²/n, където σ² значи дисперсията на нашата извадка X₁, X₂, …, Xₙ, а n значи броя на извадките.

Нека се върнем към хвърлянето на зарове и лотарията. Дисперсията на хвърлянето на зарове е 35/12 ≈ 2,916, а дисперсията на тексаската лотария е почти 157 000 000. Това е с петдесет милиона повече. Това значи, че приблизително се нуждаете от петдесет милиона пъти по-голяма извадка, с цел да може междинната стойност на извадката да е толкоз близка до същинската междинна стойност, колкото е тази на заровете.

Важно е също по този начин да се означи, че защото законът за огромните цифри е вероятностна дефиниция, изказвания като „ трябват ни петдесет милиона пъти повече извадки “ би трябвало да се схващат вероятностно. Ако имаме шанс, междинната стойност на извадката може да бъде доста близка до същинската междинна стойност след няколко хиляди извадки.

Заключение

Законът за огромните цифри постоянно се схваща неправилно.

Ние го използваме постоянно, само че той има значима специфичност. Въпреки че междинната стойност на извадката се доближава (почти гарантирано) към предстоящата стойност, скоростта на сходимост зависи от дисперсията на извадката. Колкото по-голяма е дисперсията, толкоз по-бавна е сходимостта.

А за голям брой на практика приложения това се оказва неприятна вест. Ето за какво да вземем за пример сходимостта на метода Монте Карло е мудна. В действителна обстановка като хазарта може даже да ви свършат парите, преди да започнете да печелите. (Повечето казино игри обаче имат негативна предстояща стойност, тъй че в дълготраен проект постоянно ще губите.)

И по този начин, какъв извод може да се направи от това? Когато прилагате закона за огромните цифри, постоянно вземайте поради скоростта на сходимост.


СПОДЕЛИ СТАТИЯТА


Промоции

КОМЕНТАРИ
НАПИШИ КОМЕНТАР