9. Lielo skaitļu likums

Kāpēc pie monētas mešanas mēs ģērboņa uzkrišanas iespējai pierakstām varbūtību 0,5? Kāpēc spēļu kauliņa katrai skaldnei mēs pierakstām varbūtību 1/6? Kāda tam jēga?

No vienas puses, mums likās, ka monētas abas puses ir līdzvērtīgas, tāpēc, ja jau tām ir jāpieraksta skaitļi, kas summā dod 1, tad nekas cits neatliek kā pierakstīt katrai pusei varbūtību 0,5. Tāpat mums likās, ka (simetriska) spēļu kauliņa visas sešas skaldnes ir līdzvērtīgas, tāpēc katrai no tām mēs pierakstījām varbūtību 1/6. Vai šie skaitļi izsaka tikai mūsu subjektīvo pārliecību, ka monētas puses vai kauliņa skaldnes ir līdzvērtīgas?

Kādu taustāmu labumu var dot notikuma varbūtības zināšana? Jau 1.sadaļā tika minēts viens no fundamentāliem dabas likumiem: ja kāda procesa visi iespējamie iznākumi ir līdzvērtīgi, tad, šo procesu daudzreiz atkārtojot, visi iznākumi parādās aptuveni vienādi bieži. Tas nozīmē, ka, ja notikuma A varbūtība ir P(A), tad, procesu atkārtojot N reizes (N - liels skaitlis), notikums A parādīsies aptuveni N*P(A) gadījumos. Piemēram, monētai ģērbonis krīt aptuveni pusē gadījumu, bet spēļu kauliņam sešinieks - aptuveni 1/6 gadījumu. Šāda informācija jau ir kaut kas "taustāms": tā ļauj paredzēt notikumus uz priekšu. Ja esam nolēmuši 1000 reizes mest monētu, tad jau iepriekš varam rēķināties ar to, ka uzkritušo ģērboņu skaits daudz neatšķirsies no 500. Monētas mešana, protams, ir niekošanās, toties tajos gadījumos, kad mums izdodas iepriekš noteikt kāda praktiski nozīmīga notikuma parādīšanās biežumu, varbūtību teorija dažkārt dod pat naudā izsakāmu efektu (sk., piemēram, otro etīdi 1.sadaļā ). "Efekta" mehānisms vienmēr paliek viens un tas pats - kā pie monētas mešanas: iespējams uz priekšu paredzēt notikumu parādīšanās biežumu (lai arī ne notikuma parādīšanos vai neparādīšanos katrā atsevišķā gadījumā).

Jūs droši vien ievērojāt, ka, runājot par notikuma varbūtības un notikuma parādīšanās biežuma attiecībām, mēs pastāvīgi lietojām izteicienus "aptuveni sakrīt", "daudz neatšķiras". Tā nav nejaušība. Nevar prasīt, lai parādīšanās biežums (t.i., notikuma parādīšanās skaita attiecība pret visu mēģinājumu kopskaitu) precīzi sakristu ar varbūtību. Tiešām, ja monētu met 1000 reizes, tad varbūtība, ka uzkritīs tikai cipari (un nevis 500 cipari un 500 ģērboņi) ir vienāda 1/21000 (pārliecinieties paši). Tas ir ļoti niecīgs skaitlis, tomēr pozitīvs skaitlis un nevis nulle! Tātad teorētiski pastāv iespēja, ka 1000 monētas metienu dos 1000 ciparu un neviena ģērboņa. Mūsu pārliecība, ka šī teorētiskā iespēja nekad nerealizēsies praksē, balstās uz attiecīgā notikuma varbūtības niecīguma apziņu:

1/21000 < 1/10300,

t.i., vairāk nekā 300 pirmie cipari aiz komata ir nulles!

20.uzdevums. Ja n monētas metienos uzkritušo ciparu skaitu apzīmēsim ar Sn, tad viegli pārliecināties, ka:

P{S2=1}= 0,5, P{S4=2}=0,375, P{S6=3} ~ 0,31, P{S8=4}~ 0,27,

t.i. varbūtība, ka n metienos uzkritīs tieši puse ciparu, n pieaugot, arvien samazinās. Pamēģiniet pierādīt, ka P{S2n=n} tiecas uz 0, ja n tiecas uz bezgalību.

Šie piemēri rāda, ka ir vērts pamēģināt precizēt mūsu apgalvojumu, ka biežums "daudz neatšķiras" no varbūtības. Jo ar nelielu varbūtību biežums, kā redzējām, var tālu novirzīties no varbūtības. Gribētos, lai mums būtu metode, kas ļautu aprēķināt, piemēram, ar kādu varbūtību 1000 monētas metienos uzkritušo ciparu skaits var novirzīties no 500, teiksim, vairāk par 50. Ja šīs novirzes varbūtība izrādītos niecīga, piemēram, 0,001, mēs varētu droši cerēt, ka praktiski vienmēr uzkritušo ciparu skaits būs starp 450 un 550.

Pirmajā brīdī, pēc visu iepriekš doto uzdevumu atrisināšanas, var likties, ka nekā sarežģīta te nav. Tiešām, kā redzējām 4.sadaļā, varbūtība, ka ciparu skaits būs mazāks par 450, ir

(C01000+C11000+...+C4491000+) / 21000,

bet varbūtība, ka ciparu skaits būs lielāks par 550, ir

(C5511000+C5521000+...+C10001000+) / 21000,

Pamēģiniet sākt šo varbūtību aprēķināšanu. Jau pirmās minūtes laikā Jūs pārliecināsieties, ka uzdevums nav reāli veicams. Nepalīdzēs arī tas, ja Jūs pamanīsiet, ka abas varbūtības ir vienādas un ka to summa faktiski ir vienāda ar

1 - (C4501000+C4511000+...+C5501000+) / 21000,

Šeit ir tikai 101 saskaitāmais (abās pirmajās izteiksmēs bija pa 450 saskaitāmo). Bet ar to nekas nav līdzēts! Mēs tāpat nespējam ne vien aprēķināt šīs izteiksmes tuvinātu vērtību, mēs nespējam pat izteikt kaut cik saprātīgus spriedumus par tās lielumu: tā ir lielāka par 1/10 vai mazāka? Lielāka par 1/100 vai mazāka?

Radušās tehniskās grūtības izdodas apiet tikai ar nopietnas teorijas palīdzību.

Aplūkosim procesu, kurā notikums A var parādīties ar varbūtību p (0<p<1). Atkārtosim šo procesu n reizes, skaitot, cik reižu parādīsies notikums A. Šo reižu skaitu apzīmēsim ar Sn. No 4.sadaļas mēs jau zinām, ka visiem m n(0<=m<=n):

P{Sn=m} = Cmn pm(1-p)n-m.

Taču, kā tikko konstatējām, šī formula nepalīdz atrisināt mūs interesējošo uzdevumu līdz galam.

Tāpēc, sekojot vēsturiskai tradīcijai, vispirms pierādīsim t.s. lielo skaitļu likumu: jo vairāk reižu atkārto procesu, kurā ar varbūtību p parādās notikums A, jo mazāka varbūtība, ka A parādīšanās biežums stipri novirzīsies no p. Precīzāk, ja process atkārtots ("izmēģināts") n reižu, tad apzīmēsim ar Sn to mēģinājumu skaitu, kuros parādījies notikums A. Tad A parādīšanās biežums būs Sn/n. Ja mūs interesē novirzes par 1%, tad mums gribētos zināt, ar kādu varbūtību biežums Sn/n novirzīsies no p ne vairāk kā par 0,01, t.i. mums gribētos novērtēt varbūtību

P{|Sn/n - p|<=0,01}.

Katram n šī varbūtība ir noteikts skaitlis. Lielo skaitļu likums apgalvo, ka n augot, šis skaitlis tiecas uz 1. T.i., jo lielāks n, jo mazāka varbūtība, ka notikuma A parādīšanās biežums Sn/n atšķirsies no varbūtības p vairāk par 0,01. Gluži to pašu lielo skaitļu likums apgalvo par vēl mazāko novirzi 0,001 utt.

Teorēma. Jebkuram (arī ļoti mazam) pozitīvam skaitlim c varbūtība, ka notikuma A parādīšanās biežums n mēģinājumos novirzīsies no notikuma varbūtības p ne vairāk par c, tiecas uz 1, ja n tiecas uz bezgalību:

P{|Sn/n - p| <= c} -> 1.

Pierādījums. Sāksim ar Čebiševa nevienādību gadījuma lielumam Sn:

P{|Sn - np| >= a} <= np(1-p)/a2.

Dalīsim pirmās nevienādības abas puses ar n:

P{|Sn/n - p| >= a / n} <= np(1-p)/a2

Ievietosim a vietā cn:

P{|Sn/n - p| >= c} <= p(1-p)/(nc2). (*)

Ja n tiecas uz bezgalību, tad labās puses izteiksme tiecas uz 0. Teorēma pierādīta.

Lielo skaitļu likumu šādā formulējumā jau 17.gadsimta beigās zināja Šveices matemātiķis Jakobs Bernulli (1654-1705). Čebiševa nevienādība ir pusotru gadsimtu "jaunāka", taču tā dod lielo skaitļu likuma viselegantāko pierādījumu, vienlaikus padarot to "praktiskāku". Tiešām, šis likums apgalvot tikai, ka varbūtība P{|Sn/n - p| <= c} tiecas uz 1, neko nesakot par to, cik ātri tas notiek (piemēram, nenosakot, cik lielam jābūt n, lai varbūtība pārsniegtu 0,999). Nevienādība (*) šai ziņā dod vairāk informācijas (sīkāk par to sk. iepriekšējās sadaļas beigās).

Taču izrādās, ka elegantā un ļoti universālā Čebiševa nevienādība (tā lietojama jebkuriem gadījuma lielumiem!), ja to lieto gadījuma lielumam Sn, dod noviržu varbūtībām ne gluži precīzu novērtējumu. Precīzāku, bet stipri sarežģītāku metodi 18. gadsimtā izstrādāja franču matemātiķi Abrahams de Muavrs (1667-1754) un Pjērs Simons Laplass (1749-1827).

Ja procesu atkārtojam n reizes, tad notikumam A būtu jāparādās "vidēji" np reizes. Tas nozīmē, ka izteiksmes Sn - np vērtībai ar lielu varbūtību vajadzētu būt "mazai". Muavrs pirmais pamanīja, ka ja Sn - np izdalīt ar standartnovirzi sqrt(np(1-p)), tad iegūtais gadījuma lielums

Tn = (Sn - np) / sqrt(np(1-p))

"uzvedas ļoti regulāri": ja n ir ļoti liels skaitlis, tad šī lieluma varbūtību sadalījums vairs tikpat kā nav atkarīgs ne no p, ne no n. Simboliski to var pierakstīt tā: ja n tiecas uz bezgalību, tad jebkuram reālam skaitlim x:

P{(Sn - np) / sqrt(np(1-p)) <= x} --> N(x).

Tā kā N(x) ir viena konkrēta funkcija, tad matemātiķiem ir izdevies tās vērtības aprēķināt ļoti precīzi, sastādot t.s. varbūtību integrāļa tabulu. Lūk, neliels šīs tabulas fragments:

x N(x) x N(x) x N(x) x N(x)
0,0 0,50 1,0 0,84 2,0 0,977 3,00 0,9986
0,2 0,58 1,2 0,89 2,2 0,986 3,10 0,9990
0,4 0,66 1,4 0,92 2,4 0,992 3,20 0,9993
0,6 0,73 1,6 0,95 2,6 0,995 3.23 0,9994
0,8 0,79 1,8 0,96 2,8 0.997 3,28 0,9995

Var pierādīt, ka N(-x)=1-N(x). Šī sakarība ļauj, izmantojot mūsu tabulu, atrast N(x) arī negatīvām x vērtībām.

21.uzdevums. Pārliecinieties, ka jebkuriem diviem reāliem skaitļiem a,b (a<b): ja n tiecas uz bezgalību, tad

P{ a<= (Sn - np) / sqrt(np(1-p)) <= b } --> N(b)-N(a),

kā arī, ka jebkuram pozitīvam x:

P{ |Sn - np| / sqrt(np(1-p)) > x } --> 2(1-N(x)).

Izrādās, ka pēdējā sakarība ļauj ievērojami precīzāk (salīdzinot ar Čebiševa nevienādību) aprēķināt varbūtību, ka 1000 monētas metienos uzkritušo ciparu skaits novirzīsies no 500 vairāk par doto lielumu. Tā kā šai gadījumā p=0,5 un n=1000, tad sqrt(np(1-p)) ~ 15,81 un

P{|Sn - 500|>15,81x}~ 2(1-N(x)).

Ja ņemsim x=2, tad (saskaņā ar tabulu) N(x) ~ 0,977, tātad P{|Sn - 500|>31,62} ~ 0,046 ~ 1/20. Tātad nebūs nekāds brīnums, ja pēc 1000 metieniem Jūs konstatēsiet, ka uzkritušo ciparu skaits ir nevis 500, bet 468 vai 532 (kaut arī tik lielas novirzes negadīsies bieži).

Ja ņemsim x=3, tad N(x) ~ 0,9986, un

P{|Sn - 500|>47,43}~ 0,0028 ~ 1/350 < 1/256.

Tātad varbūtība, ka ciparu skaits atšķirsies no 500 vairāk par 47, ir jau mazāka nekā varbūtība, ka uzkritīs 8 cipari pēc kārtas.

Un beidzot, ja ņemsim x=3,28, tad N(x) ~ 0,9995, un

P{|Sn - 500|>51,86}~ 0,001.

Tātad varbūtība, ka ciparu skaits atšķirsies no 500 vairāk par 51, ir jau mazāka par 1/1000. Ar šo varbūtību var nerēķināties: tātad praktiski droši, ka 1000 metienos uzkritušo ciparu skaits būs starp 449 un 551. (Salīdziniet šos rezultātus ar tiem, ko iepriekšējās sadaļas beigās mums izdevās iegūt, izmantojot Čebiševa nevienādību).

22.uzdevums. Spēļu kauliņu met 6000 reizes. Izpētiet, cik tālu no vidējā skaita 1000 var novirzīties uzkritušo sešinieku skaits.