Microsoft Excel'de ortalama değerin hesaplanması. Ortalama nasıl hesaplanır

Çoğu durumda veriler merkezi bir nokta etrafında yoğunlaşır. Bu nedenle herhangi bir veri kümesini tanımlamak için ortalama değeri belirtmek yeterlidir. Dağılımın ortalama değerini tahmin etmek için kullanılan üç sayısal özelliği sırasıyla ele alalım: aritmetik ortalama, medyan ve mod.

Ortalama

Aritmetik ortalama (genellikle basitçe ortalama olarak adlandırılır), bir dağılımın ortalamasının en yaygın tahminidir. Gözlenen tüm sayısal değerlerin toplamının sayılarına bölünmesi sonucudur. Sayılardan oluşan bir örnek için X 1, X 2, …, XN, örnek ortalama (ile gösterilir) ) eşittir = (X 1 + X 2 + … + XN) / N, veya

örnek ortalaması nerede, N- örnek boyut, XBen– numunenin i-inci elemanı.

Notu veya formatında indirin, formattaki örnekler

Çok yüksek riskli 15 yatırım fonunun beş yıllık ortalama yıllık getirilerinin aritmetik ortalamasını hesaplamayı düşünün (Şekil 1).

Pirinç. 1. Çok yüksek riskli 15 yatırım fonunun ortalama yıllık getirisi

Örnek ortalaması şu şekilde hesaplanır:

Bu, özellikle banka veya kredi birliği mevduat sahiplerinin aynı dönemde aldıkları %3-4'lük getiriyle karşılaştırıldığında iyi bir getiridir. Getirileri sıraladığımızda sekiz fonun ortalamanın üzerinde, yedi fonun ise ortalamanın altında getiri sağladığını görmek kolay. Aritmetik ortalama denge noktası görevi görür, böylece düşük getirili fonlar yüksek getirili fonları dengeler. Ortalamanın hesaplanmasında numunenin tüm unsurları yer alır. Bir dağılımın ortalamasına ilişkin diğer tahminlerin hiçbiri bu özelliğe sahip değildir.

Aritmetik ortalamayı ne zaman hesaplamanız gerekir? Aritmetik ortalama örnekteki tüm elemanlara bağlı olduğundan uç değerlerin varlığı sonucu önemli ölçüde etkiler. Bu gibi durumlarda aritmetik ortalama, sayısal verilerin anlamını bozabilir. Bu nedenle uç değerler içeren bir veri seti açıklanırken medyanın veya aritmetik ortalamanın ve medyanın belirtilmesi gerekir. Örneğin RS Emerging Growth fonunun getirilerini örneklemden çıkarırsak, 14 fonun örneklem ortalaması neredeyse %1 azalarak %5,19'a düşüyor.

Medyan

Medyan, sıralı bir sayı dizisinin orta değerini temsil eder. Dizi tekrarlayan sayılar içermiyorsa, elemanlarının yarısı ortancadan küçük, yarısı da büyük olacaktır. Örnek aşırı değerler içeriyorsa, ortalamayı tahmin etmek için aritmetik ortalama yerine ortancayı kullanmak daha iyidir. Bir örneğin medyanını hesaplamak için önce sıralanması gerekir.

Bu formül belirsizdir. Sonuç, sayının çift veya tek olmasına bağlıdır N:

  • Örnek tek sayıda öğe içeriyorsa, medyan (n+1)/2-'inci eleman.
  • Örnek çift sayıda öğe içeriyorsa, medyan, örneğin ortadaki iki öğesi arasında yer alır ve bu iki öğe üzerinden hesaplanan aritmetik ortalamaya eşittir.

Çok yüksek riskli 15 yatırım fonunun getirilerini içeren bir örneğin medyanını hesaplamak için öncelikle ham verileri sıralamanız gerekir (Şekil 2). Daha sonra medyan, numunenin ortadaki elemanının sayısının karşısında olacaktır; 8 numaralı örneğimizde. Excel'in sırasız dizilerle de çalışan özel bir işlevi =MEDIAN() vardır.

Pirinç. 2. Ortalama 15 fon

Dolayısıyla medyan 6,5'tir. Bu, çok yüksek riskli fonların bir yarısının getirisinin 6,5'u geçmediği, diğer yarısının getirisinin ise onu aştığı anlamına geliyor. 6,5'lik medyanın 6,08'lik ortalamadan çok da büyük olmadığını unutmayın.

Örneklemden RS Emerging Growth fonunun getirisini çıkarırsak kalan 14 fonun medyanı %6,2'ye düşüyor, yani aritmetik ortalama kadar anlamlı değil (Şekil 3).

Pirinç. 3. Ortalama 14 fon

Moda

Terim ilk kez 1894'te Pearson tarafından icat edildi. Moda, bir örnekte en sık görülen (en moda olan) sayıdır. Moda, örneğin sürücülerin trafik ışığı sinyaline hareket etmeyi bırakma yönündeki tipik tepkisini çok iyi tanımlıyor. Moda kullanımının klasik bir örneği, ayakkabı bedeninin veya duvar kağıdının renginin seçimidir. Bir dağıtımın birden fazla modu varsa, bu durumda multimodal veya multimodal (iki veya daha fazla "zirveye" sahip) olduğu söylenir. Dağılımın çok modlu olması, incelenen değişkenin doğası hakkında önemli bilgiler sağlar. Örneğin sosyolojik araştırmalarda, eğer bir değişken bir şeye yönelik bir tercihi veya tutumu temsil ediyorsa, bu durumda çok modluluk birbirinden tamamen farklı birkaç görüşün olduğu anlamına gelebilir. Çok modluluk aynı zamanda numunenin homojen olmadığının ve gözlemlerin iki veya daha fazla "örtüşen" dağılım tarafından üretilebileceğinin bir göstergesi olarak da hizmet eder. Aritmetik ortalamanın aksine aykırı değerler modu etkilemez. Yatırım fonlarının ortalama yıllık getirisi gibi sürekli dağıtılan rastgele değişkenler için bu mod bazen mevcut olmayabilir (veya hiçbir anlam ifade etmeyebilir). Bu göstergeler çok farklı değerler alabildiğinden tekrarlanan değerler son derece nadirdir.

Çeyrekler

Çeyrekler, büyük sayısal örneklerin özelliklerini açıklarken veri dağılımını değerlendirmek için en sık kullanılan metriklerdir. Medyan, sıralı diziyi ikiye bölerken (dizinin öğelerinin %50'si medyandan küçük ve %50'si büyüktür), çeyrekler sıralı veri kümesini dört parçaya böler. Q 1 , medyan ve Q 3 değerleri sırasıyla 25., 50. ve 75. yüzdelik dilimlerdir. İlk çeyrek Q1, numuneyi iki parçaya bölen bir sayıdır: öğelerin %25'i ilk çeyrekten küçüktür ve %75'i büyüktür.

Üçüncü çeyrek Q3 aynı zamanda numuneyi iki parçaya bölen bir sayıdır: Öğelerin %75'i üçüncü çeyrekten küçüktür ve %25'i büyüktür.

Excel'in 2007'den önceki sürümlerinde çeyrekleri hesaplamak için =QUARTILE(array,part) işlevini kullanın. Excel 2010'dan itibaren iki işlev kullanılmaktadır:

  • =QUARTILE.ON(dizi, parça)
  • =QUARTILE.HRC(dizi, parça)

Bu iki fonksiyon biraz farklı değerler vermektedir (Şekil 4). Örneğin, çok yüksek riskli 15 yatırım fonunun ortalama yıllık getirisini içeren bir örneğin çeyrekleri hesaplanırken, QUARTILE.IN ve QUARTILE.EX için sırasıyla Q 1 = 1,8 veya –0,7. Bu arada, daha önce kullanılan QUARTILE işlevi, modern QUARTILE.ON işlevine karşılık gelir. Yukarıdaki formülleri kullanarak Excel'de çeyrekleri hesaplamak için veri dizisinin sıralanmasına gerek yoktur.

Pirinç. 4. Excel'de çeyrekleri hesaplamak

Tekrar vurgulayalım. Excel, tek değişkenli bir değişken için çeyrekleri hesaplayabilir ayrık seri rastgele bir değişkenin değerlerini içeren. Frekans bazlı bir dağılım için çeyreklerin hesaplanması aşağıdaki bölümde verilmiştir.

Geometrik ortalama

Aritmetik ortalamanın aksine geometrik ortalama, bir değişkenin zaman içindeki değişim derecesini tahmin etmenize olanak tanır. Geometrik ortalama köktür N işten elde edilen derece N miktarlar (Excel'de =SRGEOM işlevi kullanılır):

G= (X 1 * X 2 * … * X n) 1/n

Benzer bir parametre - kâr oranının geometrik ortalama değeri - aşağıdaki formülle belirlenir:

G = [(1 + R 1) * (1 + R 2) * … * (1 + R n)] 1/n – 1,

Nerede Ri– kar oranı Ben zaman dilimi.

Örneğin ilk yatırımın 100.000$ olduğunu varsayalım. İlk yılın sonunda 50.000$'a düşüyor, ikinci yılın sonunda ise başlangıç ​​seviyesi olan 100.000$'a geri dönüyor. -yıllık dönem, başlangıç ​​ve son fon tutarları birbirine eşit olduğundan 0'a eşittir. Ancak yıllık kâr oranlarının aritmetik ortalaması = (–0,5 + 1) / 2 = 0,25 veya %25 olur, çünkü ilk yıldaki kâr oranı R 1 = (50.000 – 100.000) / 100.000 = –0,5 ve ikinci R 2 = (100.000 – 50.000) / 50.000 = 1. Aynı zamanda, kâr oranının iki yıllık geometrik ortalama değeri şuna eşittir: G = [(1–0,5) * (1+1 ) ] 1/2 – 1 = ½ – 1 = 1 – 1 = 0. Dolayısıyla geometrik ortalama, iki yıllık bir süre boyunca yatırım hacmindeki değişimi (daha kesin olarak değişiklik yokluğunu) aritmetikten daha doğru bir şekilde yansıtır. Anlam.

İlginç gerçekler. Birincisi, geometrik ortalama her zaman aynı sayıların aritmetik ortalamasından küçük olacaktır. Alınan tüm sayıların birbirine eşit olduğu durum hariç. İkinci olarak, dik üçgenin özelliklerini dikkate alarak ortalamanın neden geometrik olarak adlandırıldığını anlayabilirsiniz. Hipotenüse indirilen bir dik üçgenin yüksekliği, bacakların hipotenüse izdüşümleri arasındaki ortalama orantılıdır ve her bacak, hipotenüs ile hipotenüse izdüşümü arasındaki ortalama orantılıdır (Şekil 5). Bu, iki (uzunluk) parçanın geometrik ortalamasını oluşturmak için geometrik bir yol sağlar: çap olarak bu iki parçanın toplamı üzerinde bir daire oluşturmanız, ardından bunların daire ile kesişme noktasına bağlantı noktasından yüksekliği geri yüklemeniz gerekir. istenen değeri verecektir:

Pirinç. 5. Geometrik ortalamanın geometrik doğası (Wikipedia'dan şekil)

Sayısal verilerin ikinci önemli özelliği ise varyasyon, veri dağılım derecesini karakterize eder. İki farklı örnek hem ortalama hem de varyans açısından farklı olabilir. Ancak Şekil 2'de gösterildiği gibi. Şekil 6 ve 7'de, iki numune aynı varyasyonlara ancak farklı ortalamalara veya aynı ortalamaya ve tamamen farklı varyasyonlara sahip olabilir. Şekil 2'deki B poligonuna karşılık gelen veriler. Şekil 7'de, A poligonunun oluşturulduğu verilere göre çok daha az değişiklik olur.

Pirinç. 6. Aynı yayılma ve farklı ortalama değerlere sahip iki simetrik çan şeklindeki dağılım

Pirinç. 7. Aynı ortalama değerlere ve farklı spreadlere sahip iki simetrik çan şeklindeki dağılım

Veri değişimine ilişkin beş tahmin vardır:

  • kapsam,
  • çeyrekler arası aralık,
  • dağılım,
  • standart sapma,
  • varyasyon katsayısı.

Kapsam

Aralık, numunenin en büyük ve en küçük elemanları arasındaki farktır:

Aralık = XMaksimum – XMin.

Çok yüksek riskli 15 yatırım fonunun ortalama yıllık getirilerini içeren bir örneklemin aralığı, sıralı dizi kullanılarak hesaplanabilir (bkz. Şekil 4): Aralık = 18,5 – (–6,1) = 24,6. Bu da çok yüksek riskli fonların en yüksek ve en düşük ortalama yıllık getirileri arasındaki farkın %24,6 olduğu anlamına geliyor.

Aralık, verilerin genel yayılımını ölçer. Örnek aralığı, verilerin genel yayılımına ilişkin çok basit bir tahmin olmasına rağmen zayıflığı, verilerin minimum ve maksimum öğeler arasında nasıl dağıldığını tam olarak hesaba katmamasıdır. Bu etki Şekil 2'de açıkça görülmektedir. Şekil 8, aynı aralığa sahip numuneleri göstermektedir. Ölçek B, bir numunenin en az bir uç değer içermesi durumunda numune aralığının, verilerin yayılmasına ilişkin oldukça kesin olmayan bir tahmin olduğunu göstermektedir.

Pirinç. 8. Aynı aralığa sahip üç numunenin karşılaştırılması; üçgen ölçeğin desteğini sembolize eder ve konumu örnek ortalamaya karşılık gelir

Çeyrekler arası aralık

Çeyrekler arası veya ortalama aralık, numunenin üçüncü ve birinci çeyrekleri arasındaki farktır:

Çeyrekler arası aralık = Q 3 – Q 1

Bu değer, aşırı elementlerin etkisini hesaba katmadan elementlerin %50'sinin dağılımını tahmin etmemizi sağlar. Çok yüksek riskli 15 yatırım fonunun ortalama yıllık getirilerini içeren bir örneklemin çeyrekler arası aralığı, Şekil 1'deki veriler kullanılarak hesaplanabilir. 4 (örneğin, QUARTILE.EXC işlevi için): Çeyrekler arası aralık = 9,8 – (–0,7) = 10,5. 9,8 ve -0,7 sayılarıyla sınırlanan aralığa genellikle orta yarı denir.

Q 1 ve Q 3 değerlerinin ve dolayısıyla çeyrekler arası aralığın, aykırı değerlerin varlığına bağlı olmadığına dikkat edilmelidir, çünkü hesaplamaları Q 1'den küçük veya daha büyük herhangi bir değeri hesaba katmaz. Q 3'ten daha. Aykırı değerlerden etkilenmeyen medyan, birinci ve üçüncü çeyrekler ve çeyrekler arası aralık gibi özet ölçümlere sağlam ölçümler denir.

Aralık ve çeyrekler arası aralık sırasıyla bir numunenin genel ve ortalama yayılımına ilişkin tahminler sağlasa da, bu tahminlerin hiçbiri verilerin tam olarak nasıl dağıtıldığını hesaba katmaz. Varyans ve standart sapma bu dezavantajdan yoksundur. Bu göstergeler, verilerin ortalama değer etrafında ne ölçüde dalgalandığını değerlendirmenize olanak tanır. Örnek varyans her bir örnek öğe ile örnek ortalaması arasındaki farkların karelerinden hesaplanan aritmetik ortalamanın bir yaklaşımıdır. Bir X 1, X 2, ... X n örneği için örnek varyansı (S2 sembolüyle gösterilir) aşağıdaki formülle verilir:

Genel olarak numune varyansı, numune öğeleri ile numune ortalaması arasındaki farkların karelerinin toplamının numune boyutundan bir eksiğine eşit bir değere bölünmesiyle elde edilir:

Nerede - aritmetik ortalama, N- örnek boyut, X ben - Ben seçimin inci unsuru X. Excel'de sürüm 2007'den önce, örnek varyansını hesaplamak için =VARP() işlevi kullanılıyordu; sürüm 2010'dan bu yana =VARP.V() işlevi kullanılıyor.

Verilerin yayılmasına ilişkin en pratik ve yaygın olarak kabul edilen tahmin şu şekildedir: Numune standart sapması. Bu gösterge S sembolüyle gösterilir ve örnek varyansın kareköküne eşittir:

Excel'de sürüm 2007'den önce standart örnek sapmayı hesaplamak için =STDEV.() işlevi kullanılıyordu; sürüm 2010'dan bu yana =STDEV.V() işlevi kullanılıyor. Bu işlevleri hesaplamak için veri dizisi sırasız olabilir.

Ne örneklem varyansı ne de örneklem standart sapması negatif olamaz. S 2 ve S göstergelerinin sıfır olabileceği tek durum, numunenin tüm elemanlarının birbirine eşit olmasıdır. Tamamen olasılık dışı olan bu durumda aralık ve çeyrekler arası aralık da sıfırdır.

Sayısal veriler doğası gereği değişkendir. Herhangi bir değişken birçok farklı değer alabilir. Örneğin, farklı yatırım fonlarının farklı getiri ve zarar oranları vardır. Sayısal verilerin değişkenliği nedeniyle, yalnızca doğası gereği özet olan ortalama tahminlerini değil, aynı zamanda verilerin yayılmasını karakterize eden varyans tahminlerini de incelemek çok önemlidir.

Dağılım ve standart sapma, verilerin ortalama değer etrafındaki yayılımını değerlendirmenize, başka bir deyişle kaç örnek öğenin ortalamadan küçük, kaçının büyük olduğunu belirlemenize olanak tanır. Dispersiyonun bazı değerli matematiksel özellikleri vardır. Ancak değeri ölçü biriminin karesidir - yüzde kare, dolar kare, inç kare vb. Bu nedenle, dağılımın doğal bir ölçüsü, ortak gelir birimleri yüzdesi, dolar veya inç cinsinden ifade edilen standart sapmadır.

Standart sapma, örnek öğelerin ortalama değer etrafındaki değişim miktarını tahmin etmenize olanak tanır. Hemen hemen tüm durumlarda, gözlemlenen değerlerin çoğunluğu, ortalamadan artı veya eksi bir standart sapma aralığında yer alır. Sonuç olarak, örnek elemanların aritmetik ortalamasını ve standart örnek sapmasını bilerek, veri büyük kısmının ait olduğu aralığı belirlemek mümkündür.

Çok yüksek riskli 15 yatırım fonunun getirilerinin standart sapması 6,6'dır (Şekil 9). Bu, fonların büyük kısmının karlılığının ortalama değerden %6,6'dan fazla farklılık göstermediği anlamına gelir (yani, -S= 6,2 – 6,6 = –0,4 ila +S= 12.8). Aslında fonların beş yıllık ortalama yıllık getirisi %53,3 (15 üzerinden 8) bu aralıkta yer alıyor.

Pirinç. 9. Örnek standart sapma

Kareleri alınmış farkları toplarken, ortalamadan daha uzak olan örnek öğelere, ortalamaya daha yakın olan öğelerden daha fazla ağırlık verildiğini unutmayın. Bu özellik, bir dağılımın ortalamasını tahmin etmek için aritmetik ortalamanın en sık kullanılmasının ana nedenidir.

Değişim katsayısı

Önceki dağılım tahminlerinin aksine, varyasyon katsayısı göreceli bir tahmindir. Orijinal verilerin birimlerinde değil, her zaman yüzde olarak ölçülür. CV simgeleriyle gösterilen varyasyon katsayısı, verilerin ortalama etrafındaki dağılımını ölçer. Değişim katsayısı, standart sapmanın aritmetik ortalamaya bölünmesi ve %100 ile çarpılmasına eşittir:

Nerede S- standart numune sapması, - örnek ortalaması.

Değişim katsayısı, elemanları farklı ölçü birimleriyle ifade edilen iki örneği karşılaştırmanıza olanak tanır. Örneğin, bir posta dağıtım hizmetinin yöneticisi, kamyon filosunu yenilemeyi planlıyor. Paketleri yüklerken dikkate alınması gereken iki tür kısıtlama vardır: her paketin ağırlığı (pound cinsinden) ve hacmi (fit küp cinsinden). 200 torba içeren bir numunede ortalama ağırlığın 26,0 pound, ağırlığın standart sapmasının 3,9 pound, ortalama torba hacminin 8,8 fit küp ve hacmin standart sapmasının 2,2 fit küp olduğunu varsayalım. Paketlerin ağırlık ve hacmindeki farklılıklar nasıl karşılaştırılır?

Ağırlık ve hacim ölçü birimleri birbirinden farklı olduğundan, yöneticinin bu miktarların göreceli yayılımını karşılaştırması gerekir. Ağırlık değişim katsayısı CV W = 3,9 / 26,0 * %100 = %15 ve hacim değişim katsayısı CV V = 2,2 / 8,8 * %100 = %25'tir. Dolayısıyla paketlerin hacmindeki göreceli değişim, ağırlıklarındaki göreceli değişimden çok daha fazladır.

Dağıtım formu

Bir numunenin üçüncü önemli özelliği dağılımının şeklidir. Bu dağılım simetrik veya asimetrik olabilir. Bir dağılımın şeklini tanımlamak için ortalamasını ve medyanını hesaplamak gerekir. İkisi aynıysa değişkenin simetrik olarak dağıldığı kabul edilir. Bir değişkenin ortalama değeri ortancadan büyükse dağılımı pozitif çarpıklığa sahiptir (Şekil 10). Medyan ortalamadan büyükse değişkenin dağılımı negatif çarpıktır. Ortalama olağandışı yüksek değerlere yükseldiğinde pozitif çarpıklık meydana gelir. Ortalama alışılmadık derecede küçük değerlere düştüğünde negatif çarpıklık ortaya çıkar. Bir değişken her iki yönde de uç değerler almıyorsa simetrik olarak dağılmıştır, böylece değişkenin büyük ve küçük değerleri birbirini iptal eder.

Pirinç. 10. Üç tür dağıtım

A ölçeğinde gösterilen veriler negatif çarpıktır. Bu şekil, alışılmadık derecede küçük değerlerin varlığından kaynaklanan uzun bir kuyruğu ve sola doğru bir eğimi göstermektedir. Bu son derece küçük değerler ortalama değeri sola kaydırarak medyandan daha küçük hale getirir. B ölçeğinde gösterilen veriler simetrik olarak dağıtılmıştır. Dağılımın sol ve sağ yarıları kendilerinin ayna görüntüleridir. Büyük ve küçük değerler birbirini dengeler ve ortalama ile medyan eşittir. B ölçeğinde gösterilen veriler pozitif olarak çarpıktır. Bu şekil, alışılmadık derecede yüksek değerlerin varlığından kaynaklanan uzun bir kuyruğu ve sağa doğru bir eğimi göstermektedir. Bu çok büyük değerler ortalamayı sağa kaydırarak medyandan daha büyük hale getirir.

Excel'de bir eklenti kullanılarak tanımlayıcı istatistikler elde edilebilir. Analiz paketi. Menüde gezinme VeriVeri analizi, açılan pencerede satırı seçin Tanımlayıcı istatistikler ve tıklayın Tamam. Pencerede Tanımlayıcı istatistikler mutlaka belirtin Giriş aralığı(Şekil 11). Açıklayıcı istatistikleri orijinal verilerle aynı sayfada görmek istiyorsanız radyo düğmesini seçin. Çıkış aralığı ve görüntülenen istatistiklerin sol üst köşesinin yerleştirileceği hücreyi belirtin (örneğimizde $C$1). Verileri yeni bir sayfaya veya yeni bir çalışma kitabına çıkarmak istiyorsanız uygun radyo düğmesini seçmeniz yeterlidir. yanındaki kutuyu işaretleyin Özet istatistikler. İstenirse siz de seçebilirsiniz Zorluk seviyesi,en küçük veen büyük k..

Eğer depozito varsa Veri bölgede Analiz simgeyi görmüyorsun Veri analizi, önce eklentiyi yüklemeniz gerekiyor Analiz paketi(örneğin bkz.).

Pirinç. 11. Çok yüksek risk seviyesine sahip fonların eklenti kullanılarak hesaplanan beş yıllık ortalama yıllık getirilerine ilişkin tanımlayıcı istatistikler Veri analizi Excel programları

Excel yukarıda tartışılan bir dizi istatistiği hesaplar: ortalama, medyan, mod, standart sapma, varyans, aralık ( aralık), minimum, maksimum ve örneklem büyüklüğü ( kontrol etmek). Excel ayrıca bizim için yeni olan bazı istatistikleri de hesaplar: standart hata, basıklık ve çarpıklık. Standart hata standart sapmanın örneklem büyüklüğünün kareköküne bölünmesine eşittir. Asimetri dağılımın simetrisinden sapmayı karakterize eder ve örnek öğeler ile ortalama değer arasındaki farkların küpüne bağlı bir fonksiyondur. Basıklık, dağılımın kuyruklarına kıyasla ortalama etrafındaki göreceli veri konsantrasyonunun bir ölçüsüdür ve örnek öğeler ile dördüncü kuvvete yükseltilen ortalama arasındaki farklara bağlıdır.

Bir popülasyon için tanımlayıcı istatistiklerin hesaplanması

Yukarıda tartışılan dağılımın ortalaması, yayılımı ve şekli örneklemden belirlenen özelliklerdir. Ancak veri seti tüm popülasyonun sayısal ölçümlerini içeriyorsa parametreleri hesaplanabilir. Bu parametreler popülasyonun beklenen değerini, dağılımını ve standart sapmasını içerir.

Beklenen değer popülasyondaki tüm değerlerin toplamının popülasyon büyüklüğüne bölünmesine eşittir:

Nerede µ - beklenen değer, XBen- Ben değişkenin gözlemlenmesi X, N- genel nüfusun hacmi. Excel'de matematiksel beklentiyi hesaplamak için aritmetik ortalamayla aynı işlev kullanılır: =ORTALAMA().

Nüfus değişimi genel popülasyonun unsurları ile mat arasındaki farkların karelerinin toplamına eşittir. beklentinin nüfus büyüklüğüne bölümü:

Nerede σ2– genel nüfusun dağılımı. Sürüm 2007'den önceki Excel'de, sürüm 2010 =VARP()'dan başlayarak popülasyon varyansını hesaplamak için =VARP() işlevi kullanılıyordu.

Nüfus standart sapması popülasyon varyansının kareköküne eşittir:

2007 sürümünden önceki Excel'de, 2010 =STDEV.Y() sürümünden başlayarak bir popülasyonun standart sapmasını hesaplamak için =STDEV() işlevi kullanılıyordu. Popülasyon varyansı ve standart sapmaya ilişkin formüllerin, örneklem varyansı ve standart sapmanın hesaplanmasına ilişkin formüllerden farklı olduğunu unutmayın. Örnek istatistikleri hesaplarken S2 Ve S kesrin paydası n – 1 ve parametreleri hesaplarken σ2 Ve σ - genel nüfusun hacmi N.

Temel kural

Çoğu durumda, gözlemlerin büyük bir kısmı medyan çevresinde yoğunlaşarak bir küme oluşturur. Pozitif çarpıklık içeren veri setlerinde bu küme matematiksel beklentinin solunda (yani altında), negatif çarpıklık bulunan kümelerde ise bu küme matematiksel beklentinin sağında (yani üstünde) yer alır. Simetrik veriler için ortalama ve medyan aynıdır ve gözlemler ortalamanın etrafında toplanarak çan şeklinde bir dağılım oluşturur. Dağılım açıkça çarpık değilse ve veriler belirli bir ağırlık merkezi etrafında yoğunlaşmışsa, değişkenliği tahmin etmek için kullanılabilecek genel kural şudur: Veriler çan şeklinde bir dağılıma sahipse, gözlemlerin yaklaşık %68'i dağılır. Beklenen değerin bir standart sapması dahilinde, gözlemlerin yaklaşık %95'i matematiksel beklentiden en fazla iki standart sapma uzaktadır ve gözlemlerin %99,7'si matematiksel beklentiden en fazla üç standart sapma uzaktadır.

Böylece, beklenen değer etrafındaki ortalama değişimin bir tahmini olan standart sapma, gözlemlerin nasıl dağıldığını anlamaya ve aykırı değerleri belirlemeye yardımcı olur. Temel kural, çan şeklindeki dağılımlarda yalnızca yirmi değerden birinin matematiksel beklentiden iki standart sapmadan fazla farklı olduğudur. Bu nedenle aralığın dışındaki değerler u ± 2σ, aykırı değerler olarak kabul edilebilir. Ayrıca 1000 gözlemden yalnızca üçü matematiksel beklentiden üç standart sapmadan fazla farklılık göstermektedir. Böylece aralığın dışındaki değerler u ± 3σ neredeyse her zaman aykırıdır. Oldukça çarpık veya çan şeklinde olmayan dağılımlar için Bienamay-Chebyshev temel kuralı uygulanabilir.

Yüz yıldan fazla bir süre önce matematikçiler Bienamay ve Chebyshev bağımsız olarak standart sapmanın faydalı özelliğini keşfettiler. Herhangi bir veri seti için, dağılımın şekline bakılmaksızın, belirli bir mesafede bulunan gözlemlerin yüzdesinin, k matematiksel beklentiden standart sapmalar, daha az değil (1 – 1/ k 2)*100%.

Örneğin, eğer k= 2, Bienname-Chebyshev kuralı, gözlemlerin en az (1 – (1/2) 2) x %100 = %75'inin aralıkta yer alması gerektiğini belirtir u ± 2σ. Bu kural her şey için geçerlidir k, birini aşıyor. Bienamay-Chebyshev kuralı çok geneldir ve her tür dağılım için geçerlidir. Minimum gözlem sayısını, matematiksel beklentiye olan mesafenin belirli bir değeri aşmadığını belirtir. Bununla birlikte, eğer dağılım çan şeklindeyse, temel kural, verilerin beklenen değer etrafındaki konsantrasyonunu daha doğru bir şekilde tahmin eder.

Frekans Tabanlı Bir Dağılım için Tanımlayıcı İstatistiklerin Hesaplanması

Orijinal veriler mevcut değilse frekans dağılımı tek bilgi kaynağı haline gelir. Bu gibi durumlarda, aritmetik ortalama, standart sapma ve çeyrekler gibi dağılımın niceliksel göstergelerinin yaklaşık değerlerini hesaplamak mümkündür.

Örnek veriler bir frekans dağılımı olarak temsil edilirse, her sınıftaki tüm değerlerin sınıf orta noktasında yoğunlaştığı varsayılarak aritmetik ortalamanın yaklaşık değeri hesaplanabilir:

Nerede - örnek ortalaması, N- gözlem sayısı veya örneklem büyüklüğü, İle- frekans dağılımındaki sınıf sayısı, m j- orta nokta J sınıf, FJ- karşılık gelen frekans J-inci sınıf.

Bir frekans dağılımından standart sapmayı hesaplamak için, her sınıftaki tüm değerlerin sınıfın orta noktasında yoğunlaştığı da varsayılır.

Bir serinin çeyreklerinin frekanslara göre nasıl belirlendiğini anlamak için, Rus nüfusunun kişi başına düşen ortalama parasal gelire göre dağılımına ilişkin 2013 verilerine dayanarak alt çeyreğin hesaplanmasını düşünün (Şekil 12).

Pirinç. 12. Kişi başına aylık ortalama nakit geliri olan Rus nüfusunun payı, ruble

Bir aralık varyasyon serisinin ilk çeyreğini hesaplamak için aşağıdaki formülü kullanabilirsiniz:

burada Q1, birinci çeyreğin değeridir, xQ1, birinci çeyreği içeren aralığın alt sınırıdır (aralık, ilk olarak %25'i aşan birikmiş frekans tarafından belirlenir); i – aralık değeri; Σf – tüm numunenin frekanslarının toplamı; muhtemelen her zaman %100'e eşittir; SQ1–1 – alt çeyreği içeren aralıktan önceki aralığın birikmiş frekansı; fQ1 – alt çeyreği içeren aralığın frekansı. Üçüncü çeyreğin formülü, her yerde Q1 yerine Q3 kullanmanız ve ¼ yerine ¾ kullanmanız gerektiği açısından farklılık gösterir.

Örneğimizde (Şekil 12), alt çeyrek 7000,1 – 10.000 aralığındadır ve bunun toplam frekansı %26,4'tür. Bu aralığın alt sınırı 7000 ruble, aralığın değeri 3000 ruble, alt çeyreği içeren aralıktan önceki aralığın toplam frekansı %13,4, alt çeyreği içeren aralığın frekansı %13,0'dır. Böylece: Q1 = 7000 + 3000 * (¼ * 100 – 13,4) / 13 = 9677 ovma.

Tanımlayıcı İstatistiklerle İlişkili Tuzaklar

Bu yazıda, bir veri kümesinin ortalamasını, yayılmasını ve dağılımını değerlendiren çeşitli istatistikleri kullanarak nasıl tanımlanabileceğine baktık. Bir sonraki adım veri analizi ve yorumlamadır. Şimdiye kadar verilerin nesnel özelliklerini inceledik ve şimdi onların öznel yorumlarına geçiyoruz. Araştırmacı iki hatayla karşı karşıyadır: yanlış seçilmiş bir analiz konusu ve sonuçların yanlış yorumlanması.

Çok yüksek riskli 15 yatırım fonunun getirilerinin analizi oldukça tarafsızdır. Tamamen nesnel sonuçlara varmıştır: tüm yatırım fonlarının farklı getirileri vardır, fon getirilerinin dağılımı -6,1 ile 18,5 arasında değişmektedir ve ortalama getiri 6,08'dir. Veri analizinin nesnelliği, özet niceliksel dağıtım göstergelerinin doğru seçimiyle sağlanır. Verilerin ortalamasını ve dağılımını tahmin etmek için çeşitli yöntemler dikkate alındı ​​ve bunların avantajları ve dezavantajları belirtildi. Objektif ve tarafsız bir analiz sağlamak için doğru istatistikleri nasıl seçersiniz? Veri dağılımı biraz çarpıksa ortalama yerine medyanı mı seçmelisiniz? Hangi gösterge verinin yayılmasını daha doğru şekilde karakterize eder: standart sapma mı yoksa aralık mı? Dağılımın pozitif çarpıklığına dikkat çekilmeli mi?

Öte yandan veri yorumlama subjektif bir süreçtir. Farklı insanlar aynı sonuçları yorumlarken farklı sonuçlara varırlar. Herkesin kendi bakış açısı vardır. Birisi çok yüksek risk seviyesine sahip 15 fonun toplam ortalama yıllık getirisinin iyi olduğunu düşünüyor ve elde edilen gelirden oldukça memnun. Diğerleri bu fonların getirisinin çok düşük olduğunu düşünebilir. Bu nedenle öznellik, dürüstlük, tarafsızlık ve sonuçların netliği ile telafi edilmelidir.

Etik konular

Veri analizi ayrılmaz bir şekilde etik konularla bağlantılıdır. Gazeteler, radyo, televizyon ve internet aracılığıyla yayılan bilgileri eleştirmelisiniz. Zamanla yalnızca sonuçlara değil, aynı zamanda araştırmanın hedeflerine, konusuna ve nesnelliğine de şüpheyle yaklaşmayı öğreneceksiniz. Ünlü İngiliz siyasetçi Benjamin Disraeli bunu en iyi şekilde ifade etmiştir: "Üç tür yalan vardır: yalanlar, kahrolası yalanlar ve istatistikler."

Notta belirtildiği gibi, raporda sunulması gereken sonuçların seçiminde etik sorunlar ortaya çıkmaktadır. Hem olumlu hem de olumsuz sonuçlar yayınlanmalıdır. Ayrıca bir rapor veya yazılı rapor hazırlarken sonuçların dürüst, tarafsız ve objektif bir şekilde sunulması gerekir. Başarısız ve dürüst olmayan sunumlar arasında yapılması gereken bir ayrım vardır. Bunu yapmak için konuşmacının niyetinin ne olduğunu belirlemek gerekir. Bazen konuşmacı önemli bilgileri bilgisizliğinden dolayı atlar ve bazen de bunu kasıtlı olarak yapar (örneğin, istenen sonucu elde etmek amacıyla açıkça çarpık verilerin ortalamasını tahmin etmek için aritmetik ortalamayı kullanırsa). Araştırmacının bakış açısına uymayan sonuçların gizlenmesi de dürüstlüktür.

Levin ve diğerleri İstatistikleri kitabından materyaller kullanılmıştır. – M.: Williams, 2004. – s. 178–209

DÖRTTEBİRLİK işlevi, Excel'in önceki sürümleriyle uyumluluk amacıyla korunmuştur.

İstatistiksel toplam birimlerinin özellikleri anlam bakımından farklıdır; örneğin, bir işletmede aynı meslekte çalışan işçilerin ücretlerinin aynı zaman dilimi için aynı olmaması, aynı ürünlerin piyasa fiyatları, ilçedeki mahsul rekolteleri. çiftlikler vb. Bu nedenle, incelenen birimlerin tüm popülasyonunun karakteristiği olan bir özelliğin değerini belirlemek için ortalama değerler hesaplanır.
ortalama değer bu, bazı niceliksel özelliklere sahip bir dizi bireysel değerin genelleştirici bir özelliğidir.

Niceliksel olarak incelenen popülasyon bireysel değerlerden oluşur; hem genel nedenlerden hem de bireysel koşullardan etkilenirler. Ortalama değerde, bireysel değerlerin karakteristik sapmaları iptal edilir. Bir dizi bireysel değerin bir fonksiyonu olan ortalama, tek bir değere sahip toplamın tamamını temsil eder ve tüm birimlerinde ortak olanı yansıtır.

Niteliksel olarak homojen birimlerden oluşan popülasyonlar için hesaplanan ortalamaya denir. tipik ortalama. Örneğin, belirli bir meslek grubundaki (madenci, doktor, kütüphaneci) bir çalışanın ortalama aylık maaşını hesaplayabilirsiniz. Elbette madencilerin aylık ücret düzeyleri, niteliklerindeki farklılıklar, hizmet süreleri, aylık çalışılan süre ve diğer birçok faktör nedeniyle birbirinden ve ortalama ücret düzeyinden farklılık göstermektedir. Ancak ortalama düzey, ücret düzeyini etkileyen temel faktörleri yansıtmakta ve çalışanın bireysel özelliklerinden kaynaklanan farklılıklar ortadan kaldırılmaktadır. Ortalama maaş, belirli bir çalışan türü için tipik ücret düzeyini yansıtır. Tipik bir ortalamanın elde edilmesinden önce, belirli bir popülasyonun niteliksel olarak ne kadar homojen olduğunun bir analizi yapılmalıdır. Bütünlük bireysel parçalardan oluşuyorsa, tipik gruplara (hastanedeki ortalama sıcaklık) bölünmelidir.

Heterojen popülasyonlar için özellik olarak kullanılan ortalama değerlere denir sistem ortalamaları. Örneğin, kişi başına düşen gayri safi yurtiçi hasılanın (GSYİH) ortalama değeri, çeşitli mal gruplarının kişi başına ortalama tüketim değeri ve tek bir ekonomik sistem olarak devletin genel özelliklerini temsil eden diğer benzer değerler.

Yeterince fazla sayıda birimden oluşan popülasyonlar için ortalamanın hesaplanması gerekir. Büyük sayılar yasasının yürürlüğe girmesi için bu koşula uygunluk gereklidir, bunun sonucunda bireysel değerlerin genel eğilimden rastgele sapmaları karşılıklı olarak iptal edilir.

Ortalama türleri ve bunları hesaplama yöntemleri

Ortalama türünün seçimi, belirli bir göstergenin ve kaynak verilerin ekonomik içeriğine göre belirlenir. Bununla birlikte, herhangi bir ortalama değer, ortalama özelliğin her bir varyantını değiştirdiğinde, nihai, genelleştirici veya genel olarak adlandırıldığı gibi değişmeyecek şekilde hesaplanmalıdır. belirleyici gösterge ortalama göstergeyle ilişkilidir. Örneğin, rotanın ayrı bölümlerindeki gerçek hızları ortalama hızlarla değiştirirken, aracın aynı anda kat ettiği toplam mesafe değişmemelidir; bir işletmenin bireysel çalışanlarının fiili ücretlerini ortalama ücretle değiştirirken ücret fonu değişmemelidir. Sonuç olarak, her özel durumda, mevcut verilerin niteliğine bağlı olarak, incelenen sosyo-ekonomik olgunun özelliklerine ve özüne uygun göstergenin yalnızca bir gerçek ortalama değeri vardır.
En sık kullanılanlar aritmetik ortalama, harmonik ortalama, geometrik ortalama, ikinci dereceden ortalama ve kübik ortalamadır.
Listelenen ortalamalar sınıfa aittir sakinleştirici ortalamalar ve genel formülle birleştirilir:
,
incelenen özelliğin ortalama değeri nerede;
m – ortalama derece indeksi;
– ortalaması alınan özelliğin mevcut değeri (varyant);
n – özellik sayısı.
Üs m'nin değerine bağlı olarak, aşağıdaki güç ortalama türleri ayırt edilir:
m = -1 olduğunda – harmonik ortalama;
m = 0'da – geometrik ortalama;
m = 1 için – aritmetik ortalama;
m = 2 için – ortalama karekök;
m = 3'te – ortalama kübik.
Aynı başlangıç ​​verilerini kullanırken, yukarıdaki formüldeki m üssü ne kadar büyük olursa, ortalama değer de o kadar büyük olur:
.
Güç ortalamalarının bu özelliğine, tanımlayıcı fonksiyonun artan üssüyle birlikte artış denir. ortalamaların çoğunluğu kuralı.
İşaretlenen ortalamaların her biri iki biçimde olabilir: basit Ve ağırlıklı.
Basit orta form ortalama birincil (gruplanmamış) verilerden hesaplandığında kullanılır. Ağırlıklı form– ikincil (gruplandırılmış) verilere dayalı ortalamayı hesaplarken.

Aritmetik ortalama

Aritmetik ortalama, popülasyonun hacmi değişen bir karakteristiğin tüm bireysel değerlerinin toplamı olduğunda kullanılır. Ortalamanın türü belirtilmediği takdirde aritmetik ortalamanın varsayılacağına dikkat edilmelidir. Mantıksal formülü şuna benzer:

Basit aritmetik ortalama hesaplanmış gruplandırılmamış verilere dayalı formüle göre:
veya ,
özelliğin bireysel değerleri nerede;
j, değeri ile karakterize edilen gözlem ünitesinin seri numarasıdır;
N – gözlem birimlerinin sayısı (nüfusun hacmi).
Örnek.“İstatistiksel verilerin özeti ve gruplandırılması” dersi, 10 kişilik bir ekibin iş deneyimini gözlemlemenin sonuçlarını inceledi. Ekip çalışanlarının ortalama iş deneyimini hesaplayalım. 5, 3, 5, 4, 3, 4, 5, 4, 2, 4.

Basit aritmetik ortalama formülünü kullanarak şunu da hesaplayabiliriz: kronolojik serilerdeki ortalamalar karakteristik değerlerin sunulduğu zaman aralıkları eşitse.
Örnek.İlk çeyrekte satılan ürün hacmi 47 den'i buldu. ikinci 54, üçüncü 65 ve dördüncü 58 den için birimler. birimler Ortalama üç aylık ciro (47+54+65+58)/4 = 56 den. birimler
Anlık göstergeler kronolojik bir seri halinde verilirse, ortalama hesaplanırken bunlar, dönemin başındaki ve sonundaki değerlerin yarı toplamları ile değiştirilir.
İkiden fazla an varsa ve aralarındaki aralıklar eşitse, ortalama kronolojik formül kullanılarak ortalama hesaplanır.

,
burada n, zaman noktalarının sayısıdır
Verilerin karakteristik değerlere göre gruplandırılması durumunda (yani ayrı bir varyasyonel dağılım serisi oluşturulmuştur) ile aritmetik ortalama ağırlıklı sayısı (k) gözlem sayısından (N) önemli ölçüde daha az olan, özelliğin belirli değerlerinin gözlem frekansları veya gözlem frekansları kullanılarak hesaplanır.
,
,
burada k, varyasyon serisinin grup sayısıdır,
i – varyasyon serisinin grup numarası.
a olduğundan pratik hesaplamalar için kullanılan formülleri elde ederiz:
Ve
Örnek. Gruplandırılmış bir satırdaki çalışma ekiplerinin ortalama hizmet süresini hesaplayalım.
a) frekansların kullanılması:

b) frekansların kullanılması:

Verilerin aralıklara göre gruplandırılması durumunda yani aralık dağılım serileri şeklinde sunulur; aritmetik ortalama hesaplanırken, belirli bir aralıkta nüfus birimlerinin tekdüze bir dağılımı varsayımına dayanarak aralığın ortası özelliğin değeri olarak alınır. Hesaplama aşağıdaki formüller kullanılarak gerçekleştirilir:
Ve
aralığın ortası nerede: ,
nerede ve aralıkların alt ve üst sınırlarıdır (belirli bir aralığın üst sınırının bir sonraki aralığın alt sınırıyla çakışması koşuluyla).

Örnek. 30 işçinin yıllık ücretleri üzerine yapılan bir çalışmanın sonuçlarına dayanarak oluşturulan aralık değişim serisinin aritmetik ortalamasını hesaplayalım (bkz. “İstatistiksel verilerin özeti ve gruplandırılması” dersi).
Tablo 1 – Aralık değişim serisi dağılımı.

Aralıklar, UAH

Frekans, insanlar

Sıklık,

Aralığın ortası

600-700
700-800
800-900
900-1000
1000-1100
1100-1200

3
6
8
9
3
1

0,10
0,20
0,267
0,30
0,10
0,033

(600+700):2=650
(700+800):2=750
850
950
1050
1150

1950
4500
6800
8550
3150
1150

65
150
226,95
285
105
37,95

UAH veya UAH
Kaynak verilere ve aralık varyasyon serilerine dayanarak hesaplanan aritmetik ortalamalar, nitelik değerlerinin aralıklar içindeki eşit olmayan dağılımı nedeniyle çakışmayabilir. Bu durumda ağırlıklı aritmetik ortalamanın daha doğru hesaplanması için aralıkların ortaları değil, her grup için hesaplanan basit aritmetik ortalamalar kullanılmalıdır ( grup ortalamaları). Ağırlıklı hesaplama formülü kullanılarak grup ortalamalarından hesaplanan ortalamaya denir. genel ortalama.
Aritmetik ortalamanın birçok özelliği vardır.
1. Ortalama seçenekten sapmaların toplamı sıfırdır:
.
2. Opsiyonun tüm değerleri A miktarı kadar artar veya azalırsa, ortalama değer aynı A miktarı kadar artar veya azalır:

3. Her seçenek B katı artırılır veya azaltılırsa ortalama değer de aynı sayıda artacak veya azalacaktır:
veya
4. Seçeneğin çarpımlarının frekanslara göre toplamı, ortalama değerin frekansların toplamına göre çarpımına eşittir:

5. Tüm frekanslar herhangi bir sayıya bölünür veya çarpılırsa aritmetik ortalama değişmeyecektir:

6) tüm aralıklarda frekanslar birbirine eşitse, ağırlıklı aritmetik ortalama, basit aritmetik ortalamaya eşittir:
,
burada k, varyasyon serisinin grup sayısıdır.

Ortalamanın özelliklerini kullanmak, hesaplamasını basitleştirmenize olanak tanır.
Tüm seçeneklerin (x) önce aynı A sayısı kadar, sonra da B faktörü kadar azaltıldığını varsayalım. En büyük sadeleştirme, en yüksek frekansa sahip aralığın ortasının değeri A olarak seçildiğinde ve aralığın değeri (aynı aralıklara sahip seriler için) B olarak seçildiğinde elde edilir. A miktarına orijin denir, dolayısıyla ortalamayı hesaplamanın bu yöntemine denir. yol B koşullu sıfırdan ohm referansı veya anların yolu.
Böyle bir dönüşümün ardından varyantları eşit olan yeni bir varyasyonel dağılım serisi elde ederiz. Aritmetik ortalamalarına denir ilk sipariş anı, formülle ifade edilir ve ikinci ve üçüncü özelliklere göre aritmetik ortalama, orijinal versiyonun ortalamasına eşittir, önce A, sonra B katı ile azaltılır, yani;
Almak için gerçek ortalama(orijinal serinin ortalaması) birinci dereceden momenti B ile çarpmanız ve A'yı eklemeniz gerekir:

Momentler yöntemi kullanılarak aritmetik ortalamanın hesaplanması Tablodaki verilerle gösterilmektedir. 2.
Tablo 2 – Fabrika atölyesi çalışanlarının hizmet süresine göre dağılımı


Çalışanların hizmet süresi, yıl

İşçi miktarı

Aralığın ortası

0 – 5
5 – 10
10 – 15
15 – 20
20 – 25
25 – 30

12
16
23
28
17
14

2,5
7,5
12,7
17,5
22,5
27,5

15
-10
-5
0
5
10

3
-2
-1
0
1
2

36
-32
-23
0
17
28

İlk sipariş anını bulma . Daha sonra A = 17,5 ve B = 5 olduğunu bilerek atölye çalışanlarının ortalama hizmet süresini hesaplıyoruz:
yıllar

Harmonik ortalama
Yukarıda gösterildiği gibi, aritmetik ortalama, bir özelliğin x varyantlarının ve f frekanslarının bilindiği durumlarda, bir özelliğin ortalama değerini hesaplamak için kullanılır.
İstatistiksel bilgi popülasyonun bireysel x seçenekleri için f frekanslarını içermiyor ancak bunların ürünü olarak sunuluyorsa formül uygulanır ağırlıklı harmonik ortalama. Ortalamayı hesaplamak için nerede olduğunu belirtelim. Bu ifadeleri aritmetik ağırlıklı ortalama formülünde değiştirerek harmonik ağırlıklı ortalama formülünü elde ederiz:
,
i (i=1,2, …, k) numaralı aralıktaki gösterge nitelik değerlerinin hacmi (ağırlığı) nerededir.

Bu nedenle, harmonik ortalama, seçeneklerin kendisinin toplamaya tabi olmadığı, ancak bunların karşılıklı olduğu durumlarda kullanılır: .
Her seçeneğin ağırlığının bire eşit olduğu durumlarda; Ters karakteristiğin bireysel değerleri bir kez uygulanır, uygulanır harmonik basit demek:
,
ters özelliğin bireysel değişkenleri nerede bir kez meydana gelir;
N – sayı seçeneği.
Bir popülasyonun iki kısmı için harmonik ortalamalar varsa, tüm popülasyonun genel ortalaması aşağıdaki formül kullanılarak hesaplanır:

ve denir grup ortalamalarının ağırlıklı harmonik ortalaması.

Örnek. Döviz alım satımı sırasında operasyonun ilk saatinde üç işlem gerçekleştirildi. Grivna satış miktarı ve ABD doları karşısında Grivna döviz kuruna ilişkin veriler tabloda verilmektedir. 3 (sütun 2 ve 3). İşlemin ilk saati için Grivnanın ABD dolarına karşı ortalama döviz kurunu belirleyin.
Tablo 3 – Döviz ticaretinin ilerlemesine ilişkin veriler

Ortalama dolar kuru, tüm işlemler sırasında satılan Grivna miktarının, aynı işlemler sonucunda elde edilen dolar miktarına oranıyla belirlenir. Grivnanın nihai satış tutarı tablonun 2. sütunundan bilinmektedir ve her işlemde satın alınan dolar miktarı, Grivnanın satış tutarının döviz kuruna bölünmesiyle belirlenir (sütun 4). Üç işlem sırasında toplam 22 milyon dolar satın alındı. Bu, bir dolar için Grivnanın ortalama döviz kurunun şu şekilde olduğu anlamına gelir:
.
Ortaya çıkan değer gerçektir çünkü İşlemlerdeki gerçek Grivna döviz kurları ile değiştirilmesi, Grivna satışlarının nihai tutarını değiştirmeyecektir. belirleyici gösterge: milyon UAH
Hesaplama için aritmetik ortalama kullanıldıysa; Grivnası, daha sonra 22 milyon dolarlık döviz kuruyla satın alındı. 110,66 milyon UAH harcamak gerekecek ki bu doğru değil.

Geometrik ortalama
Geometrik ortalama, olayların dinamiklerini analiz etmek için kullanılır ve ortalama büyüme katsayısının belirlenmesine olanak tanır. Geometrik ortalamayı hesaplarken, bir özelliğin bireysel değerleri, her seviyenin bir öncekine oranı olarak zincir değerleri şeklinde oluşturulan dinamiklerin göreceli göstergeleridir.
Basit geometrik ortalama aşağıdaki formül kullanılarak hesaplanır:
,
ürünün işareti nerede,
N – ortalama değerlerin sayısı.
Örnek. 4 yılda kayıtlı suç sayısı 1,57 kat arttı; 1'incide 1,08 kat, 2'de 1,1 kat, 3'te 1,18 ve 4'te 1,12 kat artış yaşandı. Bu durumda suç sayısının ortalama yıllık artış oranı: , yani. Kayıtlı suçların sayısı her yıl ortalama %12 arttı.

1,8
-0,8
0,2
1,0
1,4

1
3
4
1
1

3,24
0,64
0,04
1
1,96

3,24
1,92
0,16
1
1,96

Ağırlıklı ortalamanın karesini hesaplamak için ve'yi belirleyip tabloya giriyoruz. Daha sonra ürünlerin uzunluğunun verilen normdan ortalama sapması şuna eşittir:

Bu durumda aritmetik ortalama uygun olmayacaktır çünkü sonuç olarak sıfır sapma elde ederiz.
Ortalama karenin kullanımı varyasyon açısından daha ayrıntılı olarak tartışılacaktır.

Ortam Türleri

Cauchy'ye göre ortalama değer bağımsız değişkenlerin tüm olası değerleri için, bu işlevin değeri sayıların minimumundan az ve bu sayıların maksimumundan fazla olmayacak şekilde herhangi bir işlevdir.

Kolmogorov'a göre ortalama gerçek sayılar için - formun bir miktarı

burada sürekli tam monoton bir fonksiyondur ve 'nin ters fonksiyonudur. At aritmetik ortalama, at geometrik ortalama, at harmonik ortalama, at ikinci dereceden ortalama, at güç ortalamasıdır.

Böyle bir fonksiyon süreklilik, her biri için monotonluk ve simetri özelliklerine sahiptir. Aynı sayıların ortalaması toplam değerlerine eşittir.

.

Moda- Bir dizi gözlemde en sık meydana gelen değer. Bazen birden fazla mod bir arada ortaya çıkar (örneğin: 2, 6, 6, 6, 8, 9, 9, 9, 10; mod = 6 ve 9). Bu durumda bütünlüğün multimodal olduğunu söyleyebiliriz. Yapısal ortalamalardan yalnızca mod böyle benzersiz bir özelliğe sahiptir. Tipik olarak çok modluluk, veri setinin normal bir dağılım izlemediğini gösterir.

Ortalama değer olarak mod, sayısal olmayan veriler için kullanılabilir. Listelenen araba renkleri arasında şunlar yer almaktadır: beyaz, siyah, mavi, beyaz, mavi, beyaz- moda eşit olacak beyazçiçek aç. Uzman değerlendirmesi sırasında, satışları tahmin ederken veya üretimlerini planlarken dikkate alınan en popüler ürün türlerini belirlemek için kullanılır.

Medyan (50. yüzdelik dilim, 0,5 yüzdelik dilim)- sıralanan popülasyonu (örnek varyasyon serisi) iki eşit parçaya bölen bir özelliğin olası değeri: veri serisinin "alt" birimlerinin %50'si, medyandan daha büyük olmayan bir karakteristik değere sahip olacak ve "üst" 50 %, medyandan daha az olmayan bir karakteristik değere sahip olacaktır.

Sıralı ölçekte ortalamalar

Tüm Cauchy ortalamaları arasında yalnızca varyasyon serisinin üyeleri (sıralı istatistikler) sıralı ölçekte kabul edilebilir ortalamalardır. Özellikle medyan, sıralı bir ölçekte ölçülen veriler için ortalama olarak kullanılabilir (örnek boyutu tek ise). Hacim eşitse, varyasyon serisinin iki merkezi üyesinden biri kullanılmalıdır; bazen sol medyan veya sağ medyan olarak da adlandırılırlar. Moda da kullanılabilir; her zaman varyasyon serisinin bir üyesidir. Ancak aritmetik ortalamayı, geometrik ortalamayı vb. asla hesaplayamazsınız.

Matematikte Birleşik Devlet Sınavı mezunlar için en zor sınavlardan biridir. Uzun yıllara dayanan uygulama, öğrencilerin doğal bir sayının son basamağını hesaplarken sıklıkla yanlışlıklar yaptığını göstermiştir. Bu konu başlı başına oldukça karmaşıktır çünkü özel doğruluk, dikkat ve gelişmiş mantıksal düşünme gerektirir. Bu tür görevlerle sorunsuz bir şekilde başa çıkabilmek için uygun çevrimiçi hizmet olan “Shkolkovo” yu kullanmanızı öneririz. Web sitemizde bir sayının sıfırdan farklı son rakamını bulmak için denklem çözmek ve ilgili konularda bilginizi geliştirmek için ihtiyacınız olan her şeyi bulacaksınız.

Shkolkovo ile Birleşik Devlet Sınavını mükemmel notlarla geçin!

Eğitim portalımız, mezunların nihai sertifikasyona hazırlanmalarını mümkün olduğunca kolaylaştıracak şekilde inşa edilmiştir. Öğrenci ilk önce "Teorik Yardım" bölümüne yönelir: denklem çözme kurallarını hatırlar, bir sayının son rakamını bulmaya yardımcı olan önemli formüllerle ilgili hafızasını tazeler. Bundan sonra, çeşitli karmaşıklık seviyelerinde birçok görevi bulduğu "Kataloglar" a gider. Herhangi bir alıştırmada zorluk yaşarsanız, onu “Favoriler”e taşıyabilir, böylece daha sonra dönüp kendi başınıza veya bir öğretmenin yardımıyla çözebilirsiniz.

Shkolkovo uzmanları konuyla ilgili materyalleri en basit ve anlaşılır biçimde topladı, sistemleştirdi ve sundu. Böylece kısa sürede büyük miktarda bilgi emilir. Öğrenciler, birkaç çözüm belirtmenin gerekli olduğu durumlar da dahil olmak üzere, son zamanlarda kendilerine büyük zorluklara neden olan görevleri bile tamamlayabileceklerdir.

Dersleri olabildiğince etkili hale getirmek için en kolay örneklerle başlamanızı öneririz. Zorluk yaratmıyorlarsa, zaman kaybetmeyin - orta seviye görevlere geçin, bu şekilde zayıf yönlerinizi tespit edecek, sizin için en zor olan görevlere odaklanacak ve daha büyük sonuçlar elde edeceksiniz. 1-2 hafta boyunca günlük pratik yaptıktan sonra Pi sayısının son rakamını bile birkaç dakika içinde çıkarabileceksiniz. Bu görev matematikte Birleşik Devlet Sınavında oldukça yaygındır.

Portalımızdaki alıştırma veri tabanı, geniş deneyime sahip öğretmenler tarafından sürekli olarak güncellenmekte ve desteklenmektedir. Okul çocukları, her gün tamamen yeni görevler alma ve bir okul ders kitabını tekrarlarken sıklıkla yapmak zorunda kaldıkları gibi aynı örneklere takılıp kalmama konusunda mükemmel bir fırsata sahiptir.

Bugün Shkolkovo web sitesinde derslere başlayın ve sonuçların gelmesi uzun sürmeyecek!

Portalımızdaki eğitim herkese açıktır. İlerlemenizi takip etmek ve sizin için kişisel olarak oluşturulan yeni görevleri almak için sisteme kaydolun. Başarılı hazırlıklar dileriz!

Şimdi konuşalım ortalama nasıl hesaplanır.
Klasik formunda genel istatistik teorisi bize ortalama değer seçme kurallarının bir versiyonunu sunar.
Öncelikle ortalama değeri (AFV) hesaplamak için doğru mantıksal formülü oluşturmanız gerekir. Her ortalama değer için, onu hesaplamak için her zaman tek bir mantıksal formül vardır, bu nedenle burada hata yapmak zordur. Ancak payın (kesrin en üstünde olan) tüm olguların toplamını içerdiğini ve paydanın (kesirin en altında bulunan) toplam öğe sayısını içerdiğini her zaman hatırlamalıyız.

Mantıksal formül derlendikten sonra kuralları kullanabilirsiniz (anlaşılma kolaylığı için bunları basitleştirip kısaltacağız):
1. Kaynak veriler (frekansla belirlenir) mantıksal bir formülün paydasını içeriyorsa, hesaplama ağırlıklı aritmetik ortalama formülü kullanılarak gerçekleştirilir.
2. Mantıksal bir formülün payı kaynak verilerde sunuluyorsa, hesaplama ağırlıklı harmonik ortalama formülü kullanılarak gerçekleştirilir.
3. Sorun mantıksal bir formülün hem payını hem de paydasını sunuyorsa (bu nadiren olur), hesaplamayı bu formülü veya basit aritmetik ortalama formülünü kullanarak yaparız.
Ortalamayı hesaplamak için doğru formülü seçmenin klasik fikri budur. Daha sonra, ortalama değeri hesaplamak için problemleri çözerken yapılacak eylem sırasını sunuyoruz.

Ortalama değerin hesaplanmasıyla ilgili problemleri çözmek için algoritma

A. Ortalama değeri hesaplama yöntemini belirleyin - basit veya ağırlıklı . Veriler tablo halinde sunuluyorsa ağırlıklı yöntem, veriler basit bir numaralandırmayla sunuluyorsa basit hesaplama yöntemi kullanıyoruz.

B. Sembolleri tanımlar veya düzenleriz - X - seçenek, F - sıklık . Seçenek, hangi olguya ilişkin ortalama değeri bulmak istediğinizdir. Tabloda kalan veriler frekans olacaktır.

B. Ortalama değeri hesaplamak için formu belirleriz - aritmetik veya harmonik . Belirleme frekans sütunu kullanılarak gerçekleştirilir. Frekanslar açık bir miktarla belirtilmişse aritmetik form kullanılır (şartlı olarak, parça kelimesini, öğe sayısını "parça" olarak değiştirebilirsiniz). Frekanslar açık bir miktarla değil, karmaşık bir göstergeyle (ortalama miktar ve frekansın çarpımı) belirtilirse harmonik form kullanılır.

Özellikle bu konularda tecrübesiz bir öğrenci için en zor olanı nereye ve ne miktarda verildiğini tahmin etmektir. Böyle bir durumda aşağıdaki yöntemlerden birini kullanabilirsiniz. Bazı görevler için (ekonomik), yıllar süren uygulamalar sonucunda geliştirilen bir ifade uygundur (B.1 noktası). Diğer durumlarda B.2 maddesini kullanmanız gerekecektir.

B.1 Frekans para birimi cinsinden (ruble cinsinden) verilmişse, hesaplama için harmonik ortalama kullanılır, bu ifade her zaman doğrudur, eğer tanımlanan frekans para cinsinden verilirse, diğer durumlarda bu kural geçerli değildir.

B.2 Yukarıda bu makalede belirtilen ortalama değeri seçmek için kuralları kullanın. Frekans, ortalama değeri hesaplamak için mantıksal formülün paydası tarafından veriliyorsa, o zaman aritmetik ortalama formunu kullanarak hesaplıyoruz; eğer frekans, ortalama değeri hesaplamak için mantıksal formülün payı tarafından veriliyorsa, o zaman aşağıdakileri kullanarak hesaplıyoruz: harmonik ortalama formu.

Bu algoritmayı kullanma örneklerine bakalım.

C. Veriler bir satırda sunulduğu için basit bir hesaplama yöntemi kullanıyoruz.

B.V. Elimizde yalnızca emekli maaşlarının miktarına ilişkin veriler var ve bunlar bizim seçeneğimiz olacak - x. Veriler basit bir sayı (12 kişi) olarak sunulmaktadır, hesaplama için basit aritmetik ortalamayı kullanıyoruz.

Bir emeklinin ortalama emekli maaşı 9208,3 ruble.

B. Çocuk başına ortalama ödemeyi bulmamız gerektiğinden, seçenekler ilk sütundadır, oraya x adını koyarız, ikinci sütun otomatik olarak f frekansı olur.

B. Sıklık (çocuk sayısı) açık bir miktarla verilir (çocukların kelime parçalarını değiştirebilirsiniz, Rus dili açısından bu yanlış bir ifadedir, ancak aslında çok uygundur) Bu, hesaplama için ağırlıklı aritmetik ortalamanın kullanıldığı anlamına gelir.

Aynı problem formülsel bir yöntemle değil, tablosal bir yöntemle, yani ara hesaplamaların tüm verilerinin bir tabloya girilmesiyle çözülebilir.

Sonuç olarak şimdi yapılması gereken tek şey iki toplamı doğru sırayla ayırmaktır.

Çocuk başına aylık ortalama ödeme 1.910 ruble idi.

C. Veriler tabloda sunulduğundan hesaplama için ağırlıklı formu kullanıyoruz.

B. Sıklık (üretim maliyeti), örtülü bir miktarla verilir (sıklık, ruble B1 algoritmasının noktası), bu da hesaplama için ağırlıklı harmonik ortalamanın kullanıldığı anlamına gelir. Genel olarak üretim maliyeti, bir ürünün birim maliyetinin bu tür ürünlerin sayısıyla çarpılmasıyla elde edilen karmaşık bir göstergedir, harmonik ortalamanın özü budur.

Bu sorunun aritmetik ortalama formülü kullanılarak çözülebilmesi için üretim maliyeti yerine ürün sayısının buna karşılık gelen maliyete sahip olması gerekir.

Hesaplamalar sonucunda elde edilen paydanın toplamı 410 (120+80+210) olup, üretilen toplam ürün sayısıdır.

Birim ürün başına ortalama maliyet 314,4 ruble idi.

C. Veriler tabloda sunulduğundan hesaplama için ağırlıklı formu kullanıyoruz.

B. Birim ürün başına ortalama maliyeti bulmamız gerektiğinden, seçenekler ilk sütundadır, oraya x adını koyarız, ikinci sütun otomatik olarak f frekansı olur.

B. Sıklık (toplam devamsızlık sayısı) örtülü bir miktarla verilir (bu, devamsızlık sayısı ile bu sayıda devamsızlığı olan öğrenci sayısının iki göstergesinin çarpımıdır), bu da ağırlıklı harmonik ortalamanın kullanıldığı anlamına gelir. hesaplama için. B2 algoritmasının noktasını kullanacağız.

Bu problemin aritmetik ortalama formülü kullanılarak çözülebilmesi için toplam devamsızlık sayısı yerine öğrenci sayısının bulunması gerekmektedir.

Öğrenci başına ortalama devamsızlık sayısını hesaplamak için mantıksal bir formül oluşturuyoruz.

Görev koşuluna göre sıklık Toplam ihmal sayısı. Mantıksal formülde bu gösterge paydadır, yani harmonik ortalama formülünü kullanıyoruz.

Lütfen 31 (18+8+5) hesaplaması sonucunda elde edilen paydadaki toplamın toplam öğrenci sayısı olduğunu unutmayın.

Öğrenci başına ortalama devamsızlık sayısı 13,8 gündür.



İlgili yayınlar