انجمن‌های فارسی اوبونتو

اوبونتو ۲۴٫۰۴ با پشتیبانی بلند مدّت (۱۲ سال) منتشر شد 🎉

« قبلی بعدی »

صفحه: [1] 2 پایین

نویسنده موضوع: محاسبات آماری با سایلب و آر (دفعات بازدید: 43967 بار)

0 کاربر و 1 مهمان درحال مشاهده موضوع.

alend

High Hero Member
ارسال: 1316

محاسبات آماری با سایلب و آر

« : 05 فروردین 1392، 12:46 ب‌ظ »

در اینجا قصد داریم به نحوه انجام محاسبات آماری در R و scilab به کمک دوستم akhorshidi بپردازیم.

براساس گفته آلبرت اینشتین مثال زدن یکی از روشهای آموزش نیست بلکه تنها راه آن است. بنابراین تمامی این آموزش براساس مثال خواهد بود.

(مدیران لطف کنند این تاپیک را جزو تاپیک های مهم قرار دهند)

معادلهای scilab بعداز پست دوستم akhorshidi اضافه شده است.

در ابتدا یک جمعیت با ۱۰۰۰ عضو ایجاد می کنیم که دارای توزیع نرمال است با میانگین صفر و انحراف معیار یک:

کد R:

کد: [انتخاب]

data=rnorm(1000)
معادل در scilab:

کد: [انتخاب]

data=rand(1:1000,"normal")
به صورت پیش فرض میانگین صفر و انحراف معیار یک است.

هیستوگرام هم یکی از راهها جهت تشخیص توزیع یک سری داده است:

کد R:

کد: [انتخاب]

hist(data)
معادل در scilab:

کد: [انتخاب]

histplot(10,a)
۱۰ تعداد شکستگی هادر هیستوگرام است معادل breaks در R

میانگین و میانه هم توسط دستورات زیر محاسبه می شود:

کد R:

کد: [انتخاب]

mean(data)
median(data)

معادل در scilab:

کد: [انتخاب]

mean(data)
median(a)

انحراف معیار و واریانس هم به ترتیب توسط دستورات زیرمحاسبه می گردد:

کد: [انتخاب]

sd(data)
var(data)

برای ترسیم density histogram از دستورات زیر می توان استفاده کرد:

کد: [انتخاب]

hist(data,prob=T)
lines(density(data))

دستور lines خطی بر روی نمودار موجود ترسیم میکند.

« آخرین ویرایش: 05 فروردین 1392، 05:18 ب‌ظ توسط alend »

خارج شده است

Scilab.IR

Jr. Member
ارسال: 59
!Everything is a Matrix

پاسخ : محاسبات آماری با سایلب و آر

« پاسخ #1 : 05 فروردین 1392، 03:55 ب‌ظ »

سلام – امیدوارم در پایان یک تاپیک جامع و قابل استناد برای مباحث آماری داشته باشیم.
(داخل پرانتز بگم که ~~این آموزش با این فرض نگاشته می‌شود که دانش کاربران از آمار در حد دوم دبیرستان باشد~~ .

و اینکه اگر معادل انگلیسی اصطلاحات آماری نیز ذکر بشود، مفید خواهد بود!

زبان آر: (در تکمیل صحبت‌های شما)
جمعیتی با ۱۰۰۰ عضو ایجاد کردیم برای نمونه‌‌برداری از تابع sample استفاده می‌کنیم. فرض کنیم ۲۰ نمونه لازم داریم:

نمونه‌گیری با جایگذاری (Sampling with replacement)

کد: [انتخاب]

sample(data,20,replace=T)
نمونه‌گیری بدون جایگذاری (Sampling without replacement)

کد: [انتخاب]

sample(data,20,replace=F)

[یه سوال؟] توی سایلب برای تولید اعداد تصادفی از تابع rand استفاده می‌کنیم که نوع توزیع اون‌ها یا نرماله و یا یکنواخت. تفاوت uniform distribution و normal distribution چیه؟

سایلب:

تابع rand: تولید عناصر تصادفی (یا از توزیع نرمال یا از توزیع یکنواخت)
آرگومان اول و دوم در تابع rand اندازه‌ی ماتریس مورد نظر را مشخص می‌کند. آرگومان سوم انتخابی بوده و به‌صورت پیش‌فرض مقدار آن برابر uniform می‌باشد.

معادل تابع متلب (B=rand (A در سایلب (B=rand(A ویا (B=rand(A,A ویا (["B=rand(A[,"uniform می‌باشد که اعداد تصادفی حقیقی بین (0,1] تولید می‌کند.

معادل تابع متلب (B=randn(A در سایلب ("B=rand(A,"normal ویا("B=rand(A,A,"normal می‌باشد که اعداد تصادفی حقیقی به‌گونه‌ای تولید می‌کند که میانگین صفر و انحراف معیار یک ‌باشد.

الف) ایجاد یک جمعیت ۴۰ نفره:

کد: [انتخاب]

rand(5,8,"normal")
rand(5,8,"uniform")
rand(5,8)
rand(4,10)
rand(1:40)

توابع floting point:
فهرست زیر توابع موجود در دسته‌ی floting point بوده که مقدار صحیح یک عدد اعشاری را بر‌می‌گرداند:

ceil ; floor ; fix ; int ; round

مثال:

کد: [انتخاب]

-->ceil([1.3 1.5 1.7 2.5 3.7])
 ans  =
 
    2.    2.    2.    3.    4.  
 
-->floor([1.3 1.5 1.7 2.5 3.7])
 ans  =
 
    1.    1.    1.    2.    3.  
 
-->fix([1.3 1.5 1.7 2.5 3.7])
 ans  =
 
    1.    1.    1.    2.    3.  
 
-->int([1.3 1.5 1.7 2.5 3.7])
 ans  =
 
    1.    1.    1.    2.    3.  
 
-->round([1.3 1.5 1.7 2.5 3.7])
 ans  =
 
    1.    2.    2.    3.    4.

ب) انتخاب تصادفی چند نمونه:

بیست نمونه بین صفر تا ۴۰

کد: [انتخاب]

-->y4=int(rand(4,5)*40)
بیست نمونه بین یک تا ۴۰

کد: [انتخاب]

-->y3=ceil(rand(4,5)*40)
بیست نمونه بین ۱۱ تا ۴۰

کد: [انتخاب]

-->y2=ceil(rand(4,5)*30)+10

بیست نمونه بین ۱۰ تا ۳۹

کد: [انتخاب]

-->y1=int(rand(4,5)*30)+10
 y1  =
 
    25.    13.    33.    10.    17.  
    31.    36.    29.    27.    29.  
    36.    26.    17.    39.    19.  
    27.    36.    36.    25.    27.

توابع Summaries

nfreq — فراوانی مقادیر یک بردار یا ماتریسی از اعداد حقیقی یا مختلط
tabul — فراوانی مقادیر یک بردار یا ماتریسی از اعداد حقیقی یا مختلط و یا رشته‌های کاراکتری

[یه سوال؟] آیا توی آمار واژه‌ی summary به مفهوم خاصی اشاره دارد؟ چون راهنمای سایلب توابع nfreq و tabul را در دسته‌‌ای با نام « Summaries » قرار داده است.

کد: [انتخاب]

-->f1=nfreq(y1)
 f1  =
 
    25.    2.  
    31.    1.  
    36.    4.  
    27.    3.  
    13.    1.  
    26.    1.  
    33.    1.  
    29.    2.  
    17.    2.  
    10.    1.  
    39.    1.  
    19.    1.

در پست بعدی به رسم هیستوگرام و مباحث مرتبط و نیز توابع نمونه‌برداری می‌پردازیم.

HTH
Mehran
ـ

« آخرین ویرایش: 13 بهمن 1395، 06:32 ب‌ظ توسط Scilab.IR »

خارج شده است

alend

High Hero Member
ارسال: 1316

پاسخ : محاسبات آماری با سایلب و آر

« پاسخ #2 : 05 فروردین 1392، 04:31 ب‌ظ »

نقل‌قول

[یه سوال؟] توی سایلب برای تولید اعداد تصادفی از تابع rand استفاده می‌کنیم که نوع توزیع اون‌ها یا نرماله و یا یکنواخت. تفاوت uniform distribution و normal distribution چیه؟

توزیع نرمال:
http://en.wikipedia.org/wiki/Normal_distribution

توزیع یکنواخت:
http://en.wikipedia.org/wiki/Uniform_distribution_%28continuous%29

لیست توزیع های آماری:

http://en.wikipedia.org/wiki/Statistical_distribution

نقل‌قول

[یه سوال؟] آیا توی آمار واژه‌ی summary به مفهوم خاصی اشاره دارد؟ چون راهنمای سایلب توابع nfreq و tabul را در دسته‌‌ای با نام « Summaries » قرار داده است.

http://en.wikipedia.org/wiki/Summary_statistic

« آخرین ویرایش: 05 فروردین 1392، 04:34 ب‌ظ توسط alend »

خارج شده است

alend

High Hero Member
ارسال: 1316

پاسخ : محاسبات آماری با سایلب و آر

« پاسخ #3 : 05 فروردین 1392، 05:17 ب‌ظ »

چه جوری در scilab یک عدد را ۱۰۰۰ بار تکرار می کنیم و در داخل یک متغیر قرار می دهیم.

« آخرین ویرایش: 05 فروردین 1392، 05:24 ب‌ظ توسط alend »

خارج شده است

Scilab.IR

Jr. Member
ارسال: 59
!Everything is a Matrix

پاسخ : محاسبات آماری با سایلب و آر

« پاسخ #4 : 05 فروردین 1392، 05:37 ب‌ظ »

نقل‌قول از: alend در 05 فروردین 1392، 05:17 ب‌ظ

چه جوری در scilab یک عدد را ۱۰۰۰ بار تکرار می کنیم و در داخل یک متغیر قرار می دهیم.

مطمئنا روش‌های زیادی با توجه به جایگاه و کاربردی که مدنظره، وجود داره ولی چیزی که الان به ذهنم میرسه:

فرض اگر عدد مورنظر تون ۱۳۹۲ باشه:
v=ones(1,1000)*1392

_

خارج شده است

Scilab.IR

Jr. Member
ارسال: 59
!Everything is a Matrix

پاسخ : محاسبات آماری با سایلب و آر

« پاسخ #5 : 06 فروردین 1392، 12:23 ب‌ظ »

برای تولید اعداد تصادفی بر اساس توزیع‌های مختلف از تابع grand استفاده می‌کنیم. برای مثال برای تولید اعداد تصادفی از توزیع نرمال (Gauss Laplace or normal distribution) داریم:

کد: [انتخاب]

Y=grand(m, n, "nor", mean, standard-deviation)
mو n اندازه‌ی ماتریس جواب (Y) را مشخص می‌کنند(m تعداد سطر‌ها و nتعداد ستون‌ها)
آرگومان سوم نشان‌دهنده‌ی نوع توزیع مورد‌نظر می‌باشد؛ اینجا «نرمال»
آرگومان چهارم: مقدار میانگین (یک عدد حقیقی)
آرگومان پنجم: مقدار انحراف معیار (یک عدد حقیقی نامنفی)
مثال:

کد: [انتخاب]

// Returns a 400-by-800 matrix of random doubles, 
// with normal distribution and average 0 and standard deviation 1.
R = grand(400,800,"nor",0,1);
scf();
histplot(10,R);
xtitle("Normal random numbers from grand","X","Frequency");

برای رسم یک هیستوگرام در فضای 2D از تابع histplot و در فضای از 3D از تابع hist3d استفاده می‌کنیم. (به ترتیب زیر)

کد: [انتخاب]

histplot(classes, data, <opt_args>)
hist3d(matrix, <opt_args>)

آرگومان اول در تابع histplot تعداد دسته‌ها (جعبه‌ها) را مشخص می‌کند.
آرگومان دوم در تابع histplot ، داده‌هایی که باید آنالیز شوند را تعریف می‌کند.
آرگومان سوم در تابع histplot انتخابی بوده و همان پارامتر‌های اختیاری تابع plot2d می باشند؛ مثلاً رنگ نمودار.
به صورت پیش‌فرض مقیاس محور y نرمال‌شده بوده و سطح زیر نمودار هیستوگرام برابر یک می‌باشد. اگر بخواهید روی محور y، تعداد مقادیر هر دسته نشان داده شود مقدار normalization=%f را در آرگومان سوم قرار دهید.
مثال:

کد: [انتخاب]

d=rand(1,1000,'normal');  // the gaussian random sample
clf();histplot(20,d)
clf();histplot(20,d,normalization=%f)

آرگومان دوم در تابع hist3d انتخابی بوده و برخی از پارامتر‌های اختیاری تابع plot3d را شامل می شود؛
مثال:

کد: [انتخاب]

a=(10*rand(2,2))
hist3d(a)

[یه سوال؟] در توضیح این‌که چرا مقیاس محور y به صورت پیش‌فرض نرمال‌شده می‌باشد، آمده:
This is default comportment of histplot because plotting the histograms of a sequence of values of a random variable X, histograms will "converge" to the graph of the density of X.

منظور از نموداری از چگالی X چیه؟

یا شما در پست اول گفته‌اید:

نقل‌قول از: alend در 05 فروردین 1392، 12:46 ب‌ظ

برای ترسیم density histogram از دستورات زیر می توان استفاده کرد:
کد: [انتخاب]
hist(data,prob=T) lines(density(data))

۱- چه تفاوتی بین نمودار density histogram و histogram هست؟
۲- منظور از چگالی یک متغیر آماری چیست؟

HTH
Mehran

ـ

خارج شده است

alend

High Hero Member
ارسال: 1316

پاسخ : محاسبات آماری با سایلب و آر

« پاسخ #6 : 06 فروردین 1392، 06:41 ب‌ظ »

نقل‌قول

۱- چه تفاوتی بین نمودار density histogram و histogram هست؟

http://www.math.leidenuniv.nl/~gill/teaching/statistics/histogram.pdf

نقل‌قول

۲- منظور از چگالی یک متغیر آماری چیست؟

http://en.wikipedia.org/wiki/Probability_density_function

خارج شده است

Scilab.IR

Jr. Member
ارسال: 59
!Everything is a Matrix

پاسخ : محاسبات آماری با سایلب و آر

« پاسخ #7 : 06 فروردین 1392، 07:11 ب‌ظ »

نمودار دایره‌ای
برای رسم یک نمودار دایره‌ای از تابع pie به صورت زیر استفاده می‌کنیم:

کد: [انتخاب]

pie(x)

or

pie(x[,sp[,txt]])

(pie(x بر اساس داده‌های موجود در بردار x، یک نمودار دایره‌ای رسم می‌کند.

آرگومان اول برداری از اعدادحقیقی مثبت می‌‌باشد. بوسیله‌ی مقادیر بردار x ، مساحت i-امین قطاع دایره از رابطه‌ی زیر مشخص می‌شود:
(x(i) / sum(x)) * ( surface-of-the-unit-cercle)

آرگومان‌های دوم و سوم انتخابی می‌باشند. آرگومان دوم برای ایجاد فاصله بین قطاع‌ها استفاده می‌شود (توجه داشته‌باشید که اندازه‌ی بردار‌های x و sp باید یکسان باشد). بردار sp فقط مقادیر صفر و یک را قبول می‌کند. آرگومان سوم (که هم اندازه‌ی بردار‌های x و sp می‌باشد) متنی را به قطاع متناظرش اختصاص می‌دهد.

مثال(۱)
سایلب:

کد: [انتخاب]

pie([1 1 1],[0 0 1 ],["Blue Sector","Green Sector","Red Sector"]);
xtitle("Draw a Pie: three input argument – Here the sectors have the same area and the red colored sector has been separated from the others by a space!");

کد R (با تشکر از Alend):

کد: [انتخاب]

> data=c(1,1,1)
> pie(data)

مثال(۲)
سایلب:

کد: [انتخاب]

pie([1 2 1 4])
xtitle("Draw a Pie: one input argument – The values in x are normalized via x(i) / sum(x) to determine the area of each slice of pie!");

کد R:

کد: [انتخاب]

> data=c(1,2,1,4)
> pie(data)

ـ

« آخرین ویرایش: 07 فروردین 1392، 12:06 ق‌ظ توسط akhorshidi »

خارج شده است

Scilab.IR

Jr. Member
ارسال: 59
!Everything is a Matrix

پاسخ : محاسبات آماری با سایلب و آر

« پاسخ #8 : 06 فروردین 1392، 10:34 ب‌ظ »

توابع مقدماتی آماری
در مورد توابع سایلب، این توابع هم روی بردار‌ها و هم روی ماتریس‌ها قابل اعمال هستند.

تابع سایلب توصیف مثال

mean میانگین (v=(3:6); mean(v

meanf میانگین وزنی ([meanf(v,[1 1 2 1

median میانه (median(v

sum مجموع

prod حاصل‌ضرب

diff تفاضل:
(x(i)-x(i-1

geomean میانگین هندسی: (geomean(v
((prod(v)^(1/size(v,2

harmean         میانگین هارمونیک:       (harmean(v
           (size(v,2)/sum(1 ./v
           or
           (size(v,2)/sum(v^-1

stdev انحراف معیار: (stdev(v
((sqrt(variance(v

mad انحراف میانگین: (mad(v
(sum(abs(v-mean(v)))/size(v,2

variance واریانس: (variance(v
stdev(v)^2

gsort مرتب کردن نزولی عناصر (gsort(v

min کوچکترین (min(v

max بزرگترین (max(v

quart چارک‌های اوّل، دوم و سوم (quart(v

iqr دامنه‌ی تغییر بین چارک‌ها: (iqr(v
Q3-Q1

_

خارج شده است

alend

High Hero Member
ارسال: 1316

پاسخ : محاسبات آماری با سایلب و آر

« پاسخ #9 : 06 فروردین 1392، 10:50 ب‌ظ »

نمودار دایره ای در R:

کد: [انتخاب]

pie(1:10)

خارج شده است

Scilab.IR

Jr. Member
ارسال: 59
!Everything is a Matrix

پاسخ : محاسبات آماری با سایلب و آر

« پاسخ #10 : 06 فروردین 1392، 10:57 ب‌ظ »

نقل‌قول از: alend در 06 فروردین 1392، 10:50 ب‌ظ

نمودار دایره ای در R:
کد: [انتخاب]
pie(1:10)

مرسی Alend ،

برای رسم مثال‌های زیر توی آر از چه دستوری استفاده میشه؟

کد: [انتخاب]

pie([1 1 1],[0 0 1 ],["Blue Sector","Green Sector","Red Sector"]);

کد: [انتخاب]

pie([1 2 1 4])
ـ

خارج شده است

alend

High Hero Member
ارسال: 1316

پاسخ : محاسبات آماری با سایلب و آر

« پاسخ #11 : 06 فروردین 1392، 11:15 ب‌ظ »

نقل‌قول از: akhorshidi در 06 فروردین 1392، 10:57 ب‌ظ

نقل‌قول از: alend در 06 فروردین 1392، 10:50 ب‌ظ
نمودار دایره ای در R:
کد: [انتخاب]
pie(1:10)
مرسی Alend ،

برای رسم مثال‌های زیر توی آر از چه دستوری استفاده میشه؟
کد: [انتخاب]
pie([1 1 1],[0 0 1 ],["Blue Sector","Green Sector","Red Sector"]);
کد: [انتخاب]
pie([1 2 1 4])
ـ

خواهش می کنم.

کد: [انتخاب]



data=c(2,5,3,8)
names(data)<-c("A","B","C","D")
pie(data)

« آخرین ویرایش: 06 فروردین 1392، 11:25 ب‌ظ توسط alend »

خارج شده است

Scilab.IR

Jr. Member
ارسال: 59
!Everything is a Matrix

پاسخ : محاسبات آماری با سایلب و آر

« پاسخ #12 : 07 فروردین 1392، 01:16 ب‌ظ »

رسم نمودار میله‌ای

کد: [انتخاب]

x=3:3:12;
bar(x)

کد: [انتخاب]

x = 1:10; y=2*x;
bar(x,y)

کد: [انتخاب]

x = 1:10; y=2*x;
bar(x,y,'yellow')

در مثال بالا آرگومان سوم، رنگ نمودار را مشخص می‌کند(اینجا زرد).

کد: [انتخاب]

x=[5 7 9];
y=[10 8 6;8 6 4;6 4 2];
bar(x,y,0.5);

در مثال بالا آرگومان سوم، عرض هر ستون را مشخص می‌کند(اینجا width=0.5).

کد: [انتخاب]

x=[5 7 9];
y=[10 8 6;8 6 4;6 4 2];
bar(x,y,'stacked');

در مثال بالا آرگومان سوم، یک نمودار ستونی انباشته رسم می‌کند.

توابع نمونه برداری:

sample — نمونه‌گیری با جایگذاری

کد: [انتخاب]

s = sample(n,X,[orient])
n : یک عدد صحیح مثبت که اندازه‌ی نمونه را مشخص می‌کند.
X : یک ماتریس؛ نمونه‌ها از این ماتریس استخراج می‌شوند.
آرگومان سوم انتخابی بوده و فقط مقادیر ۱ و ۲ و یا 'r' و 'c' را قبول می‌کند (1 وr به سطر‌ها و 2 و c به ستون‌ها اشاره دارند).
1 یاr : نمونه‌برداری از سطر‌های ماتریس X انجام می‌شود.
2 یاc : نمونه‌‌‌ها از ستون‌های ماتریس X استخراج می‌شوند.

مثال:

کد: [انتخاب]

X=['A' 'BB' 'CCC'] ;
s=sample(10,X) 
f=tabul(s)

تابع tabul، فراوانی هر مقدار X را بر‌می‌گرداند.

samwr — نمونه‌گیری بدون جایگذاری

کد: [انتخاب]

s = samwr(sizam,numsamp,X)
sizam: یک عدد صحیح که اندازه‌ی نمونه را مشخص می‌کند (اندازه‌‌ی آن باید کوچکتر یا مساوی اندازه X باشد).
numsamp : یک عدد صحیح ؛ بیانگر تعداد نمونه‌های انتخابی می‌باشد.
X : یک بردار ستونی که دربردارنده‌ی جمعیت می‌باشد.

مثال:

کد: [انتخاب]

a=[0.33 1.24 2.1 1.03]
s=samwr(4,6,a)

samplef — نمونه‌گیری با جایگذاری از یک جمعیت با فروانی مقادیرش

کد: [انتخاب]

s = samplef(n,X,f,[orient])
آرگومان‌های اول، دوم و چهارم مشابه آرگومان‌های ورودی تابع sample هستند.
آرگومان سوم،f ، ماتریسی از اعداد صحیح مثبت هم‌اندازه با ماتریس X می‌باشد که فراوانی مقادیر متناظر در ماتریس X را نشان‌ می‌دهد.
مثال:

کد: [انتخاب]

a=[3 7 9;22 4 2]
f1=[10 1 1 1 1 1]
s=samplef(15,a,f1)

HTH
Mehran

_

خارج شده است

alend

High Hero Member
ارسال: 1316

پاسخ : محاسبات آماری با سایلب و آر

« پاسخ #13 : 07 فروردین 1392، 08:43 ب‌ظ »

رگرسیون خطی در R:

کد: [انتخاب]

a=1:10
 b=a*2+1
 lm(b~a)

Call:
lm(formula = b ~ a)

Coefficients:
(Intercept)            a  
          1            2

خارج شده است

سعید زبردست

سعید زبردست
گروه راهبران
ارسال: 1053
جنسیت :
سعید زبردست

پاسخ : محاسبات آماری با سایلب و آر

« پاسخ #14 : 28 اردیبهشت 1392، 06:10 ب‌ظ »

به درخواست کاربران و با توجه به مفید بودن این تاپیک، وضعیت آن به صورت مهم در آمد.

خارج شده است

وب سایت - وبلاگ - «آنان که می توانند انجام می دهند و آنان که نمی توانند، انتقاد می کنند ...»
• قوانین و خط مشی رفتاری در انجمنهای اوبونتو ایران

صفحه: [1] 2 بالا

« قبلی بعدی »

XHTML RSS WAP2

SMF 2.0.19 | SMF © 2011, Simple Machines