پانڈاس گروپ بائی اوسط

Pan As Grwp Bayy Awst



جب ہم دو یا دو سے زیادہ اقدار کو ایک ساتھ جوڑتے ہیں اور ان کی جمع کو ایک ساتھ جوڑی گئی قدروں کی کل تعداد سے تقسیم کیا جاتا ہے، تو نتیجہ اوسط ہوتا ہے۔ Pandas Mean ایک دیئے گئے محور کے ساتھ ڈیٹا یا قدر کی اوسط لوٹاتا ہے۔ ایک محور میں اوسط کے ساتھ ایک سیریز پانڈا کے ذریعہ واپس کی جائے گی اگر میتھ() ڈیٹا فریم پر لاگو ہوتا ہے۔ پانڈے ایک عددی قدر (واحد نمبر) واپس کرتے ہیں اگر 'میان()' کسی سیریز میں استعمال ہوتا ہے۔ زمرہ جات کے گروپس بنانے کے بعد فنکشنز کو زمرہ جات پر لاگو کیا جا سکتا ہے۔ یہ ایک سادہ خیال ہے لیکن ایک انتہائی موثر تکنیک ہے جو ڈیٹا سائنس میں کثرت سے لاگو ہوتی ہے۔ یہ ہمیں ہر گروپ کے لیے ڈیٹا کا خلاصہ بنانے، گروپ کے لیے مخصوص ترمیمات کو لاگو کرنے اور ڈیٹا فلٹریشن کرنے کی اجازت دیتا ہے۔ groupby() فنکشن کے ساتھ، آبجیکٹ کو تقسیم کیا جا سکتا ہے، ایک فنکشن لاگو کیا جا سکتا ہے، اور پھر مصنوعات کو جوڑا جا سکتا ہے۔ اس کے ساتھ بڑے ڈیٹاسیٹس کو گروپ کیا جا سکتا ہے، اور گروپس پر آپریشن کیے جا سکتے ہیں۔

پانڈوں میں groupby.mean() طریقہ استعمال کیسے کریں؟

ڈیٹا فریم کی اوسط یا ڈیٹا فریم کے مخصوص کالموں کی اوسط کا حساب لگانے کے لیے، ہم groupby.mean() فنکشن استعمال کر سکتے ہیں۔ ہم مندرجہ ذیل مثالوں میں اسے استعمال کرنے کا طریقہ دکھائیں گے۔







مثال # 01: سنگل کالم کے ڈیٹا کو گروپ کرکے سنگل انٹیجر کالم کی اوسط کا تعین کریں۔

pd.DataFrame() فنکشن کا استعمال کرتے ہوئے، ہم سب سے پہلے ایک ڈیٹا فریم بنائیں گے تاکہ ہم ڈیٹا فریم کے کالم یا کالم کے ڈیٹا کو گروپس میں تقسیم کر سکیں اور پھر ان کی اوسط قدر تلاش کر سکیں۔ ڈیٹا فریم بنانے سے پہلے، ہمیں numpy لائبریری کے ساتھ pandas ماڈیول درآمد کرنا ہوگا۔





جیسا کہ دیکھا جا سکتا ہے، ہم نے پانڈا ڈکشنری کا استعمال کرکے اپنا ڈیٹا فریم بنایا ہے۔ ہمارے ڈی ایف ڈیٹا فریم میں ہمارے پاس 3 کالم ہیں، یعنی 'آئٹمز'، 'مینوفیکچرر'، اور 'مقدار'۔ کالم 'آئٹمز' میں، ہم نے اقدار ('شرٹ'، 'ٹائی'، 'پینٹس'، 'شرٹ'، 'ٹائی'، 'پینٹس'، 'شرٹ'، 'پینٹس'، 'پینٹس'، ' tie')، جبکہ  کالم 'مینوفیکچرر' اور  'مقدار' جس میں اقدار ہیں ('اٹلی'، 'فرانس'، 'چین'، 'فرانس'،  'چین'، 'اٹلی'، 'چین'، 'اٹلی'، 'فرانس'، 'چین') اور (13، 16، 21، 32، 26، 41، 24، 42، 12، 15) بالترتیب۔ آئیے مینوفیکچرر کالم میں قدروں کو گروپ کرتے ہیں اور ہر ایک الگ صنعت کار کے لیے اوسط مقدار کی قدر کا تعین کرتے ہیں۔





مینوفیکچرر ویلیو 'چین' کی اوسط مقدار کی قدر 21.5 ہے، 'فرانس' کے لیے اوسط مقدار کی قیمت 20.0 ہے، اور 'اٹلی' کے لیے اوسط مقدار کی قدر 32.0 ہے۔ ہم groupby.mean() فنکشن کے ساتھ reset_index فنکشن کا استعمال کرکے آؤٹ پٹ میں ایک انڈیکس بھی بتا سکتے ہیں۔



مثال # 02: ایک کالم کے ڈیٹا کو گروپ کرکے سنگل فلوٹ کالم کا مطلب تلاش کریں

ہم نے دیکھا ہے کہ ڈیٹا کو گروپ کرنے کے بعد ہم انٹیجر کالم کا مطلب کیسے تلاش کر سکتے ہیں۔ اب ایک اور ڈیٹا ٹائپ کالم کو آزماتے ہیں جیسے float۔ pd.DataFrame() فنکشن کا استعمال کرتے ہوئے فلوٹ ویلیوز کے ساتھ کم از کم ایک کالم والا ڈیٹا فریم بنایا جائے گا۔

pd.DataFrame() کے اندر ایک لغت ڈال کر، ہم نے تین کالموں کے ساتھ ایک ڈیٹا فریم بنایا ہے۔ کالم 'نام' کچھ بے ترتیب کھلاڑیوں ('سیم'، 'جے'، 'لیو'، 'مائیک'، 'وِل'، 'بلی'، 'جونی'، 'لارا'، 'ہنا'، کے نام محفوظ کر رہا ہے۔ 'ٹونی')، کالم 'ٹیم' اس ٹیم کی نمائندگی کرتی ہے جس سے ہر کھلاڑی کا تعلق ہے ('A', 'A', 'B',  'A', 'B', 'A', 'C', 'B '، 'C'، 'C')، اور 'اونچائی' کالم ہر کھلاڑی کی بلندیوں کو فلوٹ ویلیو کے طور پر محفوظ کر رہا ہے (5.6, 5.4, 6.3, 5.2, 5.5, 6.4, 5.6, 5.8, 6.0, 5.2)۔ آئیے 'ٹیم' کالم میں ڈیٹا کو گروپ کریں اور ہر ایک 'ٹیم' کی قدر کے لیے اوسط اونچائی کی قدر کا تعین کریں۔

آپ دیکھ سکتے ہیں کہ ٹیم A کے کھلاڑیوں کی اوسط اونچائی کی قیمت 5.65 ہے، جب کہ ٹیم B اور C کے کھلاڑیوں کی اوسط اونچائی بالترتیب 5.866 اور 5.6 ہے۔

مثال # 03: groupby.mean() فنکشن کا استعمال کرتے ہوئے ایک سے زیادہ کالموں کی اوسط کا تعین کریں۔

سابقہ ​​مثالوں میں، ہم نے ایک کالم کی اوسط کا تعین کیا۔ تاہم، ہر گروپ کے لیے متعدد کالموں کے وسط کا بھی تعین کیا جا سکتا ہے۔ آئیے ایک ڈیٹا فریم بنائیں جس میں ایک سے زیادہ عددی کالم ہوں، پانڈا اور نمپی ماڈیولز درآمد کرنے کے بعد۔

نئے بنائے گئے ڈیٹا فریم میں، 'نام'، 'اسکور'، اور 'میچز' کے لیبل والے تین کالم ہیں۔ کالم کے نام جن میں ڈیٹا کی قدریں بطور اسٹرنگ  ('Ron', 'Jim', 'Dany', 'Jim', 'Jim', 'Dany', 'Ron', 'Ron', 'Dany', 'Jim' )، جبکہ 'اسکور' اور 'میچز' عددی ڈیٹا پر مشتمل ہوتے ہیں جیسا کہ (3، 4، 2، 4، 1، 5، 2، 3، 1، 2) اور (2، 3، 1، 2، 1، 3) ، 4، 1، 2، 1)۔ اب کالم 'نام' کے ڈیٹا کو گروپ کرنے کے بعد کالم 'اسکور' اور 'میچز' کا مطلب تلاش کریں۔ اس کے لیے groupby.mean() فنکشن استعمال کیا جائے گا۔

یہ دیکھا جا سکتا ہے کہ گروپ 'ڈینی' کا 2.00 میچوں میں اوسط اسکور 2.66 ہے۔ گروپ جم کا اوسط اسکور 2.75 ہے اور کھیلے گئے میچوں کی اوسط قیمت 1.75 ہے۔ جبکہ گروپ 'رون' کا اوسط اسکور ویلیو 2.66 ہے اور کھیلے گئے میچوں کی اوسط قدر 2.33 ہے۔

آبجیکٹ کے لحاظ سے زمرہ جات کے گروپ کی اوسط کا حساب بھی agg() طریقہ استعمال کر کے لگایا جا سکتا ہے۔ ہم اوسط کو agg() فنکشن میں بطور دلیل فراہم کریں گے۔ دیئے گئے محور پر ایک یا ایک سے زیادہ آپریشنز کا استعمال کرتے ہوئے مجموعی طور پر، ہم agg() فنکشن استعمال کر سکتے ہیں۔

آؤٹ پٹ پہلے جیسا ہی ہے۔

مثال # 04: ایک سے زیادہ کالموں کو گروپ کرکے مخصوص کالموں کے اوسط کا تعین کریں

مثال 1، 2 اور 3 میں، ہم نے ایک کالم کی قدروں یا ڈیٹا کو گروپ کیا ہے۔ اب ہم گروپ بائی() فنکشن کے اندر کالم لیبلز کی فہرست کا استعمال کرتے ہوئے متعدد کالموں کو گروپ کریں گے، اور پھر ہم ہر گروپ کے لیے اوسط قدر تلاش کریں گے۔ ڈیٹا فریم بنانے کے لیے ایک ان پٹ کے طور پر pd.Dataframe() فنکشن کے اندر ایک ڈکشنری 'd' پاس کی جائے گی۔

ہم نے مطلوبہ ڈیٹا فریم بنایا ہے۔ کالم 'کھیل' کچھ کھیلوں کا نام محفوظ کر رہا ہے ('بیڈمنٹن', 'فٹ بال', 'ٹینس', 'باسکٹ بال', 'فٹ بال', 'ٹینس', 'باسکٹ بال', 'فٹ بال', 'بیڈمنٹن', ' باسکٹ بال', 'باسکٹ بال', 'ٹینس'), ممالک کے نام ('چین', 'روس', 'اٹلی', 'اسپین', 'روس', 'اٹلی', 'چین', 'اٹلی', ' سپین'، 'چین'، 'روس'، 'اٹلی') 'ملک' کالم میں محفوظ ہیں۔ جب کہ کالم 'جیت' میں ہم نے ہر کھیل میں ہر ملک کے جیتنے والے میچوں کی تعداد محفوظ کی ہے (13، 10، 6، 7، 10، 12، 7، 11، 8، 13، 11، 6)۔ آئیے groupby.mean() فنکشن کا استعمال کرتے ہوئے کالم 'sports' اور 'country' کو گروپ کرکے 'win' کالم ویلیوز کا مطلب تلاش کریں۔

فنکشن نے ملک میں ہر کھیل کے لیے 'جیت' کالم کی قدروں کی اوسط کا کامیابی سے تعین کیا ہے۔ گروپ کے لحاظ سے ڈیٹا فریم کو reset_index() فنکشن کا استعمال کرتے ہوئے ری سیٹ کیا جا سکتا ہے، جو ایک نیا انڈیکس بھی تیار کرتا ہے، جس سے اسے ایک مناسب ڈیٹا فریم ڈھانچہ ملتا ہے۔

ہر ڈیٹا فریم کی قطار کے لیے ایک انڈیکس شامل کیا جاتا ہے۔ نتائج کو ایک پرکشش جدول میں ترتیب دینے کے لیے، ہم pivot() فنکشن بھی استعمال کر سکتے ہیں۔

نتیجہ

اس ٹیوٹوریل میں، ہم نے بحث کی ہے کہ اعداد کا اوسط یا اوسط کیا ہے اور ڈیٹا فریم کے کالم یا کالموں کو گروپ کرنے کے بعد کسی مخصوص کالم (ایک یا زیادہ) کا مطلب کیسے تلاش کیا جائے۔ ہم نے اس مضمون میں چند مثالیں دی ہیں تاکہ آپ کو یہ سکھایا جا سکے کہ ایک کالم کے ڈیٹا کو گروپ کر کے کسی ایک عدد یا فلوٹ کالم کی اوسط کا تعین کیسے کیا جائے؛ groupby.mean() فنکشن کا استعمال کرتے ہوئے متعدد کالموں کے وسط کا تعین کیسے کریں؛ اور یہ بھی کہ ایک سے زیادہ کالموں کو گروپ کرکے مخصوص کالموں کے وسط کا تعین کیسے کریں۔