پانڈاس ڈیٹا فریم منفرد

Pan As Y A Frym Mnfrd



پائیتھن کی سب سے مشہور لائبریری جو ڈیٹا سائنس میں استعمال ہوتی ہے اسے پانڈاس کہتے ہیں۔ یہ Python پروگرامرز کو اعلیٰ کارکردگی، صارف دوست، اور ڈیٹا تجزیہ کے ٹولز پیش کرتا ہے۔ ایک بار جب آپ بنیادی افعال اور ان کو استعمال کرنے کے طریقے کو سمجھ لیتے ہیں، تو پانڈاس ڈیٹا کو تبدیل کرنے کا ایک طاقتور ٹول ہے۔ 'پانڈا' میں ڈیٹا کو ٹیبلر شکل میں ذخیرہ کرنے کے معیاری طریقے DataFrames ہیں۔ ہم 'پانڈا' ڈیٹا فریم کے کالم میں منفرد اقدار حاصل کرنے کے لیے کچھ 'پانڈا' طریقے استعمال کر سکتے ہیں۔ جب ہمیں ڈیٹا فریم کے کالموں میں منفرد اقدار حاصل کرنے کی ضرورت ہوتی ہے اور 'پانڈا' ڈیٹا فریم کے کالم میں اقدار کی نقل نہیں چاہتے ہیں، تو ہم وہ طریقے استعمال کر سکتے ہیں جو 'پانڈا' ایسا کرنے کے لیے فراہم کرتے ہیں۔ آئیے اس گائیڈ میں اس طرح کے طریقوں کو دیکھتے ہیں، کچھ مثالوں اور آؤٹ پٹ کے ساتھ ڈیٹا فریم کے کالم 'پانڈا' میں منفرد اقدار حاصل کرنے کے لیے۔

'پانڈا' ڈیٹا فریم کے کالموں میں منفرد قدریں حاصل کرنے کے طریقے

ہم 'پانڈا' ڈیٹا فریم کے کالموں میں منفرد اقدار حاصل کرنے کے لیے دو طریقے استعمال کر سکتے ہیں۔ ہم ڈپلیکیٹ اقدار کو چھوڑ دیتے ہیں اور ڈیٹا فریمز کے کالموں میں صرف منفرد اقدار حاصل کرتے ہیں۔ اس کام کو انجام دینے کے لیے جو طریقے 'پانڈا' فراہم کرتے ہیں وہ ہیں:







  • منفرد() طریقہ استعمال کرکے۔
  • drop_dupliactes() طریقہ استعمال کرکے۔

اب، ہم 'پانڈا' ڈیٹا فریم کے کالموں میں منفرد اقدار حاصل کرنے کے لیے 'پانڈا' کوڈز میں دونوں طریقے استعمال کریں گے۔



مثال نمبر 01

'اسپائیڈر' ایپ کو یہاں ان 'پانڈا' کوڈز کو تیار کرنے کے لیے استعمال کیا گیا ہے تاکہ ان طریقوں کو استعمال کیا جا سکے جو 'پانڈا' ڈیٹا فریم کے کالموں میں منفرد اقدار حاصل کرنے میں ہماری مدد کرتے ہیں۔ ہمیں ڈیٹا فریم بنانے سے پہلے 'پانڈا' ماڈیولز درآمد کرنے چاہئیں، جو 'پانڈا' کوڈ کے لیے ضروری ہیں۔ 'درآمد' کی اصطلاح استعمال کرکے اور 'پانڈا کو بطور pd' رکھ کر، ہم ان ماڈیولز کو درآمد کرتے ہیں۔



اب، 'pd' کی مدد سے، ہم تیزی سے 'پانڈا' کے افعال یا طریقے حاصل کر سکتے ہیں۔ پھر ہم 'سبجیکٹ_ڈیٹا' ڈالتے ہیں جس میں ہم 'نام' شامل کرتے ہیں اور 'نام' میں، ہم نام کا ڈیٹا شامل کر رہے ہیں جو کہ 'رومن، ولیم، پیٹر، سمتھ، جان، ملی، تھامس اور جیمز' ہیں۔ پھر، ہم مضمون کا ڈیٹا 'سبج' میں شامل کرتے ہیں جو کہ 'ریاضی، معاشیات، سائنس، ریاضی، شماریات، شماریات، شماریات، اور کمپیوٹر' ہیں۔ پھر، ہم 'pd.DataFrame()' طریقہ استعمال کرکے اس 'Subject_data' کو 'Subject_df' ڈیٹا فریم میں تبدیل کرتے ہیں۔ ہم 'Subject_df' کو 'print()' طریقہ میں رکھتے ہیں تاکہ یہ ٹرمینل پر ظاہر ہو جائے۔





اب، ہم 'پانڈا' ڈیٹا فریم کے کالم 'Subj' میں منفرد اقدار حاصل کرنا چاہتے ہیں۔ اس مقصد کے لیے، ہم یہاں 'منفرد()' طریقہ استعمال کر رہے ہیں اور ہم کالم کا نام اور ڈیٹا فریم کا نام بھی شامل کرتے ہیں جیسا کہ ذیل میں دکھایا گیا ہے۔ ہم اس طریقہ کو 'print()' میں شامل کرتے ہیں تو نتیجہ ٹرمینل پر بھی ظاہر ہوگا۔



اب، ہم اس کوڈ کا نتیجہ حاصل کرنے کے لیے 'Shift+Enter' کو دبا رہے ہیں اور یہ ٹرمینل پر رینڈر ہوتا ہے اور یہاں بھی دکھایا گیا ہے، جس میں تمام ویلیوز کے ساتھ ڈیٹا فریم موجود ہے۔ یہ اصل ڈیٹا فریم ہے جسے ہم نے کوڈ میں شامل کیا ہے اور اس کے نیچے 'Subj' کالم کی منفرد قدریں ظاہر ہوتی ہیں۔ یہ ڈپلیکیٹ اقدار کو چھوڑتا ہے اور ڈیٹا فریم کے 'Subj' کالم کی منفرد اقدار کو ظاہر کرتا ہے۔

مثال نمبر 02

ہم 'Sample_list' بناتے ہیں جس میں کچھ معلومات ہوتی ہیں۔ ہم 'Layla, 21, 28, 31, 14, and 39' داخل کرتے ہیں جو کہ پہلے کالم کے طور پر ظاہر ہوگا جب ہم اس فہرست کو ڈیٹا فریم میں تبدیل کریں گے۔ پھر، ہم ڈیٹا فریم کی دوسری قطار کے طور پر 'Lusy, 31, 25, 34, 26, اور 21' کو شامل کرتے ہیں۔ اس کے بعد، ہمارے پاس 'پیٹر، 38، 20، 20، 35، اور 24' اور 'لیلا 38، 23، 39 24، 23' ہیں جو ڈیٹا فریم کی تیسری اور چوتھی قطاریں ہوں گی۔ ہم تین مزید ڈیٹا بھی داخل کرتے ہیں جو کہ 'سٹیلا، 21، 24، 24، 28، 31'، 'لیلا، 33، 32، 26، 30، 25' اور 'پیٹر، 21، 21، 31، 21، 29' .

اب، ہم 'Sample_list' کو 'DF_Sample' میں تبدیل کر رہے ہیں جو کہ یہاں 'pd.DataFrame()' فنکشن ڈال کر ڈیٹا فریم کا نام ہے۔ اس کے علاوہ، ہم اس ڈیٹا فریم کے کالموں کا نام بھی سیٹ کرتے ہیں اور یہ نام ہیں 'Name, Ass_1, Ass_2, Ass_3, Ass_4، اور Ass_5'۔ پھر، ہم 'print()' استعمال کرتے ہیں جو ڈیٹا فریم 'DF_Sample' کو ظاہر کرنے میں مدد کرتا ہے۔ اب، ہم ڈیٹا فریم کے کالم میں منفرد اقدار حاصل کرنے کے لیے اس مثال میں ایک اور طریقہ استعمال کر رہے ہیں۔ یہ طریقہ 'پانڈا' کا 'drop_duplicates()' طریقہ ہے۔

'drop_duplicates()' طریقہ میں، ہم اس کالم کا نام سیٹ کرتے ہیں جہاں ہم ڈیٹا فریم کے کالم میں منفرد اقدار حاصل کرنا چاہتے ہیں۔ ہم اس کالم میں 'drop_duplicates()' طریقہ کی مدد سے ڈپلیکیٹ ویلیوز کو چھوڑ کر 'نام' کالم کی منفرد ویلیوز حاصل کر رہے ہیں اور یہاں 'print()' فنکشن کا استعمال کرتے ہوئے ان منفرد ویلیوز کو بھی رینڈر کر رہے ہیں۔

ڈپلیکیٹ کیے گئے ناموں کو چھوڑ دیا جاتا ہے اور 'drop_duplicates()' طریقہ کو لاگو کرنے کے بعد منفرد قدریں پیش کی جاتی ہیں۔ آپ نوٹ کر سکتے ہیں کہ 'Lyla' کا نام 'نام' کالم کے تین خلیوں میں ظاہر ہوتا ہے۔ لیکن جب 'drop_duplicates()' طریقہ اس کالم پر لاگو ہوتا ہے، تو تمام ڈپلیکیٹ ویلیوز ڈراپ ہو جاتی ہیں اور ایک 'Lyla' نام اسکرین پر ظاہر ہوتا ہے۔ ڈپلیکیٹ اقدار کو چھوڑنے کے بعد، نیا ڈیٹا فریم ظاہر ہوا جو اس 'نام' کالم میں منفرد اقدار پر مشتمل ہے۔ اس طرح، ہم ڈپلیکیٹ ویلیوز کو چھوڑ سکتے ہیں اور 'drop_duplicates()' طریقہ کی مدد سے ڈیٹا فریم کے کالم میں منفرد ویلیو حاصل کر سکتے ہیں۔

مثال نمبر 03

اسی ڈیٹا فریم کو دوبارہ استعمال کیا گیا ہے اور اب ہم یہاں 'منفرد()' طریقہ استعمال کر رہے ہیں۔ 'منفرد()' طریقہ کے ساتھ ہم کالم کے نام کے ساتھ ساتھ ڈیٹا فریم کا نام بھی رکھتے ہیں جس پر ہم منفرد اقدار حاصل کرنے کے لیے اس 'منفرد()' طریقہ کو لاگو کرنا چاہتے ہیں۔ یہ صرف اس کالم کی منفرد اقدار کو پیش کرے گا اور ڈیٹا فریم کی شکل میں ان اقدار کو نہیں دکھائے گا۔

یہاں، ڈیٹا فریم 'نام' کالم میں سات اقدار پر مشتمل ہے لیکن جب ہم اس کالم پر 'منفرد()' طریقہ کو لاگو کرتے ہیں، تو صرف چار اقدار ظاہر ہوتی ہیں اور یہ اس کالم کی منفرد اقدار ہیں۔ یہ ڈپلیکیٹ اقدار پیش نہیں کرتا ہے۔

مثال نمبر 04

ڈیٹا فریم جو ہم اس مثال میں بناتے ہیں وہ ہے 'F_G_df'۔ ہم اس ڈیٹا فریم میں 'My_fruits' اور 'my_Vegs' ڈالتے ہیں۔ 'My_fruits' کالم میں 'Apple, Orange, Apple, Pear, Lychee, Apple, Apple, Pear, and Apple' شامل ہیں۔ اگلا، ہمارے پاس 'My_Vegs' ہے جس میں سبزیوں کے نام ہیں جو کہ 'مرچ، برنگل، گاجر، آلو، آلو، گاجر، پیاز، لہسن، اور ادرک' ہیں۔ اس ڈیٹا فریم میں صرف دو کالم ہیں۔

اب، ہم دونوں کالموں میں 'انوکھا()' طریقہ کی مدد سے منفرد اقدار حاصل کر رہے ہیں۔ ہم ڈیٹا فریم کے نام کا ذکر کرتے ہیں۔ پھر، کالم کے پہلے کالم کا نام ڈالیں۔ اس کے بعد، ہم append() طریقہ استعمال کرتے ہیں۔ اس ضمیمہ میں، ہم دوبارہ ڈیٹا فریم کا نام اور دوسرے کالم کا نام رکھتے ہیں اور 'منفرد()' طریقہ رکھتے ہیں۔ اس سے دونوں کالموں کی منفرد قدریں ملیں گی اور پھر دونوں کالموں کی منفرد قدریں شامل کریں گی اور انہیں اسکرین پر ظاہر کریں گی۔

ڈیٹا فریم سب سے پہلے تمام اقدار پر مشتمل ہوتا ہے۔ اس کے بعد، 'منفرد()' طریقہ کا اطلاق ہوتا ہے اور دونوں کالموں کی منفرد قدریں ذیل میں پیش کی جاتی ہیں۔ اس کوڈ میں، ہم ڈیٹا فریم کے ایک سے زیادہ کالموں میں منفرد اقدار حاصل کرتے ہیں۔

نتیجہ

ڈیٹا فریم کے کالم میں منفرد اقدار حاصل کرنے کی مکمل وضاحت اس گائیڈ میں موجود ہے۔ ہم نے 'منفرد()' اور 'drop_duplicates()' طریقوں پر تبادلہ خیال کیا ہے جو ڈیٹا فریم کے کالم کی منفرد اقدار حاصل کرنے میں ہماری مدد کرتے ہیں۔ ہم نے یہاں اپنے کوڈز میں ان طریقوں کو استعمال کرکے 'پانڈا' کوڈ میں ان طریقوں کو استعمال کرنے کا طریقہ دریافت کیا ہے۔ ہم نے اس گائیڈ میں مختلف مثالیں پیش کی ہیں اور آپ کو دکھایا ہے کہ 'منفرد()' طریقہ کے ساتھ ساتھ 'drop_duplicates()' طریقہ استعمال کرکے ایک کالم کی منفرد قدریں کیسے حاصل کی جائیں۔ ہم نے اس گائیڈ میں 'منفرد()' طریقہ استعمال کر کے متعدد کالموں میں منفرد اقدار حاصل کرنے کا طریقہ بھی دریافت کیا ہے۔