پانڈا جوائن بمقابلہ ضم کریں۔

Pan A Jwayn Bmqabl Dm Kry



'پانڈا' ازگر کے ماحول کے لیے ایک اعلیٰ کارکردگی کا آلہ ہے۔ یہ ڈیٹا کے تجزیہ کے لیے ایک 'اوپن' سورس کوڈ ہے۔ پانڈا جوائن اور پانڈا انضمام کا طریقہ دونوں ڈیٹا فریموں کو ایک ساتھ ایک ڈیٹا فریم میں جوڑنے کے لیے استعمال کیا جاتا ہے۔ پانڈوں کے دونوں طریقوں میں، فرق یہ ہے کہ پانڈا 'جوائن' فنکشن انڈیکس کا استعمال کرتے ہوئے ڈیٹا فریم میں شامل ہوتا ہے۔ جبکہ پانڈا 'مرج' فنکشن انڈیکس اور کالم کا طریقہ استعمال کرکے ڈیٹا فریم میں شامل ہوتا ہے جس میں ہم خود مطلوبہ کالم منتخب کرسکتے ہیں۔ پانڈوں کے انضمام کا طریقہ زیادہ تر پانڈا کے جوائن کے طریقہ کے مقابلے میں استعمال ہوتا ہے۔ عمل درآمد کے لیے ہم جو سافٹ ویئر استعمال کریں گے وہ 'اسپائیڈر' سافٹ ویئر ہے، جو ازگر کے ماحول میں ہے جو ہمیں پانڈا جوائن میتھڈ() اور پانڈاس مرج() میتھڈ فنکشن کے کوڈ کے نفاذ کے لیے فوائد فراہم کرے گا۔

پانڈا جوائن () طریقہ کا نحو

'df1. شامل ہونا ( df2 ) '

مندرجہ بالا نحو میں 'df' 'ڈیٹا فریم' کا مخفف ہے۔ 'ڈاٹ جوائن' فنکشن کے ساتھ نحو میں دو ڈیٹا فریم ہیں، جو طریقہ کو کال کرنے کے لیے ہے۔ یہ دو ڈیٹا فریموں میں شامل ہونے کا پانڈا طریقہ ہے۔ یہ انڈیکس کا استعمال کرتے ہوئے ڈیٹا فریموں کو ایک ایک میں جوڑ کر کام کرتا ہے۔







پانڈاس مرج () طریقہ کا نحو

'df1. ضم ( df2 ، پر = 'کالم_نام' ) '

پانڈاس مرج طریقہ ترکیب میں دو ڈیٹا فریم ہیں جیسے 'df1' اور 'df2'۔ 'ڈاٹ مرج' فنکشن کالموں کی الٹی شکل کے ساتھ دونوں ڈیٹا فریموں میں شامل ہونے کا طریقہ بتا رہا ہے۔



ہم پانڈا مرج اور پانڈا جوائن کرنے کے طریقوں کو استعمال کرنے کے لیے دو ڈیٹا فریموں کو ملانے کے درج ذیل طریقوں کا احاطہ کریں گے۔



  • پانڈاس جوائن کا طریقہ اوورلیپنگ۔
  • پانڈا انڈیکس ری سیٹ کا استعمال کرتے ہوئے طریقہ میں شامل ہوتے ہیں۔
  • پانڈوں کے انضمام کا طریقہ (کالم 'بائیں اور دائیں')۔
  • پانڈوں کا انضمام کا طریقہ واضح ہے۔

پانڈوں کے انضمام اور پانڈوں میں شمولیت کے طریقہ کار کے نفاذ کے لیے ڈیٹا فریم بنانا

سب سے پہلے، ہمیں ایک ڈیٹا فریم بنانا ہوگا. اس کے لیے، ہم 'اسپائیڈر' ٹول استعمال کریں گے۔ اسے کھولنے کے بعد، کوڈ لکھنا شروع کریں۔ پانڈا لائبریری ایسوسی ایشن کے لیے پانڈا کو بطور 'pd' درآمد کریں۔ ہمارے پاس ڈیٹا فریم متغیرات 'x'، 'y'، 'p'، اور 'q اسی مناسبت سے ہیں اور 'a' قدروں کے ساتھ '1' اور 'b' کے ساتھ '2' کے طور پر تفویض کردہ ویلیو ہیں۔





آؤٹ پٹ ایک 'df' ہے جسے تفویض کردہ اقدار کے ساتھ بنایا گیا ہے۔ ہم اسے اتنا بڑا بنا سکتے ہیں جتنا ڈیٹا ہے۔



ایک اور ڈیٹا فریم بنانا

ہمیں ایک اور ڈیٹا فریم بنانا ہوگا، تاکہ پانڈا کے شامل ہونے اور پانڈوں کے ضم ہونے کے طریقے واضح طور پر سمجھ سکیں۔ یہاں، ہم نے 'df' کو اوپر والے 'df' جیسا ہی بنایا ہے، صرف ویلیوز متغیرات مختلف ہیں۔ ہمارے پاس 'h'، 'j'، 's' اور 'd' ہیں، جبکہ قدر 'b' کو '8' اور 'Y' کو '3' کے ساتھ تفویض کریں۔

آؤٹ پٹ ایک سادہ 'df' بنا ہوا دکھاتا ہے۔

مثال # 01: پانڈا جوائن کا طریقہ (اوور لیپنگ)

اب، ہم دیکھیں گے کہ پانڈا جوائن کے طریقہ سے دو ڈیٹا فریموں کو کیسے جوائن کیا جائے۔ اس طریقہ کے لیے، ہم ڈیٹا فریم سے آپ کی پسند کا کالم منتخب کر سکتے ہیں جس پر ہم کام کرنا چاہتے ہیں۔ ہم نے مثال کو 'df' سے اوور لیپنگ کالم 'بائیں' کے ساتھ لیا ہے، لہذا ہم ڈیٹا کے اوور لیپنگ پر قابو پانے کے لیے اسے 'لاحقہ' کے ساتھ ٹھیک کر سکتے ہیں۔ یہاں، 'x'، 'z'، 'v'، 'd' استعمال کیے گئے متغیرات ہیں۔ 'p'، 'o'، 'l'، اور 'y' کو '3'، '6'، '7' اور '9' کے طور پر تفویض کردہ اقدار کے ساتھ۔ '.join' طریقہ کو کال کرتا ہے، جس میں دائیں 'df' لاحقہ کے ساتھ بائیں جوائن پر سیٹ کیا جاتا ہے۔ ' کوڈ میں 'لاحقہ' استعمال ہوتا ہے کیونکہ ڈیٹا فریم میں، دو کالم ہوتے ہیں جن کا ایک ہی نام ہوتا ہے جو کہ 'کی' ہوتا ہے اور یہ ڈیٹا کو اوورلیپ نہیں کرتا ہے۔

آؤٹ پٹ پانڈا جوائن کا طریقہ استعمال کرتے ہوئے دو 'df' میں شامل ہونے کے طریقے کے ساتھ کوئی اوورلیپڈ ڈیٹا نہیں دکھاتا ہے۔

مثال نمبر 02: انڈیکس ری سیٹ کا استعمال کرتے ہوئے پانڈاس جوائن کرنے کا طریقہ

اس مثال میں، ہم پیرامیٹر 'آن' کے ساتھ کالم کو علیحدہ طور پر جوائن کرنے کے طریقہ کار میں 'کلید' کے طور پر استعمال کرنے کے لیے متعین کریں گے جو دو ڈیٹا فریموں کو جوڑنے میں مدد کرتا ہے۔ مشترکہ چیز اس پیرامیٹر کے ساتھ کی جاتی ہے۔ نیز، ان دونوں میں سے ایک 'df' کا اشاریہ ان میں شامل ہونے کے لیے یکساں ہونا چاہیے۔ اسی طرح کا ڈیٹا یا ڈیٹا اسی مقصد کے لیے استعمال ہوتا ہے جو پروسیسنگ کے لیے ایک ساتھ ہو سکتا ہے۔ یہ دائیں طرف سے استعمال کرتے ہوئے، انڈیکس کو مستحکم استعمال کرے گا۔ متغیرات 's'، 't'، 'u'، 'v'، 'n'، 'w'، 'k' اور 'q' ہیں۔ تفویض کردہ اقدار '3'، '6'، '7' اور '9' ہیں۔ 'ری سیٹ ڈاٹ انڈیکس' 'df' کے انڈیکس کو دوبارہ ترتیب دینے کے لیے پانڈوں کا ایک طریقہ ہے۔ ری سیٹ انڈیکس 0 سے لے کر ڈیٹا فریم ڈیٹا کے لمبا ہونے تک آپ کے ڈیٹا فریم کی فہرست کے تمام عدد کو سیٹ کرتا ہے۔

یہاں پانڈا کے انڈیکس 'کی' جوائن کے طریقہ کار کے ساتھ آؤٹ پٹ دکھا رہا ہے۔

مثال # 03: پانڈوں کو ملانے کا طریقہ (کالم 'بائیں اور دائیں')

انضمام کا طریقہ اسی طرح کا عمل انجام دیتا ہے جیسا کہ پانڈوں کے جوائن کا طریقہ۔ دونوں طریقے اسی طرح کے ڈیٹا فریم پر ڈیٹا کو یکجا کرنے کے لیے ہیں۔ انضمام کا طریقہ زیادہ ورسٹائل ہے جس میں کلید کی وضاحت کی ضرورت ہوتی ہے۔ آپ کے ڈیٹا فریم کے کام کے لحاظ سے ہم اسے بائیں اور دائیں کالموں پر بھی بتا سکتے ہیں۔ کوڈ میں متغیرات 's'، 'd'، 'g'، 'f'، 'k'، 'j'، 'b' اور 'q' ہیں۔ تفویض کردہ اقدار '9'، '5'، '6' اور '7' ہیں۔ بیرونی 'جوائن' کا نفاذ پانڈاس مرج میتھڈ فنکشن کے پیرامیٹر 'کیسے' کو استعمال کرکے دونوں 'df' پر کیا جاتا ہے۔

ہم جو آؤٹ پٹ دیکھتے ہیں وہ دونوں ڈیٹا فریموں کے ضم شدہ ڈیٹا کو ظاہر کرتا ہے۔ 'NaN' 'نمبر نہیں' کی نمائندگی کرتا ہے جس کا مطلب ہے کہ جہاں ڈیٹا میں کوئی نمبر تفویض نہیں ہوتا ہے وہاں 'NaN' دکھاتا ہے۔

مثال #04: ضم کرنے کا طریقہ واضح طور پر

یہاں، اس مثال میں، انضمام کا طریقہ انڈیکس کی تباہی ہے اور ڈیٹا فریم پر انڈیکس ویلیو فرض نہیں کی گئی ہے۔ ہم اس طریقے کو اس کام کے مطابق کریں گے جس کی ضرورت ہے، جہاں واضح کرنے والے کو فالو اپ کرنا ہے۔ یہ پیرامیٹر کے ساتھ بائیں انڈیکس یا دائیں انڈیکس کی بنیاد پر ڈیٹا کو ضم کر دے گا۔ اس ڈیٹا فریم میں متغیرات 't'، 'r'، 'I'، 'u'، 'h'، 'o'، 'e' اور 'e' ہیں۔ تفویض کردہ اقدار '2'، '4'، '6' اور '4' ہیں۔ ضرورت کے مطابق کالم کے انتخاب کے ساتھ پانڈوں کے انضمام کے طریقہ کار کی مندرجہ بالا مثال دو ڈیٹا فریموں کو جوڑنے کا سب سے قابل قدر اور قابل قدر طریقہ ہے۔ کوڈ کی لائن کے آخر میں چیک کیا جا رہا ہے کہ ڈیٹا سیٹ میں انضمام کی کلید منفرد ہے۔

نیچے دیے گئے آؤٹ پٹ میں انڈیکس انڈیکس کے بغیر نہیں دکھایا جاتا ہے لیکن فنکشن دائیں اور بائیں انڈیکس کی بنیاد پر انجام دیا جاتا ہے۔

نتیجہ

merge() اور join() طریقے دونوں طریقے ہیں جو بہت آسان اور موثر ہیں۔ یہ دونوں فنکشنز ایک ہی ڈیٹا فریم پر دو الگ الگ ڈیٹا فریم میں شامل ہونے کے لیے استعمال ہوتے ہیں لیکن کیس کے لحاظ سے مختلف استعمال ہوتے ہیں۔ اس آرٹیکل میں، ہم نے پانڈوں کے شامل ہونے اور انضمام کے طریقہ کار کے درمیان اہم فرق سیکھا ہے۔ مثالوں کو کرنے اور پانڈوں کے جوائن کے طریقہ کار کو سمجھنے کے بعد، ہم اس علم کے ساتھ نتیجہ اخذ کریں گے کہ، اگر ہم زیادہ لچکدار اور ڈیٹا بیس اسٹائل جوائن کرنا چاہتے ہیں، تو یہ بہتر ہے کہ پانڈوں کے انضمام کے طریقہ کار کے ساتھ چلیں۔ دوسری طرف، اگر ہم ڈیٹا فریم کو انڈیکس کے ساتھ بڑے پیمانے پر ملانا چاہتے ہیں، تو ہم pandas join() میتھڈ فنکشن کے ساتھ جا سکتے ہیں۔