پانڈاس سیریز سے CSV تک

Pan As Syryz S Csv Tk



پانڈوں میں 'Series.to_csv()' طریقہ کوما سے الگ کردہ اقدار (csv) اشارے میں مخصوص سیریز آبجیکٹ کو آؤٹ پٹ کرتا ہے۔ یہ فنکشن صرف ایک سیریز سے اقدار لیتا ہے اور انڈیکس اور کالم کی قدروں کی علیحدگی کے لیے کوما شامل کر کے ان کی شکل میں ترمیم کرتا ہے۔

اس فنکشن کو استعمال کرنے کے لیے، ہمیں درج ذیل نحو کو استعمال کرنا ہوگا:









یہ مضمون آپ کو ازگر کے پروگرام میں اس طریقے کو استعمال کرنے کے طریقے سیکھنے کے لیے دو مختلف تکنیکیں فراہم کرے گا۔



مثال # 1: ڈیٹ ٹائم انڈیکس والی سیریز کو کوما سے الگ کردہ اقدار میں تبدیل کرنے کے لیے Series.to_csv() طریقہ استعمال کرنا

سیریز کو CSV فارمیٹ میں تبدیل کرنے کے لیے، ہم 'Series.to_csv()' فنکشن استعمال کریں گے۔ یہ مثال ڈیٹ ٹائم انڈیکس کے ساتھ ایک سیریز تیار کرے گی اور پھر اسے کوما سے الگ کردہ اقدار کی شکل میں تبدیل کر دے گی۔





اس طریقہ کار کو عملی جامہ پہنانے کے لیے، ہمارے پاس ایسا ٹول ہونا چاہیے جو ازگر کی پروگرامنگ کو سپورٹ کرتا ہو۔ کوڈز کو مرتب کرنے کے لیے 'اسپائیڈر' ٹول کا انتخاب کیا گیا ہے۔ اس پر اسکرپٹ لکھنے کے لیے، ہم نے پہلے اپنے سسٹم میں انسٹال کردہ ٹول لانچ کیا۔ python پروگرام کو مطلوبہ نتائج حاصل کرنے کے لیے اپنے طریقوں کو استعمال کرنے کے لیے ایک لائبریری کی ضرورت ہے۔ ہم نے یہاں جو لائبریری لوڈ کی ہے وہ 'پانڈا' ہے۔ کوڈ کی اسی لائن میں، اس لائبریری کے عرف کی شناخت 'pd' کے طور پر کی گئی ہے۔ لہذا، پروگرام میں جہاں کہیں بھی، ہمیں فنکشن تک رسائی کے لیے 'پانڈا' لکھنا ہوگا۔ اس کے بجائے ہم 'pd' لکھیں گے۔

کوڈ کے ساتھ شروع کرنے کا پہلا قدم ایک پانڈاس سیریز تیار کرنا ہے۔ ہمیں پانڈا سے سیریز بنانے کا طریقہ استعمال کرنے کے لیے 'pd' لکھنے کی ضرورت ہے۔ 'pd.Series()' فنکشن کو مخصوص اقدار کے ساتھ سیریز بنانے کے لیے کہا جاتا ہے۔ سیریز کے لیے ہم نے جو اقدار فراہم کی ہیں وہ ہیں 'استنبول'، 'ازمیر'، 'انقرہ'، 'انقرہ'، 'انطالیہ'، 'کونیا'، اور 'برسا'۔ اگر آپ اقدار کی اس صف کو کوئی نام دینا چاہتے ہیں، تو آپ 'نام' پیرامیٹر استعمال کر کے ایسا کر سکتے ہیں۔ یہاں، ہم نے اقدار کی اس صف کو 'شہروں' کا نام دیا ہے کیونکہ اس میں 6 شہروں کے نام ہیں۔ اس سیریز کو ذخیرہ کرنے کے لیے ایک سیریز آبجیکٹ 'Turkey' بنایا گیا ہے۔



ڈیٹ ٹائم انڈیکس بنانے کے لیے، ہم نے 'pd.date_range()' طریقہ استعمال کیا ہے۔ اس فنکشن کے قوسین کے درمیان، ہم نے 4 آرگیومینٹس پاس کیے ہیں جو یہ ہیں: 'start'، 'freq'، 'periods'، اور 'tz'۔

'شروع' دلیل اس سے تاریخ کی حد بنانا شروع کرنے میں ایک تاریخ اور وقت لیتا ہے۔ یہاں، ہم نے آغاز کی تاریخ اور وقت کو '2022-03-02 02:30' کے طور پر بیان کیا ہے۔ 'freq' پیرامیٹر تاریخ کی حد کے لیے تعدد کی درجہ بندی کر رہا ہے۔ لہذا، ہم نے اسے 'D' کی قدر فراہم کی۔ اب، یہ روزانہ کی تعدد پر تاریخ کی حد بنائے گا۔ 'مدت' دلیل کو '6' پر سیٹ کیا گیا ہے جس کا مطلب ہے کہ یہ 6 دنوں کے لیے تاریخ کی حد پیدا کرے گا۔ آخری پیرامیٹر 'tz' ہے جو مخصوص علاقے کے لیے ٹائم زون کی وضاحت کرتا ہے۔ ہم نے 'Asia/Istanbul' کے لیے ٹائم زون کی وضاحت کی ہے۔

اس تاریخ کی حد کو ذخیرہ کرنے کے لیے، ہم نے ایک متغیر 'Datetime' متغیر بنایا ہے۔ ڈیٹ ٹائم انڈیکس سیٹ کرنے کے لیے، ہم نے 'Series.index' پراپرٹی کو استعمال کیا ہے۔ سیریز 'Turkey' کا نام '.index' پراپرٹی کے ساتھ فراہم کیا جاتا ہے اور اسے 'Datetime' متغیر میں ذخیرہ شدہ تاریخ کے وقت کی حد تفویض کی جاتی ہے۔ اس طرح، 'انڈیکس' خاصیت 'ڈیٹ ٹائم' متغیر سے قدریں لے گی اور انہیں 'ترکی' سیریز کی فہرست فہرست بنا دے گی۔ آخر میں، آؤٹ پٹ سیریز دیکھنے کے لیے، ہم نے 'print()' طریقہ استعمال کیا ہے اور 'Turkey' سیریز کو بطور ان پٹ اس کے مواد کو ظاہر کرنے کے لیے پاس کیا ہے۔

ہم نے اسکرپٹ کو چلانے کے لیے صرف 'رن فائل' کا اختیار دبایا۔ نتیجتاً، ہم ڈیٹ ٹائم انڈیکس کے ساتھ ایک سیریز دیکھ سکتے ہیں جو '2022-03-02 02:30:00+03:00' سے شروع ہوتی ہے اور '2022-03-07 02:30:00+03:00″ پر ختم ہوتی ہے 6 دنوں کے. سیریز کے نیچے 'Freq :D'، صفوں کی فہرست 'شہروں' کا نام اور dtype 'object' کا بھی ذکر ہے۔

اب، ہم اس سیریز کو تبدیل کرنا سیکھیں گے جسے ہم نے ابھی اوپر کے سنیپ شاٹ میں CSV فارمیٹ میں دیکھا ہے۔ سیریز کو کوما سے الگ کردہ اقدار میں تبدیل کرنے کے لیے، ہمارے پاس پانڈاس ماڈیول کے ذریعے فراہم کردہ ایک طریقہ ہے جو کہ 'Series.to_csv()' ہے۔ یہ طریقہ فراہم کردہ سیریز کی اقدار لیتا ہے اور کالم کی اقدار کے درمیان کوما شامل کرتا ہے۔

'Series.to_csv()' فنکشن کو کہا جاتا ہے۔ جس سیریز کو ہم تبدیل کرنا چاہتے ہیں اس کا نام 'Turkey.to_csv()' کے طریقہ کار کے ساتھ درج ہے۔ کوما سے الگ ہونے والی اقدار کو محفوظ رکھنے کے لیے، ہم نے ایک متغیر 'Comma_Separated' بنایا ہے اور پھر 'print()' فنکشن کو استعمال کرکے اس کے مواد کو آؤٹ پٹ ونڈو پر ڈال دیا ہے۔

یہ ہماری سیریز csv فارمیٹ میں ہے۔ ہم اسنیپ شاٹ میں دیکھ سکتے ہیں کہ انڈیکس اور سیریز کی قدروں کو ان میں کوما کا استعمال کرتے ہوئے الگ کیا گیا ہے۔

مثال # 2: NaN اقدار والی سیریز کو کوما سے الگ کردہ اقدار میں تبدیل کرنے کے لیے Series.to_csv() طریقہ استعمال کرنا

'Series.to_csv()' طریقہ استعمال کرنے کی دوسری تکنیک یہ ہے کہ اس طریقہ کو ایک سیریز کو تبدیل کرنے کے لیے لاگو کیا جائے جس میں کچھ null اندراجات کو CSV فارمیٹ میں رکھا گیا ہو۔

ہم نے ابتدائی طور پر ضروری پیکجز درآمد کیے ہیں۔ 'pd' کو پانڈا کے لیے ایک عرف بنایا گیا ہے اور 'np' کو numpy کے لیے ایک عرف کے طور پر۔ numpy ٹول کٹ یہاں لوڈ کی گئی ہے کیونکہ ہم 'np.NaN' کا استعمال کرتے ہوئے اپنی سیریز میں کچھ null اندراجات کریں گے جبکہ اسے pandas 'pd.Series()' طریقہ استعمال کرتے ہوئے بنائیں گے۔

'pd.Series()' فنکشن کو ان اقدار کے ساتھ پانڈا سیریز بنانے کے لیے استعمال کیا جاتا ہے: 'نائل'، 'Amazon'، np.NaN، 'گنگا'، 'Mississippi'، 'np.NaN'، 'Yangtze'، 'ڈینوب'، 'میکونگ'، 'np.NaN'، اور 'وولگا'۔ سیریز کے لیے مجموعی طور پر 21 اقدار کی وضاحت کی گئی ہے جن میں سے 3 اندراجات میں 'np.NaN' اقدار ہیں جس کا مطلب ہے کہ سیریز میں 3 قدریں غائب ہیں۔ 'نام' خاصیت اقدار کی اس صف کا نام بتا رہی ہے جسے ہم نے 'ٹائٹلز' فراہم کیا ہے۔ 'انڈیکس' پراپرٹی کا استعمال ڈیفالٹ لسٹ کے ساتھ جانے کی بجائے صارف کی وضاحت کردہ انڈیکس لسٹ کو سیٹ کرنے کے لیے کیا جاتا ہے۔

یہاں، ہم '10'، '11'، '12'، '13'، '14'، '16'، '17'، '18'، '19'، '20' کے ساتھ اشاریہ کی فہرست چاہتے ہیں، اور 21'۔ اب، ہماری سیریز میں انڈیکس کی فہرست '0' کے بجائے '10' سے شروع ہوگی۔ اب، اس سیریز کو اسٹور کریں تاکہ ہم اسے بعد میں پروگرام میں استعمال کرسکیں۔ ہم نے ایک سیریز آبجیکٹ 'Rivers' کو شروع کیا ہے اور اسے 'pd.Series()' طریقہ کو کال کرنے سے پیدا ہونے والی آؤٹ پٹ سیریز الاٹ کی ہے۔ سیریز کو python کے ذریعے 'print()' فنکشن کا استعمال کرتے ہوئے ڈسپلے پر رکھ کر دیکھا جا سکتا ہے۔

ٹرمینل پر پیش کردہ آؤٹ پٹ نے ایک سیریز کو پرنٹ کیا جس کی فہرست کی فہرست 10 سے شروع ہو رہی ہے اور 21 پر ختم ہوتی ہے جس کا مطلب ہے کہ سیریز کی 21 اقدار ہیں۔

سیریز کو 'Series.to_csv()' طریقہ کے ساتھ CSV فارمیٹ میں تبدیل کر دیا جائے گا۔

ہم نے اپنی سیریز 'ترکی' کے ساتھ 'Series.to_csv()' طریقہ استعمال کیا ہے۔ لہذا، یہ طریقہ 'ترکی' سیریز سے اقدار لے گا اور انہیں کوما سے الگ کردہ اقدار کی شکل میں تبدیل کر دے گا۔ نتیجہ 'Converted_csv' متغیر میں محفوظ ہے۔ اور بالآخر، تبدیل شدہ سیریز 'print()' فنکشن کی مدد سے پرنٹ کی جاتی ہے۔

نیچے دیے گئے نتائج کے سنیپ شاٹ میں، آپ دیکھ سکتے ہیں کہ سیریز کی قدروں کو اب اس طرح تبدیل کیا گیا ہے جہاں انڈیکس کی فہرست سے الگ کرنے کے لیے کوما کا استعمال کیا جاتا ہے۔ مزید یہ کہ، جہاں اقدار غائب ہیں، صرف انڈیکس نمبر کوما کے ساتھ پرنٹ کیا جاتا ہے۔

نتیجہ

پانڈاس سیریز کو CSV فارمیٹ میں تبدیل کرنا ایک عملی طریقہ ہے۔ یہ پانڈا 'Series.to_csv()' فنکشن کا استعمال کرکے حاصل کیا جاسکتا ہے۔ اس گائیڈ نے اس طریقہ کار کو استعمال کرنے کے لیے دو تکنیکوں کو عملی جامہ پہنایا۔ پہلی مثال میں، ہم نے ڈیٹ ٹائم انڈیکس والی سیریز کو کوما سے الگ کردہ اقدار کی شکل میں تبدیل کرنے کے لیے یہ طریقہ استعمال کیا ہے۔ دوسری مثال نے 'Series.to_csv()' فنکشن کو CSV فارمیٹ میں کچھ گمشدہ اندراجات والی سیریز میں ترمیم کرنے کے لیے استعمال کیا۔ ونڈوز آپریٹنگ سسٹم پر 'اسپائیڈر' ٹول کا استعمال کرتے ہوئے دونوں تکنیکوں کو عملی طور پر لاگو کیا گیا ہے۔