Python میں XLSX سے CSV

Python My Xlsx S Csv



حالیہ برسوں میں، Python غالب پروگرامنگ زبانوں میں سے ایک کے طور پر ابھرا ہے۔ Python کی مقبولیت اور افادیت کے نتیجے میں Python کمیونٹی میں نمایاں طور پر توسیع ہوئی ہے۔ ہم اس مضمون میں تفصیل میں جائیں گے کہ XLSX کو CSV میں تبدیل کرنے کے لیے Python کا استعمال کیسے کریں۔ ہم جانتے ہیں کہ ایکسل فائلیں اکثر مالیاتی تجزیہ کرنے، ڈیٹا کو منظم کرنے، ڈیٹا انٹری، اکاؤنٹنگ، ڈیٹا مینجمنٹ، چارٹ اور گراف بنانے وغیرہ کے لیے استعمال ہوتی ہیں۔ تاہم، ہم زیادہ تر ڈیٹا کی درآمد اور برآمد کے لیے CSV فائلوں کو استعمال کرنے کو ترجیح دیتے ہیں۔ یہ ایک طریقہ ہے کہ سادہ ٹیکسٹ فائل کا استعمال کرتے ہوئے سٹرکچرڈ ڈیٹا کو منتقل کیا جائے۔

Xslx فائل کیا ہے؟

Excel کے تازہ ترین ورژنز میں اسپریڈ شیٹس بناتے وقت، Microsoft XLSX فائل کو بطور ڈیفالٹ فائل استعمال کرتا ہے۔ Word کی DOCX فائل کی قسم کی طرح، ہم مختلف قسم کی ایپلی کیشنز/پروگراموں کا استعمال کرتے ہوئے XLSX فائلوں کو کھول سکتے ہیں۔

CSV فائل کیا ہے؟

CSV فائل فارمیٹ وہ ہے جسے ہم اسپریڈ شیٹس اور ڈیٹا بیس میں ٹیبلر ڈیٹا ویلیوز کو ذخیرہ کرنے کے لیے استعمال کر سکتے ہیں۔ ٹیبلولر ڈیٹا، متن یا متن، CSV فائل میں سادہ متن کے طور پر محفوظ کیا جاتا ہے۔ CSV فائل میں ایک ریکارڈ فائل کی ہر قطار میں ذخیرہ شدہ ڈیٹا ویلیو ہے۔ ہر ریکارڈ میں ایک سے زیادہ فیلڈ ہو سکتی ہیں جو کوما سے الگ کی گئی ہیں۔







XLSX اور CSV فائلوں کے درمیان کلیدی فرق

صارفین اکثر CSV اور XLSX کو ایک دوسرے کے ساتھ استعمال کرتے ہیں، اور وہ عام طور پر ان کے درمیان فرق، ان کی بنیادی خصوصیات کیا ہیں، اور وہ کیسے کام کرتے ہیں، اس سے لاعلم ہیں۔ یہ صرف صارف کے لیے معلومات کے ایک ذریعہ کے طور پر کام کرتا ہے۔ تقریباً ہر کاروبار اور کارپوریٹ دونوں کا استعمال صارف کے ڈیٹا کو منظم کرنے، اپ ڈیٹ کرنے اور ذخیرہ کرنے میں صارفین کی مدد کے لیے کرتے ہیں۔ ذیل میں XLSX اور CSV فائلوں کے درمیان کچھ اہم فرق ہیں جو آپ کو معلوم ہونا چاہیے:



  • CSV فارمیٹ ٹیبلر ڈیٹا کو .csv ایکسٹینشن کے ساتھ ڈیلیمیٹر ٹیکسٹ فائل میں محفوظ کرتا ہے۔ جبکہ، ایکسل یا XLSX فائل ایک اسپریڈشیٹ ہے جو فائلوں کو اپنے ملکیتی فارمیٹ میں اسٹور کرتی ہے، یعنی۔ xls یا XLSX۔
  • ایکسل فائلیں بائنری فائلیں ہیں جن میں ورک بک میں ہر ورک شیٹ کا ڈیٹا ہوتا ہے۔ جبکہ، CSV ایک سادہ اور سادہ ٹیکسٹ فارمیٹ ہے جس میں کوما سے الگ کردہ ڈیٹا کی قدروں کی ترتیب ہے۔
  • CSV فائلوں پر ڈیٹا آپریشن نہیں کیا جا سکتا۔ تاہم، وہ ایکسل فائلوں پر کئے جا سکتے ہیں.
  • CSV فائلیں تیز ہوتی ہیں اور XLSX فائلوں سے کم میموری استعمال کرتی ہیں۔ تاہم، ڈیٹا درآمد کرتے وقت ایکسل زیادہ میموری استعمال کرتا ہے۔
  • اگر ہم CSV کا موازنہ Excel کے ساتھ کریں، تو ہم CSV فائلوں کو کسی بھی ونڈوز ٹیکسٹ ایڈیٹر میں کھول سکتے ہیں جبکہ Excel فائلیں نہیں کر سکتیں۔

Python کا استعمال کرتے ہوئے XLSX فائل کو CSV میں کیسے تبدیل کیا جا سکتا ہے؟

ایک XLSX فائل کو مختلف طریقوں کا استعمال کرتے ہوئے Python میں CSV فائل میں تبدیل کیا جا سکتا ہے۔ Python میں متعدد ماڈیولز اور فنکشنز شامل ہیں جو اس کام کو پورا کرنے میں ہماری مدد کر سکتے ہیں۔ یہاں، ہم کچھ ایسے طریقوں سے گزریں گے جن کا استعمال XLSX فائلوں کو Python میں CSV فائلوں میں تبدیل کرنے کے لیے کیا جا سکتا ہے۔



ایکسل سے CSV کی تبدیلی کو انجام دینے کے لیے ضروری شرائط

ضروریات کو انسٹال کرنا پہلا قدم ہے۔ ہم اس ٹیوٹوریل میں کمبائن پانڈاس، CSV، اور Openpyxl وغیرہ جیسے ماڈیول استعمال کرتے ہیں۔ Python's Pandas پیکیج ڈیٹا کے ہیرا پھیری اور تجزیہ کی اجازت دیتا ہے۔ پانڈاس Python پروگرامرز کے درمیان ایک مشہور لائبریری ہے۔ ایکسل فائلوں کو Openpyxl کے نام سے جانا جاتا Python پیکیج کا استعمال کرتے ہوئے پڑھا اور لکھا جا سکتا ہے۔ ہم اس لائبریری کے ساتھ براہ راست معاملہ نہیں کریں گے۔ پانڈا اس کے بجائے اندرونی طور پر Openpyxl کا استعمال کرتے ہیں۔





PyPI ریپوزٹری کا استعمال کرتے ہوئے، ہم دونوں پیکجز انسٹال کر سکتے ہیں:

طریقہ 1: پانڈاس ماڈیول کا استعمال کرتے ہوئے XLSX کو CSV میں تبدیل کرنا

مثال 1: ایک XLSX فائل کو CSV میں تبدیل کرنا



پانڈاس ایک اوپن سورس ماڈیول ہے جو Python پروگرامنگ لینگویج کے لیے ڈیٹا میں ہیرا پھیری اور تجزیہ کرنے کے لیے بنایا گیا ہے۔ ٹائم سیریز اور عددی جدولوں کے ساتھ کام کرنے کے لیے، پانڈا مختلف قسم کی فعالیت اور خصوصیات فراہم کرتا ہے۔ پانڈوں کا استعمال کرتے ہوئے، چھوٹے اور بڑے ڈیٹا سیٹس کو پڑھا، فلٹر کیا اور دوبارہ ترتیب دیا جا سکتا ہے۔ اور نتائج مختلف فارمیٹس جیسے کہ Excel، JSON، اور CSV میں تیار کیے جا سکتے ہیں۔ ہم ایکسل فائل کو پڑھنے کے لیے پانڈوں کا read_excel() طریقہ استعمال کرتے ہیں، اور ڈیٹا فریم کو CSV فائل میں تبدیل کرنے کے لیے to_csv() طریقہ استعمال کرتے ہیں۔

ہم اپنی .csv فائل کو ڈیٹا فریم کے طور پر پرنٹ کرتے ہیں جیسا کہ آؤٹ پٹ میں دیکھا جا سکتا ہے۔ پچھلا اسکرپٹ ہماری XLSX فائل کو CSV میں تبدیل کرتا ہے اور موجودہ ڈائرکٹری میں ایک 'salary.csv' فائل بناتا ہے۔

مثال 2: XLSX فائل (متعدد شیٹس کے ساتھ) کو CSV میں تبدیل کرنا

مندرجہ ذیل مثال میں، ہم سب سے پہلے ایکسل فائل کے شیٹ کے نام پڑھتے ہیں۔ انفرادی شیٹس کے ناموں کو پھر لوپ کیا جاتا ہے اور الگ الگ CSV فائلوں کے طور پر محفوظ کیا جاتا ہے۔ اسکرپٹ CSVs کو اسی مقام پر محفوظ کرتا ہے۔

ہم ایک نمونہ XLSX فائل استعمال کرتے ہیں جس میں دو یا زیادہ ورک شیٹس یا اسپریڈ شیٹس ہوں۔

جیسا کہ دیکھا جا سکتا ہے، ہماری XLSX فائل دو شیٹس (شیٹ 1 اور شیٹ2) پر مشتمل ہے۔ اب، ہم اس XLSX فائل کو CSV میں تبدیل کرنے کے لیے ایک کوڈ لکھتے ہیں۔

آؤٹ پٹ:

اسکرپٹ نے کامیابی کے ساتھ دو شیٹس والی XLSX فائل کو ایک ہی شیٹ کے ساتھ ایک ہی CSV فائل میں تبدیل کر دیا۔

مثال 3: ایک سے زیادہ XLSX فائلوں کو علیحدہ CSV فائلوں میں تبدیل کرنا

ایک ایسے منظر نامے پر غور کریں جس میں آپ کو اپنی ورکنگ ڈائرکٹری میں موجود متعدد ایکسل فائلوں کو CSV میں تبدیل کرنے کی ضرورت ہے۔ آپ یہ طریقہ استعمال کر سکتے ہیں۔ ہم یہ فرض کر کے شروع کرتے ہیں کہ ہر فائل میں صرف ایک شیٹ ہوتی ہے۔ پھر، ہم ایک سے زیادہ فائلوں اور کئی شیٹس کو ہینڈل کرنے کے لیے اپنا طریقہ بڑھاتے ہیں۔ Python کوڈ جو مندرجہ ذیل ہے گلوب معیاری ماڈیول کا استعمال کرتا ہے۔ ہم Glob کے ساتھ پیٹرن کا استعمال کرتے ہوئے فائل کے راستوں کو ملاتے ہیں۔ یہ ورکنگ ڈائرکٹری میں موجود .xlsx ایکسٹینشن کے ساتھ تمام فائلوں سے میل کھاتا ہے۔ اس کے بعد، ہم ایک ایسا فنکشن تیار کرتے ہیں جو Excel فائلوں کو پڑھتا ہے اور انہیں CSV فائلوں کے طور پر محفوظ کرتا ہے۔ ہم اس فنکشن کو ہر فائل پاتھ پر کہتے ہیں جو پایا جاتا ہے۔

یہ پچھلا اسکرپٹ موجودہ ڈائرکٹری میں موجود تمام xlsx فائلوں کو CSV فائلوں میں تبدیل کرتا ہے۔

اب، ہم ایک سے زیادہ اسپریڈ شیٹس والی XLSX فائلوں کو CSV میں تبدیل کرتے ہیں۔ یہ سب سے زیادہ مشکل حصہ ہے. تین ایکسل فائلیں ہماری ورکنگ ڈائرکٹری میں ہیں۔ اس کے علاوہ، ان میں سے کچھ ایک سے زیادہ شیٹ پر مشتمل ہیں. ہمارا مقصد ہے:

  1. ہر اسپریڈشیٹ فائل کے لیے ایک ڈائرکٹری بنائیں،
  2. ایکسل فائل شیٹس کو CSV میں تبدیل کریں اور انہیں نئی ​​بنائی گئی ڈائرکٹری میں رکھا جائے۔

اسکرپٹ XLSX کو سنگل اور ایک سے زیادہ شیٹس کے ساتھ الگ الگ CSV فائلوں میں تبدیل کرتا ہے اور انہیں اسی نام کے ساتھ نئی ڈائریکٹریوں میں اسٹور کرتا ہے۔

موجودہ ڈائریکٹری میں موجود ہر ایکسل فائل کو بازیافت کرنے کے لیے، گلوب فنکشن استعمال کیا جاتا ہے۔ اس کے بعد، os.mkdir فنکشن کا استعمال کرتے ہوئے ہر XLSX فائل کے لیے فولڈر بنائے جاتے ہیں۔ اس کے بعد شیٹ کے نام کو لوپ کرکے نئی ڈائرکٹری کے اندر ہر شیٹ کے لیے ایک CSV فائل بنائی جاتی ہے۔

طریقہ 2: Openpyxl اور CSV ماڈیولز کا استعمال کرتے ہوئے XLSX کو CSV میں تبدیل کرنا

اس طریقہ میں، ہم XLSX فائلوں کو CSV میں تبدیل کرنے کے لیے openpyxl اور CSV ماڈیول استعمال کریں گے۔ 2010 xlsx، xlsm، xltx، اور xltm فائلوں کو پڑھنے اور لکھنے کے لیے، Python ماڈیول openpyxl استعمال کیا جا سکتا ہے۔ CSV ماڈیول میں وہ کلاسز شامل ہیں جو CSV فارمیٹ شدہ ٹیبلر ڈیٹا کو پڑھنے اور لکھنے کے قابل بناتے ہیں۔

اپنی xlsx فائل کو پڑھنے یا لوڈ کرنے کے لیے، ہم openpyxl ماڈیول کا load_workbook() فنکشن استعمال کرتے ہیں۔ اگر آپ کو Python میں موجودہ XLSX/Excel فائل لکھنے یا پڑھنے کی ضرورت ہو تو آپ اس فنکشن کو استعمال کر سکتے ہیں۔ ایکسل کے فعال ہونے کے بعد، ہم اپنی CSV فائل بنانے کے لیے csv.writer() فنکشن استعمال کرتے ہیں۔ پھر، CSV فائل کے ڈیٹا سیلز میں ڈیٹا کو ذخیرہ کرنے کے لیے for-loop کا استعمال کیا جاتا ہے۔ ہم اپنی example.xlsx فائل کو myfile.csv میں تبدیل کرتے ہیں جیسا کہ درج ذیل تصویر میں دیکھا گیا ہے۔

نتیجہ

اس ٹیوٹوریل میں، ہم نے آپ کو XLSX فائلوں اور CSV فائلوں کا مختصر تعارف دیا ہے۔ ہم نے دونوں فائل فارمیٹس کے درمیان اہم فرق کی وضاحت کی۔ ہم نے متعدد مثالوں کے ساتھ دو طریقوں پر تبادلہ خیال کیا تاکہ یہ سکھایا جا سکے کہ کس طرح سنگل یا ایک سے زیادہ شیٹس والی XLSX فائلوں کو CSV فائلوں میں تبدیل کیا جا سکتا ہے۔ ہم نے متعدد XLSX فائلوں کو بیک وقت CSV فائلوں میں تبدیل کرنے کے لیے ایک مثال نافذ کی۔ ڈیٹا کو Excel سے CSV میں تبدیل کرنا آسان یا مشکل ہو سکتا ہے۔ اگر آپ کے پاس صرف ایک فائل ہے جس میں شیٹس کی ایک چھوٹی سی تعداد ہے، تو یہ آسان ہے۔ لیکن اگر نہیں، تو یہ مشکل ہوسکتا ہے۔