مصنوعی ذہانت (Qehwa AI) کا انقلاب تیزی سے مقامی زبانوں کی طرف منتقل ہو رہا ہے۔ ایک شاندار انفرادی کاوش میں پاکستانی ڈیولپر جنید احمد نے باضابطہ طور پر ‘قہوہ’ (Qehwa) لانچ کیا ہے جو خاص طور پر پشتو زبان کے لیے ڈیزائن کیا گیا دنیا کا پہلا لارج لینگویج ماڈل (Large Language Model – LLM) ہے۔
دنیا بھر میں تقریباً 6 کروڑ پشتو بولنے والوں کی خدمت کے لیے بنایا گیا قہوہ اے آئی خاص طور پر پشاوری لہجے پر توجہ مرکوز کرتا ہے۔ یہ اقدام نیچرل لینگویج پروسیسنگ (NLP) میں اس بہت بڑے خلا کو پُر کرتا ہے جہاں عالمی اے آئی سسٹمز روایتی طور پر علاقائی زبانوں اور ثقافتی حوالوں کو سمجھنے میں جدوجہد کرتے نظر آتے ہیں۔
تیمور حسن کی جانب سے بنائے گئے اردو ایل ایل ایم ‘قلب’ (Qalb) سے متاثر ہو کر جنید احمد نے کسی بھی ادارہ جاتی فنڈنگ یا ڈیولپمنٹ ٹیم کے بغیر آزادانہ طور پر اس پروجیکٹ کا آغاز کیا۔ آئیے اس بات کا تفصیلی جائزہ لیتے ہیں کہ قہوہ کو کیسے بنایا گیا اس کی شاندار صلاحیتیں کیا ہیں اور اوپن سورس کمیونٹی کے لیے اس کا کیا مطلب ہے۔
قہوہ اے آئی کی بنیاد: Qwen2.5-7B
قہوہ بنانے کے لیے ڈیولپر نے Qwen2.5-7B کو بنیاد کے طور پر استعمال کیا۔ Qwen علی بابا کلاؤڈ (Alibaba Cloud) کی جانب سے تیار کردہ انتہائی قابل اور اوپن سورس لارج لینگویج ماڈلز کی ایک فیملی ہے۔ "7B” کا مطلب یہ ہے کہ اس ماڈل میں 7 بلین (7 ارب) پیرامیٹرز شامل ہیں جو بنیادی طور پر ماڈل کے کمپیوٹیشنل دماغی خلیے ہیں جو اس کی منطق اور استدلال کو کنٹرول کرتے ہیں۔
اگرچہ بنیادی Qwen ماڈل پہلے ہی عمومی منطق اور متعدد زبانوں کی گہری سمجھ رکھتا تھا لیکن اس میں پشتو میں قدرتی بات چیت کے لیے درکار مقامی گہرائی کی کمی تھی۔ احمد نے اس بنیاد کو لیا اور اسے خاص طور پر پشاوری پشتو لہجے کے لیے تیار کردہ ایک سخت، دو مرحلوں پر مشتمل تربیتی عمل سے گزارا۔
قہوہ اے آئی کا تربیتی عمل (Training Process of Qehwa AI)
شروع سے ایک مقامی LLM تیار کرنے کے لیے ڈیٹا پروسیسنگ کی ایک بہت بڑی مقدار درکار ہوتی ہے۔ قہوہ کی ٹریننگ دو اہم مراحل میں مکمل کی گئی:
پہلا مرحلہ: مسلسل پری ٹریننگ (Continued Pre-Training)
اس ابتدائی مرحلے کے دوران ماڈل کو 3.4 ملین (34 لاکھ) پاکستانی پشتو دستاویزات فراہم کی گئیں۔ اس وسیع مواد نے اے آئی کو ایک بھرپور ذخیرہ الفاظ (Vocabulary) بنانے پیچیدہ گرامر کے ڈھانچے کو سمجھنے اور سب سے اہم بات اس علاقائی ثقافتی پس منظر کو سمجھنے میں مدد دی جسے عالمی ماڈلز اکثر نظر انداز کر دیتے ہیں۔
ایک اکیلے ڈیولپر کے طور پر کمپیوٹیشنل بوجھ کو سنبھالنے کے لیے احمد نے 64 کا "LoRA رینک” استعمال کیا۔ LoRA (Low-Rank Adaptation) ایک جدید ریاضیاتی تکنیک ہے جو ڈیولپرز کو کروڑوں ڈالرز کے سپر کمپیوٹرز کی ضرورت کے بغیر بڑے اے آئی ماڈلز کو فائن ٹیون کرنے کی اجازت دیتی ہے۔ تمام 7 ارب پیرامیٹرز کو دوبارہ لکھنے کے بجائے LoRA نیورل نیٹ ورک کے صرف ایک چھوٹے انتہائی مخصوص حصے کو اپ ڈیٹ کرتا ہے جس سے ٹریننگ کا عمل ایک اکیلے ڈیولپر کے لیے انتہائی موثر اور سستا ہو جاتا ہے۔
دوسرا مرحلہ: ہدایات کے لیے فائن ٹیوننگ (Fine-Tuning for Instructions)
ایک بار جب ماڈل زبان سمجھ گیا تو اسے کمانڈز پر عمل کرنا سیکھنے کی ضرورت تھی۔ دوسرے مرحلے میں 100,000 سے زیادہ پشتو ہدایات کے جوڑوں (Instruction pairs) کا استعمال کرتے ہوئے قہوہ کو فائن ٹیون کیا گیا۔ اس ٹریننگ نے چیٹ بوٹ کو سوالات کے درست جواب دینے متن کا ترجمہ کرنے اور روانی سے بات چیت کرنے کے قابل بنایا۔
قہوہ اے آئی: ایک نئے معیار کا تعین
چونکہ پشتو اے آئی کی ٹیسٹنگ کے لیے پہلے سے کوئی معیار موجود نہیں تھا اس لیے احمد کو خود ایک معیار (Benchmark) بنانا پڑا۔ قہوہ نے پہلا مخصوص پشتو LLM بینچ مارک متعارف کرایا ہے جس میں 15 مختلف کیٹیگریز میں 150 سخت تشخیصی ٹیسٹ شامل ہیں۔
اس کے نتائج انتہائی شاندار ہیں۔ قہوہ نے مجموعی طور پر 85.3% ایکوریسی (درستگی) کا سکور حاصل کیا۔
قہوہ اے آئی بینچ مارک کی نمایاں خصوصیات:
انگریزی سے پشتو ترجمہ: 90 فیصد درستگی۔
اردو سے پشتو ترجمہ: 84 فیصد درستگی۔
مخصوص مضامین میں درستگی: ماڈل نے ثقافت اور تاریخ، صحت اور روزمرہ زندگی اور جغرافیہ اور فطرت سے متعلق کیٹیگریز میں شاندار 90% سکور حاصل کیا۔
یہ چیٹ بوٹ فی الحال انگریزی، اردو اور پشتو میں یوزر پرامپٹس (سوالات/ہدایات) کو سپورٹ کرتا ہے جبکہ اپنے جوابات خالص اور گرامر کے لحاظ سے درست پشتو میں تیار کرتا ہے۔
قہوہ اے آئی کو انسٹال اور رن (Run) کرنے کا طریقہ
ان ڈیولپرز کے لیے جو اس ماڈل کو اپنے سسٹم پر چلانا چاہتے ہیں قہوہ کو عام کنزیومر ہارڈویئر کے لیے آپٹیمائز کیا گیا ہے:
Unsloth انضمام: اس ماڈل کو Unsloth کا استعمال کرتے ہوئے چلایا جا سکتا ہے جو ایک مقبول اوپن سورس ٹول ہے اور LLMs کی فائن ٹیوننگ اور رننگ کو نمایاں طور پر تیز اور میموری کے لحاظ سے ہلکا بناتا ہے۔
BitsAndBytes (4-bit Quantization): 4-بٹ کوانٹائزیشن (ایک کمپریشن تکنیک) کا استعمال کرتے ہوئے ماڈل کا سائز نمایاں طور پر کم ہو جاتا ہے۔ یہ صارفین کو مہنگے انٹرپرائز لیول سرور ہارڈویئر کی ضرورت کے بغیر 7 بلین پیرامیٹر والے اس ماڈل کو عام گرافکس کارڈز (جیسے 8GB گیمنگ GPU) پر چلانے کی اجازت دیتا ہے۔
قہوہ کے لانچ کے ساتھ، پشتو بولنے والوں کے پاس بالآخر ایک ایسا اے آئی ٹول آ گیا ہے جو واضح طور پر ان کی زبان اور ثقافت کے لیے ڈیزائن کیا گیا ہے، جو پاکستان کے بڑھتے ہوئے اے آئی منظر نامے میں ایک اہم سنگ میل ہے۔
تازہ ترین خبریں اور بروقت اپڈیٹس حاصل کرنے کے لیے Urdu Khabar کا ہوم پیج ضرور وزٹ کریں۔
(FAQs)
قہوہ اے آئی (Qehwa AI) کیا ہے؟
قہوہ اے آئی دنیا کا پہلا لارج لینگویج ماڈل (LLM) اور چیٹ بوٹ ہے جو خاص طور پر پشتو زبان کے لیے بنایا گیا ہے۔ پاکستانی ڈیولپر جنید احمد کی جانب سے تیار کردہ، یہ پشاوری لہجے پر توجہ مرکوز کرتا ہے اور پشتو گرامر، ذخیرہ الفاظ اور ثقافتی باریکیوں کو درست طریقے سے سمجھنے کے لیے ڈیزائن کیا گیا ہے۔
قہوہ، ChatGPT جیسے عالمی اے آئی ماڈلز سے کیسے مختلف ہے؟
اگرچہ عالمی اے آئی ماڈلز بہت سی زبانوں کو سپورٹ کرتے ہیں، لیکن وہ اکثر پشتو جیسی علاقائی زبانوں کے ثقافتی پس منظر اور مقامی گرامر کو سمجھنے میں مشکلات کا شکار رہتے ہیں۔ قہوہ کو خاص طور پر 3.4 ملین پاکستانی پشتو دستاویزات پر ٹرین کیا گیا ہے، جس کی وجہ سے اس کے جوابات پشتو بولنے والوں کے لیے انتہائی درست اور ثقافتی لحاظ سے متعلقہ ہیں۔
کیا قہوہ دیگر زبانوں کا پشتو میں ترجمہ کر سکتا ہے؟
جی ہاں۔ قہوہ انگریزی، اردو اور پشتو میں یوزر پرامپٹس قبول کرتا ہے۔ یہ ترجمہ کرنے میں انتہائی ماہر ہے، اور اس نے بینچ مارک ٹیسٹ میں انگریزی سے پشتو ترجمے کے لیے 90% اور اردو سے پشتو ترجمے کے لیے 84% درستگی کی شرح حاصل کی ہے۔
کیا مجھے قہوہ اے آئی چلانے کے لیے سپر کمپیوٹر کی ضرورت ہے؟
نہیں۔ چونکہ ڈیولپر نے 4-bit quantization نامی کمپریشن تکنیک استعمال کی ہے، اس لیے ماڈل کا سائز کافی حد تک کم ہو گیا ہے۔ یہ ڈیولپرز اور ٹیکنالوجی کے شوقین افراد کو مہنگے ہارڈویئر کے بجائے عام گرافکس کارڈز (جیسے 8GB گیمنگ GPU) والے معیاری کمپیوٹرز پر قہوہ کو آسانی سے چلانے کی سہولت دیتا ہے۔
کیا قہوہ اے آئی استعمال کرنے کے لیے مفت ہے؟
جی ہاں، قہوہ کو مکمل طور پر ایک مفت اور اوپن سورس پروجیکٹ کے طور پر تیار کیا گیا ہے۔ محققین، طلباء اور ڈیولپرز بغیر کسی قیمت کے اس ماڈل تک رسائی حاصل کر سکتے ہیں، اس کے کوڈ کا جائزہ لے سکتے ہیں، اور اسے اپنی ایپلیکیشنز میں شامل کر سکتے ہیں۔






