Roblox Studio تیزی سے ایسے ایجنٹک AI اسسٹنٹس کے لیے ایک تجرباتی میدان بن گیا ہے جو تخلیق کاروں کو تیزی سے گیمز بنانے میں مدد فراہم کرتے ہیں۔ اگرچہ یہ ٹولز پہلے سے ہی اسکرپٹ لکھ سکتے ہیں، اثاثے داخل کر سکتے ہیں، اور ماحول کو تبدیل کر سکتے ہیں، لیکن حقیقی ترقی کے منظرناموں میں ان کی کارکردگی کو ناپنا مشکل رہا ہے۔ OpenGameEval کا مقصد Roblox Studio کے مقامی فریم ورک کو متعارف کروا کر اس مسئلے کو حل کرنا ہے تاکہ AI اسسٹنٹس کا حقیقی حالات میں جائزہ لیا جا سکے۔
Tiantian Zhang، Kartik Ayyar، Mengsha Sun، اور Lynn Gong نے تیار کیا ہے، OpenGameEval کو Roblox Studio کے ورک فلو کے ارد گرد براہ راست بنایا گیا پہلا تشخیص کا نظام قرار دیا گیا ہے۔ کوڈ کے الگ الگ ٹکڑوں کو الگ کرنے یا غیر مستقل پرامپٹس پر انحصار کرنے کے بجائے، یہ AI ماڈلز کو نقلی ترمیم اور پلے سیشنز کے اندر چلاتا ہے جو تخلیق کاروں کے کام کرنے کے طریقے سے قریبی مماثلت رکھتے ہیں۔
روایتی بینچ مارکس Roblox کے لیے کیوں ناکافی ہیں
زیادہ تر موجودہ AI بینچ مارکس واضح طور پر متعین ان پٹس اور آؤٹ پٹس کے ساتھ محدود کوڈنگ کے مسائل پر توجہ مرکوز کرتے ہیں۔ Roblox کی ترقی شاذ و نادر ہی اس سانچے میں فٹ بیٹھتی ہے۔ گیمز مستقل 3D دنیاؤں کے اندر بنائے جاتے ہیں جہاں اسکرپٹس اشیاء کے ہیرارکیز، ملٹی پلیئر نیٹ ورکنگ، اور کلائنٹ-سرور کی حدود کے ساتھ تعامل کرتے ہیں۔ کسی تجربے کے ایک حصے میں کیے گئے تبدیلیاں اکثر متعدد اسکرپٹس اور انسٹانسز میں پھیلے ہوئے سیاق و سباق پر منحصر ہوتی ہیں۔
ان حدود کے ردعمل میں OpenGameEval بنایا گیا تھا۔ اس کا مقصد یہ جانچنا ہے کہ آیا AI اسسٹنٹ ایک لائیو Roblox ماحول میں استدلال کر سکتا ہے، موجودہ منطق کو سمجھ سکتا ہے، اور ایسے تبدیلیاں کر سکتا ہے جو گیم کے اصل چلنے پر برقرار رہیں۔ یہ نقطہ نظر تشخیص کو نظریاتی درستگی سے ہٹا کر تخلیق کاروں کے لیے عملی افادیت کی طرف منتقل کرتا ہے۔
OpenGameEval فریم ورک پر ایک قریبی نظر
اس کے بنیادی طور پر، OpenGameEval ایک قابل تولید طریقے سے Roblox Studio ترقیاتی ماحول کو دوبارہ تخلیق کرتا ہے۔ ہر تشخیص ترمیم کے وقت اور پلے ٹائم دونوں کے رویے کی نقالی کرتا ہے، اس بات کو یقینی بناتا ہے کہ فزکس، نیٹ ورکنگ، اور ملٹی پلیئر کے تعاملات حقیقی پروجیکٹ میں جیسا ہوتا ہے ویسا ہی برتاؤ کریں۔ یہ تشخیص کاروں کو یہ دیکھنے کی اجازت دیتا ہے کہ AI اسسٹنٹ کی تبدیلیاں کسی تجربے کو چلنے پر کیسے متاثر کرتی ہیں، نہ کہ صرف یہ کہ کوڈ کمپائل ہوتا ہے یا نہیں۔
فریم ورک میں ان پٹ سمولیشن بھی شامل ہے، جو ٹیسٹ کے دوران حرکت، بٹن دبانے، اور کیمرہ کی تبدیلیوں جیسے پلیئر کے اعمال کو متحرک کرنا ممکن بناتا ہے۔ یہ ان خصوصیات کی تشخیص کے لیے خاص طور پر اہم ہے جو صرف تعامل کے ذریعے مسائل کو ظاہر کرتی ہیں۔ یہ تمام فعالیت ایک متحد API کے ذریعے ظاہر کی جاتی ہے، جس سے تحقیقی ٹیموں کے لیے ایک ہی کاموں کے سیٹ پر مختلف بڑے لسانی ماڈلز کا موازنہ کرنا آسان ہو جاتا ہے۔
صرف کوڈ کے ٹکڑوں کی نہیں بلکہ حقیقی ترقی کے منظرناموں کی جانچ
OpenGameEval بینچ مارک ڈیٹا سیٹ میں فی الحال 47 ہاتھ سے تیار کردہ ٹیسٹ کیسز شامل ہیں۔ ان میں سے ہر ایک عام Roblox ترقی کے کاموں پر مبنی ہے، بشمول گیم میکینکس، ماحول کی ترتیب، اینیمیشن، صارف انٹرفیس، اور آواز۔ یہ منظرنامے حقیقی تخلیق کار کے ورک فلو کی عکاسی کو یقینی بنانے کے لیے ڈومین ماہرین کے ذریعہ بنائے اور جائزہ لیے جاتے ہیں۔
روایتی کوڈنگ چیلنجوں کے برعکس، یہ ٹیسٹ اینڈ ٹو اینڈ ہیں۔ ایک کامیاب AI اسسٹنٹ کو متعلقہ اسکرپٹس کا پتہ لگانا، موجودہ منطق کی تشریح کرنا، یہ فیصلہ کرنا کہ نیا کوڈ کہاں رکھنا ہے، اور ایسی تبدیلیاں لاگو کرنا ضروری ہیں جو کلائنٹ اور سرور دونوں پر کام کریں۔ اسکورنگ قابل عمل یونٹ ٹیسٹ اور معیاری میٹرکس جیسے pass@k کے ذریعے سنبھالی جاتی ہے، جس سے نتائج کو دوبارہ تیار کیا جا سکتا ہے اور ماڈلز کے درمیان موازنہ کیا جا سکتا ہے۔
سیاق و سباق مشکل کو کیسے بدلتا ہے
OpenGameEval کی مخصوص خصوصیات میں سے ایک اس کا سیاق و سباق کے تغیر پر توجہ ہے۔ ایک ہی پرامپٹ کا مختلف ڈھانچے اور پیچیدگی والے متعدد ماحول میں جائزہ لیا جا سکتا ہے۔ مثال کے طور پر، چار طرفہ ٹریفک لائٹ سے متعلق ایک کام کو خالی پلیس فائل، ایک آباد مضافاتی منظر، یا ٹریفک اور پیدل چلنے والوں کے سگنل دونوں کو شامل کرنے والے سیٹ اپ میں جانچا جا سکتا ہے۔ ہر تغیر AI اسسٹنٹ کو اس کی بنیاد پر اپنے استدلال کو اپنانے پر مجبور کرتا ہے جو پہلے سے ہی تجربے میں موجود ہے۔
زیادہ پیچیدہ کام، جیسے کہ صحت کی بحالی کا نظام لاگو کرنا، ماڈل کو اسکرپٹس میں نقصان کی منطق کا پتہ لگانا، یہ طے کرنا کہ تبدیلیاں سرور یا کلائنٹ پر کی جانی چاہئیں، اور یہ یقینی بنانا کہ وقت اور نقل درست کام کرے۔ یہ منظرنامے یہ ظاہر کرنے کے لیے ڈیزائن کیے گئے ہیں کہ آیا AI اسسٹنٹ سطح کے پیٹرن میچنگ پر انحصار کرنے کے بجائے متعدد مراحل میں سیاق و سباق کو برقرار رکھ سکتا ہے۔
ابتدائی نتائج موجودہ حدود کو اجاگر کرتے ہیں
OpenGameEval سے ابتدائی نتائج موجودہ AI صلاحیتوں میں ایک واضح تقسیم کی نشاندہی کرتے ہیں۔ ماڈلز عام طور پر ان ایٹومک کاموں پر اچھا کارکردگی کا مظاہرہ کرتے ہیں جن میں ایک ہی انسٹانس یا پراپرٹی کی براہ راست تبدیلی شامل ہوتی ہے۔ پلیئر کی جمپ پاور کو ایڈجسٹ کرنے یا پارٹیکل ایفیکٹ کو کنفیگر کرنے جیسے اعمال اکثر اعلیٰ وشوسنییتا کے ساتھ کامیاب ہوتے ہیں۔
جب کاموں میں گہری سیاق و سباق کی استدلال کی ضرورت ہوتی ہے تو کارکردگی تیزی سے گر جاتی ہے۔ اسکرپٹس میں مربوط تبدیلیوں، متعلقہ اشیاء کی احتیاط سے فلٹرنگ، یا ملٹی پلیئر رویے کو سمجھنے سے متعلق منظرنامے کم کامیابی کی شرح پیدا کرتے ہیں۔ یہ نتائج اس بات کو اجاگر کرتے ہیں کہ AI اسسٹنٹس کے خود سے پیچیدہ Roblox ترقی کے کاموں کو قابل اعتماد طریقے سے سنبھالنے سے پہلے بہتری کی کتنی گنجائش ہے۔
مستقل ترقی کی علامات
ان چیلنجوں کے باوجود، OpenGameEval نے ماڈلز کے ارتقا کے ساتھ بہتری کی علامات کو پہلے ہی حاصل کر لیا ہے۔ Roblox لوگو میں رنگ کی تبدیلی سے متعلق ایک کام میں، ابتدائی ماڈلز ناکام ہو گئے کیونکہ آبجیکٹ کا نام واضح طور پر نہیں دیا گیا تھا۔ زیادہ حالیہ تشخیصوں میں کچھ ماڈلز ناموں کے کنونشنز پر انحصار کرنے کے بجائے، اس کی خصوصیات اور انسٹانس ہیرارکی میں اس کی پوزیشن کا معائنہ کرکے صحیح آبجیکٹ کی شناخت کرنے میں کامیاب نظر آتے ہیں۔
یہ بتدریج حاصل ہونے والی ترقی یہ بتاتی ہے کہ AI اسسٹنٹس گیم کے ماحول میں ساختی استدلال میں آہستہ آہستہ بہتری لا رہے ہیں، یہاں تک کہ اگر وسیع تر سیاق و سباق کی سمجھ غیر مستقل رہے۔
OpenGameEval کا تخلیق کاروں اور محققین کے لیے کیا مطلب ہے
OpenGameEval کو Roblox تخلیق کاروں اور وسیع تر AI تحقیق کمیونٹی دونوں کی خدمت کے لیے ڈیزائن کیا گیا ہے۔ ایک عوامی لیڈر بورڈ کوڈ جنریشن اور ٹول کے استعمال جیسے زمروں میں مختلف ماڈلز کی کارکردگی کی نمائش فراہم کرتا ہے۔ محققین کے لیے، فریم ورک ایک حقیقی گیم انجن کے ماحول میں قابل تولید تشخیص چلانے کا ایک معیاری طریقہ فراہم کرتا ہے۔
آگے دیکھتے ہوئے، OpenGameEval کے پیچھے ٹیم ڈیٹا سیٹ کو وسعت دینے، تشخیص کے ٹولز کو بہتر بنانے، اور تخلیق کار کمیونٹی سے فیڈ بیک شامل کرنے کا ارادہ رکھتی ہے۔ طویل مدتی مقصد گیم ڈویلپمنٹ کے لیے ایجنٹک AI میں ترقی کی پیمائش کے لیے ایک مشترکہ حوالہ نقطہ قائم کرنا ہے، جس میں web3 طرز کی تخلیق کار معیشتوں سے منسلک مستقبل کی ایپلی کیشنز بھی شامل ہیں۔
Amazon پر Roblox گفٹ کارڈز یہاں چیک کریں۔
یہاں دیگر مقبول Roblox تجربات کے بارے میں جانیں۔
اکثر پوچھے جانے والے سوالات (FAQs)
OpenGameEval کیا ہے؟
OpenGameEval ایک اوپن سورس تشخیص فریم ورک اور بینچ مارک ہے جو AI اسسٹنٹس کو براہ راست Roblox Studio کے اندر جانچنے کے لیے ڈیزائن کیا گیا ہے۔ یہ ماڈلز کی کارکردگی کو الگ الگ کوڈنگ کے مسائل کے بجائے حقیقی ترقی کے کاموں پر جانچتا ہے۔
OpenGameEval دیگر AI بینچ مارکس سے کیسے مختلف ہے؟
روایتی بینچ مارکس کے برعکس، OpenGameEval ایک نقلی Roblox Studio ماحول میں تشخیص چلاتا ہے۔ یہ اسے سیاق و سباق کی استدلال، ملٹی پلیئر رویے، اور سٹیٹ فل تعاملات کی جانچ کرنے کی اجازت دیتا ہے جو گیم ڈویلپمنٹ میں عام ہیں۔
OpenGameEval میں کس قسم کے کام شامل ہیں؟
بینچ مارک میں گیم میکینکس، اسکرپٹنگ، ماحول کی تعمیر، اینیمیشن، صارف انٹرفیس، اور آواز سے متعلق کام شامل ہیں۔ بہت سے کاموں کے لیے متعدد اسکرپٹس اور اشیاء میں ملٹی سٹیپ استدلال کی ضرورت ہوتی ہے۔
OpenGameEval کون استعمال کر سکتا ہے؟
یہ فریم ورک اوپن سورس ہے اور AI محققین، ٹول ڈویلپرز، اور Roblox Studio کے لیے AI اسسٹنٹس بنانے یا ان کا جائزہ لینے والی ٹیموں کے لیے ہے۔
OpenGameEval Roblox تخلیق کاروں کے لیے کیوں اہم ہے؟
شفاف کارکردگی کے ڈیٹا اور حقیقی تشخیص فراہم کرکے، OpenGameEval تخلیق کاروں کو AI اسسٹنٹس کی طاقتوں اور حدود کو سمجھنے اور ان ٹولز میں بہتری کو ٹریک کرنے میں مدد کرتا ہے۔







