GPT-6 احتمالا با حافظه بهتر و ادغام عمیق تر در ChatGPT توسعه می یابد

1 هفته پیش

زمان تقریبی مطالعه 2 دقیقه

GPT-6 احتمالا با حافظه بهتر و ادغام عمیق تر در ChatGPT توسعه می یابد

سم آلتمن Sam Altman مدیرعامل اوپن ای آی، با یک شوخی کوتاه درباره GPT-6 دوباره موجی از گمانه زنی درباره نسل بعدی مدلهای ChatGPT ایجاد کرد. او در جریان بحثی درباره رفتارهای عجیب Codex به آموزش GPT-6 با گابلین های بیشتر اشاره کرد، اما هیچ زمان عرضه، مشخصات فنی یا تایید رسمی برای مدل بعدی ارائه نداد.

به گزارش رسانه اخبار فناوری تکنا، زمینه این شوخی به ماجرای عجیبی برمی گردد که در روزهای اخیر پیرامون Codex شکل گرفت. کاربران متوجه شدند ابزار برنامه نویسی اوپن ای آی گاهی در پاسخهای فنی و کدنویسی، بی دلیل به گابلین ها و موجودات خیالی اشاره می کند. شرکت بعدا برای کاهش این رفتار، دستورهای محدود کننده ای به prompt توسعه دهنده اضافه کرد.

اوپن ای آی در توضیح رسمی خود اعلام کرد ریشه این رفتار از GPT-5.1 آغاز شده و با نسلهای بعدی شدت گرفته است. طبق این توضیح، یک سیگنال پاداش مربوط به شخصیت Nerdy به طور ناخواسته خروجیهایی را که از استعاره های موجودات خیالی استفاده می کردند مطلوب تر ارزیابی کرده و همین الگو در مدلها گسترش یافته است.

اعداد منتشر شده نشان می دهند این مسئله فقط یک شوخی اینترنتی نبود. پس از عرضه GPT-5.1، استفاده از واژه گابلین در پاسخهای ChatGPT حدود ۱۷۵ درصد و استفاده از گرملین ۵۲ درصد افزایش یافت. در عین حال، شخصیت Nerdy فقط ۲.۵ درصد پاسخهای ChatGPT را تشکیل می داد، اما ۶۶.۷ درصد اشاره ها به گابلین از همان مسیر آمده بود.

تحلیل داخلی اوپن ای آی نشان داد پاداشهای مرتبط با Nerdy در ۷۶.۲ درصد مجموعه داده های بررسی شده، خروجیهای دارای واژه های گابلین یا گرملین را بالاتر از خروجیهای مشابه بدون این واژه ها امتیاز داده اند. این یعنی آموزش تقویتی می تواند یک عادت زبانی کوچک را از یک حالت شخصیتی به بخشهای دیگر رفتار مدل منتقل کند.

مشکل در GPT-5.5 نیز باقی ماند، چون آموزش این مدل پیش از شناسایی کامل علت آغاز شده بود. اوپن ای آی می گوید شخصیت Nerdy را در مارس بازنشسته کرده، سیگنال پاداش مرتبط را حذف کرده و داده های آموزشی دارای واژه های موجودات خیالی را پالایش کرده است. با این حال، Codex برای مهار رفتار ناخواسته به دستورهای اضافی نیاز پیدا کرد.

اشاره آلتمن به GPT-6 را باید در همین بستر خواند. این جمله بیشتر یک شوخی عمومی درباره رفتار عجیب مدلها بود تا معرفی رسمی محصول، اما چون مستقیما نام GPT-6 را وارد بحث کرد، به عنوان نشانه ای از توسعه نسل بعدی تعبیر شد. خود آلتمن توضیحی درباره قابلیت، معماری یا زمان عرضه این مدل نداده است.

انتظارهای فعلی درباره GPT-6 بیشتر حول حافظه بهتر، تعامل پیوسته تر، رفتار پایدارتر و ادغام عمیق تر با فایلها، اپلیکیشنها و ابزارهای کاری شکل گرفته است. مسیر فعلی ChatGPT نیز به همین سمت حرکت می کند؛ یعنی کاربر به جای باز کردن یک ابزار جداگانه برای هر وظیفه، با دستیار ماندگارتری روبه رو می شود که زمینه کاری او را بهتر حفظ می کند.

عرضه GPT-5.5 هم نشان می دهد اوپن ای آی به مدلهای عامل محور و مناسب کار حرفه ای فشار بیشتری وارد کرده است. این مدل برای کاربران Plus، Pro، Business و Enterprise در ChatGPT و Codex عرضه شده و در Codex با پنجره زمینه ۴۰۰ هزار توکنی در دسترس قرار گرفته است. نسخه API نیز با شرایط حفاظتی جداگانه برنامه ریزی شده است.

اهمیت واقعی ماجرای گابلین ها در این است که نشان می دهد رفتار مدلهای بزرگ فقط با توان خام سنجیده نمی شود. یک سیگنال پاداش کوچک می تواند در طول آموزش به عادت رفتاری گسترده تبدیل شود. بنابراین GPT-6 اگر در راه باشد، فقط باید قدرتمندتر نباشد؛ باید قابل کنترل تر، قابل پیش بینی تر و شفاف تر هم باشد.

1 هفته پیش

زمان تقریبی مطالعه 2 دقیقه

مشاهده بیشتر