شرکت OpenAI، تنها چند هفته پس از انتشار آخرین نسخه بزرگ خود، به سرعت در حال تغییر جهت ChatGPT، محصول شاخص خود، از یک نوآوری مصرفکننده به یک نیروی محرک ضروری برای شرکتها است.
معرفی GPT-5.2
روز پنجشنبه، این شرکت GPT-5.2 را منتشر کرد، یک مدل زبانی بزرگ جدید که ادعا میکند سریعتر، قابل اطمینانتر و برای رسیدگی به گردش کارهای حرفهای پیچیده طراحی شده است.
این بهروزرسانی نشان میدهد که OpenAI از کمک به انجام تکالیف و پرسشهای عمومی فراتر رفته و در عوض قصد دارد فناوری خود را به عنوان یک ابزار ضروری و روزانه در دنیای تجارت ادغام کند، همانطور که معاملات سودآور آن با دولت ایالات متحده و دیزنی گواه این امر است.
OpenAI در بیانیهای اعلام کرد: «ما GPT-5.2 را طوری طراحی کردیم که ارزش اقتصادی بیشتری را برای مردم آزاد کند. این مدل در ایجاد صفحات گسترده، ساخت ارائهها، نوشتن کد، درک تصاویر، درک زمینههای طولانی، استفاده از ابزارها و رسیدگی به پروژههای پیچیده و چند مرحلهای، عملکرد بهتری دارد.»
معیار ارزیابی جدید
این شرکت با تبلیغ عملکرد GPT-5.2، یک معیار ارزیابی اختصاصی به نام GDPval را معرفی کرد که وظایف را در 44 شغل شبیهسازی میکند.
این شرکت ادعا میکند که GPT-5.2 در حدود 71 درصد از مقایسهها با عملکرد کارگران انسانی برابری یا از آن فراتر رفته است.
فیدجی سیمو، مدیرعامل برنامههای OpenAI، در X نوشت: «در GDPval، این مدل فکری در 70.9 درصد از وظایف حرفهای رایج مانند صفحات گسترده، ارائهها و ایجاد اسناد، از متخصصان انسانی پیشی میگیرد یا با آنها برابر است. همچنین در هوش عمومی، نوشتن کد، فراخوانی ابزار، دید و درک زمینههای طولانی بهتر عمل میکند، بنابراین میتواند ارزش اقتصادی بیشتری را برای مردم آزاد کند.»
مشخص نیست که آیا این معیار مورد بررسی خارجی قرار گرفته است یا خیر، و این امر باعث شده است که کارشناسان صنعت منتظر تأیید مستقل این ادعاها باشند.
دسترسی و قیمتگذاری
GPT-5.2 روز پنجشنبه در سطوح اشتراک پولی در دسترس قرار گرفت و دسترسی به API نیز در همان روز باز شد. توسعهدهندگان اکنون میتوانند از بین سه نسخه مجزا انتخاب کنند که هر کدام برای نیازهای حرفهای مختلف بهینه شدهاند.
قیمتگذاری API برای هر میلیون توکن ورودی 1.75 دلار و برای هر میلیون توکن خروجی 14 دلار تعیین شده است.
بهبود عملکرد
علاوه بر معیار GDPval، GPT-5.2 عملکرد بهتری را در آزمونهای فنی تثبیتشده نشان داد و نمرات بالاتری را در GPQA Diamond و FrontierMath ثبت کرد. همچنین گزارش شده است که نتایج قابل اطمینانتری را در وظایف دشواری مانند کدنویسی، تجزیه و تحلیل دادهها و طراحی آزمایش نشان داده است.
این شرکت در این اطلاعیه، چندین اظهارنظر مثبت از آزمایشکنندگان اولیه ارائه کرد.
چشمانداز بازار کار
انتشار یک هوش مصنوعی تواناتر برای محیط کار در یک فضای کاری از قبل پرتنش صورت میگیرد.
به نظر میرسد مدیران شرکتها عمدتاً خوشبین هستند، به طوری که یک نظرسنجی اخیر Just Capital نشان میدهد که 93 درصد از رهبران کسبوکار، هوش مصنوعی را به عنوان یک نیروی مثبت میبینند. با این حال، همان مطالعه نشان داد که تقریباً نیمی از آمریکاییها انتظار دارند که این فناوری مشاغل را از بین ببرد، نگرانیای که مدیران ظاهراً کمتر با آن موافق هستند.
