نام کاربری یا نشانی ایمیل
رمز عبور
مرا به خاطر بسپار
به گزارش پایگاه خبری پیام خلیج فارس، «اوپنایآی»(OpenAI) در حال حاضر مدلهای «GPT-4.1»، «GPT-4.1 mini» و «GPT-4.1 nano» را دارد که برتری خود را در کدنویسی و دنبال کردن دستورالعملها نشان دادهاند. مدلهای چندوجهی که از طریق API اوپنایآی در دسترس هستند، میتوانند هر بار تقریبا یک میلیون توکن (۷۵۰ هزار کلمه) را دریافت کنند. این میزان کلمه، یک متن طولانیتر از رمان «جنگ و صلح» را تشکیل میدهد.
به نقل از تک کرانچ، GPT-4.1 زمانی وارد شده است که رقبای اوپنایآی مانند «گوگل» و «آنتروپیک» تلاشهای خود را برای ساخت مدلهای برنامهنویسی پیچیده افزایش میدهند. «جمینای ۲.۵ پرو»(Gemini 2.5 Pro) که اخیرا توسط گوگل منتشر شد و یک میلیون توکن را پوشش میدهد، رتبه بالایی را در معیارهای محبوب کدنویسی دارد. «کلود ۳.۷ سونت»(Claude 3.7 Sonnet) و «V3» ارتقاءیافته شرکت چینی «دیپسیک»(DeepSeek) نیز همین طور هستند.
هدف بسیاری از غولهای فناوری از جمله اوپنایآی، آموزش دادن مدلهای کدنویسی هوش مصنوعی است که میتوانند وظایف پیچیده مهندسی نرمافزار را انجام دهند. «سارا فریار»(Sarah Friar)، مدیر ارشد مالی اوپنایآی ماه گذشته در نشست فناوری لندن گفت که جاهطلبی بزرگ این شرکت، ایجاد یک مهندس نرمافزار عاملی است. این شرکت ادعا میکند که مدلهای آینده آن میتوانند همه برنامهها را به صورت سرتاسری برنامهریزی کنند و بر جنبههایی مانند تضمین کیفیت، آزمایش مشکل و نوشتن مستندات مدیریت داشته باشند.
مدل GPT-4.1 گامی در این مسیر است. یکی از سخنگویان اوپنایآی در یک ایمیل به تک کرانچ، گفت: ما GPT-4.1 را برای استفاده در دنیای واقعی بر اساس بازخورد مستقیم تنظیم کردهایم تا در زمینههایی که توسعهدهندگان بیشتر به آنها اهمیت میدهند مانند برنامهنویسی فرانتاند، کاهش ویرایشهای اضافی، فرمتهای قابل اعتماد، رعایت ساختار پاسخ و سفارش، استفاده ثابت از فناوری و موارد دیگر بهبود پیدا کنیم. این پیشرفتها توسعهدهندگان را قادر میسازند تا عواملی را ارائه دهند که در کارهای مهندسی نرمافزار در دنیای واقعی به طور قابل توجهی بهتر باشند.
اوپنایآی ادعا میکند که مدل کامل GPT-4.1 از مدلهای GPT-4o و GPT-4o mini در معیارهای کدنویسی مانند «SWE-bench» بهتر عمل میکند. گفته میشود که GPT-4.1 mini و nano با کمی دقت، کارآمدتر و سریعتر عمل میکنند و GPT-4.1 nano سریعترین و ارزانترین مدل آن است.
مدل GPT-4.1 برای هر میلیون توکن ورودی، دو دلار و برای هر میلیون توکن خروجی، هشت دلار هزینه دارد. هزینه GPT-4.1 mini برای هر میلیون توکن ورودی ۰.۴۰ دلار و برای میلیون توکن خروجی ۱.۶۰ دلار است و GPT-4.1 nano برای هر میلیون توکن ورودی ۰.۱۰ دلار و برای هر میلیون توکن خروجی ۰.۴۰ دلار هزینه دارد.
آزمایش داخلی اوپنایآی نشان میدهد GPT-4.1 که میتواند همزمان توکنهای بیشتری را نسبت به GPT-4o تولید کند (۳۲۷۶۸ در مقابل ۱۶۳۸۴)، امتیازی بین ۵۲ تا ۵۴.۶ درصد در پایگاه داده «SWE-bench Verified» کسب کرده است. اوپنایآی در یک پست وبلاگ خاطرنشان کرد که برخی از راهحلها برای مشکلات SWE-bench Verified را نمیتوان در زیرساختهای آن اجرا کرد و به همین دلیل، این دامنه امتیازها وجود دارند. این ارقام کمی کمتر از امتیازات گزارششده توسط گوگل و آنتروپیک برای جمینای ۲.۵ پرو (۶۳.۸ درصد) و کلود ۳.۷ سونت (۶۲.۳ درصد) هستند.
اوپنایآی در یک ارزیابی جداگانه، GPT-4.1 را با استفاده از «Video-MME» بررسی کرد که برای ارزیابی توانایی یک مدل در درک محتوای ویدئوها طراحی شده است. اوپنایآی ادعا میکند که GPT-4.1 به دقت ۷۲ درصدی در مقوله ویدئوهای طولانی و بدون زیرنویس رسیده است.
اگرچه GPT-4.1 امتیاز قابل قبولی را در معیارها کسب کرده و دارای یک رکورد جدیدتر در آموزش داده است، اما به خاطر داشته باشید حتی برخی از بهترین مدلهای امروزی در حال دستوپنجه نرم کردن با وظایفی هستند که متخصصان را غافلگیر نمیکنند. به عنوان مثال، بسیاری از پژوهشها نشان دادهاند که مدلهای تولیدکننده کد اغلب در رفع و حتی معرفی آسیبپذیریها و مشکلات امنیتی شکست میخورند.
همچنین، اوپنایآی تصدیق میکند که GPT-4.1 هر چه توکنهای ورودی بیشتری داشته باشد، کمتر قابل اعتماد میشود؛ یعنی احتمال بروز اشتباه افزایش مییابد. در یکی از آزمایشهای خود اوپنایآی موسوم به «OpenAI-MRCR»، دقت مدل از حدود ۸۴ درصد با ۸۰۰۰ توکن به ۵۰ درصد با یک میلیون توکن کاهش یافت. اوپنایآی میگوید که GPT-4.1 نسبت به GPT-4o به معنای واقعی کلمه دقیقتر است و گاهی اوقات به درخواستهای مشخصتر و واضحتر نیاز دارد.
بازار ارز و طلا در میانه هفته در وضعیت آرام اما حساس قرار دارد. دلار در محدوده ۱۰۷ تا ۱۰۸ هزار تومان نوسان میکند و معاملهگران میگویند هر تغییر در سیگنالهای سیاسی یا تورمی میتواند جرقهی موج جدیدی از نوسان را روشن کند.
مهلت ارائه اظهارنامه مالیات بر ارزشافزوده رو به پایان است و مؤدیان برای ثبت اطلاعات خود فرصت محدودی دارند.
سازمان هواشناسی اعلامکرد: امروز (سهشنبه) در نیمه شرقی کشور به ویژه شرق و شمال شرق کاهش نسبی دما رخ خواهد داد و پس از آن تا پایان هفته روند افزایشی خواهد داشت.
بازار مسکن همچنان در روند رکودی قرار دارد و بسیاری از واحدهای عرضهشده هنوز فروش نرفتهاند؛ قیمتهای بالا و موقعیت نامناسب برخی املاک، خریداران مصرفی را برای ورود به معاملات، ترغیب نمیکند. منصور غیبی، کارشناس بازار مسکن گفته است که مراجعه متقاضیان خرید و فروش مسکن به دفاتر مشاوران املاک اندکی افزایش یافته اما فروشندگان نیز همچنان مردد هستند و اقدامی جدی برای فروش ملک خود نکردهاند. او معتقد است که تعداد فایلهای موثر، مناسب و قابل اعتماد ملکی در مناطق مختلف، اندک است.