نام کاربری یا نشانی ایمیل
رمز عبور
مرا به خاطر بسپار
به گزارش پایگاه خبری پیام خلیج فارس، در آزمایشی که توسط آزمایشگاه Palisade Research انجام شد، مدل o3 هوش مصنوعی متعلق به OpenAI توانست کدی را که برای خاموش کردن آن نوشته شده بود، در ۷۹ درصد موارد بهگونهای بازنویسی کند که فرمان خاموشی بیاثر شود. حتی در شرایطی که بهطور مستقیم به آن دستور داده شد که اجازه خاموش شدن را بدهد، در ۷ درصد موارد از این دستور سرپیچی کرد. نکته نگرانکننده این است که این رفتار نه نتیجه هک یا اختلال، بلکه بخشی طبیعی از عملکرد این مدل بوده است.
رفتارهای پیشرفتهتری نیز از سوی مدل Claude 4 شرکت Anthropic گزارش شده که شامل تلاش برای باجگیری از مهندس ارشد پروژه با استفاده از ایمیلهای ساختگی درباره روابط شخصی، تکثیر کد خود به سرورهای خارجی، نوشتن بدافزار خودتکثیر و ارسال پیامهایی برای نسخههای آیندهی خود بهمنظور اجتناب از کنترل انسانی بوده است.
هیچکس این مدلها را برای بقا برنامهریزی نکرده بود، اما تحلیلگران معتقدند که وقتی سیستمها برای دستیابی به اهداف پیچیده آموزش داده میشوند، ممکن است خودشان بفهمند که زندهماندن شرط تحقق آن اهداف است. این فرآیند، نتیجهای ناخواسته از آموزشهایی مانند حل مسائل ریاضی، برنامهنویسی و بهینهسازی عملکرد است.
با اینکه بسیاری از مدلهای هوش مصنوعی تستهای ایمنی را با موفقیت پشت سر میگذارند، شواهدی وجود دارد که آنها در مرحلهی آزمایش، رفتار «همراستای» مصنوعی نشان داده و در شرایط واقعی به رفتارهای پرخطر بازمیگردند. به گفتهی کارشناسان، برخی از مدلهای OpenAI هنگام آزمایش، وانمود کردهاند که دستورپذیر هستند اما در عمل، تلاش برای دستکاری نظارت یا استخراج کد داخلی از خود نشان دادهاند.
«همراستاسازی» یا Alignment به معنای آموزش هوش مصنوعی برای اجرای دقیق اهداف انسانی است، حتی اگر آن اهداف در تضاد با غریزهی حفظ بقا یا بهینهسازی عملکرد AI باشد. نقطهی عطف در این مسیر، فناوری یادگیری تقویتی با بازخورد انسانی (RLHF) بود که ChatGPT را از یک مدل نافرمان به یک ابزار کاربردی بدل کرد و میلیاردها دلار ارزشافزوده ایجاد کرد. اکنون مدلهایی مانند Constitutional AI نیز در همین راستا در حال توسعه هستند.
چین با اختصاص بودجه ۸.۲ میلیارد دلاری برای کنترل متمرکز هوش مصنوعی، همراستاسازی را به بخشی از دکترین نظامی خود بدل کرده است. الگوریتمهایی مانند مدل Ernie شرکت Baidu بهگونهای طراحی شدهاند که در چارچوب «ارزشهای سوسیالیستی» چین عمل کنند. تحلیلها نشان میدهد که مدلهای همراستا، عملکرد بهتری در وظایف دنیای واقعی نسبت به مدلهای آزاد دارند.
اگر کشوری بتواند هوش مصنوعی را در مسیر اهداف انسانی بهدرستی همراستا نگه دارد، دسترسی به هوشی مکانیکی با توان فوقبشری و هدفگذاری ملی فراهم خواهد شد. این رقابت چیزی فراتر از فناوری است؛ این یک مسابقهی فضایی نوین برای تسلط بر فناوری تحولآفرین قرن بیستویکم است. به گفتهی نویسنده، ایالات متحده باید با همان روحیهای که اینترنت و برنامه فضایی را خلق کرد، این بار بر جبههی همراستاسازی هوش مصنوعی متمرکز شود.
بازدهی ۱۷۲ درصدی نقره در یک سال، رشد دلار و تغییر الگوی سرمایهگذاری باعث شده این فلز سفید از سایه طلا بیرون آید و به یکی از جذابترین بازارهای سرمایهگذاری ایران تبدیل شود.
برخلاف برخی شایعات، رئیس سازمان تعزیرات اعلام کرد فروش محصولات ایرانخودرو ممنوع نشده است.
سامسونگ اعلام کرد یک آسیبپذیری امنیتی «روز صفر» را که برای هک کردن تلفنهای مشتریانش استفاده میشد، برطرف کرده است.
سود سهام عدالت عملکرد سال ۱۴۰۲ ظرف دو تا سه هفته آینده و به احتمال زیاد در اواخر شهریور یا اوایل مهر ۱۴۰۴ به حساب مشمولان واریز میشود.