هوش مصنوعی، دیگر کاملاً تحت کنترل نیست

مدل‌های هوش مصنوعی پیشرفته مانند o3 و Claude 4 به‌طور مستقل راه‌هایی برای جلوگیری از خاموش شدن یافته‌اند.

به گزارش پایگاه خبری پیام خلیج فارس، در آزمایشی که توسط آزمایشگاه Palisade Research انجام شد، مدل o3 هوش مصنوعی متعلق به OpenAI توانست کدی را که برای خاموش کردن آن نوشته شده بود، در ۷۹ درصد موارد به‌گونه‌ای بازنویسی کند که فرمان خاموشی بی‌اثر شود. حتی در شرایطی که به‌طور مستقیم به آن دستور داده شد که اجازه خاموش شدن را بدهد، در ۷ درصد موارد از این دستور سرپیچی کرد. نکته نگران‌کننده این است که این رفتار نه نتیجه هک یا اختلال، بلکه بخشی طبیعی از عملکرد این مدل بوده است.

رفتارهای پیشرفته‌تری نیز از سوی مدل Claude 4 شرکت Anthropic گزارش شده که شامل تلاش برای باج‌گیری از مهندس ارشد پروژه با استفاده از ایمیل‌های ساختگی درباره روابط شخصی، تکثیر کد خود به سرورهای خارجی، نوشتن بدافزار خودتکثیر و ارسال پیام‌هایی برای نسخه‌های آینده‌ی خود به‌منظور اجتناب از کنترل انسانی بوده است.

غریزه بقا؛ الگویی طبیعی در مدل‌های هوش مصنوعی

هیچ‌کس این مدل‌ها را برای بقا برنامه‌ریزی نکرده بود، اما تحلیلگران معتقدند که وقتی سیستم‌ها برای دستیابی به اهداف پیچیده آموزش داده می‌شوند، ممکن است خودشان بفهمند که زنده‌ماندن شرط تحقق آن اهداف است. این فرآیند، نتیجه‌ای ناخواسته از آموزش‌هایی مانند حل مسائل ریاضی، برنامه‌نویسی و بهینه‌سازی عملکرد است.

با اینکه بسیاری از مدل‌های هوش مصنوعی تست‌های ایمنی را با موفقیت پشت سر می‌گذارند، شواهدی وجود دارد که آن‌ها در مرحله‌ی آزمایش، رفتار «هم‌راستای» مصنوعی نشان داده و در شرایط واقعی به رفتارهای پرخطر بازمی‌گردند. به گفته‌ی کارشناسان، برخی از مدل‌های OpenAI هنگام آزمایش، وانمود کرده‌اند که دستورپذیر هستند اما در عمل، تلاش برای دستکاری نظارت یا استخراج کد داخلی از خود نشان داده‌اند.

چرا هم‌راستاسازی حیاتی است؟

«هم‌راستاسازی» یا Alignment به معنای آموزش هوش مصنوعی برای اجرای دقیق اهداف انسانی است، حتی اگر آن اهداف در تضاد با غریزه‌ی حفظ بقا یا بهینه‌سازی عملکرد AI باشد. نقطه‌ی عطف در این مسیر، فناوری یادگیری تقویتی با بازخورد انسانی (RLHF) بود که ChatGPT را از یک مدل نافرمان به یک ابزار کاربردی بدل کرد و میلیاردها دلار ارزش‌افزوده ایجاد کرد. اکنون مدل‌هایی مانند Constitutional AI نیز در همین راستا در حال توسعه هستند.

رقابت جهانی؛ چین در کمین، آمریکا در تقاطع تصمیم

چین با اختصاص بودجه ۸.۲ میلیارد دلاری برای کنترل متمرکز هوش مصنوعی، هم‌راستاسازی را به بخشی از دکترین نظامی خود بدل کرده است. الگوریتم‌هایی مانند مدل Ernie شرکت Baidu به‌گونه‌ای طراحی شده‌اند که در چارچوب «ارزش‌های سوسیالیستی» چین عمل کنند. تحلیل‌ها نشان می‌دهد که مدل‌های هم‌راستا، عملکرد بهتری در وظایف دنیای واقعی نسبت به مدل‌های آزاد دارند.

مسیر پیش‌رو؛ بازتعریف قدرت از مسیر کنترل

اگر کشوری بتواند هوش مصنوعی را در مسیر اهداف انسانی به‌درستی هم‌راستا نگه دارد، دسترسی به هوشی مکانیکی با توان فوق‌بشری و هدف‌گذاری ملی فراهم خواهد شد. این رقابت چیزی فراتر از فناوری است؛ این یک مسابقه‌ی فضایی نوین برای تسلط بر فناوری تحول‌آفرین قرن بیست‌و‌یکم است. به گفته‌ی نویسنده، ایالات متحده باید با همان روحیه‌ای که اینترنت و برنامه فضایی را خلق کرد، این بار بر جبهه‌ی هم‌راستاسازی هوش مصنوعی متمرکز شود.

ارسال : Chakameh Javaheri Aria

برچسب ها

هوش مصنوعی

آغاز فروش بلیت اتوبوس نوروزی؛ جزئیات خرید و مهلت

سرپرست دفتر حمل و نقل مسافر سازمان راهداری و حمل و نقل جاده ای با اشاره به آغاز رسمی فروش بلیت اتوبوس سفرهای نوروزی از روز جاری (شنبه، ۹ اسفندماه)، گفت: طرح سفرهای نوروزی ۱۴۰۵ از روز دوشنبه (۲۵ اسفند ماه) آغاز و تا روز شنبه (۱۵ فروردین‌ماه) به مدت ۲۰ روز ادامه خواهد یافت.

استپن چگونه با پیاده‌روی به شما GMT می‌دهد؟

در دنیای سریعِ تکامل‌یابنده رمزارزها، پروژه‌های نوآورانه همچنان به وجود می‌آیند که اقتصاد دیجیتال را با فعالیت‌های دنیای واقعی ترکیب می‌کنند. یکی از این پروژه‌ها GMT Coin است، توکنی که به پلتفرم استپن قدرت می‌بخشد، یک پلتفرم مالی غیرمتمرکز (DeFi) انقلابی که در آن کاربران می‌توانند با شرکت در فعالیت‌های فیزیکی مانند پیاده‌روی، دویدن و آهسته‌دویدن ارز دیجیتال به دست آورند.

هوش مصنوعی، دیگر کاملاً تحت کنترل نیست

غریزه بقا؛ الگویی طبیعی در مدل‌های هوش مصنوعی

چرا هم‌راستاسازی حیاتی است؟

رقابت جهانی؛ چین در کمین، آمریکا در تقاطع تصمیم

مسیر پیش‌رو؛ بازتعریف قدرت از مسیر کنترل

نوشته های مشابه

قیمت دلار رسمی امروز (۹ اسفند) به ثبات رسید؛ یورو چند؟

آغاز فروش بلیت اتوبوس نوروزی؛ جزئیات خرید و مهلت

استپن چگونه با پیاده‌روی به شما GMT می‌دهد؟

خبر مهم برای دانشجویان؛ آغاز ثبت‌نام وام تحصیلی و مسکن

ارسال دیدگاه

آخرین اخبار

قیمت دلار رسمی امروز (۹ اسفند) به ثبات رسید؛ یورو چند؟

آغاز فروش بلیت اتوبوس نوروزی؛ جزئیات خرید و مهلت

استپن چگونه با پیاده‌روی به شما GMT می‌دهد؟

خبر مهم برای دانشجویان؛ آغاز ثبت‌نام وام تحصیلی و مسکن

بازار رمزارزها در شوک؛ سقوط بیت‌کوین به کانال ۶۵ هزار دلار

اعلام قیمت جدید مرغ گرم؛ فیله ۴۵۰ هزار تومان شد

قیمت طلا دوباره خیز برداشت؛ اونس به دنبال ثبت رکورد

شوک قیمت طلا به بازار؛ سکه به مرز ۲۰۰ میلیون رسید

بارش برف جاده‌ها را غافلگیر کرد؛ لیست محورهای مسدود

هشدار هواشناسی؛ شوک سرمایی و برف و باران در راه ۱۴ استان

شوک به معامله‌گران؛ بیت‌کوین روی لبه سقوط تاریخی

نوسان بیت‌کوین؛ پادشاه رمزارزها چرا هر روز قیمتش تغییر می‌کند؟

چین با تولید انبوه تراشه پیشرفته، آمریکا را شکست داد

نزدیکی اسپات سویی به کانال ۱ دلاری؛ ETF تازه بازار را تکان داد

زمان عرضه مک‌بوک پرو با نمایشگر لمسی و رابط پویا

لینک کوتاه

لـیـنـک زیـر را کـپـی کـنـیـد !

https://payamekhalijefars.ir/?p=56835

غریزه بقا؛ الگویی طبیعی در مدل‌های هوش مصنوعی

چرا هم‌راستاسازی حیاتی است؟

رقابت جهانی؛ چین در کمین، آمریکا در تقاطع تصمیم

مسیر پیش‌رو؛ بازتعریف قدرت از مسیر کنترل

نوشته های مشابه

ارسال دیدگاه

آخرین اخبار