مدل GPT-4.5 در آزمون تورینگ سربلند شد!

فروردین 24, 1404

مدل GPT-4.5 در آزمون تورینگ سربلند شد!

پژوهشی جدید از دانشگاه کالیفرنیا، سن‌دیگو نشان داد که مدل زبان بزرگ GPT-4.5 از OpenAI و مدل Llama-3.1-405B از متا موفق به گذراندن آزمون تورینگ با شرایط خاص شده‌اند. طبق این نتایج، مدل‌های AI توانستند در بسیاری از موارد به اشتباه به عنوان انسان شناسایی شوند، که این امر نشان‌دهنده پیشرفت چشمگیر هوش مصنوعی در شبیه‌سازی مکالمات انسانی است.

این تحقیق نشان داد که GPT-4.5 با استفاده از یک دستور خاص به نام “پرسونا” توانست با نرخ موفقیت ۷۳٪ در جلسات پنج دقیقه‌ای، شبیه به یک فرد واقعی به نظر برسد.

در مقابل، مدل Llama-3.1-405B موفقیت کمتری داشت و توانست در ۵۶٪ از موارد، خودش را به عنوان انسان معرفی کند.

این در حالی است که مدل GPT-4o که پایه‌گذار چت‌جی‌پی‌تی فعلی است، تنها ۲۱٪ موفقیت در آزمون تورینگ داشت. این تفاوت‌ها نشان می‌دهند که استفاده از «پرسونا» تا چه حد در موفقیت این مدل‌ها تاثیرگذار است.

با وجود این دستاوردها، منتقدان آزمون تورینگ را به عنوان معیاری برای اندازه‌گیری هوش مصنوعی زیر سوال برده‌اند. آنها معتقدند که این آزمون بیشتر نشان‌دهنده قابلیت‌های فریب‌دهنده مدل‌ها در تولید مکالمات زبان‌شناختی است تا ارزیابی واقعی تفکر و خودآگاهی.

در پایان، این تحقیق به بحث‌های جدیدی پیرامون کاربرد و اعتبار آزمون تورینگ در دنیای امروزی اشاره دارد. برخی کارشناسان بر این باورند که آزمون تورینگ دیگر نمی‌تواند تنها معیاری برای سنجش هوش مصنوعی باشد، چرا که هوش واقعی نیازمند توانایی‌های پیچیده‌تری همچون درک، خلاقیت و آگاهی از خود است.