مدل GPT-4.5 در آزمون تورینگ سربلند شد!
پژوهشی جدید از دانشگاه کالیفرنیا، سندیگو نشان داد که مدل زبان بزرگ GPT-4.5 از OpenAI و مدل Llama-3.1-405B از متا موفق به گذراندن آزمون تورینگ با شرایط خاص شدهاند. طبق این نتایج، مدلهای AI توانستند در بسیاری از موارد به اشتباه به عنوان انسان شناسایی شوند، که این امر نشاندهنده پیشرفت چشمگیر هوش مصنوعی در شبیهسازی مکالمات انسانی است.
این تحقیق نشان داد که GPT-4.5 با استفاده از یک دستور خاص به نام “پرسونا” توانست با نرخ موفقیت ۷۳٪ در جلسات پنج دقیقهای، شبیه به یک فرد واقعی به نظر برسد.
در مقابل، مدل Llama-3.1-405B موفقیت کمتری داشت و توانست در ۵۶٪ از موارد، خودش را به عنوان انسان معرفی کند.
این در حالی است که مدل GPT-4o که پایهگذار چتجیپیتی فعلی است، تنها ۲۱٪ موفقیت در آزمون تورینگ داشت. این تفاوتها نشان میدهند که استفاده از «پرسونا» تا چه حد در موفقیت این مدلها تاثیرگذار است.
با وجود این دستاوردها، منتقدان آزمون تورینگ را به عنوان معیاری برای اندازهگیری هوش مصنوعی زیر سوال بردهاند. آنها معتقدند که این آزمون بیشتر نشاندهنده قابلیتهای فریبدهنده مدلها در تولید مکالمات زبانشناختی است تا ارزیابی واقعی تفکر و خودآگاهی.
در پایان، این تحقیق به بحثهای جدیدی پیرامون کاربرد و اعتبار آزمون تورینگ در دنیای امروزی اشاره دارد. برخی کارشناسان بر این باورند که آزمون تورینگ دیگر نمیتواند تنها معیاری برای سنجش هوش مصنوعی باشد، چرا که هوش واقعی نیازمند تواناییهای پیچیدهتری همچون درک، خلاقیت و آگاهی از خود است.