رقابت متا با اوپن‌ای‌آی برای شکست GPT-4

دی 25, 1403

طبق اسناد داخلی که در جریان یکی از پرونده‌های حقوقی جاری شرکت متا به نام “Kadrey v. Meta” فاش شد، مدیران و پژوهشگران مسئول تلاش‌های هوش مصنوعی این شرکت به شدت بر شکست دادن مدل GPT-4 اوپن‌ای‌آی تمرکز داشته‌اند و در حال توسعه مدل Llama 3 بوده‌اند.

احمد آل-داهله، معاون ارشد هوش مصنوعی مولد متا، در پیامی به هوگو توورون، یکی از پژوهشگران متا، در اکتبر ۲۰۲۳ نوشت: «صادقانه بگویم… هدف ما باید GPT-4 باشد. ما ۶۴ هزار GPU داریم! باید یاد بگیریم چطور مدل‌های پیشرفته بسازیم و در این رقابت پیروز شویم.»

با وجود اینکه متا مدل‌های هوش مصنوعی خود را به صورت باز منتشر می‌کند، مدیران این شرکت بیشتر به شکست رقبا مانند آنتروپیک و اوپن‌ای‌آی که مدل‌های خود را معمولاً به‌صورت بسته ارائه می‌دهند، متمرکز بودند و این رقبا را به عنوان استانداردی برای رسیدن به آن‌ها در نظر گرفته بودند.

در پیام‌های داخلی، استارتاپ فرانسوی میسترا، یکی از رقبای بزرگ متا، چندین بار ذکر شد، اما لحن اشاره به این شرکت به طور عمده تحقیرآمیز بود. آل-داهله در پیامی گفت: «میسترا برای ما هیچ چیزی نیست. باید بهتر از آن عمل کنیم.»

این اسناد نشان می‌دهند که رقابت بین شرکت‌های فناوری برای پیشی گرفتن از یکدیگر در عرصه مدل‌های هوش مصنوعی چقدر شدید است، و فشارهای درون متا برای برتری در این زمینه نیز آشکار است. در برخی از پیام‌ها، مدیران هوش مصنوعی متا درباره این صحبت کردند که چطور «بسیار پرخاشگرانه» داده‌های لازم برای آموزش مدل Llama را جمع‌آوری کرده‌اند. در یکی از موارد، یکی از مدیران گفت که «Llama 3 واقعاً تنها چیزی است که به آن اهمیت می‌دهم.»

در این پرونده‌های حقوقی، مدعیان ادعا کرده‌اند که مدیران متا در این رقابت تند، گاهی اوقات از قوانین کپی‌رایت در هنگام آموزش مدل‌های هوش مصنوعی خود چشم‌پوشی کرده‌اند و از کتاب‌های دارای کپی‌رایت برای این کار استفاده کرده‌اند.

توورون در یکی از پیام‌ها به مشکل ترکیب داده‌ها برای آموزش مدل Llama 2 اشاره کرده و گفته بود که متا می‌تواند با استفاده از ترکیب بهتری از منابع داده‌ها، مدل Llama 3 را بهبود بخشد. او و آل-داهله سپس درباره استفاده از دیتاست LibGen که شامل آثار دارای کپی‌رایت از ناشران معتبر است، بحث کردند.

مارک زاکربرگ، مدیرعامل متا، پیش از این اعلام کرده بود که قصد دارد فاصله عملکردی مدل‌های Llama را با مدل‌های بسته‌ای همچون اوپن‌ای‌آی و گوگل کاهش دهد. پیام‌های داخلی فشاری که در درون شرکت برای دستیابی به این هدف وارد می‌شد را به وضوح نشان می‌دهند.

زاکربرگ در نامه‌ای از جولای ۲۰۲۴ گفته بود: «امسال، Llama 3 در مقایسه با مدل‌های پیشرفته، رقابتی است و در برخی زمینه‌ها پیشتاز است. از سال آینده، انتظار داریم مدل‌های آینده Llama به پیشرفته‌ترین مدل‌ها در صنعت تبدیل شوند.»

در نهایت، زمانی که متا مدل Llama 3 را در آوریل ۲۰۲۴ منتشر کرد، این مدل توانست با مدل‌های پیشرفته بسته از گوگل، اوپن‌ای‌آی و آنتروپیک رقابت کند و حتی از مدل‌های باز میسترا پیشی بگیرد. اما داده‌هایی که برای آموزش این مدل‌ها استفاده شد، که گفته می‌شود زاکربرگ مجوز استفاده از آن‌ها را با وجود وضعیت کپی‌رایت داده است، اکنون در معرض بررسی در چندین پرونده حقوقی جاری قرار دارند.