طبق اسناد داخلی که در جریان یکی از پروندههای حقوقی جاری شرکت متا به نام “Kadrey v. Meta” فاش شد، مدیران و پژوهشگران مسئول تلاشهای هوش مصنوعی این شرکت به شدت بر شکست دادن مدل GPT-4 اوپنایآی تمرکز داشتهاند و در حال توسعه مدل Llama 3 بودهاند.
احمد آل-داهله، معاون ارشد هوش مصنوعی مولد متا، در پیامی به هوگو توورون، یکی از پژوهشگران متا، در اکتبر ۲۰۲۳ نوشت: «صادقانه بگویم… هدف ما باید GPT-4 باشد. ما ۶۴ هزار GPU داریم! باید یاد بگیریم چطور مدلهای پیشرفته بسازیم و در این رقابت پیروز شویم.»
با وجود اینکه متا مدلهای هوش مصنوعی خود را به صورت باز منتشر میکند، مدیران این شرکت بیشتر به شکست رقبا مانند آنتروپیک و اوپنایآی که مدلهای خود را معمولاً بهصورت بسته ارائه میدهند، متمرکز بودند و این رقبا را به عنوان استانداردی برای رسیدن به آنها در نظر گرفته بودند.
در پیامهای داخلی، استارتاپ فرانسوی میسترا، یکی از رقبای بزرگ متا، چندین بار ذکر شد، اما لحن اشاره به این شرکت به طور عمده تحقیرآمیز بود. آل-داهله در پیامی گفت: «میسترا برای ما هیچ چیزی نیست. باید بهتر از آن عمل کنیم.»
این اسناد نشان میدهند که رقابت بین شرکتهای فناوری برای پیشی گرفتن از یکدیگر در عرصه مدلهای هوش مصنوعی چقدر شدید است، و فشارهای درون متا برای برتری در این زمینه نیز آشکار است. در برخی از پیامها، مدیران هوش مصنوعی متا درباره این صحبت کردند که چطور «بسیار پرخاشگرانه» دادههای لازم برای آموزش مدل Llama را جمعآوری کردهاند. در یکی از موارد، یکی از مدیران گفت که «Llama 3 واقعاً تنها چیزی است که به آن اهمیت میدهم.»
در این پروندههای حقوقی، مدعیان ادعا کردهاند که مدیران متا در این رقابت تند، گاهی اوقات از قوانین کپیرایت در هنگام آموزش مدلهای هوش مصنوعی خود چشمپوشی کردهاند و از کتابهای دارای کپیرایت برای این کار استفاده کردهاند.
توورون در یکی از پیامها به مشکل ترکیب دادهها برای آموزش مدل Llama 2 اشاره کرده و گفته بود که متا میتواند با استفاده از ترکیب بهتری از منابع دادهها، مدل Llama 3 را بهبود بخشد. او و آل-داهله سپس درباره استفاده از دیتاست LibGen که شامل آثار دارای کپیرایت از ناشران معتبر است، بحث کردند.
مارک زاکربرگ، مدیرعامل متا، پیش از این اعلام کرده بود که قصد دارد فاصله عملکردی مدلهای Llama را با مدلهای بستهای همچون اوپنایآی و گوگل کاهش دهد. پیامهای داخلی فشاری که در درون شرکت برای دستیابی به این هدف وارد میشد را به وضوح نشان میدهند.
زاکربرگ در نامهای از جولای ۲۰۲۴ گفته بود: «امسال، Llama 3 در مقایسه با مدلهای پیشرفته، رقابتی است و در برخی زمینهها پیشتاز است. از سال آینده، انتظار داریم مدلهای آینده Llama به پیشرفتهترین مدلها در صنعت تبدیل شوند.»
در نهایت، زمانی که متا مدل Llama 3 را در آوریل ۲۰۲۴ منتشر کرد، این مدل توانست با مدلهای پیشرفته بسته از گوگل، اوپنایآی و آنتروپیک رقابت کند و حتی از مدلهای باز میسترا پیشی بگیرد. اما دادههایی که برای آموزش این مدلها استفاده شد، که گفته میشود زاکربرگ مجوز استفاده از آنها را با وجود وضعیت کپیرایت داده است، اکنون در معرض بررسی در چندین پرونده حقوقی جاری قرار دارند.