شرکت متا در واکنش به ترند داغ ابزارهای هوش مصنوعی از مدل زبانی بزرگی به نام LLaMA رونمایی کرد که اگرچه حدود 10برابر کوچکتر از مدل GPT-3 شرکت OpenAI است، ولی به ادعای متا، میتواند بهتر از آن عمل کند. البته این مدل جدید چتباتی نیست که کاربران بتوانند با آن حرف بزنند؛ درعوض برای کارهای تحقیقاتی کاربرد دارد.
متا در پستی در وبلاگ خود مقالهای را منتشر کرده است که میگوید مدل LLaMA مثل سایر مدلهای زبانی بزرگ، دنبالهای از کلمات را بهعنوان ورودی دریافت و کلمه بعدی را پیشبینی میکند. این غول فناوری میگوید این مدل روی 20 زبان جهانی و با کمک دادههای عمومی وبسایتهایی مثل ویکیپدیا، arXiv ،Stack Exchange ،C4 و CCNet آموزش داده شده است.
متا در مقاله خود مدعی شده که نسخهای از این مدل هوش مصنوعی به نام LLaMA-13B در اکثر بنچمارکها قویتر از GPT-3 ظاهر شده و نسخه بزرگتری از همین مدل به نام LLaMA-65B قادر به رقابت با بهترین مدلها ازجمله Chinchilla70B از دیپمایند و PaLM 540B از گوگل است. متا میگوید LLaMA-13B مدلی کوچکتر است که توان و منابع پردازشی کمتری لازم دارد. این مدل درواقع از مجموعهای از مدلهای زبانی تشکیل شده است و در اندازههای مختلف در دسترس خواهد بود. این شرکت درباره عرضه مدل خود میگوید: «دسترسی به این مدل بهصورت موردی برای محققان آکادمیک، سازمانهای دولتی، گروههای مدنی و آزمایشگاههای تحقیقاتی در سراسر دنیا فراهم میشود.»