رونمایی متا از هوش مصنوعی LLaMA

شرکت متا در واکنش به ترند داغ ابزارهای هوش مصنوعی از مدل زبانی بزرگی به نام LLaMA رونمایی کرد که اگرچه حدود 10برابر کوچک‌تر از مدل GPT-3 شرکت OpenAI است، ولی به ادعای متا، می‌تواند بهتر از آن عمل کند. البته این مدل جدید چت‌باتی نیست که کاربران بتوانند با آن حرف بزنند؛ درعوض برای کارهای تحقیقاتی کاربرد دارد.

متا در پستی در وبلاگ خود مقاله‌ای را منتشر کرده است که می‌گوید مدل LLaMA مثل سایر مدل‌های زبانی بزرگ، دنباله‌ای از کلمات را به‌عنوان ورودی دریافت و کلمه بعدی را پیش‌بینی می‌کند. این غول فناوری می‌گوید این مدل روی 20 زبان جهانی و با کمک داده‌های عمومی وب‌سایت‌هایی مثل ویکی‌پدیا، arXiv ،Stack Exchange ،C4 و CCNet آموزش داده شده است.

متا در مقاله خود مدعی شده که نسخه‌ای از این مدل هوش مصنوعی به نام LLaMA-13B در اکثر بنچمارک‌ها قوی‌تر از GPT-3 ظاهر شده و نسخه بزرگ‌تری از همین مدل به نام LLaMA-65B قادر به رقابت با بهترین مدل‌ها ازجمله Chinchilla70B از دیپ‌مایند و PaLM 540B از گوگل است. متا می‌گوید LLaMA-13B مدلی کوچک‌تر است که توان و منابع پردازشی کمتری لازم دارد. این مدل درواقع از مجموعه‌ای از مدل‌های زبانی تشکیل شده است و در اندازه‌های مختلف در دسترس خواهد بود. این شرکت درباره عرضه مدل خود می‌گوید: «دسترسی به این مدل به‌صورت موردی برای محققان آکادمیک، سازمان‌های دولتی، گروه‌های مدنی و آزمایشگاه‌های تحقیقاتی در سراسر دنیا فراهم می‌شود.»