۱۵ مرداد ۱۴۰۴ - ۱۱:۰۴
کد خبر: ۷۷۳۵۲

ونمایی از مدل‌های پیشرفته هوش مصنوعی برای برنامه‌نویسی و ریاضیات

شرکت اپن‌ای‌آی دو مدل زبان جدید منتشر کرده که در استدلال‌های پیشرفته عملکرد بسیار خوبی دارند و بهینه‌سازی شده‌اند تا روی لپ‌تاپ‌ها با عملکردی شبیه به مدل‌های استدلالی کوچک‌تر و اختصاصی این شرکت اجرا شوند.

به گزارش پایداری ملی به نقل از فارس،  شرکت اپن‌ای‌آی اعلام کرد دو مدل زبان جدید با وزن باز را منتشر کرده است.
مدل‌های زبان با وزن باز به مدل‌هایی گفته می‌شود که پارامترهای آموزش‌دیده‌ی آن‌ها به صورت عمومی در دسترس قرار می‌گیرند. این کار به توسعه‌دهندگان اجازه می‌دهد بدون نیاز به داده‌های آموزشی اصلی، مدل را برای کارهای خاص تجزیه و تحلیل و بهینه‌سازی کنند.
گرگ براکمن، یکی از بنیان‌گذاران اپن‌ای‌آی در نشست خبری گفت: «یکی از ویژگی‌های منحصر به فرد مدل‌های باز این است که مردم می‌توانند آن‌ها را به صورت محلی و روی زیرساخت خودشان اجرا کنند.»
آمازون در خبری جداگانه، اعلام کرد این مدل‌های با وزن باز اکنون در پلتفرم هوش مصنوعی مولد «Bedrock» آمازون در سرویس وب آمازون (AWS) در دسترس هستند. اتول دئو، مدیر این پلتفرم گفت این اولین باری است که یک مدل اپن‌ای‌آی در Bedrock ارائه می‌شود.
به زبان ساده، این پلتفرم یک واسطه قدرتمند است که به توسعه‌دهندگان و کسب‌وکارها اجازه می‌دهد به طیف وسیعی از مدل‌های هوش مصنوعی مولد از شرکت‌های پیشرو در این حوزه، از جمله مدل‌های خود آمازون و حالا OpenAI، دسترسی داشته باشند.
یکی از مدل‌های بزرگ‌تر این شرکت به نام gpt-oss-120b می‌تواند روی یک واحد پردازش گرافیکی (GPU) اجرا شود و مدل دوم به نام gpt-oss-20b آنقدر کوچک است که مستقیماً روی یک کامپیوتر شخصی قابل اجراست.
 اپن‌ای‌آی اعلام کرد این مدل‌ها عملکردی مشابه مدل‌های اختصاصی خود به نام‌های o3-mini و o4-mini دارند و به خصوص در زمینه‌های برنامه‌نویسی، ریاضیات رقابتی و سوالات مربوط به سلامت بسیار قدرتمند هستند.
این مدل‌ها با استفاده از یک مجموعه داده‌ی متنی که علاوه بر دانش عمومی، بر روی علوم، ریاضیات و برنامه‌نویسی تمرکز داشته، آموزش دیده‌اند. اپن‌ای‌آی هیچ معیار مقایسه‌ای برای این مدل‌های با وزن باز با مدل‌های رقیب مانند DeepSeek-R1 منتشر نکرده است.

گزارش خطا
ارسال نظرات
نام
ایمیل
نظر