علی‌بابا از Qwen3-Max با 1 تریلیون پارامتر رونمایی کرد

علی‌بابا از قدرتمندترین مدل هوش مصنوعی خود با نام Qwen3-Max-Preview رونمایی کرد که با بیش از 1 تریلیون پارامتر و عملکرد فوق‌العاده در بنچمارک‌های اولیه، رقبای سرسختی چون Claude Opus 4 را پشت سر گذاشته است.

علی‌بابا در تابستان امسال بخش هوش مصنوعی خود را به‌شدت تقویت کرده و چندین مدل متن‌باز قدرتمند منتشر کرده است. حالا این غول چینی با معرفی Qwen3-Max-Preview قصد دارد فاصله خود را با شرکت‌های آمریکایی مانند OpenAI، گوگل و آنتروپیک کاهش دهد.

در حالی که بسیاری از آزمایشگاه‌های هوش مصنوعی اخیراً روی توسعه مدل‌های کوچک‌تر و بهینه‌تر متمرکز شده‌اند، Qwen استراتژی متفاوتی را دنبال کرده و یک مدل عظیم 1 تریلیون پارامتری توسعه داده است. پارامترها تنظیمات داخلی هستند که رفتار مدل را هدایت می‌کنند و تعداد بیشتر آن‌ها معمولاً به معنای قدرت و عملکرد بالاتر است.

نتایج بنچمارک‌های منتشر شده توسط تیم Qwen نشان می‌دهد که این مدل جدید چینی در آزمون‌های معتبری مانند SuperGPQA و AIME25 از مدل‌هایی چون Claude Opus 4، Kimi K2 و Deepseek-V3.1 بهتر عمل کرده است. این دستاورد نشان‌دهنده پیشرفت چشمگیر هوش مصنوعی چین در عرصه جهانی است.

آزمایش‌های اولیه و غیررسمی نشان می‌دهد که Qwen3-Max-Preview نه‌تنها از اشتباهات رایج مدل‌های زبانی مانند شمارش نادرست حروف در کلمات اجتناب می‌کند، بلکه سرعت پاسخ‌دهی آن به‌طرز شگفت‌انگیزی بالا است. در برخی موارد حتی از ChatGPT نیز سریع‌تر عمل می‌کند که این موضوع اهمیت زیادی در کاربردهای تجاری دارد.

اپ جیمیل با هوش مصنوعی ایمیل‌ها را خودکار خلاصه می‌کند

بازخوردهای اولیه جامعه فناوری نیز بسیار مثبت بوده است. برخی کاربران گزارش داده‌اند که این مدل هوش مصنوعی با وجود اینکه هنوز به‌طور رسمی به عنوان یک «مدل استدلال‌گر» معرفی نشده، در حل مسائل منطقی و ریاضی عملکردی فراتر از انتظار داشته است.

این مدل چینی توانسته معماهایی را حل کند که حتی مدل‌های پیشرفته مانند GPT-5 Thinking و Gemini 2.5 Pro بدون ابزارهای کمکی از حل آن‌ها عاجز بوده‌اند. این قابلیت نشان‌دهنده پتانسیل بالای Qwen3-Max در کاربردهای پیشرفته است.

یکی از ویژگی‌های برجسته این مدل علی‌بابا پشتیبانی از پنجره زمینه عظیم 262,144 توکنی است که به آن اجازه می‌دهد حجم بسیار زیادی از اطلاعات را در یک درخواست پردازش کند. این ویژگی Qwen3-Max را برای کارهای پیچیده مانند کدنویسی و تحلیل داده‌ها ایده‌آل می‌سازد.

آیا این مقاله برای شما مفید بود؟

بله

تقریبا

خیر

در صورت تمایل به اشتراک بگذارید