علی‌بابا با «Qwen3» به مصاف غول‌های هوش مصنوعی می‌رود

علی‌بابا با «Qwen3» به مصاف غول‌های هوش مصنوعی می‌رود

شرکت فناوری علی‌بابا از نسل سوم مدل‌های زبانی خود با نام Qwen3 رونمایی کرد؛ مدلی که به گفته این شرکت، در برخی آزمون‌ها از مدل‌های پرچم‌دار OpenAI و Google عملکرد بهتری داشته است. Qwen3 که تحت لایسنس متن‌باز منتشر شده، نه‌تنها در آزمایش‌های کدنویسی و منطق موفق ظاهر شده، بلکه از معماری «ترکیبی» نیز بهره می‌برد؛ ویژگی‌ای که می‌تواند نحوه استفاده از مدل‌های هوش مصنوعی را به‌طور قابل توجهی تغییر دهد.

علی‌بابا، روز دوشنبه از خانواده‌ای از مدل‌های هوش مصنوعی به نام Qwen3 رونمایی کرد؛ خانواده‌ای از مدل‌های «ترکیبی» که با هدف رقابت مستقیم با OpenAI و Google طراحی شده‌اند. این مدل‌ها در بسترهایی مانند Hugging Face و GitHub برای استفاده عموم منتشر شده‌اند یا به‌زودی در دسترس قرار می‌گیرند.

مدل‌های Qwen3 در اندازه‌هایی از 0.6 میلیارد پارامتر تا 235 میلیارد پارامتر ارائه می‌شوند. پارامترها به‌طور تقریبی معیاری برای قدرت حل مسئله مدل هستند و هرچه تعداد آن‌ها بیشتر باشد، کیفیت عملکرد بالاتر می‌رود.

بر اساس توضیحات تیم Qwen، مدل‌های Qwen3 به صورت «ترکیبی» عمل می‌کنند؛ یعنی بسته به پیچیدگی سؤال، یا به سرعت پاسخ می‌دهند یا وارد حالت تحلیل و استدلال می‌شوند. این ویژگی مشابه با مدل‌هایی چون o3 OpenAI است و به کاربران اجازه می‌دهد تا میزان «تفکر» مورد نیاز مدل را مدیریت کنند.

از دیگر نوآوری‌های Qwen3، بهره‌گیری برخی از مدل‌ها از معماری MoE (مجموعه‌ای از متخصصان) است. این معماری اجازه می‌دهد تا مدل وظایف را به زیرمدل‌های تخصصی بسپارد و در نتیجه با بهره‌وری محاسباتی بیشتر پاسخ دهد.

  آمادگی وردپرس برای دریافت MySQL 8.0

مدل‌های Qwen3 از 119 زبان پشتیبانی می‌کنند و بر پایه دیتاستی متشکل از 36 تریلیون توکن آموزش دیده‌اند. منابع این دیتاست شامل کتاب‌های درسی، پرسش و پاسخ‌ها، کدهای برنامه‌نویسی، داده‌های تولیدشده توسط هوش مصنوعی و… است.

استفاده از مدل‌های هوش مصنوعی متن‌باز مانند Qwen3 می‌تواند زمینه‌ساز توسعه ابزارها و سرویس‌های جدید در بسترهای مختلف از جمله وردپرس باشد. اگر علاقه‌مندید با کاربردهای عملی هوش مصنوعی در وب‌سایت‌های وردپرسی آشنا شوید، پیشنهاد می‌کنیم مقاله بهترین افزونه‌های هوش مصنوعی در وردپرس را بخوانید.

مدل Qwen3-235B-A22B، که بزرگ‌ترین مدل این خانواده است، توانسته در پلتفرم‌های Codeforces و آزمون‌های AIME و BFCL، مدل‌هایی چون o3-mini OpenAI و Gemini 2.5 Pro Google را پشت سر بگذارد. البته هنوز این مدل به‌صورت عمومی منتشر نشده است.

qwen3-235a22

در سوی دیگر، مدل Qwen3-32B به عنوان بزرگ‌ترین نسخه قابل دسترس عمومی، عملکردی قابل رقابت با مدل‌های متن‌باز و اختصاصی، از جمله R1 شرکت DeepSeek دارد. این مدل همچنین در آزمون LiveCodeBench عملکردی بهتر از o1 OpenAI داشته است.

تیم Qwen همچنین اعلام کرده که Qwen3 در توانایی‌های فراخوانی ابزارها، دنبال‌کردن دقیق دستورالعمل‌ها و حفظ ساختارهای داده بسیار دقیق عمل می‌کند. افزون بر امکان دانلود این مدل‌ها، آن‌ها از طریق پلتفرم‌های ابری مانند Fireworks AI و Hyperbolic نیز قابل استفاده هستند.

توحین سریواستاوا، مدیرعامل پلتفرم Baseten در واکنش به این رونمایی گفت: «Qwen3 گواهی است بر این‌که مدل‌های متن‌باز می‌توانند هم‌پای سیستم‌های بسته مانند OpenAI پیشرفت کنند.»

آیا این مقاله برای شما مفید بود؟
تقریبا
خیر

دیدگاهتان را بنویسید

ارسال دیدگاه به معنی این است که شما ابتدا قوانین ارسال دیدگاه را مطالعه کرده‌اید و با آن موافق هستید.