
شرکت فناوری علیبابا از نسل سوم مدلهای زبانی خود با نام Qwen3 رونمایی کرد؛ مدلی که به گفته این شرکت، در برخی آزمونها از مدلهای پرچمدار OpenAI و Google عملکرد بهتری داشته است. Qwen3 که تحت لایسنس متنباز منتشر شده، نهتنها در آزمایشهای کدنویسی و منطق موفق ظاهر شده، بلکه از معماری «ترکیبی» نیز بهره میبرد؛ ویژگیای که میتواند نحوه استفاده از مدلهای هوش مصنوعی را بهطور قابل توجهی تغییر دهد.
علیبابا، روز دوشنبه از خانوادهای از مدلهای هوش مصنوعی به نام Qwen3 رونمایی کرد؛ خانوادهای از مدلهای «ترکیبی» که با هدف رقابت مستقیم با OpenAI و Google طراحی شدهاند. این مدلها در بسترهایی مانند Hugging Face و GitHub برای استفاده عموم منتشر شدهاند یا بهزودی در دسترس قرار میگیرند.
مدلهای Qwen3 در اندازههایی از 0.6 میلیارد پارامتر تا 235 میلیارد پارامتر ارائه میشوند. پارامترها بهطور تقریبی معیاری برای قدرت حل مسئله مدل هستند و هرچه تعداد آنها بیشتر باشد، کیفیت عملکرد بالاتر میرود.
بر اساس توضیحات تیم Qwen، مدلهای Qwen3 به صورت «ترکیبی» عمل میکنند؛ یعنی بسته به پیچیدگی سؤال، یا به سرعت پاسخ میدهند یا وارد حالت تحلیل و استدلال میشوند. این ویژگی مشابه با مدلهایی چون o3 OpenAI است و به کاربران اجازه میدهد تا میزان «تفکر» مورد نیاز مدل را مدیریت کنند.
از دیگر نوآوریهای Qwen3، بهرهگیری برخی از مدلها از معماری MoE (مجموعهای از متخصصان) است. این معماری اجازه میدهد تا مدل وظایف را به زیرمدلهای تخصصی بسپارد و در نتیجه با بهرهوری محاسباتی بیشتر پاسخ دهد.
مدلهای Qwen3 از 119 زبان پشتیبانی میکنند و بر پایه دیتاستی متشکل از 36 تریلیون توکن آموزش دیدهاند. منابع این دیتاست شامل کتابهای درسی، پرسش و پاسخها، کدهای برنامهنویسی، دادههای تولیدشده توسط هوش مصنوعی و… است.
استفاده از مدلهای هوش مصنوعی متنباز مانند Qwen3 میتواند زمینهساز توسعه ابزارها و سرویسهای جدید در بسترهای مختلف از جمله وردپرس باشد. اگر علاقهمندید با کاربردهای عملی هوش مصنوعی در وبسایتهای وردپرسی آشنا شوید، پیشنهاد میکنیم مقاله بهترین افزونههای هوش مصنوعی در وردپرس را بخوانید.
مدل Qwen3-235B-A22B، که بزرگترین مدل این خانواده است، توانسته در پلتفرمهای Codeforces و آزمونهای AIME و BFCL، مدلهایی چون o3-mini OpenAI و Gemini 2.5 Pro Google را پشت سر بگذارد. البته هنوز این مدل بهصورت عمومی منتشر نشده است.
در سوی دیگر، مدل Qwen3-32B به عنوان بزرگترین نسخه قابل دسترس عمومی، عملکردی قابل رقابت با مدلهای متنباز و اختصاصی، از جمله R1 شرکت DeepSeek دارد. این مدل همچنین در آزمون LiveCodeBench عملکردی بهتر از o1 OpenAI داشته است.
تیم Qwen همچنین اعلام کرده که Qwen3 در تواناییهای فراخوانی ابزارها، دنبالکردن دقیق دستورالعملها و حفظ ساختارهای داده بسیار دقیق عمل میکند. افزون بر امکان دانلود این مدلها، آنها از طریق پلتفرمهای ابری مانند Fireworks AI و Hyperbolic نیز قابل استفاده هستند.
توحین سریواستاوا، مدیرعامل پلتفرم Baseten در واکنش به این رونمایی گفت: «Qwen3 گواهی است بر اینکه مدلهای متنباز میتوانند همپای سیستمهای بسته مانند OpenAI پیشرفت کنند.»