Qwen 3.0
Qwen 3 rappresenta la più recente generazione di modelli linguistici di grandi dimensioni nella serie Qwen, offrendo un’ampia gamma di modelli densi e basati su un approccio Mixture-of-Experts (MoE). Il modello di punta, Qwen3-235B-A22B, ottiene risultati competitivi nelle valutazioni di benchmark in ambito di coding, matematica, capacità generali e altro ancora, quando confrontato con altri modelli di
fascia alta come DeepSeek-R1, o1, o3-mini, Grok-3 e Gemini-2.5-Pro. Inoltre, il piccolo modello MoE, Qwen3-30B-A3B, supera QwQ-32B con 10 volte più parametri attivati, e anche un modello minuscolo come Qwen3-4B può rivaleggiare le prestazioni di Qwen2.5-72B-Instruct.
fascia alta come DeepSeek-R1, o1, o3-mini, Grok-3 e Gemini-2.5-Pro. Inoltre, il piccolo modello MoE, Qwen3-30B-A3B, supera QwQ-32B con 10 volte più parametri attivati, e anche un modello minuscolo come Qwen3-4B può rivaleggiare le prestazioni di Qwen2.5-72B-Instruct.
- Supporta in modo univoco il passaggio fluido tra thinking mode (per un ragionamento logico complesso, matematica e coding) e non-thinking mode (per un dialogo efficiente e a uso generale). Ciò garantisce prestazioni ottimali in una vasta gamma di scenari.
- Ha inoltre migliorato significativamente le sue capacità di ragionamento, superando QwQ (in thinking mode) e Qwen2.5 instruct (in non-thinking mode) in termini di generazione di codice, ragionamento logico e matematica.
- Presenta una superiore allineamento alle preferenze umane, eccellendo nella scrittura creativa, nel role-playing, nel dialogo multi-turno e nell’esecuzione di istruzioni, per offrire un’esperienza conversazionale più naturale, coinvolgente e immersiva.
- Possiede competenze avanzate per l’esecuzione di agenti, consentendo un’integrazione precisa con strumenti esterni sia in modalità di pensiero che non-pensiero, e ottenendo prestazioni leader tra i modelli open-source in compiti di agenti complessi.
Qwen 3 supporta oltre 100 lingue e dialetti, con forti capacità di seguire istruzioni multilingue e di traduzione
Qween 3 è disponibile su Braincluster
(Questo testo è stato tradotto utilizzando i sistemi di inferenza forniti da Braincluster)