Photo by John Schnobrich on Unsplash

Alibaba Luncurkan Model AI Qwen Baru dan Klaim Lebih Unggul dari DeepSeek-V3

Waktu baca: 2 Mnt

Diposting pada Apr 1, 2025

Ditulis oleh Andrea Miliani Pakar Berita Teknologi
Diterjemahkan oleh Tim Pelokalan & Penerjemahan Layanan Pelokalan & Penerjemahan

Raksasa Cina, Alibaba, merilis versi terbaru dari model AI unggulannya, Qwen, pada hari Rabu ini. Perusahaan ini mengklaim bahwa model tersebut dapat berfungsi lebih baik daripada DeepSeek-V3 yang populer.

Terburu-buru? Berikut adalah Fakta Singkatnya!

Alibaba merilis model penalaran terbarunya, Qwen 2.5-Max, pada hari Rabu ini.
Raksasa Cina ini mengklaim bahwa modelnya mampu melampaui model populer lainnya seperti DeepSeek-V3, GPT-4o, dan Llama-3.1-405B.
Perusahaan juga meluncurkan Qwen2.5-VL minggu ini, sebuah model AI yang mampu memproses gambar dan berfungsi sebagai agen AI yang menggunakan komputer dan ponsel untuk melakukan tugas.

Menurut Reuters, Alibaba meluncurkan model penalaran baru yang diberi nama Qwen 2.5-Max, tepat di tengah perayaan Tahun Baru Imlek di Cina, untuk bergabung dalam perkembangan AI yang besar-besaran dalam beberapa hari terakhir dan menambah kompetisi domestik.

Pada hari Senin, DeepSeek mencapai peringkat pertama di App Store Apple di Amerika Serikat, melampaui ChatGPT, yang menimbulkan kekhawatiran bagi perusahaan lain di industri AI dan mengejutkan investor—saham Nvidia turun 17% dalam hanya satu hari.

Sekarang, Alibaba telah mengumumkan versi terbaru dari model Qwen-nya—perusahaan merilis 100 model AI sumber terbuka untuk suite Qwen pada September tahun lalu—menjanjikan hasil yang lebih baik daripada model-model terkemuka populer.

“Qwen 2.5-Max berkinerja lebih baik (…) hampir di semua bidang dibandingkan GPT-4o, DeepSeek-V3 dan Llama-3.1-405B,” tulis perusahaan tersebut di akun WeChat resminya.

API dari model penalaran baru Qwen 2.5-Max tersedia melalui cloud Alibaba dan pengguna juga dapat mencoba model tersebut di halaman chat.

“Kami sedang mengembangkan Qwen2.5-Max, sebuah model MoE skala besar yang telah dilatih sebelumnya dengan lebih dari 20 triliun token dan dilanjutkan dengan pelatihan lanjutan yang dikurasi dengan metode Supervised Fine-Tuning (SFT) dan Reinforcement Learning from Human Feedback (RLHF),” tulis Tim Qwen di Github.

Raksasa Tiongkok juga merilis Qwen2.5-VL pada hari Senin, serangkaian model AI multimodal yang juga dapat memproses gambar dan mengakses ponsel dan komputer untuk melakukan tugas. OpenAI mengumumkan fitur serupa, Operator, yang memungkinkan ChatGPT untuk melakukan tugas secara otonom dengan mengendalikan komputer pengguna.

Menurut tim Alibaba, semua model Qwen unggul daripada versi serupa dari OpenAI, Microsoft, Google, Meta, dan DeepSeek.

Alibaba Luncurkan Model AI Qwen Baru dan Klaim Lebih Unggul dari DeepSeek-V3

Kami senang kamu menyukai artikel kami!

Berikan komentar