
Image by TechCrunch, from Flickr
AI yang Berpikir Sebelum Berbicara? Claude 3.7 Sonnet Luncurkan Penalaran Hibrida
Anthropic telah meluncurkan Claude 3.7 Sonnet, versi baru dari model AI-nya yang memperkenalkan mode “pemikiran diperpanjang” yang opsional, memberikan pengguna lebih banyak kontrol atas bagaimana model memproses tugas-tugas yang kompleks.
Dalam Kesibukan? Berikut Fakta-Faktanya Yang Singkat!
- Model ini meningkatkan penalaran dan pemecahan masalah dengan memungkinkan introspeksi diri sebelum menjawab.
- Mode berpikir ekstensif hanya tersedia pada paket berbayar.
- Claude Code, sebuah asisten pemrograman, saat ini dalam preview terbatas untuk pengembang
Anthropic baru saja merilis Claude 3.7 Sonnet, model AI yang diperbarui yang memperkenalkan penalaran hibrida, memungkinkan pengguna untuk memilih antara respon cepat dan berpikir lebih lanjut.
Pendekatan baru ini bertujuan untuk meningkatkan pemecahan masalah dengan memungkinkan model memiliki waktu tambahan untuk mengevaluasi dan memperbaiki responsnya saat diperlukan.
Dalam mode standar, Claude 3.7 Sonnet berfungsi sebagai peningkatan iteratif dari pendahulunya, Claude 3.5 Sonnet. Namun, dalam mode berpikir ekstensif, model ini melakukan refleksi diri sebelum menghasilkan jawaban.
Michael Gerstenhaber, Pemimpin Produk Anthropic untuk AI, mendeskripsikan fitur ini sebagai cara bagi pengguna untuk menyeimbangkan waktu respons dan kedalaman penalaran. “Pengguna [user] memiliki banyak kontrol atas perilakunya—seberapa lama ia berpikir, dan dapat menukar penalaran dan kecerdasan dengan waktu dan anggaran,” kata dia, seperti yang dilaporkan oleh WIRED.
Proses ini dimaksudkan untuk meningkatkan akurasi di bidang yang membutuhkan penalaran multi-langkah, seperti matematika, fisika, pemrograman, dan instruksi yang diikuti. Pengguna yang berinteraksi dengan model melalui API dapat menentukan batas berapa banyak token yang digunakan untuk “berpikir,” yang memungkinkan kontrol atas kecepatan respons dan biaya.
WIRED mencatat bahwa pembaruan ini juga mencakup fitur “scratchpad”, yang membuat langkah-langkah penalaran model menjadi terlihat saat sedang memproses permintaan. Pendekatan ini serupa dengan teknik yang digunakan dalam model AI lainnya, seperti DeepSeek’s.
Anthropic menyatakan bahwa Claude 3.7 Sonnet telah dioptimalkan untuk aplikasi dunia nyata daripada benchmark gaya kompetisi. Pengujian awal menunjukkan bahwa mode penalaran diperpanjang ini meningkatkan kinerja pada tugas-tugas yang melibatkan basis kode yang kompleks, penggunaan alat canggih, dan pengembangan perangkat lunak full-stack.
Model tersebut telah dievaluasi pada SWE-bench Verified dan TAU-bench, di mana dikabarkan model ini unggul dibandingkan versi-versi sebelumnya, seperti yang dilaporkan oleh Anthropic.
CNN mencatat bahwa Anthropic tetap mempertahankan harga untuk Claude 3.7 sama seperti model-model sebelumnya, menempatkannya di bawah penawaran terbaru dari OpenAI. Harganya $3 per juta token input dan $15 per juta token output, dibandingkan dengan $15 dan $60 untuk tier yang serupa dari OpenAI.
Berikan komentar
Batal