
Image by Oberon Copeland, from Unsplash
Bot AI Membuat Server Wikipedia Overload
Yayasan Wikimedia telah mengeluarkan peringatan terkait peningkatan tekanan pada servernya akibat bot otomatis yang mengambil data untuk melatih model kecerdasan buatan.
Terburu-buru? Berikut fakta singkatnya:
- Bot AI sedang melakukan scraping konten Wikimedia pada tingkat yang belum pernah terjadi sebelumnya.
- Bot menyebabkan peningkatan penggunaan bandwidth multimedia sebesar 50%.
- Sekarang, 65% lalu lintas berbiaya tinggi berasal dari crawler.
Foundation melaporkan dalam sebuah posting baru-baru ini bahwa lalu lintas yang dihasilkan oleh mesin terus bertumbuh dengan kecepatan yang belum pernah terjadi sebelumnya, sementara orang-orang hanya membentuk sebagian kecil dari lalu lintas ini.
“Sejak Januari 2024, kami telah melihat penggunaan bandwidth untuk mengunduh konten multimedia meningkat sebesar 50%,” demikian pernyataan dalam postingan tersebut.
“Peningkatan ini tidak berasal dari pembaca manusia, tetapi sebagian besar dari program otomatis yang mengambil gambar dari katalog gambar Wikimedia Commons yang memiliki lisensi terbuka untuk memberi makan gambar ke model AI,” tambah postingan tersebut.
Bot yang dikenal sebagai crawler mencuri sejumlah besar data dari proyek-proyek Wikimedia termasuk Wikipedia dan Wikimedia Commons tanpa penghargaan yang tepat atau alat akses resmi. Proses ini membuat pengguna baru kesulitan untuk menemukan Wikimedia dan memberikan tekanan berlebih pada sistem teknis mereka.
Sebagai contoh, catatan post menunjukkan bahwa halaman Wikipedia Jimmy Carter mendapatkan lebih dari 2,8 juta tampilan pada hari ia meninggal di bulan Desember 2024. Video debat 1980-nya menyebabkan peningkatan lalu lintas website yang signifikan. Sebuah video dari debatnya pada tahun 1980 juga memicu lonjakan lalu lintas. Wikimedia berhasil menanganinya – tetapi hanya tipis-tipis saja. Masalah sebenarnya menurut para insinyur adalah aliran lalu lintas bot yang terus-menerus.
“65% dari lalu lintas kami yang paling mahal berasal dari bot,” tulis Foundation tersebut. Bot “membaca massal” konten, terutama halaman yang kurang populer, yang memicu permintaan mahal ke pusat data inti Wikimedia.
Meskipun konten Wikimedia gratis untuk digunakan, servernya tidak. “Konten kami gratis, infrastruktur kami tidak,” kata Foundation itu. Tim ini terus mengembangkan metode untuk mendorong “penggunaan infrastruktur yang bertanggung jawab” dengan mendesak pengembang untuk menggunakan API alih-alih mengikis seluruh situs.
Masalah ini mempengaruhi Wikimedia serta berbagai situs web dan penerbit lainnya. Namun, bagi platform pengetahuan terbuka terbesar di dunia, ini mengancam stabilitas layanan yang diandalkan oleh jutaan orang.
Berikan komentar
Batal