Kos Melatih DeepSeek R1 Hanya $294,000 – 18 Kali Lebih Murah Daripada Dijangka
Effi Saharudin
Awal tahun ini, model DeepSeek R1 tular di media sosial kerana kemampuannya yang tinggi walaupun dihasilkan oleh firma China yang tidak dikenali ramai. Pada waktu tersebut muncul laporan kos melatih model ini ialah sekitar $5.58 juta (~RM 23.46) yang adalah jauh lebih murah berbanding kos model AI yang lain dan menggunakan cip lam NVIDIA. Akibatnya saham NVIDIA susut seketika.

Pagi ini kos sebenar melatih DeepSeek R1 didedahkan hanyalah $294,000 (~RM 1.24 juta) dan menggunakan 512 cip NVIDIA H800. Rahsia didedahkan dalam kertas kajian yang diterbitkan dalam jurnal Nature. Kos melatih R1 adalah lebih rendah kerana menggunakan teknik pembelajaran pengukuhan berasaskan percubaan dan kesilapan.
Model diberikan markah sekiranya berjaya mencari jawapan sendiri dengan melakukan percubaan dan kesilapan. Model lain menggunakan data yang diberikan manusia untuk belajar menyelesaikan masalah tertentu. Ini memerlukan masa dan kos lebih tinggi.
Sungguhpun begitu kelemahan model ini ialah ia sukar menerangkan bagaimana ia berfikir untuk mendapatkan jawapan. Ianya terlalu kompleks dan panjang untuk difahami kebanyakan manusia. Kebanyakan model AI seperti ChatGPT dan Gemini boleh menerangkan jalan kerja matematik misalnya dengan lebih ringkas.
Komen
Sila log masuk untuk menghantar komen.