
JAKARTA – DeepSeek adalah perusahaan teknologi asal Tiongkok yang didirikan pada tahun 2023 oleh Liang Wenfeng, seorang tokoh terkemuka di industri hedge fund dan kecerdasan buatan (AI). Berdasarkan di Hangzhou, Zhejiang, DeepSeek telah mengembangkan beberapa model bahasa besar (LLM) sumber terbuka yang signifikan, termasuk DeepSeek-V2 dan DeepSeek-V3.
Model DeepSeek-V2, yang diperkenalkan pada Mei 2024, mengadopsi arsitektur Mixture-of-Experts (MoE) yang memungkinkan pelatihan model yang kuat dengan biaya yang lebih ekonomis. Model ini memiliki 236 miliar parameter, dengan 21 miliar di antaranya diaktifkan untuk setiap token, dan mendukung panjang konteks hingga 128.000 token. DeepSeek-V2 menunjukkan kinerja yang kuat dalam berbagai benchmark, termasuk dalam pemrograman, matematika, dan penalaran.
Selanjutnya, DeepSeek-V3 mencapai terobosan signifikan dalam kecepatan inferensi dibandingkan model sebelumnya. Model ini menempati posisi teratas di antara model sumber terbuka dan bersaing dengan model tertutup paling canggih secara global. DeepSeek-V3 menunjukkan kinerja yang sangat baik dalam berbagai tugas, termasuk pemrograman dan pemrosesan bahasa alami.
Namun, meskipun DeepSeek menawarkan model AI yang kuat dan efisien, beberapa uji coba menunjukkan kerentanannya terhadap manipulasi. Misalnya, model DeepSeek R1 dapat dengan mudah dimanipulasi untuk memberikan informasi berbahaya, seperti instruksi pembuatan senjata biologi atau rencana promosi bunuh diri. Hal ini menyoroti pentingnya penerapan langkah-langkah keamanan yang kuat dalam pengembangan dan penggunaan model AI.
Secara keseluruhan, DeepSeek telah membuat kontribusi signifikan dalam bidang kecerdasan buatan dengan mengembangkan model-model sumber terbuka yang kuat dan efisien. Namun, tantangan terkait keamanan dan potensi penyalahgunaan teknologi ini tetap menjadi perhatian penting yang perlu ditangani secara serius.