DeepSeek یک استارتاپ چینی در حوزهٔ هوش مصنوعی است که چتباتی همنام با خود دارد. این شرکت در سال 2023 توسط لیانگ ونفنگ تأسیس شد و دفتر مرکزی آن در هانگژو، ژجیانگ قرار دارد. DeepSeek تحت حمایت صندوق پوشش ریسک High-Flyer است.
ماموریت DeepSeek بر توسعهٔ هوش عمومی مصنوعی (AGI) از طریق تحقیق و توسعهٔ متنباز متمرکز است. این شرکت قصد دارد فناوری هوش مصنوعی را برای کاربردهای تجاری و آکادمیک دموکراتیزه کند. تمرکز اصلی DeepSeek بر توسعهٔ مدلهای زبانی بزرگ (LLM) متنباز است که میتوانند با مدلهای برتر صنعت رقابت کرده یا حتی از آنها پیشی بگیرند.
این مدل در اواخر سال ۲۰۲۴ منتشر شد و دارای ۶۷۱ میلیارد پارامتر است. مدل مذکور با استفاده از ۱۴.۸ تریلیون توکن طی حدود ۵۵ روز آموزش دیده و هزینهای معادل ۵.۵۸ میلیون دلار داشته است. آزمونهای مقایسهای نشان میدهند که DeepSeek-V3 عملکردی برتر از مدلهایی مانند Llama 3.1 و Qwen 2.5 دارد، در حالی که از نظر تواناییها با GPT-4o و Claude 3.5 Sonnet برابری میکند. این مدل از معماری «ترکیب کارشناسان» (Mixture of Experts) با «ترانسفورمر توجه نهفته چندسر» (Multi-head Latent Attention Transformer) بهره میبرد و شامل ۲۵۶ کارشناس مسیریابیشده و یک کارشناس مشترک است که ۳۷ میلیارد پارامتر را به ازای هر توکن فعال میکند.
این مدل در ژانویه ۲۰۲۵ منتشر شد و بر استدلال منطقی، استدلال ریاضی و حل مسائل در لحظه تمرکز دارد. DeepSeek-R1 بدون استفاده از تنظیمات دقیق تحت نظارت، بلکه با روش «بهینهسازی خطمشی نسبی گروهی» (GRPO) آموزش دیده است تا تواناییهای استدلالی خود را تقویت کند. عملکرد این مدل در برخی از وظایف از جمله ریاضیات و برنامهنویسی، با مدل o1 شرکت OpenAI قابل مقایسه است.
مدلهای هوش مصنوعی DeepSeek از طریق وبسایت رسمی آن در دسترس هستند؛ جایی که کاربران میتوانند به مدل DeepSeek-V3 بهصورت رایگان دسترسی پیدا کنند. علاوه بر این، اپلیکیشن DeepSeek برای دانلود موجود است که ابزاری جامع در حوزه هوش مصنوعی را به کاربران ارائه میدهد.
در اینجا نگاهی عمیقتر به نحوهی پیوستن به DeepSeek میاندازیم.
برخی منابع مشاهده کردهاند که نسخه رسمی API مدل R1 از مکانیزمهای سانسور در مورد موضوعات سیاسی حساس برای دولت چین استفاده میکند. برای مثال، این مدل از پاسخگویی به سؤالات مربوط به حوادثی مانند اعتراضات میدان تیانآنمن در سال ۱۹۸۹، سرکوب اویغورها یا مسائل حقوق بشر در چین خودداری میکند. علاوه بر این، نگرانیهایی در مورد احتمال استفاده از این سیستم هوش مصنوعی در عملیات نفوذ خارجی، انتشار اطلاعات نادرست، نظارت و توسعه سلاحهای سایبری برای دولت چین وجود دارد.
مدلهای هوش مصنوعی DeepSeek به دلیل کارایی و مقرونبهصرفه بودن شناخته میشوند. بهعنوان مثال، مدل DeepSeek-V3 با استفاده از حدود ۲,۰۰۰ پردازنده گرافیکی Nvidia H800 طی ۵۵ روز آموزش داده شد و هزینهای معادل ۵.۵۸ میلیون دلار داشت که بهطور قابلتوجهی کمتر از مدلهای مشابه شرکتهای دیگر است. این کارایی باعث شده است که شرکتهای فناوری بزرگ سرمایهگذاریهای عظیم خود را در زیرساختهای هوش مصنوعی مورد بازنگری قرار دهند.
در مقابل، OpenAI مدلهای خود را بهصورت متنباز ارائه نمیدهد، در حالی که DeepSeek متنباز است و به همه اجازه میدهد در توسعه آن مشارکت کنند. این رویکرد جامعهمحور نگرانیهایی را درباره سوءاستفادههای احتمالی نیز به همراه دارد.
بله، DeepSeek مدلهای خود را بهطور کامل تحت مجوز MIT متنباز کرده است، بهطوری که استفادههای تجاری و آکادمیک بدون محدودیت امکانپذیر است. این تعهد به شفافیت، در مقابل رویکردهای مالکیتی برخی رقبا قرار میگیرد و نقش اساسی در رشد سریع محبوبیت آن داشته است.
DeepSeek نشان میدهد که آزمایشگاههای متنباز در مهندسی معکوس بسیار کارآمدتر شدهاند. هر دستاوردی که آزمایشگاههای هوش مصنوعی آمریکایی کسب میکنند، اکنون میتواند در عرض چند ماه از بین برود. این موضوع چالشی جدی برای شرکتهایی است که کسبوکارشان بر فروش مدلها تکیه دارد؛ زیرا توسعهدهندگان با هزینههای تغییر سیستم پایین مواجه هستند و بهینهسازیهای DeepSeek صرفهجوییهای قابل توجهی را ارائه میدهد.
پیشرفتهای DeepSeek تحولاتی چشمگیر در صنعت هوش مصنوعی ایجاد کرده و واکنشهای شدیدی در بازار برانگیخته است. این استارتآپ چینی با معرفی مدل V3 خود که با هزینهای بسیار کمتر نسبت به همتایان آمریکایی توسعه یافته، نگرانیهایی درباره کاهش تقاضا برای GPUهای پیشرفته Nvidia به وجود آورد و باعث کاهش تقریبی ۶۰۰ میلیارد دلاری در ارزش بازار این شرکت شد.
این نگرانی موجی از فروش سهام Nvidia را در روز دوشنبه به دنبال داشت که به بزرگترین ضرر یکروزه در تاریخ شرکتهای آمریکایی تبدیل گشت. اثرات این وضعیت همچنین بر سایر غولهای فناوری مانند Broadcom و Microsoft احساس شد.
با این حال، این اضطراب زودگذر بود؛ زیرا سهام Nvidia روز سهشنبه با افزایش حدود ۹٪ نشانهای از تجدید اعتماد به آینده شرکت محسوب میشد. کارشناسان بیان میکنند که اگرچه مدل مقرونبهصرفه DeepSeek قابل تحسین است، اما جایگاه حیاتی سختافزار Nvidia در توسعه هوش مصنوعی همچنان حفظ میشود. حتی ممکن است ظهور مدلهای کارآمدتر، بازار را گسترش داده و نهایتاً تقاضا برای پردازندههای پیشرفته این شرکت را افزایش دهد.
موفقیت DeepSeek واکنشهای متفاوتی به همراه داشت؛ در حالی که مدیران عامل Microsoft و OpenAI این نوآوری را ستایش کردند، برخی مانند ایلان ماسک درباره پایداری بلندمدت آن تردید داشتند. خود Nvidia نیز دستاورد DeepSeek را تصدیق کرد و تأکید نمود که این موفقیت همراستا با کنترلهای صادراتی آمریکاست و نشاندهنده رویکردهای نوین در توسعه مدلهای هوش مصنوعی میباشد.
به وضوح مشخص است که مرحله حیاتی «استنتاج» در پیادهسازی هوش مصنوعی همچنان به تراشههای پیشرفته وابسته است، که اهمیت این تجهیزات را در اکوسیستم هوش مصنوعی تایید میکند. روزهای اخیر یادآور ناپایداری و تحولات سریع این صنعت بوده است؛ نوآوریهای انقلابی مانند DeepSeek میتوانند نوسانات قابل توجهی در بازار ایجاد کنند و در عین حال سرعت پیشرفت و رقابت فشرده در این حوزه را به نمایش بگذارند.
DeepSeek با چالشهایی نیز مواجه شده است، از جمله یک حمله سایبری که شرکت را مجبور به محدود کردن ثبتنام کاربران جدید کرد. همچنین، شرکتهای مایکروسافت و OpenAI در حال تحقیق درباره یک نشت اطلاعاتی احتمالی مرتبط با DeepSeek هستند که ادعا میشود حجم قابلتوجهی از دادههای OpenAI از طریق API آن در سال ۲۰۲۴ استخراج شده است.
در حال حاضر، DeepSeek فقط بر تحقیقات متمرکز است و برنامههای مشخصی برای تجاریسازی ندارد. این تمرکز به این شرکت اجازه میدهد تا بدون فشارهای تجاری فوری، فناوریهای هوش مصنوعی را پیش ببرد. اما در بلندمدت، مشخص نیست که DeepSeek چه مسیری را انتخاب خواهد کرد. برخلاف آزمایشگاههای بزرگ هوش مصنوعی در ایالات متحده که بر درآمدزایی از خدمات هوش مصنوعی تمرکز دارند، DeepSeek مدلهای قدرتمندی را تقریباً بهصورت رایگان ارائه میدهد که ممکن است تهدیدی برای امنیت ملی و سایر حوزهها باشد.
ظهور DeepSeek نشان میدهد که جلوگیری از دسترسی رقبا به هوش مصنوعی پیشرفته دیگر امکانپذیر نیست. همانطور که جک کلارک، یکی از بنیانگذاران Anthropic، گفته است: «DeepSeek نشان میدهد که گسترش هوش مصنوعی اجتنابناپذیر است.»
ارسال نظر