তবে এটি এখনও এর প্রতিযোগীদের তুলনায় সস্তা।
ডিপসেকের নতুন চ্যাটবট এই আকর্ষণীয় বিবরণ দিয়ে আমার সাথে নিজেকে পরিচয় করিয়ে দিয়েছে:
হাই, আমাকে তৈরি করা হয়েছিল যাতে আপনি কিছু জিজ্ঞাসা করতে পারেন এবং এমন একটি উত্তর পেতে পারেন যা আপনাকে অবাক করে দিতে পারে।
আজ, ডিপসিকের কৃত্রিম বুদ্ধিমত্তা বাজারে এক শক্তিশালী প্রতিযোগী হিসাবে আত্মপ্রকাশ করেছে, বিশেষত এনভিডিয়ার অন্যতম বৃহত্তম শেয়ারের দামের ড্রপকে অবদান রাখে।
চিত্র: ensigame.com
এই মডেলটিকে কী আলাদা করে দেয় তা হ'ল এর উদ্ভাবনী স্থাপত্য এবং প্রশিক্ষণের পদ্ধতি। এটি বেশ কয়েকটি উন্নত প্রযুক্তি অন্তর্ভুক্ত করে:
মাল্টি-টোকেন প্রেডিকশন (এমটিপি): traditional তিহ্যবাহী মডেলগুলির বিপরীতে যা একবারে একটি শব্দের পূর্বাভাস দেয়, ডিপসিকের মডেল এক সাথে একাধিক শব্দের পূর্বাভাস দেয় যা একটি বাক্যটির বিভিন্ন অংশ বিশ্লেষণ করে একসাথে একাধিক শব্দের পূর্বাভাস দেয়। এই পদ্ধতির মডেলটির যথার্থতা এবং দক্ষতা উভয়ই উল্লেখযোগ্যভাবে বাড়ায়।
বিশেষজ্ঞদের মিশ্রণ (এমওই): এই আর্কিটেকচার ইনপুট ডেটা প্রক্রিয়া করতে বিভিন্ন নিউরাল নেটওয়ার্ক ব্যবহার করে। এমওই নিয়োগের মাধ্যমে, প্রযুক্তিটি এআই প্রশিক্ষণকে ত্বরান্বিত করে এবং কর্মক্ষমতা উন্নত করে। ডিপসেক ভি 3 -তে, একটি চিত্তাকর্ষক 256 নিউরাল নেটওয়ার্ক ব্যবহার করা হয়, প্রতিটি টোকেন প্রসেসিং টাস্কের জন্য আটটি সক্রিয় করা হয়।
মাল্টি-হেডের সুপ্ত মনোযোগ (এমএলএ): এই প্রক্রিয়াটি মডেলটিকে একটি বাক্যটির সর্বাধিক উল্লেখযোগ্য অংশগুলিতে ফোকাস করতে সহায়তা করে। বিধায়ক গুরুত্বপূর্ণ তথ্য অনুপস্থিতির সম্ভাবনা হ্রাস করে বারবার পাঠ্য খণ্ডগুলি থেকে মূল বিবরণগুলি বের করে। এটি ইনপুট ডেটাতে গুরুত্বপূর্ণ সূক্ষ্মতা ক্যাপচার করার এআইয়ের ক্ষমতা বাড়ায়।
বিশিষ্ট চীনা স্টার্টআপ ডিপসেক দাবি করেছে যে তারা ন্যূনতম ব্যয় সহ একটি প্রতিযোগিতামূলক এআই মডেল তৈরি করেছে, তারা উল্লেখ করেছে যে তারা শক্তিশালী নিউরাল নেটওয়ার্ক ডিপসেক ভি 3 প্রশিক্ষণের জন্য মাত্র million মিলিয়ন ডলার ব্যয় করেছে এবং কেবল 2048 গ্রাফিক্স প্রসেসর ব্যবহার করেছে।
চিত্র: ensigame.com
তবে, সেমিয়ানালাইসিসের বিশ্লেষকরা আবিষ্কার করেছেন যে ডিপসেক প্রায় 50,000 এনভিডিয়া হপার জিপিইউ সমন্বিত একটি বৃহত গণ্য অবকাঠামো পরিচালনা করে। এর মধ্যে রয়েছে 10,000 এইচ 800 ইউনিট, 10,000 আরও উন্নত এইচ 100 এবং এইচ 20 জিপিইউগুলির অতিরিক্ত ব্যাচ। এই সংস্থানগুলি বেশ কয়েকটি ডেটা সেন্টারে বিতরণ করা হয় এবং এআই প্রশিক্ষণ, গবেষণা এবং আর্থিক মডেলিংয়ের জন্য ব্যবহৃত হয়।
সার্ভারগুলিতে কোম্পানির মোট বিনিয়োগ প্রায় 1.6 বিলিয়ন ডলার, অপারেশনাল ব্যয়ের সাথে আনুমানিক $ 944 মিলিয়ন ডলার।
ডিপসেক হ'ল চীনা হেজ ফান্ড হাই-ফ্লাইারের একটি সহায়ক সংস্থা, যা ২০২৩ সালে এআই টেকনোলজিসের উপর দৃষ্টি নিবদ্ধ করে একটি পৃথক বিভাগ হিসাবে শুরু করে। সংস্থাটি স্ব-অর্থায়িত রয়েছে, যা এর নমনীয়তা এবং সিদ্ধান্ত গ্রহণের গতিতে ইতিবাচকভাবে প্রভাবিত করে।
চিত্র: ensigame.com
তদুপরি, ডিপসেকের কিছু গবেষক বার্ষিক $ 1.3 মিলিয়ন ডলারের বেশি আয় করেন, শীর্ষস্থানীয় চীনা বিশ্ববিদ্যালয়গুলি থেকে শীর্ষ প্রতিভা আকৃষ্ট করে (সংস্থাটি বিদেশী বিশেষজ্ঞদের নিয়োগ দেয় না)।
এমনকি এটি বিবেচনা করেও, ডিপসেকের সাম্প্রতিক দাবিটির সর্বশেষ মডেলটিকে মাত্র million মিলিয়ন ডলারে প্রশিক্ষণ দেওয়ার দাবি অবাস্তব বলে মনে হচ্ছে। এই চিত্রটি কেবল প্রাক-প্রশিক্ষণের সময় জিপিইউ ব্যবহারের ব্যয়কে বোঝায় এবং গবেষণা ব্যয়, মডেল পরিশোধন, ডেটা প্রসেসিং বা সামগ্রিক অবকাঠামোগত ব্যয়ের জন্য অ্যাকাউন্ট করে না।
প্রতিষ্ঠার পর থেকে ডিপসেক এআই বিকাশে $ 500 মিলিয়ন ডলারের বেশি বিনিয়োগ করেছে। তবে আমলাতন্ত্র দ্বারা ভারাক্রান্ত বৃহত্তর সংস্থাগুলির বিপরীতে, ডিপসিকের কমপ্যাক্ট কাঠামো এটিকে সক্রিয়ভাবে এবং কার্যকরভাবে এআই উদ্ভাবনগুলি বাস্তবায়নের অনুমতি দেয়।
চিত্র: ensigame.com
ডিপসেকের উদাহরণটি প্রমাণ করে যে একটি ভাল অর্থায়িত স্বতন্ত্র এআই সংস্থা শিল্প নেতাদের সাথে প্রতিযোগিতা করতে পারে। তবুও, বিশেষজ্ঞরা জোর দিয়েছিলেন যে সংস্থাটির সাফল্য মূলত বিলিয়ন বিনিয়োগ, প্রযুক্তিগত অগ্রগতি এবং একটি শক্তিশালী দলের কারণে, যখন এআই মডেলগুলি বিকাশের জন্য "বিপ্লবী বাজেট" সম্পর্কে দাবি কিছুটা অতিরঞ্জিত।
তবুও, প্রতিযোগীদের ব্যয় উল্লেখযোগ্যভাবে বেশি রয়েছে। উদাহরণস্বরূপ, মডেল প্রশিক্ষণের ব্যয়ের তুলনা করুন: ডিপসেক আর 1 এর জন্য 5 মিলিয়ন ডলার ব্যয় করেছে, যখন চ্যাটজিপিটি 4o এর দাম $ 100 মিলিয়ন।