Vízválasztó pillanathoz érkezett a kínai AI-szektor
Elemzők szerint elképesztő lökést fog adni a kínai piacnak, hogy a Huawei és a Moore Threads is integrálja a DeepSeek modelljeit saját szolgáltatásaiba, egyre több helyi szereplő próbál előnyt szerezni a kínai modellel.
Miután a kínai DeepSeek mesterségesintelligencia-modellje felbukkant, és egyre komolyabb tényezőnek számít, a helyi felhőszolgáltatók és chipgyártók szinte versenyeznek azért, hogy minél előbb adaptálják a kínai modellt saját szolgáltatásukba. Elemzők szerint ugyan a DeepSeek költségeit korábban jelentősen alulértékelték a beszámolók során, az kétségtelen, hogy a kínai AI-modell vízválasztó momentumot hozott el az iparág idővonalán.
Az Nvidiával versenyezni kívánó Moore Threads és Hygon Information Technology hétfőn közölte, hogy számítási klasztereik és gyorsítóik támogatni fogják a DeepSeek R1 és V3 modelleket. A Moore Threads szerint a DeepSeek által kínált modell a kínai gyártású grafikus feldolgozóegységekkel karöltve szinte „lángra lobbanthatja” a kínai AI-szektort. Még előtte pár nappal a saját AI-chipekkel rendelkező Huawei is közölte, hogy együttműködik az AI-infrastruktúrát működtető SiliconFlow-val, hogy a DeepSeek modelljeit elérhetővé tegye az ügyfelek számára az Ascend felhőszolgáltatáson keresztül.
Így blokkold a karriered Golden handcuffs és társai: a 49. adásban összeszedtünk pár dolgot, amit IT szakemberként érdemes elkerülni.
A Huawei szerint a DeepSeekkel elérhető teljesítmény összevethető a globálisan elérhető, high-end chipeken futó modellek képességeivel, és bizonyítja, hogy a versenyképes nagy nyelvi modellek (LLM) bevethetők a kínai „elég jó” chipeken is, nem szükséges az élvonalbeli amerikai hardverekre támaszkodni. Az olyan további meghatározó kínai szereplők, mint az Alibaba, a Baido és a Tencent felhős ágai szintén közölték, hogy elérhetővé tették szolgáltatásaikon keresztül a DeepSeek modelljét.
Sok a vita a DeepSeek „valódi” GPU-költségével kapcsolatban annak ellenére, hogy vitathatatlanul sikerült csökkenteni a képzési és üzemeltetési költségeket a kisebb modellel. A South Chine Morning Post az a SemiAnalysis kutatócégre hivatkozva arról számolt be, hogy a DeepSeek teljes szerverberuházása elérhette az 1,6 milliárd dollárt, ami körülbelül 50 000 Nvidia Hopper GPU-t foglal magába, beleértve a számítási klaszterek 944 millió dolláros működési költségeit.