
DeepSeek hullám
A DeepSeek egy kínai mesterséges intelligencia (MI) vállalat, amelyet 2023 júliusában alapított Liang Wenfeng, a High-Flyer nevű kínai hedge fund társalapítója. A cég székhelye Hangzhouban található, és nyílt forráskódú nagy nyelvi modellek (LLM-ek) fejlesztésére specializálódott.
2025 januárjában a DeepSeek bemutatta első ingyenes chatbot alkalmazását, amely az R1 nevű modelljükön alapul. Ez az alkalmazás rövid időn belül az Egyesült Államok iOS App Store-jának legnépszerűbb ingyenes alkalmazásává vált, megelőzve a korábban vezető ChatGPT-t. Az R1 modell teljesítménye összehasonlítható más vezető nyelvi modellekkel, mint például az OpenAI GPT-4-e, miközben a fejlesztési költségei jelentősen alacsonyabbak voltak; mindössze 6 millió amerikai dollárba került, szemben a GPT-4 100 millió dolláros költségével.
A DeepSeek sikere jelentős piaci hatásokat váltott ki. A technológiai részvények, különösen az Nvidia, értéke jelentősen csökkent, mivel a befektetők aggódtak amiatt, hogy az olcsóbb és hatékonyabb MI modellek csökkenthetik az igényt a drága hardverek iránt. Ugyanakkor egyes elemzők szerint a DeepSeek áttörése növelheti az MI iránti általános keresletet, ami hosszú távon pozitív hatással lehet a piacra.
A vállalat nyílt forráskódú megközelítése lehetővé teszi más fejlesztők számára, hogy szabadon használják, módosítsák és továbbfejlesszék a DeepSeek által létrehozott modelleket és algoritmusokat. Ez a nyitottság hozzájárulhat az MI közösség gyorsabb fejlődéséhez és az innováció ösztönzéséhez világszerte.
Összefoglalva, a DeepSeek rövid idő alatt jelentős hatást gyakorolt az MI iparágra, bemutatva, hogy alacsonyabb költségvetéssel és nyílt forráskódú megközelítéssel is lehet versenyképes és innovatív megoldásokat létrehozni.
Az alábbi táblázatban néhány jelentős MI modellt hasonlítunk össze a DeepSeek-kel:
Modell | Fejlesztő | Paraméterek száma | Költség (USD) | Teljesítmény | Megjegyzések |
---|---|---|---|---|---|
DeepSeek R1 | DeepSeek | N/A | 6 millió | Magas | Nyílt forráskódú, alacsony fejlesztési költség, teljesítménye összehasonlítható a GPT-4-gyel. |
GPT-4 | OpenAI | N/A | 100 millió | Magas | Zárt forráskódú, magas fejlesztési költség, széles körben használt. |
Qwen 2.5-Max | Alibaba Cloud | N/A | N/A | Magas | Kínai fejlesztésű modell, versenyképes teljesítménnyel. |
AutoGLM | Zhipu | N/A | N/A | Magas | Kínai fejlesztésű modell, versenyképes teljesítménnyel. |
Kimi k1.5 | Moonshot AI | N/A | N/A | Magas | Kínai fejlesztésű modell, versenyképes teljesítménnyel. |
Doubao-1.5-pro | ByteDance | N/A | N/A | Magas | Kínai fejlesztésű modell, versenyképes teljesítménnyel. |
Hunyuan | Tencent | N/A | N/A | Magas | Kínai fejlesztésű modell, versenyképes teljesítménnyel. |
Megjegyzés: A pontos paraméterszámok és költségek nem minden modell esetében nyilvánosak.
A DeepSeek R1 modellje kiemelkedik alacsony fejlesztési költségével és nyílt forráskódú megközelítésével, amely lehetővé teszi a széleskörű hozzáférést és a közösségi fejlesztést. Teljesítménye összehasonlítható a GPT-4-ével, miközben jelentősen alacsonyabb költséggel készült. Más kínai vállalatok, mint az Alibaba Cloud, Zhipu, Moonshot AI, ByteDance és Tencent szintén fejlesztettek versenyképes MI modelleket, amelyek hozzájárulnak Kína gyors előretöréséhez az MI területén.
Összességében a DeepSeek és más kínai MI modellek megjelenése jelentős hatással van a globális MI versenyre, új lehetőségeket és kihívásokat teremtve a technológiai iparban.
//
Olvass tovább:
Lefedettségi térkép – Telekom, Yettel, One
A Mesterséges Intelligencia Fejlődése napjainkban
Apple Intelligence = 7 GB tárhely lefoglalás