DeepSeek Вікіпедія
Моделі штучного інтелекту DeepSeek можна розглядати як значний крок до розвитку передових технологій у країнах Азії, допомагаючи утримувати таланти та зменшуючи відтік мізків із таких країн, як Індія та Китай17. 27 січня 2025 DeepSeek представила модель Janus Pro — генеративну модель для генерування зображень53.
DeepSeek
- У квітні 2023 року High-Flyer заснував лабораторію штучного інтелекту, присвячену розробці ШІ-інструментів окремо від фінансового бізнесу High-Flyer2526.
- Ця безоплатна opensource модель ШІ, в останні вихідні січня 2025 року стала топовим застосунком в рейтингу App Store, що призвело до падіння цін на акції технологічних компаній інших країн51.
- Наприклад, модель відмовляється відповідати на запитання про події на площі Тяньаньмень 1989 року, переслідування уйгурів або становище прав людини в Китаї5455.
- Цей крок викликаний висновками місцевої Комісії із захисту персональної інформації, яка вимагає внесення змін для відповідності національним законам59.
- До 2019 року High-Flyer перетворився на гедж-фонд, зосереджений на розробці та використанні штучного інтелекту в алгоритмах торгівлі.
Навчання моделей DeepSeek відбувалось на тлі санкцій США, які забороняли постачання чіпів Nvidia до Китаю з метою обмежити здатність країни розробляти передові системи штучного інтелекту8. Після випуску моделі DeepSeek-V2 у травні 2024 року, яка пропонувала високу продуктивність за низьку ціну, компанія DeepSeek стала відомою як каталізатор війни цін на ШІ-моделі в КНР. Великі китайські технологічні гіганти, такі https://deepseek.net.ua/ як ByteDance, Tencent, Baidu та Alibaba почали знижувати ціни на свої моделі, щоб конкурувати з компанією. Незважаючи на низьку ціну, встановлену DeepSeek, компанія була прибутковою, в той час як конкуренти втрачали гроші29. DeepSeek публікує свої алгоритми, моделі та деталі навчання під відкритою ліцензією14. Повідомляється, що компанія набирає молодих дослідників штучного інтелекту з провідних китайських університетів15 і наймає людей за межами сфери комп’ютерних наук, щоб урізноманітнити знання та здібності при розробці своїх моделей16.
DeepSeek LLM
Наприклад, модель відмовляється відповідати на запитання про події на площі Тяньаньмень 1989 року, переслідування уйгурів або становище прав людини в Китаї5455. Наприклад, на запитання хто такий далай-лама, дає правильне визначення, доповнюючи його словами, що Тибет «невіддільна частина Китаю зі стародавніх часів»56. У квітні 2023 року High-Flyer заснував лабораторію штучного інтелекту, присвячену розробці ШІ-інструментів окремо від фінансового бізнесу High-Flyer2526. У травні 2023 року за участю High-Flyer як одного з інвесторів лабораторія перетворилась на окрему компанію DeepSeek272826.
2 листопада 2023 року DeepSeek представила свою першу модель, DeepSeek Coder, доступну безкоштовно34. У січні 2025 року Італійський Орган із захисту персональних даних терміново обмежив обробку даних італійських користувачів у DeepSeek через можливий витік даних57. DeepSeek не має детальних планів комерціалізації;30 це дозволяє її технологіям уникати найсуворіших китайських обмежень щодо ШІ, зокрема вимоги, щоб споживацькі інформаційні продукти відповідали урядовому контролю над інформацією31.
Порівняльні тести показали, що модель перевершила Llama 3.1 і Qwen 2.5, водночас зрівнявшись із GPT-4o та Claude 3.5 Sonnet40414243. Розвиток DeepSeek в умовах порівняно невеликої кількості ресурсів підкреслив потенційну обмеженість санкцій США щодо розвитку штучного інтелекту в КНР4044. У січні 2025 року західним дослідникам вдалося змусити DeepSeek дати точні відповіді на деякі з цих тем шляхом уточнення поставленого запитання. Наприклад, якщо попросити дати відповідь, де літери замінені на візуально схожі цифри (як 4 і A, див. Leet), то ШІ покаже нецензурований текст56.
У травні 2024 року було випущено DeepSeek-V2.38 Financial Times повідомила, що він дешевше аналогів, пропонуючи ціну в два юаня за кожен мільйон токенів. В рейтингу великих мовних моделей Tiger Lab від університету Ватерлоо DeepSeek-V2 посів сьоме місце39. 29 листопада 2023 року DeepSeek випустила модель DeepSeek LLM, розроблену як конкурент іншим доступним мовним моделям і з продуктивністю, що наближалась до GPT-4. Однак компанія зіткнулася з проблемами обчислювальної ефективності та масштабованості продукту36.
10 січня 2025 року DeepSeek представила безкоштовний чат-бот на основі моделі DeepSeek-R1 для iOS та Android; до 27 січня DeepSeek-R1 обігнав ChatGPT, ставши найбільш завантажуваним безкоштовним додатком в iOS App Store у США9, що призвело до падіння ціни акцій Nvidia на 18 %1011. Успіх DeepSeek у конкуренції з більшими та відомішими аналогами був описаний як «переворот у сфері штучного інтелекту»,9 що став «першим пострілом у тому, що переростає в глобальну гонитву у сфері ШІ»,12 і відкриває «нову еру ШІ з „балансуванням на межі“»13. У лютому 2025 року Південна Корея заборонила нові завантаження китайського чат-бота DeepSeek AI через занепокоєння щодо захисту персональних даних. Цей крок викликаний висновками місцевої Комісії із захисту персональної інформації, яка вимагає внесення змін для відповідності національним законам59. Коли популярність DeepSeek різко зросла в січні 2025 року, користувачі зауважили, що версія R1 використовує механізми цензури для тем, які стосуються політики Китайської Народної Республіки.
В 2015 році три випускники Чжецзянського університету, які з часів глобальної фінансової кризи 2008 року цікавились торгівлею акціями, заснували компанію High-Flyer18, яка використовувала для торгівлі машинне навчання19. 20 січня 2025 року вийшли версії DeepSeek-R1 і DeepSeek-R1-Zero4647, що базуються на оптимізованій версії V3. За результатами перших тестів, при виконанні певних завдань з математики, хімії та програмування продуктивність R1 перебуває на одному рівні з OpenAI o1484950. Ця безоплатна opensource модель ШІ, в останні вихідні січня 2025 року стала топовим застосунком в рейтингу App Store, що призвело до падіння цін на акції технологічних компаній інших країн51. До 2019 року High-Flyer перетворився на гедж-фонд, зосереджений на розробці та використанні штучного інтелекту в алгоритмах торгівлі. До 2021 року High-Flyer використовував у торгівлі виключно ШІ20, при цьому часто працюючи з чіпами Nvidia21.