Головна — Технології — 30 січня 2025, 12:00

Що відомо про китайський ШІ DeepSeek і чому його сенсаційний успіх може виявитися результатом крадіжки

DeepSeek, стартап у сфері штучного інтелекту, чия гучна поява на ринку обвалила акції технологічних гігантів на кшталт Nvidia та Microsoft, може виявитися типовою історією успіху по-китайськи, в основі якого — крадіжка чужих ідей і технологій.

Сергій Мельник, журналіст-міжнародник

Додати LB.ua як бажане
джерело в Google

Логотип китайського стартапу <i>DeepSeek</i>

Фото: EPA/UPG

Логотип китайського стартапу DeepSeek

Що таке DeepSeek?

DeepSeek — це китайська компанія у сфері штучного інтелекту, яка в січні 2025 року виклала у відкритий доступ генеративний чат-бот на основі великої мовної моделі штучного інтелекту під назвою R1.

Чат-бот DeepSeek виконує завдання приблизно на тому самому рівні, що й інші подібні сервіси, наприклад ChatGPT компанії OpenAI. Ексклюзивна особливість: R1 описує процес думання — генерує текст про те, як саме аналізує запит і готує відповідь.

У січні 2025 року він опинився серед найпопулярніших застосунків на Apple Store і Google Play.

Модель R1 має відкритий вихідний код, тобто інші компанії чи дослідники можуть використати її для створення власних аналогічних продуктів ШІ.

На популярність китайського ШІ зреагував навіть президент США Дональд Трамп, який назвав появу DeepSeek тривожним дзвінком і додав, що американцям «потрібно зосередитися на конкуренції, щоб перемогти».

Хто створив DeepSeek?

Засновником DeepSeek є 40-річний китайський інвестор і математик Лян Веньфен, засновник хедж-фонду High-Flyer, який управляє активами на 8 мільярдів доларів. Веньфен є фанатом технологій ШІ, а його High-Flyer використовує алгоритми штучного інтелекту, аби виявляти закономірності, що впливають на ціни акцій.

Фото: antikor.ua

Лян Веньфен

Веньфен заснував DeepSeek у 2023 році. Компанія активно залучає молодих і талановитих дослідників штучного інтелекту з провідних університетів, обіцяючи високі зарплати. Також DeepSeek стала одним з найбільших китайських покупців чипів Nvidia. Хоч до 2025-го стартап не сприймали як особливо перспективний. Усе змінив випуск моделі R1.

Чому поява DeepSeek спричинила такий ефект?

Звісно, спрацювали ефект новизни й відсутність абонплати за користування. Та головна особливість DeepSeek, на якій наголошує сама компанія, — її дешевизна: китайський стартап нібито використав лише 2048 графічних процесорів Nvidia H800 (цей процесор, модифікований спеціально для китайського ринку, у нього знижена швидкість передачі даних між чипами) і витратив усього 5,6 мільйона доларів на навчання своєї моделі. Для порівняння: американська компанія OpenAI, лідер з розробки великих мовних моделей, витрачає на навчання своїх моделей аналогічного рівня від приблизно 16 тисяч відеокарт більш просунутих модифікацій. GPT-4 коштував компанії 80–100 мільйонів доларів, GPT-5 — приблизно мільярд.

Декларована дешевизна DeepSeek іде врозріз із усталеним уявленням про те, що розробка моделей ШІ потребує величезної обчислювальної потужності, а отже й мільярдних інвестицій. Наприклад, минулого тижня компанії SoftBank, Oracle і OpenAI оголосили, що інвестують 500 мільярдів доларів у нову інфраструктуру штучного інтелекту в рамках проєкту Stargate. Meta планує у 2025 році інвестувати 65 мільярдів доларів у капітальну інфраструктури для ШІ. Зіставні суми на такі цілі витратять Microsoft, Alphabet й Amazon.

Значок китайського застосунку <i>DeepSeek</i> на екрані мобільного телефона

Фото: EPA/UPG

Значок китайського застосунку DeepSeek на екрані мобільного телефона

Тож поява DeepSeek спровокувала падіння акцій технологічних компаній. Подешевшали також акції компаній з виробництва електроенергії, великі обсяги якої живлять центри обробки даних ШІ.

Акції компанії Nvidia, яка випускає найкращі графічні процесори для навчання моделей штучного інтелекту, впали 27 січня на 17 %, втративши 600 мільярдів доларів ринкової капіталізації (у наступні дні, коли ефект DeepSeek минув, ціна акцій виросла на 9 %).

Чи означає успіх DeepSeek, що Китай здобуває лідерство у сфері ШІ?

Китай, безумовно, є одним зі світових лідерів у розробці систем штучного інтелекту. Але у випадку зі DeepSeek може йтися не лише про геніальні інновації, а й про банальне використання чужої праці.

29 січня компанія OpenAI повідомила Financial Times, що знайшла докази того, що китайський стартап несанкціоновано використовував її моделі, щоб навчати свою R1.

Зокрема, DeepSeek нібито використала техніку дистиляції, завдяки якій отримують кращу продуктивність на менших моделях, послуговуючись результатами більших.

Дистиляція є звичною практикою в галузі, пише Financial Times, але проблема в тому, що DeepSeek використала не свої моделі, а конкурента, до того ж без його згоди, фактично вкрала чужу інтелектуальну власність.

OpenAI заявила, що вживає контрзаходів для захисту своєї інтелектуальної власності: «Ми тісно співпрацювали з урядом США, щоб якнайкраще захистити найпотужніші моделі від зусиль супротивників і конкурентів заволодіти американськими технологіями».

Раніше компанія DeepSeek заявляла, що використовувала для навчання R1 відкриті моделі компаній Meta і Anthropic.

«Це дуже поширена практика для стартапів і науковців використовувати результати комерційних великих мовних моделей, як-от ChatGPT, щоб навчати іншу модель», — сказав Рітвік Гупта, доктор філософії зі штучного інтелекту в Університеті Каліфорнії.

Іконки чату <i>GPT</i> і китайського застосунку <i>DeepSeek</i> на екрані мобільного телефона

Фото: EPA/UPG

Іконки чату GPT і китайського застосунку DeepSeek на екрані мобільного телефона

Китайські сервіси часто цензурують контент. DeepSeek теж?

Англомовні користувачі свідчили, що чат-бот DeepSeek відмовляється відповідати на запитання про чутливі для Пекіна теми, зокрема, різанину на площі Тяньаньмень і репресії проти уйгурів.

«Коли я попросив його коротко описати різанину на площі Тяньаньмень у 1989 році, подію, яку китайський уряд довго намагався стерти з Інтернету, він відповів, що ця інформація “виходить за межі моїх поточних можливостей” і запропонував поговорити про щось інше», — розповів про свій досвід спілкування з DeepSeek оглядач The New York Times.

Автор цієї статті також запитав DeepSeek про різанину на площі Тяньаньмень (українською мовою) і отримав відповідь:

Події на площі Тяньаньмень у 1989 році є однією з найбільш суперечливих і трагічних сторінок сучасної історії Китаю. Ці події стали результатом масових протестів, які почалися навесні 1989 року і досягли піку в червні. Основною причиною протестів були вимоги демократичних реформ, боротьба з корупцією та підтримка свободи слова.

Основні події:
Початок протестів:
Протести розпочалися у квітні 1989 року, коли студенти та інтелектуали почали збиратися на площі Тяньаньмень у Пекіні, щоб висловити свої вимоги до уряду.

До протестуючих приєдналися тисячі людей, включаючи робітників, інтелектуалів та представників різних верств населення.

Ескалація ситуації:
Протягом кількох тижнів протести набирали обертів, і демонстранти встановили на площі Тяньаньмень символічну "Статую Свободи", яка нагадувала Статую Свободи у Нью-Йорку.

Уряд спочатку діяв обережно, але згодом ситуація загострилася через страх перед втратою контролю.

Фото: CATHERINE HENRIETTE

Сотні тисяч китайців, які зібралися на площі Тяньаньмень 2 червня 1989 року. На задньому плані — Богиня Демократії — десятиметрова статуя, створена студентами художніх шкіл за подобою Статуї Свободи.

Введення воєнного стану:
20 травня 1989 року уряд оголосив воєнний стан у Пекіні.

3–4 червня 1989 року китайська армія отримала наказ очистити площу Тяньаньмень від протестувальників.

Розправа:
Вночі з 3 на 4 червня 1989 року війська застосували силу проти демонстрантів, включаючи використання танків, кулеметів та інших видів зброї.

Точна кількість жертв залишається невідомою через цензуру та відсутність офіційних даних. Незалежні джерела оцінюють кількість загиблих від кількох сотень до кількох тисяч осіб.

Наслідки:
Після розправи уряд Китаю жорстко придушив будь-які прояви невдоволення, а також посилив цензуру та контроль над інформацією.

Події на площі Тяньаньмень залишаються забороненою темою в Китаї, і будь-які згадки про них цензуруються.

Міжнародна реакція:
Події на площі Тяньаньмень викликали хвилю обурення по всьому світу.

Багато країн засудили дії китайського уряду, а також ввели санкції проти Китаю.

Фото: Джефф Віднер / Вікі

5 червня 1989 року, коли колона танків поверталася з Пекіна по Чанган авеню, була зупинена на деякий час чоловіком, Ім'я цієї людини невідоме, і згадується як «Танкова людина» («Tank man») із господарськими сумками в руках. Він рухався зі сторони в сторону, заступаючи танкам шлях.

Пам'ять про події:
У Китаї події 1989 року залишаються табуйованою темою, і будь-які спроби обговорення або вшанування пам'яті жертв жорстко придушуються.

У світі події на площі Тяньаньмень вважаються символом боротьби за демократію та права людини.

Якщо у вас є додаткові питання або потреба в деталях, дайте знати!

Не менш розгорнутими були відповіді про цензуру в Китаї та утиски уйгурської меншини. Тож поки що DeepSeek відповідей на запити українською не цензурує.

Навіть про цензуру:

У Китаї діє система цензури, яка регулює інформаційний простір з метою забезпечення національної безпеки, суспільної стабільності та збереження культурних цінностей. Цензура охоплює ЗМІ, інтернет, соціальні мережі, літературу, мистецтво та інші сфери. Основні напрямки включають блокування сайтів, фільтрацію контенту, обмеження на критику влади та контроль над інформацією, яка може вплинути на громадську думку.

Фото: EPA/UPG

Значок китайського застосунку DeepSeek на екрані мобільного телефона

А чи безпечно користуватися DeepSeek?

DeepSeek є китайською компанією, на яку, звісно, поширюються всі правила й обмеження, які Пекін застосовує до інтернет-сервісів. У тому числі про збір і передачу даних користувачів. Наприклад, діє закон, який зобов'язує інтернет-сервіси співпрацювати з китайською розвідкою.

Ось, що написав DeepSeek у відповідь на запитання про це:

Китайські технологічні компанії зобов'язані співпрацювати з державними органами та надавати доступ до даних користувачів за запитом. Це регулюється національним законодавством, зокрема Законом про кібербезпеку.

За припущенням Wired, DeepSeek, імовірно, надсилає більше даних до Китаю, ніж TikTok, оскільки останній сервіс перейшов на хмарний хостинг у США, а от уся серверна інфраструктура стартапу розміщена в Китаї. Власне, в умовах користувача про це написано чітко: «Особиста інформація, яку ми збираємо від вас, може зберігатися на сервері, розташованому за межами країни, де ви проживаєте. Ми зберігаємо зібрану інформацію на безпечних серверах, розташованих у Китайській Народній Республіці».

Як і те, як довго китайський сервіс зберігає інформацію про користувача: «Ми зберігаємо інформацію стільки, скільки необхідно для надання наших Послуг та для інших цілей, викладених у цій Політиці конфіденційності».

На думку очільника Центру протидії дезінформації при РНБО Андрія Коваленка, DeepSeek є «чудовим інструментом для збору розвідданих».

Фото: Анна Стешенко

Керівник Центру протидії дезінформації РНБО Андрій Коваленко

«Будь-який штучний інтелект вивчає вас і збирає всю інформацію про ваші переживання, інтереси, сім'ю, фінанси та практично все інше», — зазначив він і додав, що завдяки здобутій інформації можна отримувати моделі поведінки цілих суспільств і продумувати інструменти впливу на нього.

Яку інформацію про користувача збирає DeepSeek?

Під час реєстрації DeepSeek отримує адресу електронної пошти, за можливості — номер телефону, дату народження, ім’я користувача тощо. Якщо користувач реєструється за допомогою входу в акаунт Google або Apple, сервіс отримує певну інформацію від цих компаній. Наприклад, рекламні ідентифікатори, які дозволяють отримувати дані про запити й поведінку користувача поза межами сервісу DeepSeek.

Звісно, зберігають і надсилають у Китай все, що стосується спілкування з чат-ботом. «Ми можемо збирати ваші текстові або аудіозапити, підказки, завантажені файли, відгуки, історію чатів або інший вміст, який ви надаєте нашій моделі та сервісам», — йдеться в політиці конфіденційності.

DeepSeek також акумулює інформацію про пристрій користувача, операційну систему, IP-адресу. Він також може записувати «схеми натискання клавіш або ритми» і використовує файли cookie й інші технології відстеження для «вимірювання та аналізу того, як ви використовуєте наші послуги».

Сергій Мельник, журналіст-міжнародник