ГоловнаСвіт

Китайський стартап DeepSeek представив прев’ю-версію нової моделі

Ця довгоочікувана модель наступного покоління здатна опрацьовувати обсяг інформації до одного мільйона слів за раз.

Китайський стартап DeepSeek представив прев’ю-версію нової моделі
Значок китайського додатка DeepSeek на екрані мобільного телефону
Фото: EPA/UPG

Китайський стартап DeepSeek представив прев’ю-версію моделі V4, повідомляє DW

Ця довгоочікувана модель наступного покоління здатна опрацьовувати обсяг інформації до одного мільйона слів за раз.

DeepSeek-V4 має дві версії: професійну та дешевшу флеш-версії. V4-Pro має 1,6 трильйона параметрів, тоді як V4-Flash – 284 мільярди. Кількість параметрів визначає здатність моделі приймати рішення.

У тестах на загальні знання DeepSeek-V4-Pro значно випереджає інші доступні моделі і лише трохи поступається лідеру ринку – Gemini-Pro-3.1 від Google.

Попередній випуск потрібен компанії, щоб зібрати відгуки користувачів і доопрацювати модель перед офіційним релізом.

DeepSeek викликав ажіотаж у січні минулого року, коли компанія представила генеративний чат-бот на базі ШІ з можливостями, які конкурували з американськими продуктами, такими як ChatGPT, але для розробки якого, за інформацією компанії, знадобилося значно менше обчислювальної потужності та коштів.

Компанія також опинилася в центрі скандалу. Наприклад, чат-бот уникав запитань на політично чутливі теми, зокрема про розгін протестів на площі Тяньаньмень у 1989 році, що викликало сумніви через цензуру.

  • США та американські конкуренти звинуватили стартап із Ханчжоу в неналежній та незаконній поведінці. У четвер Білий дім заявив, що китайські організації проводять масштабні кампанії з викрадення американських розробок у сфері штучного інтелекту.
  • Пекін назвав звинувачення безпідставними додавши, що Китай “надає великого значення захисту прав інтелектуальної власності”.