Drücke „Enter”, um zum Inhalt zu springen.
Hinweis zu diesem Datenschutz-Blog:
Anscheinend verwenden Sie einen Werbeblocker wie uBlock Origin oder Ghostery, oder einen Browser, der bestimmte Dienste blockiert.
Leider wird dadurch auch der Dienst von VG Wort blockiert. Online-Autoren haben einen gesetzlichen Anspruch auf eine Vergütung, wenn ihre Beiträge oft genug aufgerufen wurden. Um dies zu messen, muss vom Autor ein Dienst der VG Wort eingebunden werden. Ohne diesen Dienst geht der gesetzliche Anspruch für den Autor verloren.

Ich wäre Ihnen sehr verbunden, wenn Sie sich bei der VG Wort darüber beschweren, dass deren Dienst anscheinend so ausgeprägt ist, dass er von manchen als blockierungswürdig eingestuft wird. Dies führt ggf. dazu, dass ich Beiträge kostenpflichtig gestalten muss.

Durch Klick auf folgenden Button wird eine Mailvorlage geladen, die Sie inhaltlich gerne anpassen und an die VG Wort abschicken können.

Nachricht an VG WortMailtext anzeigen

Betreff: Datenschutzprobleme mit dem VG Wort Dienst(METIS)
Guten Tag,

als Besucher des Datenschutz-Blogs Dr. DSGVO ist mir aufgefallen, dass der VG Wort Dienst durch datenschutzfreundliche Browser (Brave, Mullvad...) sowie Werbeblocker (uBlock, Ghostery...) blockiert wird.
Damit gehen dem Autor der Online-Texte Einnahmen verloren, die ihm aber gesetzlich zustehen.

Bitte beheben Sie dieses Problem!

Diese Nachricht wurde von mir persönlich abgeschickt und lediglich aus einer Vorlage generiert.
Wenn der Klick auf den Button keine Mail öffnet, schreiben Sie bitte eine Mail an info@vgwort.de und weisen darauf hin, dass der VG Wort Dienst von datenschutzfreundlichen Browser blockiert wird und dass Online Autoren daher die gesetzlich garantierten Einnahmen verloren gehen.
Vielen Dank,

Ihr Klaus Meffert - Dr. DSGVO Datenschutz-Blog.

PS: Wenn Sie meine Beiträge oder meinen Online Website-Check gut finden, freue ich mich auch über Ihre Spende.
Ausprobieren Online Webseiten-Check sofort das Ergebnis sehen

DeepSeek vs ChatGPT: перевірка фактів про китайську мовну модель ШІ

0
Dr. DSGVO Newsletter detected: Extended functionality available
More articles · Website-Checks · Live Offline-AI
📄 Стаття у форматі PDF (тільки для передплатників новин)
🔒 Premium-Funktion
Der aktuelle Beitrag kann in PDF-Form angesehen und heruntergeladen werden

📊 Download freischalten
Der Download ist nur für Abonnenten des Dr. DSGVO-Newsletters möglich

Штучний інтелект – дуже складна тема, яку не розуміють навіть багато технічних спеціалістів. До цього додається звітність, яка часто є неточною з причин необхідного спрощення або необхідності привернути увагу. В результаті з'являються твердження, які створюють викривлену картину про DeepSeek. Найважливіші факти простою мовою.

Вступ

DeepSeek – китайська компанія. Нещодавно вона опублікувала мовну модель DeepSeek-R1. Стверджується, що вона не гірша, а місцями навіть краща за мовну модель o1 ("ChatGPT") від OpenAI.

Це призвело до того, що підприємницькі цінності компаній з КІ, такі як Nvidia, були на низькому рівні. навіть організація захисту даних noyb повідомила про це у своєму новинному листі від 30 січня 2025 року ([1])

Часто складається враження, що DeepSeek значно ефективніший за ChatGPT. Це правда у відповідних аспектах, але не в інших.

Потім ви читаєте такі заголовки:

Статус на 30.01.2025, Джерело: https://www.epochtimes.de/politik/deutschland/deutsche-datenschuetzer-wollen-chinesische-deepseek-ki-ueberpruefen-medienbericht-a5022687.html (зображення було перекладено автоматично).

Це створює враження, що китайськомовна модель не є безпечною, оскільки дані користувачів можуть бути використані не за призначенням.

Більшість тверджень такого роду, що циркулюють у відкритому доступі, не є повністю точними.

Факти про DeepSeek

Захист та безпека даних

DeepSeek – це назва китайської компанії. Якщо DeepSeek використовується як назва мовної моделі, слід розрізняти два варіанти:

  1. Хмарна версія, також відома як "додаток
  2. Мовна модель з відкритим вихідним кодом, може використовуватися повністю незалежно

Відповідь вище згадуваний звіт про те, що «DeepSeek» дуже ймовірно використовує дані користувачів, стосується лише облаштованої у хмарі („App“) версії програми. Для того щоб відкрити відкритий джерело мовний модуль можна завантажити та працювати з ним місцево, зовсім без інтернет-зв'язку. Без такої зв'язку дані користувачів можуть потрапляти до Китаю.

Мовна модель DeepSeek може використовуватися без жодних ризиків для безпеки.

А саме в локальній версії, яка може працювати на власному ШІ-сервері.

ЧатГПТ, звичайно, не дуже й безпечний. Американські закони про шпигунство дозволяють американським органам та американським спецслужбам отримувати дані від інших осіб. УЄФ-американський договір про захист даних ніколи не мав великого значення і був лише формальністю. Він ґрунтується на Президентському розпорядженні Джо Байдена. З розформуванням важливого органу під час президентства Трампа він ще більше втрачає свій вплив. Президентське розпорядження може бути скасоване будь-ким часом Дональдом Трампом.

OpenAI також отримує задоволення від збору ваших даних. Навіть якщо ваші дані ChatGPT не використовуються для навчання ШІ, вони можуть бути використані для інших цілей! Наприклад, для аналізу ШІ OpenAI, що робить вас все більш і більш залежними (вже оголошено про підвищення цін).

Ефективність

Згідно заявления, навчання DeepSeek-R1 коштувало близько 6 мільйонів доларів США. Реальні витрати були вищими, оскільки ця кількість відноситься не до загальних витрат і ще й до базового моделю DeepSeek-V3. Для ChatGPT повідомлялося про суму у 100 мільйонів доларів США.

Це, безумовно, правда:

  • DeepSeek-R1 може працювати на значно дешевшому обладнанні, ніж ChatGPT
  • DeepSeek-R1 відповідає набагато швидше, ніж ChatGPT, тому що він набагато "менший
  • Таким чином, робота DeepSeek-R1 споживає значно менше енергії

Чому DeepSeek-R1 менша за ChatGPT? За даними DeepSeek, R1 є моделлю 685B, тобто складається з 685 мільярдів зв'язків між нейронами. ChatGPT, ймовірно, схожий за розміром. І що тепер?

DeepSeek-R1 працює так як людське мозок: коли ви говорите, переважно активується мовне центру. При розмові лише декілька з усіх ваших нейронів у головному мозку спрацьовують. Технічним чином це відбувається за допомогою так званої Mixture of Experts-архітектури. Ця архітектура вже давно загальна. Вона була застосована, наприклад, при роботі Мистрала.

Оскільки DeepSeek-R1 має відкритий вихідний код, його може завантажити і використовувати сам користувач. Щоб запустити DeepSeek-R1 на власному обладнанні, вам потрібен сервер, який коштує близько 30 000 євро. Багато компаній можуть собі це дозволити. ChatGPT, з іншого боку, ви не захочете запускати на власному обладнанні, крім того, що ви не можете, тому що OpenAI не хоче цього і тому не випустила модель.

якість

У різних бенчмарках DeepSeek-R1 показує такі ж результати, як і OpenAI o1. І це незважаючи на те, що R1 набагато ефективніший і менший за розміром, ніж ChatGPT. Користувачі повідомляють, що R1 не поступається ChatGPT, в той час як інші вважають, що R1 лідирує.

Китайська цензура видалила або спотворила деякі факти з моделі. Як наслідок, якість деяких політичних питань є низькою.

Однак загальний чат-бот – це найгірший варіант використання корпоративного ШІ. У цьому відношенні майже не має значення, що деякі політичні факти в R1 є сумнівними. За допомогою стандартних процедур, таких як точне налаштування або RAG, текстові додатки можуть дуже добре працювати з R1. Інші варіанти використання можна реалізувати ще краще за допомогою R1. До них належать:

  • Ознайомтеся зі знаннями компанії (перегляньте документи),
  • Виконання зобов'язань, що випливають із Закону про ланцюги поставок, наприклад, шляхом аналізу документів постачальника,
  • Створюйте анотації, переклади або спрощення мови.
  • Асистент з програмування

Вор allem останній випадок застосування дуже цікавий. Так автор зміг написати програму протягом кількох годин, що в іншому випадку б зайняло кілька тижнів часу. І це здебільшого на дивані біля непривабливого планшета та без використання мікрофона. Це зовсім інший світ, коли ти 30 хвилин граєш із КІ і програмуєш, або коли ти в найкращому випадку досягаєш того ж результату після двох днів.

Додаткові переваги DeepSeek-R1 над ChatGPT

OpenAI знову й знову випускає нову версію або підверсію ChatGPT. Ці варіанти відрізняються щодо відповіді на ваш запит. Згідно з цим немає консистенції. Без консистенції ніякої Зв'язковості при автоматизації процесів.

OpenAI є платною. Безкоштовна версія для підприємств або зовсім не відноситься до справи, або просто використовується. Платна чат-ка не допомагає у автоматизації процесів. Платна програмістська інтерфейс (API) призводить Нестабільності: скільки разів буде потрібно звернутися до цієї API? Скільки даних треба відправляти на цю API? У залежності від обсягу даних будуть і більш високі, і нижчі витрати за використання API.

Оновлення відбуваються тоді, коли OpenAI їх запланує. Це також означає, що оновлення не відбуваються тоді, коли ви цього хочете. Як постачальник, OpenAI визначає версію ChatGPT, яку ви можете використовувати.

DeepSeek працює так, як ви очікували. Щойно завантажено, воно завжди відповідає однаковим результатам. Тести та бенчмарки показують постійний стан.

ГлибокийСейк може бути експлуатований за фіксованими витратами, які в основному складаються з вартості обладнання (або його оренди).

ДивідСік можна легко замініть іншими моделями або новішими варіантами моделей. Це відбувається саме тоді, коли ви цього хочете. Нестійкість можна усунути шляхом проведення тестів. Загалом це також добре ідея спробувати конкретні випадки застосування з допомогою КІ вирішити. Вони дуже добре можуть володіти та підтверджувати їх.

Чому DeepSeek – це великий вибух?

Досить дивно, що така мовна модель, як R1, на думку широкої громадськості, перемагає лідера, ChatGPT. І це незважаючи на те, що модель DeepSeek менша за розміром. DeepSeek також використовує менше ресурсів, ніж OpenAI.

Але це ще не все: DeepSeek-R1 був опублікований і знаходиться у вільному доступі. Яскраво описано, що це означає:

  1. Будь-хто може завантажити DeepSeek-R1, завантаживши кілька файлів через браузер на свій жорсткий диск. Будь-хто
  2. Після цього будь-хто може встановити R1 локально на своєму сервері штучного інтелекту. Будь-хто.
  3. Після цього кожен може користуватися R1 так часто і так довго, як захоче. Жодних додаткових витрат.

На противагу цьому, ось можливості, які пропонує ChatGPT.

  1. Ніхто не може завантажити ChatGPT.
  2. Ніхто не може використовувати ChatGPT для автоматизації завдань або іншого використання API, не витративши при цьому непередбачувану кількість грошей.

Справжня сенсація

Але це ще не все.

DeepSeek забирає корону з цим: DeepSeek розповідає нам весь рецепт виготовлення DeepSeek-R1.

Це означає:

  • Будь-хто може створити клон ChatGPT.
  • Більше OpenAI нікому не потрібен.

Зокрема, на сайті DeepSeek можна знайти наступні матеріали з відкритим вихідним кодом:

  • Метод навчання з R1 як концепція ("папір")
  • Методика навчання R1 як придатної для використання програмної бібліотеки (Python)
  • Дистилят наборів даних, що містять знання та вербалізовані процеси мислення від DeepSeek
  • Основні набори даних, такі як C4 або The Pile, які вже давно відомі

Щоб проілюструвати це, наведемо витяг з одного зі згаданих наборів даних про дистиляти:

Набір даних OpenThoughts-114k, витяг.

А ось опублікований рецепт випікання, щоб ваша компанія також могла випекти нову модель ШІ з якістю ChatGPT, якщо це необхідно:

Джерело: HuggingFace

Це було лише видалення. Названі та описані також інші особливості, такі як Мульти-токенна передбачення

Код для відтворення DeepSeek-R1 доступний у вигляді вихідного коду в бібліотеці Transformers на мові Python.

DeepSeek розповіли всім, як можна відновити ChatGPT.

Це справжня сенсація.

Більше відчуттів

DeepSeek також показав усім, як існуючі мовні моделі, які є досить невеликими, можна зробити ще більш інтелектуальними простим способом за допомогою передачі знань.

Ці менші моделі називаються Дестилатмоделями. Таке моделю дуже маленьке, щоб воно працювало на більш дешевій апаратній базі. Багато з цих розширених моделей можуть працювати на серверах низької вартості для обробки даних. Найменше з цих моделей навіть можна встановити на сучасному смартфоні та виконувати без інтернет-зв'язку!

DeepSeek також виклав ці моделі дистилятів у вільний доступ.

Результат

DeepSeek (як компанія або модель ШІ) не становить ризику для захисту даних, якщо ви не використовуєте додаток DeepSeek. OpenAI є ризиком для безпеки конфіденційних даних, оскільки ви можете використовувати лише хмарну версію.

DeepSeek показав, чим можна замінити ChatGPT. Зменшені моделі у вигляді відходів є чудовим додатковим подарунком. За досить прийнятну суму (купівля обладнання або оренда комп'ютерів) кожна компанія може відтворити ChatGPT для себе.

Навіть якщо DeepSeek походить з Китаю: відкритий код є відкритий код. Звичайно, всі постачальники великих моделей ШІ крадуть дані, а не тільки DeepSeek. Google і Meta також зловживають даними користувачів.

Німецькі компанії можуть сміливо використовувати DeepSeek AI для вирішення численних проблем і автоматизації процесів.

А саме з корпоративним ШІ, який (тільки) працює у вашій компанії.

Вища можливість для підприємств стала з появою DeepSeek-R1 – автоматизувати процеси за допомогою КІ. З локальними моделями воно ще більше приємно виконувати обов'язки згідно із законодавством про КІ, яке набуде чинності з 02 лютого 2025 року ([1]) !

Основні тези цієї статті

DeepSeek-R1 – це китайськомовна модель, яка, згідно з тестовими звітами, не поступається ChatGPT.

DeepSeek-R1 ефективніший за ChatGPT, вимагає менших обчислювальних потужностей і споживає менше енергії.

DeepSeek-R1 має відкритий вихідний код, тому його можна завантажити і використовувати локально, що гарантує безпеку даних.

Будь-хто може використовувати DeepSeek-R1 і навіть створювати власні моделі за тим самим рецептом.

Про ці основні твердження
About the author on dr-dsgvo.de
My name is Klaus Meffert. I have a doctorate in computer science and have been working professionally and practically with information technology for over 30 years. I also work as an expert in IT & data protection. I achieve my results by looking at technology and law. This seems absolutely essential to me when it comes to digital data protection. My company, IT Logic GmbH, also offers consulting and development of optimized and secure AI solutions.

DeepSeek-R1: невелика мовна модель випаровує фондовий ринок