Image by Matheus Bertelli, from Pexels

AI на DeepSeek научава да мисли само за себе си

Време за четене: 2 мин.

Последно обновени: Apr 8, 2025

Написано от Киара Фабри Мултимедиен журналист
Превод от Екипът за локализация и преводи Услуги за локализация и преводи

Китайският стартъп DeepSeek, в партньорство с Университета Tsinghua, твърди, че е разработил по-умен начин за подпомагане на моделите за изкуствен интелект да мислят по-добре и по-бързо, без нуждата от огромни компютри или скъпи ресурси.

Нямате време? Ето основните факти:

DeepSeek създаде самоподобряващ се AI, използвайки Самопринципен Критически Настройки (СКН).
СКН учи AI да оценява собствената си работа, използвайки самогенерирани правила.
Методът увеличава производителността без необходимостта от масивна изчислителна мощ.

Пробивът идва от нова техника наречена Self-Principled Critique Tuning (SPCT). SPCT се различава от простото увеличаване на AI моделите за подобряване на производителността – SPCT не изисква много енергия и изчислителна мощ за обучаване на AI да оценява своята собствена работа, използвайки набор от самостоятелно създадени правила.

Начинът, по който това работи, е чрез вграден „съдия“, който проверява дали отговорът на изкуствения интелект е в съответствие с вътрешните му правила за резониране и изглежда подходящ за човешки изход. Когато изкуственият интелект даде твърд отговор, получава положителна обратна връзка, която помага за подобряване на способността му да отговаря на подобни въпроси в бъдещите случаи.

DeepSeek внедрява този метод като част от своята система DeepSeek-GRM, която означава Generative Reward Modeling (Генеративно моделиране на награди). GRM работи по различен начин от традиционните методи, тъй като извършва паралелни проверки за подобряване на точността и последователността.

„Предлагаме настройка на самопринципен критичен анализ (Self-Principled Critique Tuning – SPCT), за да насърчим поведение, свързано с генериране на мащабируеми награди,“ написаха изследователите в своята статия. „SPCT позволява на [модела] да формулира принципи и критики в зависимост от входящата заявка и отговори, което води до по-добри крайни награди.“

С тази система, DeepSeek твърди, че неговият AI вече може да постига по-добри резултати от конкурентите, като Gemini на Google, Llama на Meta и GPT-4o на OpenAI, особено когато става въпрос за сложни задачи като резониране или вземане на решения, както беше отбелязано от Euronews.

Важно е да се отбележи, че DeepSeek обявява, че планира да пусне тези нови инструменти като отворен софтуер, въпреки че не е споделена дата за пускане.

AI на DeepSeek научава да мисли само за себе си

Радваме се, че работата ни Ви хареса!

Оставете коментар