
Image by Matheus Bertelli, from Pexels
AI на DeepSeek научава да мисли само за себе си
Китайският стартъп DeepSeek, в партньорство с Университета Tsinghua, твърди, че е разработил по-умен начин за подпомагане на моделите за изкуствен интелект да мислят по-добре и по-бързо, без нуждата от огромни компютри или скъпи ресурси.
Нямате време? Ето основните факти:
- DeepSeek създаде самоподобряващ се AI, използвайки Самопринципен Критически Настройки (СКН).
- СКН учи AI да оценява собствената си работа, използвайки самогенерирани правила.
- Методът увеличава производителността без необходимостта от масивна изчислителна мощ.
Пробивът идва от нова техника наречена Self-Principled Critique Tuning (SPCT). SPCT се различава от простото увеличаване на AI моделите за подобряване на производителността – SPCT не изисква много енергия и изчислителна мощ за обучаване на AI да оценява своята собствена работа, използвайки набор от самостоятелно създадени правила.
Начинът, по който това работи, е чрез вграден „съдия“, който проверява дали отговорът на изкуствения интелект е в съответствие с вътрешните му правила за резониране и изглежда подходящ за човешки изход. Когато изкуственият интелект даде твърд отговор, получава положителна обратна връзка, която помага за подобряване на способността му да отговаря на подобни въпроси в бъдещите случаи.
DeepSeek внедрява този метод като част от своята система DeepSeek-GRM, която означава Generative Reward Modeling (Генеративно моделиране на награди). GRM работи по различен начин от традиционните методи, тъй като извършва паралелни проверки за подобряване на точността и последователността.
„Предлагаме настройка на самопринципен критичен анализ (Self-Principled Critique Tuning – SPCT), за да насърчим поведение, свързано с генериране на мащабируеми награди,“ написаха изследователите в своята статия. „SPCT позволява на [модела] да формулира принципи и критики в зависимост от входящата заявка и отговори, което води до по-добри крайни награди.“
С тази система, DeepSeek твърди, че неговият AI вече може да постига по-добри резултати от конкурентите, като Gemini на Google, Llama на Meta и GPT-4o на OpenAI, особено когато става въпрос за сложни задачи като резониране или вземане на решения, както беше отбелязано от Euronews.
Важно е да се отбележи, че DeepSeek обявява, че планира да пусне тези нови инструменти като отворен софтуер, въпреки че не е споделена дата за пускане.
Оставете коментар
Прекрати