Alibaba пуска новия модел на Qwen AI и твърди, че той е по-ефективен от DeepSeek-V3
Китайският гигант Alibaba представи последната версия на своя водещ AI модел, Qwen, тази сряда. Компанията твърди, че той може да изпълнява по-добре от популярния DeepSeek-V3.
Бързате? Ето основните факти!
- Alibaba пусна последния си модел за резониране Qwen 2.5-Max тази сряда.
- Китайският гигант твърди, че надхвърля популярни модели като DeepSeek-V3, GPT-4o и Llama-3.1-405B.
- Компанията също така стартира Qwen2.5-VL тази седмица, AI модел, способен да обработва изображения и да действа като AI агент, използвайки компютри и мобилни устройства за изпълнение на задачи.
Според Reuters, Alibaba пусна новия Qwen 2.5-Max, както е наречена новата модел за рационализация, точно по време на празниците на Лунната нова година в Китай, за да се присъедини към масивните разработки на изкуствен интелект през последните дни и да добави вътрешна конкуренция.
В понеделник DeepSeek заема първо място в App Store на Apple в Съединените щати, изпреварвайки ChatGPT, което предизвиква тревога сред другите компании в индустрията на изкуствения интелект и насторожава инвеститорите – акциите на Nvidia спаднаха с 17% само за един ден.
Сега Alibaba обяви последните версии на своя модел Qwen – тя пусна 100 отворени AI модели за комплекта Qwen през септември миналата година – обещавайки по-добри резултати от популярните модели на границата.
„Qwen 2.5-Max надминава (…) почти във всички аспекти GPT-4o, DeepSeek-V3 и Llama-3.1-405B“, написа компанията в официалния си акаунт в WeChat.
Новият модел за резониране Qwen 2.5-Max се предлага чрез облака на Alibaba, а потребителите могат също да тестват модела на страницата за чат.
„Разработваме Qwen2.5-Max, голямоабразен модел на МоЕ, който е предварително обучен с повече от 20 трилиона токена и допълнително пост-обучен с курирани методологии за Супервизирано Фино Настройване (SFT) и Обучение с Усилване от Човешка Обратна Връзка (RLHF)“, написа Екипът на Qwen в Github.
Китайският гигант също така пусна Qwen2.5-VL в понеделник, серия от мултимодални AI модели, които също могат да обработват изображения и да достъпват мобилни устройства и компютри за изпълнение на задачи. OpenAI обяви подобна функция, Operator, позволяващ на ChatGPT да изпълнява задачи автономно като взема контрол над компютъра на потребителя.
Според екипа на Alibaba, всички модели Qwen надминават подобни версии от OpenAI, Microsoft, Google, Meta и DeepSeek.
Оставете коментар
Прекрати