DeepSeek и Alibaba, или как Китай ударно влезе в AI надпреварата

30.01.2025, 07:19

Глобалните пазари започнаха седмицата нестабилно, тъй като малко известният китайски модел изкуствен интелект (AI), наречен DeepSeek, предизвика разпродажба на акции, свързани с AI. Най-силно засегнати са акциите на големите технологични компании, сред които Nvidia.

Китайският стартъп DeepSeek пусна безплатен асистент, който използва по-евтини чипове и по-малко данни. Това изглежда оспорва общоприетото убеждение на финансовите пазари, че AI ще повиши търсенето на всичко - от производители на чипове до центрове за данни.

Дали това е балон, който предстои да се спука, или това е преждевременно предположение, пита Investing.com.

Какво е DeepSeek?

DeepSeek Artificial Intelligence Co., Ltd., стартирала през 2023 г., бързо става важна в света на AI. Базирана в Китай, DeepSeek се фокусира върху насърчаването на изследванията на изкуствения интелект.

Голямата цел на компанията е да създаде общ изкуствен интелект (AGI), или изкуствен интелект, който може да разбира, учи и изпълнява задачи като човек в много различни области.

Въпреки че компанията е започнала дейност съвсем скоро, бързият ѝ напредък показва, че е сериозна в намерението си да повлияе на бъдещето на интелигентните системи.

Произход и мисия

DeepSeek е основана по време на ключов момент за изкуствения интелект, когато пробиви в генеративни AI модели като ChatGPT предизвикаха глобален интерес към усъвършенстваното машинно обучение.

Въпреки че имената на основателите не са широко известни, според съобщенията сред тях има опитни професионалисти от китайската технологична индустрия и академичните среди, изследвали AI, с практика в софтуерното инженерство и стратегическите иновации. Тяхната цел за DeepSeek е да преминат отвъд границите на тесните AI системи, които са страхотни при специфични задачи, чрез създаване на AGI, който може да обобщава знанията и да се адаптира към нови предизвикателства.

Името "DeepSeek" означава "задълбочено изследване" или "задълбочено преследване", което подчертава фокуса върху фундаментални изследвания и иновативни приложения. Това съответства и на националната стратегия на Китай да заеме водеща позиция в иновациите в глобален план.

Технологичен фокус и ранни разработки

DeepSeek се фокусира върху няколко ключови области в развитието на AI. Едната е AGI Research, или технологии като големи езикови модели, обучение с подсилване и мултимодален AI и създаване на модели, които могат да мислят, да бъдат креативни и да разбират контекст.

Освен AGI, DeepSeek прави полезни AI инструменти за здравеопазване, финанси, образование и системи за самостоятелно управление. Инструменти на компанията се тестват при медицинската диагностика и персонализираното обучение.

Компанията не е разкрила своите акционери, но вероятно е подкрепена от частни инвеститори, рисков капитал и партньори, които споделят целите на Китай за AI.

Модел с отворен код

Подобно на своите западни конкуренти Chat-GPT, Llama и Claude, DeepSeek използва широкоезичен модел, което означава, че тренира върху огромни количества текст, за да обучи модела да разбира ежедневния език.

За разлика от компаниите от Силициевата долина обаче, които пазят своите модели частни, DeepSeek е с отворен код. Това означава, че всеки може да получи достъп до кода на компанията, да види как работи и дори да го промени.

DeepSeek твърди, че нейният е най-добрият сред моделите с отворен код и се конкурира с най-модерните модели със затворен код в света.

Приложението предизвика такъв шум, че надмина ChatGPT и се превърна в приложение №1 в магазините за приложения в САЩ, въпреки че е пуснато едва на 20 януари 2025 г.

Според DeepSeek компанията е похарчила само около 5,6 милиона долара за разработването на модела, което е нищожна сума в сравнение с вложеното от американските технологични гиганти в разработката и инфраструктурата на AI.

Alibaba също влиза в играта

Китайският концерн Alibaba също представи нов модел изкуствен интелект, за който твърди, че надминава основните конкуренти като GPT-4o на OpenAI, DeepSeek-V3 и Lama-3.1 на Meta.

Qwen2.5-Max идва на фона на повишен фокус върху китайските AI модели след пускането на DeepSeek-V3 и DeepSeek R1. Това предизвиква сериозни въпроси относно господството на САЩ в областта на изкуствения интелект.

Qwen2.5-Max е пуснат на платформата Alibaba Cloud Bailian и разработчиците могат да използват нова платформа за чат, за да взаимодействат директно с модела.

Според съобщенията на Alibaba Qwen2.5-Max е сравним с флагмана на Anthropic Claude-3.5-Sonnet и "почти цялостно надминава GPT-4o, DeepSeek-V3 и Llama-3.1-405B."

Как да развивате екипа си, за да се адаптират организациите към бурните промени в технологичния сектор? Как съвременният изкуствен интелект променя икономиката и живота на хората? Какви са добрите практики при приложението на изкуствен интелект в бизнеса? Всичко това и още ще научите на AI Innovation Summit! Повече за конференцията, програмата и лекторите можете да научите ТУК.

Споделете:

Препоръчано от автора

България има отлична интернет инфраструктура, но липсата на дигитални умения забавя цифровата трансформация

Сходни статии

Компаниите търсят начин за монетизиране на проекти с изкуствен интелект