DeepSeek представила новую модель DeepSeek-V3 — самую большую по весу в мире!
Для начала немного о самой компании. DeepSeek — это китайская компания, основанная в 2023 году. Она быстро стала одним из лидеров в области искусственного интеллекта. Главная цель DeepSeek — сделать передовые AI-технологии доступными каждому и приблизить создание общего искусственного интеллекта (AGI).
Теперь о главной новости: DeepSeek-V3 — это новая модель с впечатляющими 671 миллиардами параметров, что делает её самой крупной по весу на сегодняшний день!
Почему это важно?
📍Эффективность при минимальных затратах: DeepSeek тратит на обучение своих моделей всего $5,3 млн — для сравнения, OpenAI, Anthropic и Google за эти деньги оплачивают годовую работу около 18 исследователей. При этом DeepSeek-V3 демонстрирует уровень производительности, сравнимый с Sonnet 3.5 и GPT-4o в бенчмарках.
📌Сильные стороны: Модель особенно хорошо справляется с программированием и математическими задачами. Это делает её идеальным инструментом для разработчиков и аналитиков.
▪️Забавный момент
DeepSeek-V3 уже успела порадовать русскоязычных пользователей своей оригинальностью: • На английском она корректно представляется как DeepSeek-V3. • Но в русскоязычном чате заявляет, что она модель от OpenAI. Видимо, русскоязычные датасеты знают что-то своё😀
Попробуйте её сами здесь.
#НовостиИИ
