Overclockers.ru: В Nvidia считают, что их решения для искусственного интеллекта являются ультимативными

→ Оригинал (без защиты от корпорастов) | Изображения из статьи: [1]

Компания не видит необходимости в развитии таких продуктов как NPU, на фоне высокой производительности GPU в сфере ИИ

Nvidia недавно выпустила внутреннюю презентацию, в которой объясняется предпочтение компанией дискретных графических процессоров (GPU) перед нейронными процессорами (NPU) для запуска локальных генеративных приложений искусственного интеллекта. Компания считает, что производитель видеокарт может рассматривать процессоры других компаний как угрозу.

Intel пытается продвигать свои процессоры Meteor Lake как новый класс "ПК с искусственным интеллектом", который предназначен для операций на основе искусственного интеллекта и не зависит от крупных центров обработки данных в облаке. Microsoft и Qualcomm также планируют выпустить больше компьютеров на базе искусственного интеллекта позже в этом году, в то время как Apple стремится занять лидирующие позиции в 2024 году со своими грядущими процессорами M4 и A18 bionic.

Microsoft пытается продвигать свои сервисы как неотъемлемую часть нового тренда, включая своего виртуального помощника Second Pilot, в качестве требований для всех ПК с искусственным интеллектом. Однако, Nvidia считает, что ее видеокарты RTX лучше подходят для задач на основе искусственного интеллекта, предполагая, что процессоры не нужны и что миллионы ПК с поддержкой искусственного интеллекта уже используются.

Microsoft утверждает, что для следующего поколения ПК на базе искусственного интеллекта требуемая производительность должна составлять не менее 40 триллионов операций в секунду, но в презентации Nvidia утверждает, что ее видеокарты RTX уже могут достигать 100-1300 максимальных значений. Производитель графических процессоров заявляет, что чипы, аналогичные текущим RTX серий 30 и 40, являются отличными инструментами для создания контента, повышения производительности, создания чат-ботов и других приложений, использующих большие языковые модели. Ожидается, что мобильная GeForce RTX 4050 превзойдет Apple M3, в то время как RTX 4070 достигает "флагманской производительности" в стабильной версии Diffusion 1.5.

Чтобы продемонстрировать уникальные возможности своей технологии, Nvidia выпустила обновление для ChatRTX. Этот чат-бот на базе Nvidia TensorRT-LLM работает локально на любом ПК с графическим процессором RTX серии 30 или 40 и не менее чем 8 ГБ видеопамяти. Что отличает ChatRTX, так это его способность отвечать на запросы на нескольких языках путем сканирования документов или видеороликов YouTube, предоставленных пользователями. Он совместим с текстовыми форматами, такими как pdf, doc, docx и XML.

Хотя Nvidia утверждает, что является бесспорным лидером по производительности встроенного искусственного интеллекта, это не означает, что ее конкуренты откажутся от борьбы. Напротив, ожидается усиление конкуренции, исследований и разработок на рынке NPU, поскольку компании стремятся вытеснить Nvidia.