Microsoft заявила во вторник, что ее модель искусственного интеллекта Phi-2 работает лучше, чем конкурирующие продукты других компаний, таких как Meta (MTEA), и может работать на устройствах. В блоге Microsoft говорится: «Модель Phi-2 имеет всего 2,7 миллиарда параметров, но в различных комплексных тестах производительность ее производительность превосходит производительность модели большого языка (LLM) Mistral7B европейского ИИ-стартапа Mistral, которая имеет 7 миллиардов параметров, и модели ИИ Llama2, выпущенной Meta, с 13 миллиардами параметров».
«Примечательно, что модель Phi-2 превзошла модель Llama2 с 70 миллиардами параметров в задачах многоэтапного вывода (например, кодирование и математика) (семейство моделей Llama2 включает три варианта параметров: 7 миллиардов, 13 миллиардов и 70 миллиардов параметров)».
Microsoft добавила: «Кроме того, производительность модели Phi-2 сравнима или даже лучше, чем у недавно выпущенного Google Gemini Nano2, несмотря на меньший размер модели». В Microsoft заявили, что модель Phi-2 будет запущена в Azure Studio.
Сообщается, что в июне этого года Microsoft выпустила модель Phi-1 всего с 1,3 миллиарда параметров, которая подходит для таких сценариев, как QA-Q&A, формат чата и код. Модель полностью обучена на высококачественных данных и превосходит аналогичные модели в тестах производительности до 10 раз.
В сентябре этого года Microsoft обновила и выпустила версию Phi-1.5, которая также имеет 1,3 миллиарда параметров и может писать стихи, электронные письма и рассказы, а также обобщать текст. По критериям здравого смысла, понимания языка и рассуждения модель смогла не отставать от моделей с числом параметров до 10 миллиардов в некоторых областях.
Хотя размер Phi-2, выпущенного Microsoft в обновлении в ноябре, увеличился вдвое по сравнению с предыдущей версией, он все равно намного меньше, чем другие основные языковые модели. Microsoft заявляет, что Phi-2 демонстрирует значительные улучшения в логическом рассуждении и безопасности, а при правильной настройке и настройке модели малого языка становятся мощными инструментами для облачных и периферийных приложений.