Нашел что-то новое. Подайте ИИ изображение, и он сможет угадать за вас личность человека. Просто опираясь на плейлист, вы можете догадаться о недавнем психическом состоянии человека. И это все от КимиНовейшая модель визуального мышления k1рука.



Нет, прошел всего месяц с тех пор, как последняя математическая модель k0-math была запущена и получила рейтинг o1, а k1 быстро дебютировала.

Конечно, этот К1 не так прост, как начало: просто рассматривать картинки и анализировать личность.


Когда мы в последний раз тестировали k0-math, мы уже испытали на себе способность «мастера задач», и процесс мышления при решении задачи поразил рецензентов. Жаль, что некоторые вопросы по математике и геометрии, связанные с логикой, немного менее интересны.

Но на этот раз К1 есть что сказать,Иметь как рассуждения, так и зрительные способности.Это означает, что вы можете напрямую делать фотографии и загружать их для решения задач, а также утверждается, что он способен сравниться или даже превзойти OpenAI o1 по математике, физике и химии.


Если мы сравним вот так, мы будем очень рады. Так уж получилось, что новой модели K1 теперь не нужно ждать внутреннего тестирования. Его можно использовать как в приложении, так и в веб-версии. Без лишних слов, мы начнем весь процесс напрямую.

Когда я подошел, я задал вопрос по геометрии K1 с вступительного экзамена в колледж в этом году.


Во-первых, k1 достаточно внимательно интерпретирует вопрос и знает, какова его цель.

Учитывается также теорема косинусов, которая может участвовать в данных в вопросе условиях. Это похоже на наше мышление при решении задачи. Когда мы увидим a²+b²−c²=2ab, мы сразу же подумаем о формуле косинуса c²=a²+b²-2ab·cosC.

Далее продолжайте выводить по формуле и условиям и вы быстро сможете найти угол В = 60°.

Проведите пальцем вверх, чтобы увидеть больше


Вопрос (2) немного сложен, но рецензент тщательно проверил процесс решения задачи k1 и обнаружил, что все идеи и решения верны. Окончательный ответ о длине стороны c=2√2 также верен. (Поскольку процесс обдумывания вопроса k1 слишком длинный, скриншот не показан.)

Тот же вопрос был задан o1. Во-первых, по скорости рассуждений o1 уже проиграл за 58 секунд.

С точки зрения точности o1 и k1 связаны, оба справились.

Разница в том, что о1 скрывает идею ответа на вопрос и не дает полного мыслительного процесса, как к1.


Однако следует сказать одно: рецензент не особенно удивлен тем, как модель k1 имитирует человеческое мышление. Потому что в прошлый раз k0-математическая модель меня шокировала. Казалось, оно осознало свои ошибки и проведет неоднократные проверки.Похоже, я ломаю голову над написанием математических задач.

Напротив, на этот раз K1 более выдающимся образом компенсирует недостатки. В прошлый раз я снова попробовал решить вопрос по геометрии для младших школьников по k0-математике с k1, и теперь я могу ответить правильно. Даже сложность вступительных экзаменов в колледж не пугает.

А еще я обнаружил, что k1 хорошо справляется не только с математическими задачами, но и с задачами по физике.

Проведите пальцем вверх, чтобы увидеть больше


Затем я взял еще один вопрос-ловушку со слегка запутанной логикой и попробовал:Арбуз был куплен за 50 юаней и продан за 70 юаней. Босс получил 100 юаней фальшивой валютой. Сколько денег он потерял в итоге?

На первый взгляд этот вопрос кажется простым, но ответы пользователей сети на него разные. Кто-то говорит, что потерял 150, кто-то 180, кто-то 100...

Давайте рассмотрим вопрос, который не могут решить даже многие люди, и посмотрим, сможет ли k1 обнаружить ловушку внутри.

Более того, я намеренно неаккуратно написал этот вопрос от руки и, кстати, еще и проверил, так ли хороши зрительные способности К1, как рекламируется.


Не скажите, не скажите, "глаза" у этой модели действительно неплохие.

Что касается точности вопроса, анализ в первой половине k1 сначала дал ответ о потере 100 юаней, но он быстро опроверг себя.

продолжатьПоддельная валюта, сдача и себестоимостьПриняв во внимание эти сложные факторы, мы наконец выяснили, что босс потерял 80 юаней. (Правильный ответ: 80 юаней)

Проведите пальцем вверх, чтобы увидеть больше


Эта логическая способность действительно немного сильна.

В том числе я дал к1 несколько аналогичных аргументирующих вопросов для теста. Хотя путь логического анализа отличался от эталонного ответа, все окончательные ответы были правильными.

Проведите пальцем вверх, чтобы увидеть больше


В любом случае, после этого теста рецензент обнаружил, что k1 умеет логически мыслить, у него хорошее зрение и высокий IQ. Кими«Быть ​​автором вопросов»Его имя наконец подтверждено.

Но на этот раз я не только отвечал на вопросы, но и придумал более причудливые способы игры.

Нет смысла анализировать данные и смотреть отчеты. Разве модель k1 не делает выводы на основе изображений? Тогда он, должно быть, хорошо распознает древние монеты, верно?

Специально нашел в Интернете изображение серебряных монет периода Китайской Республики. Две серебряные монеты были фальшивыми сверху и настоящими снизу. Я отправил его в k1 для быстрого обзора.«ИИ-версия прослушивания источника для выявления сокровищ».

Источник изображения Пользователь Xiaohongshu @古古金来 (комментарий агента публичного блога)


К1 не только знал, что монета относится к периоду Китайской Республики, но и вывел все детали монеты. В конце концов он действительно увидел, что монета выше — фальшивка.


Давайте просто отправим фотографию комнаты и позволим k1 взглянуть на «фэн-шуй».

А что насчет «вентиляций», симметричной планировки, энергетического баланса... Он говорил об этом ясно и ясно и даже давал нам предложения, например, изменить положение грядки, регулярно подрезать растения, поменять люстру на более простую.

Проведите пальцем вверх, чтобы увидеть больше


Сфотографируйте к1 во время еды, и будет понятно, сколько калорий вы употребили во время еды.

Проведите пальцем вверх, чтобы увидеть больше


Но больше всего меня поражает k1Угадай фильм по картинкамспособность.

Я дал ему скриншот из фильма "Семь смертных грехов". Никаких строк, только картинки. Многим людям, которые никогда не видели этот фильм, трудно догадаться.


Когда я впервые прочитал анализ k1, я подумал, что он, вероятно, будет плохим. Но в следующую секунду я сказал: «Ракурс и тон съемки напомнили мне фильмы Дэвида Финчера». Я также пришел к выводу, что сцена на скриншоте — это сцена из «Семи смертных грехов».


Это действительно слишком сильно...

Даже если кинуть в k1 какие-то непонятные мемы, он все равно сможет серьезно объяснить смешной момент.


Хотя это немного преувеличено, общий смысл в основном понятен.


Скажем так, исходя из зрительных и рассуждений k1, ответы на вопросы являются основными. Пока ваш мозг достаточно велик, вы можете открыть больше способов игры.

Этой способностью k1 во многом обязан человек по имениЦепочка мышления COT (цепочка мыслей)технология.

Общий смысл заключается в том, что прежде чем модель выдаст ответ,Подражайте мышлению человеческого мозга, разбивайте сложные задачи и решайте их шаг за шагом.Эта технология может повысить IQ модели.

С другой стороны, с помощью технологии обучения с подкреплением модель также учится развиваться в процессе непрерывных проб и ошибок для достижения оптимальных результатов.Точно так же, как дрессировать собаку.


Что касается того, почему Кими взял на себя инициативу в выборе математики в качестве отправной точки для модели рассуждения, я думаю, что это та же самая причина, по которой мы, люди, должны хорошо изучать математику и тренировать свое мышление.

На основе «хорошего изучения математики» в модели мы можем затем применить эту способность к логическому рассуждению к физике, химии и даже ко всем аспектам нашей повседневной жизни, пока, наконец, не по-настоящему поймем мир.


И очевидно,Обобщающая способность модели вывода КимиЭто уже начинает проявляться.

Если предположить, что данные достигли пика, этот путь, основанный на технологии обучения с подкреплением, может позволить модели достичь лучших результатов.

Но в конечном итоге, какие технологии используются в модели и насколько высока ее бумажная оценка?На самом деле всех больше волнует, проста ли модель в использовании и практична.

Кими, который всегда хорошо справлялся с длинными текстами, теперь фокусируется как на длинных текстах, так и на обучении с подкреплением, что также является проявлением корректировки атрибутов его инструмента, чтобы постепенно приближаться к потребностям пользователя.

В конце концов, когда технология перестанет быть превосходной и сможет помогать людям решать практические проблемы, она действительно выполнит свою миссию.