| |
Решатель ARC-задач Франсуа Шолле | |
| |
|
write
|
| Решатель ARC-задач Франсуа Шолле |
| 19:07 08.02.2026 |
|
19:07 08.02.2026 |
|
№13569 |
Gray Tag:Вышел новый Claude, Opus 4.6, решает ARC AGI 2 с качеством 68.8%
Понимаю, ув. mserg опять бесноваться и кричать, что всё написано руками))
Написано, может быть, было и руками, а вот обдумана новая моделька была точно умной головой)))
https://www.anthropic.com/news/claude-opus-4-6
Никогда не было, и вот опять! И вообще, я миллион раз уже говорил, не надо преувеличивать!
В действительности могу повторить все то же. Нужна независимая проверка, которая делается Шолле и ко. и публикуется на https://arcprize.org/
Пока там самый умный GPT. Как появится на сайте опус с 68.8%, тогда признаем успех. А пока нет.
|
| |
|
write
|
| Решатель ARC-задач Франсуа Шолле |
Gray Tag:mserg: В действительности могу повторить все то же.
Именно об этом я и говорю, ты уже четыре года повторяешь одно и то же, а тем временем ARC-1 решена полностью, а ARC-2 на 70%, что уже выше человеческого результата)))
Цитату можно было отрезать и получше.
У Лукашенко можно поучиться:
Как из маминой из спальни
Кривоногий и хромой
Выбегает...
Так вот, выбегает Egg, и рассказывает про людей с 70%. Но это, скорее, уровень неглупой гориллы - Шолле для людей говорил о 85%. Что у вас там в Америке случилось с людьми?
И прогресс связан не чисто с LLM ...
А, ладно, пишите еще.
|
| |
|
create
|
| Решатель ARC-задач Франсуа Шолле |
Любую задачу(например Шоле) можно решить на машине тьюринга, или рекурентной нейросети, но также можно всё сделать с помощью базы данных, но она может быть велика, однако решение универсальное.
|
| |
|
create
|
| Решатель ARC-задач Франсуа Шолле |
| 16:06 24.02.2026 |
|
15:21 25.02.2026 |
|
№13649 |
Что там у людей по мнению Шолле? 85%? Конфлюэнс сделал 97.9%, код выложен, его можно воспроизвести. Настоящие задачи на интеллект начнутся тогда, когда их будут придумывать не шолли, а LL-модели)))
Confluence Labs выходит из режима скрытой разработки с результатом SOTA на ARC-AGI-2 , получив оценку 97,9% при стоимости 11,77 долларов за задачу в публичной оценке. Вот как мы этого добились, почему это важно и что нас ждет дальше:
https://github.com/confluence-labs/arc-agi-2
|
| |
|
write
|
| Решатель ARC-задач Франсуа Шолле |
Конфлюенсеры говорят о "97.92% on the ARC-AGI-2 public evaluation set". Это прямо заголовок у них в github.
С этим результатом есть только одна проблема - "public evaluation set".
А формально тест еще не пройден, т.к. лучший результут сейчас у Gemini 3 Deep Think (2/26) - дает 84.6%. А нужно 85%.
Ну и такая мелочь, как ограничение стоимости на задачу 5$. Но это, скорее всего, скоро тоже решат.
Так что можно сказать, что тест практически пройден. Огромный прогресс налицо - качество растет прямо на глазах.
Есть, правда, нюанс - используется "CoT", т.е. часть задачи ("декомпозицию") решил человек "вручную".
Но, видимо, это часть вопроса о непрерывном самообучении, о котором говорил Альтман в интервью.
В марте запускается ARC-AGI-3. По прогнозам Шолле он может продержаться 5 лет.
|
| |
|
create
|
| Решатель ARC-задач Франсуа Шолле |
| 12:24 27.02.2026 |
|
12:30 27.02.2026 |
|
№13651 |
mserg: В марте запускается ARC-AGI-3. По прогнозам Шолле он может продержаться 5 лет.
Да какая разница сколько он продержится)) Закон природы звучит так: любая задача, решаемая путем вычислений (в том числе логических или смысловых) может быть решена машиной. Всё.
|
| |
|
write
|
| Решатель ARC-задач Франсуа Шолле |
Gray Tag:Что там у людей по мнению Шолле? 85%? Конфлюэнс сделал 97.9%, код выложен, его можно воспроизвести. Настоящие задачи на интеллект начнутся тогда, когда их будут придумывать не шолли, а LL-модели)))
Confluence Labs выходит из режима скрытой разработки с результатом SOTA на ARC-AGI-2 , получив оценку 97,9% при стоимости 11,77 долларов за задачу в публичной оценке. Вот как мы этого добились, почему это важно и что нас ждет дальше:
https://github.com/confluence-labs/arc-agi-2
Во первых ВЫ конкретно не имеете никакого к этому отношения, вы — пожилой эмигрант, сломленный человек, хлебнувший горстей жизни, но не будем продолжать, изза политкорректности.
Во вторых про то что задачи Шолле решат инженерными выкрутасам, это было всем очевидно и что это нам дало? А то что также как шахматы или Го — ЭТО НЕ ИНТЕЛЛЕКТ, это просто алгоритм, калькулятор, паттерны.
Интеллект очевидно про другое, про самосознание, про трагедию существования, про иллюзию Я и страх смерти. А эта вс фигня про автоматизацию, про бизнес, по сути про охоту, если в контексте охотников собирателей, то есть нашей биологической сущности коими мы были миллионы лет.
Таков мой сказ.
|
| |
|
create
|
| Решатель ARC-задач Франсуа Шолле |
| 18:38 27.02.2026 |
|
20:04 27.02.2026 |
|
№13653 |
коитус: Во первых ВЫ конкретно не имеете никакого к этому отношения, вы — пожилой эмигрант, сломленный человек, хлебнувший горстей жизни
Ой. Очередной ватник-петушок начинает кукарекать о моих горестях. 😂😂 Живя в северном придатке северной кореи...
Я - CV архитектор с шестизначным долларовым доходом в крутой компании Кремниевой долины. Владелец недвижимости и акций. В расцвете своих сил, ежедневно проезжающий 40 км на велосипеде. Это кроме джима и бассейна. У нас во Флориде, знаете ли, лето круглый год. Вот прямо сейчас +27) Здесь у нас живут все ваши, начиная от родственников директоров спецслужб, заканчивая комерсами и артистами. Тоже, наверное, сломленные и горестные люди))
Я примерно на год раньше основных публикаций вышел на word2vec и концепцию эмбеддингов, что зафиксировано документально. У меня есть награда от IEEE за ИИ, это не так круто как нобель, но очень круто. Я имею ПРЯМОЕ отношение к ИИ, я тридцать лет профессионально тружусь в этой области))) Твоя жалкая пенсия (которая много меньше моего ежедневного дохода) существует во многом потому, что я разработал для Газпрома систему безопасности магистральных трубопроводов, с которых вы, паразиты, все кормитесь)))
Хватит пороть хуйню, петушко-ебанько))) Я понимаю, тебе обидно за бесцельно прожитые годы, но нужно было лучше учиться и развивать мозг, а не шоколадный глаз)
|
|
|