коитус: Так или иначе культура другая, нужно постоянно играть роль, самим собой быть неприлично, начинаешь ненавидеть свою суть
Именно так, вот здесь, как мне кажется, как нельзя лучше рассказано:
Ладно, не буду больше лохматить дедушку Egg, пусь спит спокойно. Тем более к теме - Решатель ARC-задач Франсуа Шолле, это не имеет никакого отношения.
коитус: Так или иначе культура другая, нужно постоянно играть роль, самим собой быть неприлично, начинаешь ненавидеть свою суть
Именно так, вот здесь, как мне кажется, как нельзя лучше рассказано:
cXj7xu0KMEk
Ладно, не буду больше лохматить дедушку Egg, пусь спит спокойно. Тем более к теме - Решатель ARC-задач Франсуа Шолле, это не имеет никакого отношения.
Не ну пацик на видео совсем не Эгг, тот создал успешный стартапик, но потом подустал, ну или перерос эти крысиные бега, или и то и другое. А Эгг панически свалил с рашки в пиндосию, искал где трава зеленее, словно в наивные 90е, когда все маврики покупали. Тыкался мыкался и всё беспонту, как рыбочка об лёд бился, но вместо духовности, мудрости, только злее и токсичнее стал. И всё бы ничего, если бы постоянно не злоподпёздывал, не кидался какашками и эти его перманентные акценты на бытовухе нижнего среднего класса, верный признак словно он голодал или побирался в прошлом и это не выходит из него, это его суть. Как такого злюку не потроллить?
Но вы правый ну его нафиг.
Почему ИИ не может решить детские задачки!
Представьте себе картину: нейросеть, которая может написать симфонию в стиле Баха, перевести древнегреческий на суахили и создать код для термоядерного реактора, тупит как пробка перед задачкой, которую решит любой пятилетний малец. На экране — простая картинка: несколько цветных квадратиков, и нужно понять закономерность. Ребенок глянет секунду и скажет: "Дядя, тут же элементарно — если фигурка одна, отражаем, если две — копируем!" Машина молчит, как партизан на допросе.
Добро пожаловать в мир ARC — Abstraction and Reasoning Corpus, теста, который стал занозой в заднице для создателей искусственного интеллекта и зеркалом, показывающим разницу между настоящим пониманием и понтовой показухой.
Глава 1: Анатомия провала — почему умные машины тормозят как чугунный утюг
Великий обман больших данных (или как впарить лоха статистикой)
Современный ИИ — это триумф хитрой математики над пониманием. GPT-4 сожрал половину интернета, научился болтать как человек с подвешенным языком, но при этом остался слепым к истинной природе мышления. Он знает, что после фразы "Солнце встает на..." чаще всего идет слово "востоке", но понимает ли он, что такое восток? Хрен его знает!
ARC обнажает эту липу с точностью хирургического скальпеля. Франсуа Шоле, создатель теста, выдвинул крутую идею: интеллект — это способность быстро абстрагировать паттерны и переносить их на новые данные. Не зубрить миллионы примеров как отличник-ботаник, а понимать принцип из нескольких наблюдений.
Симметрия как детектор лжи для разума
Возьмем простую задачу ARC: на входе три примера с разноцветными фигурами, на выходе — их преобразования. Человек на раз-два видит: "Ах, красные квадраты отражаются по вертикали, а синие торчат как вкопанные!" Это не колдовство африканского шамана — это работа врожденных модулей восприятия, которые эволюция долбила в нас молотком миллионы лет.
Нейросеть же видит только кучу циферек. У неё нет концепции "красного", нет понимания "отражения", нет чутья на "симметрию". Она может зазубрить миллион примеров отражений, но встретив новый тип симметрии — встанет колом, как первоклашка у доски.
Проклятье статистических абстракций (или мутная каша вместо мыслей)
Здесь кроется коренная разница между человеческим и машинным мышлением:
Человеческие абстракции — четкие, конкретные, как хорошо отрегулированный механизм. Мы можем по пунктам сформулировать правило: "Если объектов три, крути на 90 градусов", — и это правило будет жить в башке как отдельная рабочая деталь.
Нейросетевые абстракции — размазанные, туманные, как каша из топора. Они растворяются в миллионах коэффициентов, как сахар в компоте. Хрен извлечешь из GPT конкретное правило — оно размазано по всей архитектуре тонким слоем.
Это разница между пониманием и натаскиванием, между мышлением и дрессировкой.
Глава 2: Школа жизни (это не про тюрьму, как вы подумали) против школы данных
Как учится человек: вся жизнь — театр, а люди в нем — ученики
Чтобы понять, где собака зарыта в провале ИИ с ARC, нужно разобрать по винтикам триумф человеческого обучения. Мы не рождаемся с готовыми мозгами, как компьютер с предустановленной Windows — мы их собираем по кусочкам, взаимодействуя с окружающим бедламом.
Младенец тянется к яркой игрушке и промахивается мимо кассы — урок пространства. Роняет чашку и слышит дребезжание — урок причинности. Складывает кубики одна радость — урок устойчивости и симметрии. Каждое движение, каждая оплеуха от жизни, каждое открытие закладывают крепкий фундамент для будущих абстракций.
К пяти годам ребенок таскает в голове огромную библиотеку жизненного опыта: как предметы падают, как они отражаются в зеркале, как симметрия радует глаз, как части складываются в целое. Эта библиотека написана не умными словами, а мышечной памятью, картинками и эмоциями.
Культурная эстафета разума (или как предки передают мудрость)
Но человеческое обучение — это не только личная движуха. Это культурная эстафета, передача накопленной веками мудрости от стариков к молодежи. Мы не изобретаем велосипед заново с математикой — мы её впитываем через игры, сказки, всякую фигню.
Ребенок слушает: "Жили-были три медведя..." — и въезжает в концепцию множества. Играет в прятки — и рубит фишку отношений видимого и скрытого. Собирает пазлы — и прокачивает чувство формы и паттерна.
Это поэтапное, осмысленное, мотивированное обучение. Каждый новый лайфхак встраивается в уже существующую систему понимания, подкрепленную эмоциями и желанием что-то замутить.
Голодная диета больших языковых моделей
Сравните это с "образованием" современного ИИ. LLM жрет хаотичные куски текста, вырванные из контекста, как бомж объедки. Нет поэтапности, нет мотивации, нет тактильного взаимодействия с миром. Только бесконечное гадание на следующее слово в бессмысленной каше токенов.
Представьте ботаника, который всю жизнь просидел в библиотеке, читая книжки, но никогда не видел настоящего дерева, не чувствовал ветра, не топтал землю. Он может загнать тысячи описаний природы, но въедет ли он, что такое листопад? Дудки!
Именно поэтому LLM часто умеет "красиво сказать", но не "правильно сделать". Он знает умные слова о симметрии, но не чувствует её. Знает определение отражения, но не видит его.
Глава 3: Парадокс исчезающего интеллекта (или как все классное становится банальным)
Когда чудо превращается в рутинную работягу
История развития ИИ — это история постоянного переобувания в воздухе с определением интеллекта. Каждый покоренный рубеж мгновенно обесценивается в глазах человечества, словно проклятье египетских фараонов.
1997 год: Deep Blue размазывает Каспарова в шахматы. Мир офигевает: машина сделала человека в игре королей! Но проходит время, и вердикт безжалостен: "Это просто тупой перебор, никакого интеллекта."
2016 год: AlphaGo делает лучших игроков в Го — игру, которая считалась неприступной крепостью для машин. Снова вау-эффект, снова облом: "Просто статистика на стероидах."
2020-е годы: GPT строчит стихи, код, эссе, философствует как университетский преподаватель. "Ну и что? Это просто продвинутый попугай."
Каждое достижение ИИ проходит один сценарий: восторг → понимание механизма → полное разочарование. Мы называем интеллектом только то, что машины пока не научились делать.
Демистификация как движение к истине
Но может быть, в этом парадоксе спрятана глубокая истина? Возможно, наше представление об интеллекте как о чем-то мистическом, неземном, священном — просто красивая сказочка?
Вспомните школьный курс истории науки. Когда-то жизнь казалась чудом из чудес, недоступным пониманию. Потом нарыли ДНК — и жизнь стала химией. Мышление было загадкой вселенной — открыли нейроны, и оно стало электричеством с примесями. Сознание остается темной лошадкой — но, возможно, не навечно.
Каждое научное открытие отбирает у мира немного магии и дает взамен понимание. Это не поражение, а победа с большой буквы. Мы не теряем чудо — мы овладеваем им, как хозяева положения.
ARC как следующая жертва прогресса
Если (когда?) ИИ научится щелкать ARC как семечки, произойдет то же самое. Сначала будет триумф: "Наконец-то! Машина может думать абстрактно!" Потом — разбор полетов: "Оказывается, хватает комбинировать визуальные штучки с логическими правилами." И наконец — полное равнодушие: "Подумаешь, большое дело, никакого настоящего понимания."
И это будет в порядке вещей. Не потому что ARC фигня какая-то, а потому что мы на шаг ближе к пониманию того, что разум — не тайна за семью печатями, а система. Сложная, крутая, но познаваемая система.
Глава 4: Дорога к настоящему интеллекту
Новая архитектура понимания (или как правильно готовить мозги)
Чтобы создать ИИ, способный расправляться с ARC и подобными задачами, нужно кардинально переосмыслить подход к дрессировке машин. Вместо пассивного поглощения данных — активное взаимодействие со средой. Вместо гадания на токенах — постановка и решение конкретных задач. Вместо статистических совпадений — построение причинно-следственных связей.
Мультимодальные среды обучения: ИИ должен учиться видеть, слышать, щупать, действовать. Только через полноценное взаимодействие с богатой средой можно сформировать подлинное понимание мира.
Агентность и мотивация: Система должна хотеть что-то делать, иметь цели, наталкиваться на препятствия, учиться на шишках. Пассивное созерцание не рождает понимания.
Иерархическое обучение: От простых базовых концепций к сложным, от конкретного к абстрактному, от частного к общему. Как учится ребенок, как накапливалось человеческое знание веками.
Воплощенный интеллект (или мозги с руками и ногами)
Возможно, самый важный урок ARC в том, что интеллект неотделим от тела. Наше понимание пространства рождается из движения, понимание времени — из ритма сердца, понимание причинности — из наших действий и их последствий.
Проекты вроде OpenAI в Minecraft или DeepMind в виртуальных мирах — первые робкие шаги к воплощенному ИИ. Но этого маловато. Нужны системы, которые растут и развиваются, как растет ребенок — от простых рефлексов к сложным абстракциям.
Культурное наследование (или как впитать мудрость предков)
И наконец, ИИ нужно учиться не только на собственном опыте, но и на культурном наследии человечества. Но не просто читать тексты — впитывать структуры мышления, способы рассуждения, лайфхаки решения проблем, выработанные тысячелетиями человеческой истории.
Глава 5: Зеркало, в котором мы видим свою истинную рожу
Что ARC говорит о нас
ARC — это не просто экзамен для ИИ. Это зеркало, в котором мы видим собственные мозги в новом свете. Он показывает, что наш интеллект — не волшебство, а результат миллионов лет эволюции, тысяч часов детского познания мира, веков культурного развития.
Мы не рождаемся готовыми гениями — мы становимся ими через взаимодействие с миром, другими людьми, с самими собой. Наш разум — это не персональный компьютер, а целая экосистема, в которой врожденные способности, личный опыт и культурное наследие сплетаются в единое целое.
Скромность перед сложностью мироздания
ARC учит нас не задирать нос. Мы привыкли считать себя пупом земли, а свой разум — недостижимой вершиной. Но если наши мыслительные способности можно разложить на запчасти, понять их механизмы, скопировать в машине — значит, мы не такие особенные, как думали?
Или наоборот — мы еще более крутые? Ведь то, что кажется элементарным ("просто увидел закономерность"), на деле оказывается результатом невероятно сложной и изящной системы обработки информации, отшлифованной миллионами лет эволюции.
Между мистикой и техникой
ARC ставит перед нами основополагающий вопрос: где граница между пониманием и качественной имитацией? Если машина научится решать все задачи, которые решает человек, используя те же принципы, что и человек — будет ли она понимать мир или просто мастерски его копировать?
Возможно, это неправильная постановка вопроса. Возможно, понимание и имитация — не противоположности, а разные точки на одной шкале. И человеческий разум — тоже своего рода биологическая машина, только более сложная и изящная, чем наши нынешние поделки.
Эпилог: горизонты понимания (или что нас ждет впереди)
Сегодня ARC кажется неприступной крепостью для ИИ. Завтра он может стать очередной покоренной высотой. И когда это произойдет, мы не скажем: "Наконец-то машины начали соображать!" Мы скажем: "А, ну понятно, это просто комбинация визуального распознавания и логического вывода."
И это будет правильно. Не потому что мышление стало менее ценным, а потому что мы стали понимать его лучше. Каждый разоблаченный аспект интеллекта — это ступенька к более глубокому пониманию себя и мира.
ARC — не последний бастион человеческой уникальности. Это очередная веха на пути к пониманию того, что значит быть разумным. И возможно, самое важное открытие, которое нас ждет — это понимание того, что разум не противостоит природе, а является её самым крутым творением.
В конце концов, фиолетово, решит ли машина задачки ARC через год или через десять лет. Важно то, что в процессе создания такой машины мы лучше поймем самих себя. И это понимание будет самым ценным призом в этой интеллектуальной гонке — гораздо более ценным, чем очередная победа кремния над углеродом.
Ведь в зеркале разума мы видим не только то, какими могут стать наши машины, но и то, кем на самом деле являемся мы сами. И это уже немало.
Sanek22: Почему ИИ не может решить детские задачки!
Глава 4: Дорога к настоящему интеллекту
Новая архитектура понимания (или как правильно готовить мозги)
Чтобы создать ИИ, способный расправляться с ARC и подобными задачами, нужно кардинально переосмыслить подход к дрессировке машин. Вместо пассивного поглощения данных — активное взаимодействие со средой. Вместо гадания на токенах — постановка и решение конкретных задач. Вместо статистических совпадений — построение причинно-следственных связей.
Мультимодальные среды обучения: ИИ должен учиться видеть, слышать, щупать, действовать. Только через полноценное взаимодействие с богатой средой можно сформировать подлинное понимание мира.
Агентность и мотивация: Система должна хотеть что-то делать, иметь цели, наталкиваться на препятствия, учиться на шишках. Пассивное созерцание не рождает понимания.
Иерархическое обучение: От простых базовых концепций к сложным, от конкретного к абстрактному, от частного к общему. Как учится ребенок, как накапливалось человеческое знание веками.
Воплощенный интеллект (или мозги с руками и ногами)
Возможно, самый важный урок ARC в том, что интеллект неотделим от тела. Наше понимание пространства рождается из движения, понимание времени — из ритма сердца, понимание причинности — из наших действий и их последствий.
Проекты вроде OpenAI в Minecraft или DeepMind в виртуальных мирах — первые робкие шаги к воплощенному ИИ. Но этого маловато. Нужны системы, которые растут и развиваются, как растет ребенок — от простых рефлексов к сложным абстракциям.
Культурное наследование (или как впитать мудрость предков)
И наконец, ИИ нужно учиться не только на собственном опыте, но и на культурном наследии человечества. Но не просто читать тексты — впитывать структуры мышления, способы рассуждения, лайфхаки решения проблем, выработанные тысячелетиями человеческой истории.
Симпатичная философия, но конкретно к ARC она имеет скорее косвенное отношение. Мультимодальность, агентность, мотивация, культурное наследие — всё это, возможно, когда-нибудь пригодится для создания универсального интеллекта. Но задачи Шоле — это не про понимание мира в широком смысле, а про способность распознавать и применять визуальные абстракции. Это не "жизнь в теле", а манипуляции с пиксельными паттернами.
В ARC всегда есть явные или скрытые трансформации: перемещения, повороты, отражения, масштабирования, замены цветов, составление или разбиение форм. Мы легко узнаём эти штуки, потому что имеем богатый визуальный опыт. Но для модели это неочевидно — ей нужно специально объяснять, что такое "поворот на 90°" или "зеркальное отражение". Ни CNN ни GPT такому специально не обучали, это не статистика токенов, а чистая геометрия + логика. А мы люди с таким сталкиваемся с детства, но нужно отделить именно относящиеся к этому задачи и данные от всего остального, чтобы не закончить не начав.
Поэтому для продвижения здесь нужен не симулятор тела, а тс. "визуальный компилятор". Сначала — обучить модель распознавать базовые трансформации по паре картинок. Потом — научить её определять цепочку преобразований: например, "перемещение вправо", затем "поворот", затем "смена цвета". И только потом подключать реальные задачи из ARC, чтобы оттачивать композиции и логику применения.
Не надо сразу лепить GPT в Minecraft и учить его щупать камень, чтобы понять отражение по оси X. Надо тренировать на чётко заданных визуальных задачах с понятной структурой. Если модель не может объяснить, как один объект стал другим — она в принципе не сможет решать ARC на уровне здравого смысла, хоть ты её и обложи сенсорами и целями.
Простой пример: дана картинка с синим квадратом, а потом — та же картинка, где квадрат стал зелёным и сдвинулся на три клетки вправо. Модель должна уметь выдать: "перемещение вправо на 3, смена цвета с синего на зелёный". Пока она не научится это декомпозировать, о высокоуровневом понимании говорить рано. Начинать надо с простого, но объяснимого.
Этим ML пока не занимался(не учили этому): объяснимым выявлением элементарных визуальных операций, этому нужно СПЕЦИАЛЬНО УЧИТЬ(как в прочем и десятками других фишек человеческого опыта, если речь уже про "AGI" почти как у человека). Всё упирается не только в данные, а в структуру опыта и специфические задачки, развивающие тот или иной скил. Это можно формализовать, не прибегая к телесному воплощению или культурному багажу — достаточно зрительного опыта и чёткой постановки задач. Это путь быстрее, проще и практичнее для ARC-специфики. Ну и вообще это более целенаправленный и ОСОЗНАННЫЙ путь решения задачи, а не "сделать всё как у человека и ждать чуда".
Когда модель сможет "рассказать" что произошло с объектом между двумя состояниями — вот тогда появится шанс на качественное решение таких задач. Пока же мы чаще видим либо угадайку, либо brute-force. Так что стоит меньше говорить о мотивации ИИ, и больше — о геометрии и преобразованиях. ARC — это не про желание, это про структуру.
Ну и да, конечно, когда её решат, то это ничего не изменит, подобных скилов у человека десятки ещё есть, чему нужно обучать специализированно, которые "просто так" не возникнут, если учить угадывать следующее слово или описывать\генерировать картинку.
Как то так.
PS: Далиб мне пару десятков миллионов долларов, чтобы нанять десяток дерзких агнцев, чтобы игрались на вычислительном кластере в пару сотен видях, через год бы решил бы арк, зуб даю))